bioinfokit提供了很多生物信息分析中的小工具,像常见的差异分析、基因组注释、数据转换、火山图、热图、维恩图、主成分分析、T-sne、曼哈顿图等丰富的工具(根据作者的描述,这个包应该是作者常用的分析和方法的一个封装,这点做的非常赞)。
# 安装
easy_install bioinfokit
# 或者用pip安装
pip bioinfokit
# 卸载
pip uninstall bioinfokit
为了方便演示,我们用常见的火山图、维恩图等来做演示
# 载入需要用到的包
from bioinfokit import analys, visuz
加载演示数据
df = analys.get_data('volcano').data
print(df.head())
1. 绘制火山图
visuz.gene_exp.volcano(df=df,
lfc='log2FC',
pv='p-value',
geneid="GeneNames",
color=("#00239CFF", "grey", "#E10600FF"),
legendpos='best',
plotlegend = True,
legendlabels = ["Up", "-", "Down"],
genenames=({"LOC_Os09g01000.1":"EP", "LOC_Os01g50030.1":"CPuORF25", "LOC_Os06g40940.3":"GDH", "LOC_Os03g03720.1":"G3PD"}),
gstyle=2,
sign_line=True,
xlm=(-6,6,1),
ylm=(0,61,5),
figtype='png',
axtickfontsize=10)
2.维恩图
visuz.venn(vennset=(300,600,402,470,200,230,408),
vennlabel=("X vs Y", "Y vs Z", "X vs Z"),
vennalpha=0.9)
该软件作者还提供了许多基因组数据处理和数据可视化相关的函数,调用起来也非常方便,大家可以在github查看更多的使用方法。
参考资料:
1.https://github.com/reneshbedre/bioinfokit