bioinfokit提供了很多生物信息分析中的小工具,像常见的差异分析、基因组注释、数据转换、火山图、热图、维恩图、主成分分析、T-sne、曼哈顿图等丰富的工具(根据作者的描述,这个包应该是作者常用的分析和方法的一个封装,这点做的非常赞)。


# 安装
easy_install bioinfokit

# 或者用pip安装
pip bioinfokit

# 卸载
pip uninstall bioinfokit

为了方便演示,我们用常见的火山图、维恩图等来做演示


# 载入需要用到的包
from bioinfokit import analys, visuz

加载演示数据


df = analys.get_data('volcano').data
print(df.head())

1. 绘制火山图


visuz.gene_exp.volcano(df=df, 
    lfc='log2FC', 
    pv='p-value', 
    geneid="GeneNames", 
    color=("#00239CFF", "grey", "#E10600FF"),
    legendpos='best',
    plotlegend = True,
    legendlabels = ["Up", "-", "Down"],
    genenames=({"LOC_Os09g01000.1":"EP", "LOC_Os01g50030.1":"CPuORF25", "LOC_Os06g40940.3":"GDH", "LOC_Os03g03720.1":"G3PD"}),
    gstyle=2, 
    sign_line=True,
    xlm=(-6,6,1), 
    ylm=(0,61,5), 
    figtype='png', 
    axtickfontsize=10)

2.维恩图


visuz.venn(vennset=(300,600,402,470,200,230,408), 
    vennlabel=("X vs Y", "Y vs Z", "X vs Z"), 
    vennalpha=0.9)

该软件作者还提供了许多基因组数据处理和数据可视化相关的函数,调用起来也非常方便,大家可以在github查看更多的使用方法。

参考资料:

1.https://github.com/reneshbedre/bioinfokit