时间序列相关的软件在生物学研究相对比较少见( 主要可能是我接触的比较少),金融行业对时间序列的研究就非常多了,之前的一篇文章介绍了Mfuzz通过软聚类的方法来研究类似时间序列找出关键的cluster的方法也是非常不错的研究思路。

今天主要介绍STEM的简单使用,STEM由java语言编写而成(需要java环境,java 1.4+)的可视化操作的分析软件,主要是用于对短的时间序列的基因表达数据(少于或等于8个时间点)进行聚类、比较和可视化,整体来说操作非常简单,主要含有两个输入和一个选项、以及一个执行模块:

下载地址:http://www.sb.cs.cmu.edu/stem/stem.zip

手册下载:http://www.cs.cmu.edu/~jernst/stem/STEMmanual.pdf

1)运行软件,输入时间序列的表达数据

g27_1.txt数据文件的格式( 注意 :Spot列是序号列,如果你不想手动添加,不选择Spot IDs included in the data file选项),如下:

我们也可以选择数据预处理方式:

2)注释信息

这一块,软件本身可以下载官方的数据库,也可以自己提供注释数据,如果使用中不了解此选项含义,点击后面的问号有详细的解释。

3)选项设置

可以设置聚类方法、可接受的基因簇最大数目等,高级选项有更详细的设置,一般来说默认就好。

4)点击运行即可得到表达趋势发生显著性变化的基因聚类图

我们点击各个cluster,可以查看每个基因簇的表达趋势情况

点击Profile Gene Table即可查看每个基因/蛋白的表达情况。

总体来说使用非常方便,本文没有用GO/其他注释文件,大家也可以结合GO做后续的分析。

参考资料:

1.http://www.cs.cmu.edu/~jernst/stem/