MSstatsTMT的主要应用方向:

1.分析TMT标记的蛋白质组学数据

2.也支持代谢标记或iTRAQ标记。LC-MS, SRM, DIA(SWATH)与label-free等方法的蛋白质组学数据的分析。

总体来说软件还是很人性化的,支持多种软件的结果,作者的文章尚未发表,R包已经再github频繁更新了,预计近期可能online。下面简单介绍该包的功能及用法。

主要包含以下功能:

1.不同数据格式转换成 MSstatsTMT 需要的数据格式: PDtoMSstatsTMTFormat(Proteome Discoverer结果), MaxQtoMSstatsTMTFormat(maxquant结果), SpectroMinetoMSstatsTMTFormat( SpectroMine 格式结果) 和 OpenMStoMSstatsTMTFormat(OpenMS结果格式)

2.定量分析: proteinSummarization (蛋白定量信息)、 groupComparisonTMT (组间比较)

# 安装MSstatsTMT包
BiocManager::install("MSstatsTMT")

下面我们用一个示例来看 MSstatsTMT 分析过程:


library(MSstatsTMT)

# 内置数据集,此处我们用Proteome discover的数据做演示
# data(raw.pd)

# 注释数据
# data(annotation.pd)

# Proteome discover数据转换成MSstatsTMT数据对象
input.pd <- PDtoMSstatsTMTFormat(raw.pd, annotation.pd)

# 移除缺失值
input.pd.no.miss <- PDtoMSstatsTMTFormat(raw.pd, annotation.pd,
                                 rmPSM_withMissing_withinRun = TRUE)


# 用 MSstats方法计算蛋白的定量结果
quant.msstats <- proteinSummarization(input.pd,
                                      method="msstats",
                                      global_norm=TRUE,
                                      reference_norm=TRUE,
                                      remove_norm_channel = TRUE,
                                      remove_empty_channel = TRUE)


# 用Median方法来计算蛋白定量结果
quant.median <- proteinSummarization(input.pd.no.miss,
                                     method="Median",
                                     global_norm=TRUE,
                                     reference_norm=TRUE,
                                     remove_norm_channel = TRUE,
                                     remove_empty_channel = TRUE)

# QC 数据
dataProcessPlotsTMT(data.peptide = input.pd,
                     data.summarization = quant.msstats,
                     type = 'QCPlot',
                     width = 21, 
                     height = 7)


# 默认比较所有分组
test.pairwise <- groupComparisonTMT(quant.msstats)

# 查看分组情况
levels(quant.msstats$Condition)
#> [1] "0.125" "0.5"   "0.667" "1"
# 指定比较分组
# 只比较0.125 和 1
comparison<-matrix(c(-1,0,0,1),nrow=1)
row.names(comparison)<-"1-0.125"
# 设置列名
colnames(comparison)<- c("0.125", "0.5", "0.667", "1")
# 比较
test.contrast <- groupComparisonTMT(data = quant.msstats, contrast.matrix = comparison)

参考资料:

1.https://bioconductor.org/packages/release/bioc/vignettes/MSstatsTMT/inst/doc/MSstatsTMT.html

2.http://msstats.org/msstatstmt/