Omics - Hunter

CPTAC数据库介绍及简单使用

美国国家癌症研究所的临床蛋白质组肿瘤分析联盟 (CPTAC,clinical proteomic tumor analysis consortium) 是一项旨在通过应用大规模蛋白质组和基因组分析或蛋白质组学来加速了解癌症的研究项目。CPTAC 从临床队列中生成全面的蛋白质组学和基因组学数据。

CPTAC数据库用到的蛋白质定量技术主要是基于质谱的检测技术,包括iTRAQ(Isobaric tags for relative and absolute quantification)和TMT(Tandem Mass Tags)。iTRAQ是由美国ABI研发的一种体外同种同位素标记的相对与绝对定量技术,TMT则是由Thermo研发的多肽体外标记技术。两种技术都是采用4种或8种、11种同位素编码的标签,其中最新的TMT技术可以达到16种同位素编码的标签,通过特异性标记蛋白多肽N末端或赖氨酸侧链基团,而后进行串联质谱分析,可同时比较多个不同样品中蛋白质的相对含量。

目前数据集信息如下:

数据访问:https://proteomic.datacommons.cancer.gov/pdc/

例如我们需要研究乳腺癌

https://pdc.cancer.gov/pdc/browse/filters/primary_site:Breast

包含了完善的统计信息和数据集信息,点击Study ID查看详细信息

我们可以看到每个研究项目的详细信息:

如果我们需要下载原始数据信息点击Files下面的数字

然后点击弹窗的Download下载数据:

批量下载数据请参考:https://pdc.cancer.gov/pdc/faq/Multiple_Files

当然我们也可以通过CPTAC提供的数据来对数据进行再次分析

我们也可以根据CDAP来查看和学习蛋白数据的分析流程:

DDA数据分析

DIA数据分析

同时也有很多不错的教程讲解CPTAC的挖掘,大家可以学习参考:

教程

案例

参考文献:

1.https://paynelab.github.io/cptac/tutorial01_data_intro.html

2.https://proteomics.cancer.gov/programs/cptac


作者:陈浩


版权:本文版权归作者所有


免责声明:本文中使用的部分图片来自于网络或者参考资料,如有侵权,请联系博主:chenhao__@__evvail.com(发件请删除下划线)进行删除


转载注意:除非特别声明,本站点内容均为作者原创文章,转载须以链接形式标明本文链接


本文链接:https://evvail.com/2022/03/16/2664.html

3 评论

  1. 看了陈老师的分享,受益匪浅

  2. 某研究生

    首先,感谢作者的分享,讲述的也非常详细,就是有一个小小问题,CPTAC的使用介绍里,最后那里的“载此分析”是什么意思呢?是写错了吗?还是说我没有理解(冒昧问一下)

发表回复

如果你有什么好的建议或者疑问请给我留言,谢谢!

Captcha Code