随着测序技术的发展,单细胞转录组测序(single-cell RNA-seq,scRNA-seq)技术得到了蓬勃的发展,可在单细胞水平揭示全基因组范围内所有基因的表达情况,有助于研究细胞间的表达异质性。目前已经有几十种不同的单细胞转录组测序技术相继被开发出来。

2017年的一篇 Molecular Cell 也详细比较比较了各个单细胞测序方法的异同:

其中Smart-seq2作为测全长的转录本(full-length transcript sequencing)技术其中的一种,是由Picelli等人从Smart-seq中改良而来其对原始的Smart-Seq实验流程进行了多项改进优化,它不再需要纯化步骤,可大大提高产量。

Smart-seq2原理:通过设计oligo(dT)VN Primer作为逆转录引物,利用MMLVRT的模板转换活性,在cDNA的3’端添加一段接头序列,通过该接头序列进行反转录,生成cDNA第一条链。当逆转录酶到达mRNA5’末端时,会连续在末端添加几个胞嘧啶(C)残基。然后添加TSO(template-switching oligo)引物,退火后结合在第一条链的3’端与poly(C)突出杂交,合成第二条链。这样得到的cDNA经过PCR扩增,然后再纯化后用于测序。

Smart-seq2数据分析流程

比对和组装及QC需要用到的软件:

Pipeline FeaturesDescriptionSource
Assay Typepaired-end plate-based Smart-seq2
Overall workflowQuality control module and transcriptome quantification moduleCode available from Github
Workflow languageWDLopenWDL
Genomic reference sequenceGRCh38 human genome primary sequenceGENCODE
Gene ModelGENCODE v27 PRI GTF and Fasta filesGENCODE
AlignerHISAT2Kim, et al.,2015HISAT2 tool
QCMetrics determined using Picard command line toolsPicard Tools
Estimation of gene expressionRSEM (rsem-calculate-expression) is used to estimate the gene expression profile. The input of RSEM is a bam file aligned by HISAT2.Li and Dewey, 2011
Data Input File FormatFile format in which sequencing data is providedFASTQ
Data Output File FormatFile formats in which Smart-seq2 pipeline output is providedBAMZarr version 2

常规scRNA-seq分析流程

skylab提供了基于WDL语言的Workflow分析脚本,涵盖了下机原始数据的组装、以及质控部分,具体可以在github上招到其官方流程:

后续的分析培训教程可以参考之前的文章:scRNA-seq单细胞分析培训资源汇总,软件方法可以参考:单细胞资源大汇总

参考资料:

1.https://data.humancellatlas.org/pipelines/smart-seq2-workflow

2.https://learn.gencore.bio.nyu.edu/single-cell-rnaseq/

3.Chen G, Ning B, Shi T. Single-Cell RNA-Seq Technologies and Related Computational Data Analysis. Front Genet. 2019;10:317.

4. Ziegenhain C, Vieth B, Parekh S, et al. Comparative Analysis of Single-Cell RNA Sequencing Methods[J]. Molecular Cell, 2017, 65(4):631-643.e4.