NGS技术在当下是用于生命科学领域里非常火爆的技术,我们在数据分析方面几乎离不开诸如R、python等工具。在R中比较耀眼的一颗明星就是Bioconductor从芯片到测序,几乎囊括了这些技术的所有的数据分析方法。

对此Bioconductor也在2015的课程中介绍了各中软件方法的使用,总结起来我们生命科学利用高通量测序技术的数据分析流程分为以下几步:

  1. 实验设计
    • 实验设计尽可能简单
    • 可以重复!
    • 避免引入批次效应和其他人为因素
  2. 湿实验准备
    • 样本收集、保存
    • 样本制备
    • DNA/RNA提取、提纯等
  3. 高通量测序
    • 选择合适的测序方法
  4. 和ref序列比对
    • 序列比对
    • 序列拼接、组装
  5. 质控
    • 数据质控
    • 定位感兴趣的基因、转录本、功能等
  6. 统计分析
    • 差异分析
    • 富集分析
    • 通路分析
    • 互作分析等
  7. 解释和验证
    • 基于功能、作用机制的解释
    • 基于通路网络的解释
    • 湿实验验证

参考资料:

1.https://www.bioconductor.org/help/course-materials/2015/useR/bioc-for-sequence-analysis.html