之前文章介绍了Nextflow:《Nextflow-完整pipeline编写执行利器》,nf-core就是基于Nextflow开发的一个生物信息平台,包含如:scRNA-seq、RNA-seq、Hi-C、ATAC-seq、ChIP-seq等流程,每种流程都配有相应的文档和示例:
目前截止2020年11月,共有发布版本26个,开发中的流程15个,归档4个。基本上涵盖了当前生物信息数据分析大部分的pipeline。
安装nf-core也非常的简单:
# 首先安装java,确保Java v8+
# 安装Nextflow
curl -s https://get.nextflow.io | bash
mv nextflow ~/bin/
# 案例
# 加载 RNAseq pipeline
nextflow run nf-core/rnaseq \
-profile docker \
--genome GRCh37 \
--reads "data/*_{R1,R2}.fastq.gz"
# 安装nf-core
pip install nf-core
# 查看nf-core已有流程或者最新可用版本
nf-core list
# 命令
nf-core list :列出可用pipeline
nf-core launch :交互式运行一个pipeline
nf-core download :下载pipeline供离线使用
nf-core licences :查看pipeline中软件许可
nf-core create :从nf-core工作了模版创建一个新pipeline
nf-core lint :根据nf-core指南检查pipeline
nf-core schema :使用pipeline架构文件
nf-core bump-version :更新nf-core pipeline版本号
nf-core sync : 同步pipeline TEMPLATE到分支
其他命令需要参考Nextflow命令以及其特性。可以这样理解,Nextflow是实现这些pipeline的基础,nf-core是建立了一个生信分析流程的平台和定义了一些标准。总之,nf-core是生物信息平台架构的一个很好的典范。
参考资料:
1.https://nf-co.re/
2.https://github.com/nf-core/