今天处理一个小问题转换ped到bed,查了网上很多资料,当我们转换常规的数据时应该没有问题,但是当我们转换非常规的染色体编号的文件时会报错,先介绍下plink文件格式。

1)PED文件主要是储存每个样本的基因型的,每行代表一个样本

2)MAP文件主要是用来记录每个maker(一般为SNP)的位置信息

3)这里的bed和我们genome里的区域文件bed完全不同,bed文件是二进制文件。同时会将谱系/表型信息存储在单独的文件(* .fam)中并创建扩展的MAP文件(* .bim)(其中包含有关等位基因名称的信息,否则将丢失在BED文件中)

用一下文件转换bed测试

plink --file y --make-bed

常规染色体编号正常,如果遇见非常规染色体编号则会报如下错误:

Error: Invalid chromosome code '#######' on line 35548 of .map file.
(Use --allow-extra-chr to force it to be accepted.)

如果你确定是染色体编号没有问题那么执行如下命令,表示允许非常规染色体名称

plink --file y --make-bed --allow-extra-chr

参考资料:

1.http://www.cog-genomics.org/plink2