ped文件转bed文件【牛基因组信息】
【报错】plink --ped snp.ped --map snp.map --make-bed --outsnp_bed
PLINK v1.90 build 7 for Windows (64-bit) released on (日期格式不同), accompanying documentation and resources available at (指定链接) under the terms of the GNU General Public License version 3, authored by Shaun Purcell and Christopher Chang.
Logging to snp_bed.log. Options in effect: --make-bed --map snp.map --out
snp_bed --ped snp.ped 16283 MB RAM detected; reserving 8141 MB for main
workspace.
提示信息显示,在文件.mapfile中第42665914行存在无效的染色体代码'27'。(该错误对人类来说是不允许的。建议检查问题是否出在您的数据中或是否忘记定义了不同的染色体集合(例如使用--chr-set选项)。)
解读
解读
解读
如果你确定该map文件中存在染色体27的错误,则应该进行如下处理:
更正map文件中的错误后,请将染色体27的编号调整为正确的数字(举个例子来说吧),如果您的样本涉及牛类,则应将其更改为29号)
如果你担心染色体编码正确的编号是否正确,请参考文献或相关文档以确认你的染色体编码正确的编号。
为了将非人类物种的数据转为BED格式文件,你需要确保在命令行正确设置了相关的参数(比如--chr-set),以便正确指定染色体编码方案.
在完成上述步骤之后,请重新执行plink命令,则应该就能成功地将ped文件转换为bed文件了。
处理
请注意,在您的命令行界面中执行以下操作:调用plink应用程序,并在其参数列表中添加--chr-set30选项;这将使常染色体(autosom)被指定为从1号到29号位点(1-29),而X性染色体编码为30号位点(X),同时线粒体DNA来自细胞质基质(cellular mitochondrial DNA)。具体操作示例见下文
Win10 下git运行plink:
【代码1】plink --file snp--make-bed--out snp_bed --cow--chr-set 30
--cow选项指示PLINK处理牛遗传数据的具体类型。--chr-set 30指定自定义染色体组设置,默认包括常染色体1至29号、性染色体X以及线粒体DNA序列(M)。
【运行日志】PLINK v1.90b7 64-bit (16 Jan 2023)
Optionsin effect:
--chr-set 30
--make-bed
--map snp.map
--out snp_bed
--ped snp.ped
Hostname:DESKTOP-5CHRNIM
Working directory: G:\A测序分析数据\result\Merge_VCF
Starttime: Thu Mar 02 16:01:50 2023
Randomnumber seed: 1677744110
16283MB RAM detected; reserving 8141 MB for main workspace.
Scanning.ped file... done.
Performingsingle-pass .bed write (46580773 variants, 30 samples).
--file:snp_bed-temporary.bed + snp_bed-temporary.bim + snp_bed-temporary.fam
written.
46580773variants loaded from .bim file.
30samples (0 males, 0 females, 30 ambiguous) loaded from .fam.
Ambiguoussex IDs written to snp_bed.nosex .
Using1 thread (no multithreaded calculations invoked).
Beforemain variant filters, 30 founders and 0 nonfounders present.
Calculatingallele frequencies... done.
Totalgenotyping rate is 0.98575.
46580773variants and 30 samples pass filters and QC.
Note:No phenotypes present.
--make-bedto snp_bed.bed + snp_bed.bim + snp_bed.fam ... done.
Endtime: Fri Mar 03 00:41:36 2023
你还需要将命令行参数--file替换成你实际使用的文件夹前缀吗?这里假设文件夹前缀为snp。
当你的data file包含多个chromosomes时,请注意您也可以通过指定多个--chr参数来标识这些chromosomes,在实际操作中可以参考以下示例。
【代码2】plink --file snp--make-bed--out snp_bed --cow--chr 1-29,X,MT
其中,在此示例中使用了--chr选项来指明数据中的染色体。在本例中,默认设置采用了常染色体1-29、性染色体X以及线粒体染色体MT(即M)。值得注意的是,在本例中我们采用了与默认设置不同的方法来指定染色体——通过逗号分隔的列表形式而非--chr-set选项。
PLINKv1.90b7 64-bit (16 Jan 2023)
Optionsin effect:
--chr 1-29,X,M
--cow
--file output
--make-bed
--out output_bed
Hostname:DESKTOP-5CHRNIM
Working directory: G:\A测序分析数据\result\Merge_VCF
Starttime: Thu Mar 02 16:57:57 2023
Randomnumber seed: 1677747477
16283MB RAM detected; reserving 8141 MB for main workspace.
Scanning.ped file... done.
Performingsingle-pass .bed write (46580773 variants, 30 cattle).
--file:output_bed-temporary.bed + output_bed-temporary.bim +
output_bed-temporary.famwritten.
46580773variants loaded from .bim file.
30cattle (0 males, 0 females, 30 ambiguous) loaded from .fam.
Ambiguoussex IDs written to output_bed.nosex .
Using1 thread (no multithreaded calculations invoked).
Beforemain variant filters, 30 founders and 0 nonfounders present.
Calculatingallele frequencies... done.
Totalgenotyping rate is 0.98575.
46580773variants and 30 cattle pass filters and QC.
Note:No phenotypes present.
--make-bedto output_bed.bed + output_bed.bim + output_bed.fam ... done.
Endtime: Fri Mar 03 01:47:04 2023
【详解】
这段PLINK软件的日志包含了程序运行的相关信息。下面将对日志内容进行详细解析:
-
PLINK v1.90b7 64-bit (16 Jan 2023):运行 PLINK 版本为 1.90b7 64 位,发布日期为 2023 年 1 月 16 日。
-
Options in effect::当前生效的选项。
-
--chr 1-29,X,M:只包含染色体 1 到 29,以及 X 和 M 染色体的数据。
-
--cow:表示输入的数据为牛的基因型数据。
-
--file output:输入的数据文件名为 output。
-
--make-bed:生成 BED 格式文件。
-
--out output_bed:输出文件的名字为 output_bed。
-
Hostname: DESKTOP-5CHRNIM:运行该程序的计算机名称为 DESKTOP-5CHRNIM。
*Working directory: G:\A测序分析数据\result\Merge_VCF:程序的工作目录设置为 G:\A测序分析数据\result\Merge_VCF。
-
Start time: Thu Mar 02 16:57:57 2023:程序开始运行的时间为 2023 年 3 月 2 日下午 4:57。
-
Random number seed: 1677747477:随机数种子为 1677747477。
The system identified 16283 megabytes of RAM and allocated 8141 megabytes specifically for the main workspace.
- Scanning .ped file... done.:扫描 PED 文件完成。
Completing a single-pass .bed write (46580773 variant sites, 30 cattle): 包括 46580773 个位点 and 30 头牛.
-
--file: output Bed-Temp-Bed, output Bed-Temp-BIM and $output Bed-Temp-FAM have been written.
:The temporary BED, BIM, and FAM files have been completed.- 46580773 variants loaded from .bim file.:共有 46580773 个位点从 BIM 文件中加载进来。
-
共有 30 头牛(没有任何公牛、母牛均为不确定性别)被从 .fam. 文件中加载进来:共有 30 头动物群(1 只公畜、1 只母畜均为不确定性别)从 FAM 格式文件中被加载进来。
ambiguous sex IDs were recorded in the output_bed.nosex file.
Employing a single thread, the system performs all calculations using a single thread (no multi-threaded computations are performed).
Prior to the application of primary variant filters, there are 30 founding individuals and no nonfounders present.
- Calculating allele frequencies... done.:计算等位基因频率完成。
