題:
如何將GT:GP格式的.vcf(估算)文件轉換為GT:DS?
Nilufer
2017-06-29 20:45:09 UTC
view on stackexchange narkive permalink

我有從impute2以.gen格式輸出的基因型數據(推斷為1000G P3)。該文件具有基因型後驗概率(每個變體的GP:3值)。我已經使用qctools將.gen轉換為.vcf,並且.vcf文件具有GT:GP格式。我需要將GT:GP格式的.vcf文件轉換為GT:DS。建議在qtltools / fastqtl分析中使用基因型劑量。但是,我找不到保持.vcf格式並將GP轉換為DS的工具。任何幫助,不勝感激!

三 答案:
Tim
2017-06-29 21:57:57 UTC
view on stackexchange narkive permalink

您可以在冰雹中完成此操作。

以下是執行此操作的粗略代碼(0.1版)。

設置:

  from hail import * hc = HailContext() 

導入.gen文件。 VCF也可以工作:

 數據集= hc.import_gen('src / test / resources / example.gen','src / test / resources / example.sample') 

重新映射基因型模式並導出到VCF:

  dataset.annotate_genotypes_expr('g = {GT:g.call(),DS:g.dosage()}') \ .export_vcf('/ tmp / out.vcf.bgz') 

如果要嘗試,請查看入門頁面

我應該注意,您可以在Hail中進行QTL分析,具體取決於您要使用的方法。參見此處的博客帖子

Hannah
2017-07-25 00:52:44 UTC
view on stackexchange narkive permalink

嗯,我不知道該插件存在,所以我寫了自己的腳本將GP轉換為github上的次要等位基因劑量。也許其他人會發現它有用:) https://github.com/7methylg/VCF-GP-to-DS

winni2k
2017-06-30 17:44:22 UTC
view on stackexchange narkive permalink

bcftools的劑量插件,但它僅輸出製表符分隔的值。擴展插件以輸出帶有DS標籤的VCF並不是很困難,但是尚未完成。 bcftools開發人員很有可能會響應功能請求...

無論如何,此代碼為:

  curl https: //raw.githubusercontent.com/samtools/bcftools/develop/test/convert.vcf > convert.vcfbcftools + dosage convert.vcf > output.tsvhead -2 output.tsv  

具有輸出:

 #[1] CHROM [2] POS [3] REF [4] ALT [5] NA00001 [6] NA00002 [7] NA00003 [8] NA00004 [9] NA00005 [ 10] NA00006 [11] NA00007 [12] NA00008 [13] NA00009 [14] NA00010X 2698560 GA 0.1 0.0 0.1 0.2 0.3 0.2 0.2 0.2 0.2 0.1  

這是使用bcftools版本1.3.1 b>

這是bcftools手冊中有關劑量插件的摘錄:

劑量

打印基因型劑量。默認情況下,插件按該順序搜索PL,GL和GT。



該問答將自動從英語翻譯而來。原始內容可在stackexchange上找到,我們感謝它分發的cc by-sa 3.0許可。
Loading...