題:
確定結構變量類型的最簡單方法?
SmallChess
2018-07-16 17:57:37 UTC
view on stackexchange narkive permalink

在VCF 4.2中,可以使用 SVTYPE 中的 BND 關鍵字描述結構變體(SV)。例如,下面的示例是一個插入(來自 https://samtools.github.io/hts-specs/VCFv4.2.pdf):

 # CHROM POS ID REF ALT QUAL FILTER INFO2 321682 bnd VT] 13:123456] AGTNNNNNCAT 6 PASS SVTYPE = BND; MATEID = bnd U13 123456 bnd UC CAGTNNNNNCA [2:321682 [6 PASS SVTYPE = BND; MATEID = bnd V  

該關鍵字可用於描述任何SV事件。

我想弄清楚如何確定事件是否為插入,刪除,複製,倒置等。算法/程序將告訴我上面的示例為插入。

我找不到能為我進行轉換的工具。

PS: 我正在使用的程序是GRIDSS。該程序只會在SVTYPE字段中生成 BND 。嚴格來說,這不是一個錯誤(BND可以用於任何SV排列),但是在分析中卻很煩人。

如何使用INFO / SVTYPE屬性來“實現”呢?
@Pierre SVTYPE是BND。
@Pierre某些SV程序(例如GRIDSS)僅將BND輸出到SVTYPE。否則,我不會在這裡問。
從VCF規範中獲取:INFO = 值應為DEL,INS,DUP,INV,CNV,BND之一。因此,BND(中斷結束)不是INDEL,也不是插入。
-1
“有些GRIDSS等SV程序只能將BND輸出到SVTYPE”哦,我知道了
我是否可以建議您不使用GRIDSS而是使用產生有效輸出的工具?
@terdon是什麼意思? GRIDSS是已發布的SV程序。 BND是有效的VCF輸出嗎?
如果它使用“ BND”來表示插入,則它不遵循VCF規範,因為插入的“ SVTYPE”應為“ INS”,而“ BND”應僅用於斷點。
一 回答:
SmallChess
2018-07-19 10:01:35 UTC
view on stackexchange narkive permalink

GRIDSS的作者已經在Github上發布了他自己的解決方案。代碼為:

  simpleEventType <- function(gr){return(ifelse(seqnames(gr)!= seqnames(partner(gr)),“ ITX”,#染色體間ifelse( gr  $ insLen > = abs(gr $  span> svLen)* 0.7,“ INS”,ifelse(strand(gr)== strand(partner(gr)),“ INV “,ifelse(xor(start(gr)< start(partner(gr)),strand(gr)==”-“),” DEL“,” DUP“))))))))))))}}  
您能否詳細說明這個答案?什麼東西看起來像R,我應該為此使用哪個庫?


該問答將自動從英語翻譯而來。原始內容可在stackexchange上找到,我們感謝它分發的cc by-sa 4.0許可。
Loading...