題:
讀碼映射到外顯子,內含子和基因間區域
stack_learner
2018-05-07 20:49:42 UTC
view on stackexchange narkive permalink

對齊步驟後,我檢查了所有樣本的rnaseq指標。在40個樣本中,三個樣本顯示映射到內含子區域的讀數的百分比很高。可能是什麼原因?樣本3 529618(7.3%)3934615(54.5%)2750720(38.1%)

我還發現58k個基因中的35-40k個基因的讀計數為“零”。這是由於污染造成的嗎?可能是什麼原因?讀到映射到外顯子,內含子,基因間的信息是什麼?

更新:我使用了hisat2進行比對。我使用了hisat2網站上的人類基因組“ grch38_snp_tran”。庫是使用核醣體耗竭試劑盒生成的。

這些樣品的總體比對速率與其他具有更合理的內含子比對速率的樣品相比如何?
我看到所有37個樣本的總體對齊率在90-96%之間,而這3個樣本的總體對齊率分別為69%,79%和70%。
聽起來您的樣本質量下降了
你的意思是那三個樣本被降解了嗎?我現在該怎麼辦?我應該刪除它們以進行進一步分析嗎?
這可能是原因,但無論您應排除它們。
當然。到內含子區域的高比例映射是由於降解?
您能否將這些文件的質量指標以及其他相同運行的質量指標添加到問題中?
這些樣品可能存在低質量的RNA或基因組DNA污染(取決於樣品類型和RNA分離方法)
您從什麼軟件獲得此輸出?
二 答案:
Daniel Standage
2019-01-09 21:06:28 UTC
view on stackexchange narkive permalink

正如@DevonRyan所提到的,這些樣品很可能已降解,這是將其從後續分析中排除的很好理由。

Ian Sudbery
2019-01-10 18:26:17 UTC
view on stackexchange narkive permalink

我希望從全細胞,核糖耗盡的RNA-seq中讀取至少30%的讀物是外顯子。當錯誤時,更少的建議。

除了降解之外,另一個解釋是基因組DNA的污染。從細胞核或細胞質部分獲得的

RNA的外顯子含量可能低於30%,而poly-A選擇的RNA有望更高,更可能達到66%。



該問答將自動從英語翻譯而來。原始內容可在stackexchange上找到,我們感謝它分發的cc by-sa 4.0許可。
Loading...