stack_learner
2018-05-07 20:49:42 UTC
對齊步驟後,我檢查了所有樣本的rnaseq指標。在40個樣本中,三個樣本顯示映射到內含子區域的讀數的百分比很高。可能是什麼原因?樣本3 529618(7.3%)3934615(54.5%)2750720(38.1%)
我還發現58k個基因中的35-40k個基因的讀計數為“零”。這是由於污染造成的嗎?可能是什麼原因?讀到映射到外顯子,內含子,基因間的信息是什麼?
更新:我使用了hisat2進行比對。我使用了hisat2網站上的人類基因組“ grch38_snp_tran”。庫是使用核醣體耗竭試劑盒生成的。
這些樣品的總體比對速率與其他具有更合理的內含子比對速率的樣品相比如何?
我看到所有37個樣本的總體對齊率在90-96%之間,而這3個樣本的總體對齊率分別為69%,79%和70%。
聽起來您的樣本質量下降了
你的意思是那三個樣本被降解了嗎?我現在該怎麼辦?我應該刪除它們以進行進一步分析嗎?
這可能是原因,但無論您應排除它們。
當然。到內含子區域的高比例映射是由於降解?
您能否將這些文件的質量指標以及其他相同運行的質量指標添加到問題中?
這些樣品可能存在低質量的RNA或基因組DNA污染(取決於樣品類型和RNA分離方法)
您從什麼軟件獲得此輸出?