題:
基因比對的主成分分析和摻混物分析有何不同?
Erin Thompson
2018-04-19 08:32:18 UTC
view on stackexchange narkive permalink

遺傳比對的主成分分析和摻合物分析有何不同?

我的理解是,PCA將在整個比對中獲取原始遺傳差異,並使用降維技術(例如單值分解)將其繪製出來,而Admixture分析將繪製出共享一定數量祖先的可能性,基於等位基因頻率數據。我不了解的是兩者之間的根本區別。也就是說,PCA中發現的每個可變位置是否都不會代表Admixture中使用的等位基因?

二 答案:
juod
2018-04-19 17:38:47 UTC
view on stackexchange narkive permalink

只需在Devon Ryan的精彩摘要中添加一下:混合物分析工具比PCA靈活得多(PCA只是固定的數學運算),因此可以將其設計為合併LD模式,相信息和不同的種群演化模型。

這是FineSTRUCTURE和Chromopainter混合工具創建者的一篇論文,詳細介紹了這兩種工具的作用-似乎它們也提供了與PCA的一些比較: http://journals.plos.org /plosgenetics/article?id=10.1371/journal.pgen.1002453

Devon Ryan
2018-04-19 12:05:14 UTC
view on stackexchange narkive permalink

基本區別主要在於數學。

混合分析涉及假設未知樣本中的基因型(或更可能是基因型可能性)可以通過哈迪-溫伯格平衡建模,這是由來自兩個或多個背景變體源池的組合。然後,產出是混合比例,決定了每個來源人口的主要貢獻百分比(例如23%的愛爾蘭人,15%的挪威人,30%的北非人...)。有很多版本專門用於處理NGS數據集。

PCA是一種非常通用的方法,它使用相同的輸入等位基因信息,但是只需找到該對象的正交投影在較小的維度上最大化第一主成分的方差。您可能已經看到瞭如下圖(來自這篇關於1000個基因組計劃數據的論文):

A figure from the paper

關於種群結構的想法,但是它們對於確定單個樣本最有可能與各個種群相關的作用不是很大。

我還發現混合的k個祖先種群的假設也有所不同。 PCA /混合物在許多方面有所不同,但是混合物和k-均值聚類之間的差異又如何呢?兩者均基於似然性,假設k個來源……差異似乎更加微妙。嗯,也許我應該提一個問題。


該問答將自動從英語翻譯而來。原始內容可在stackexchange上找到,我們感謝它分發的cc by-sa 3.0許可。
Loading...