Max Jonatan Karlsson
2017-06-09 20:09:55 UTC
我在樣品(1)和具有這些內標以及約30種肽的樣品(2)中有兩組不同的內標。每個肽具有這些標準中的一種。從樣品1中,我可以獲得標準品1(S1)與標準品2(S2)之間的真實比率,從樣品2中,我可以獲得分析物(L)與每種標準品之間的比率:
樣品1:S1 / S2
樣品2:L / S1,L / S2
I因此,我可以根據樣品2中測得的比率來計算比率S1 / S2。重複進行5次技術重複(即,向LC-質譜儀進樣5次),因此一種特定分析物的S1 / S2比看起來像這樣(模擬數據):
測得的計算值0 .967 0.9871.007 0.9671.044 1.0121.041 1.0251.048 1.046
我想將測得的比率與計算得出的比率進行比較,以查看我的數據採集中是否存在任何偏差。由於計算出的比率和測得的比率來自不同的樣本,因此重複項不是“鏈接”的,因此無法使用例如Bland Altman分析。我應該使用某種方差分析嗎?還是您有其他建議?
我還想對所有30種肽的比率進行總體評估,以了解不同肽的偏倚是否不同。我該怎麼辦?
任何輸入將不勝感激。
麥克斯·喬納森·卡爾森(Max Jonatan Karlsson),您好,感謝您的提問,並歡迎您訪問生物信息學堆棧交換。我對這個問題的第一眼乍看表明它可能是一個純粹的統計問題,因此在stats Stack Exchange,[Cross Validated](https://stats.stackexchange.com/)上更合適。如果您可以提供更多背景/故事來說明計算機科學和/或生物學知識將如何幫助解決該問題(例如,您正在計算數千個此類統計信息),請隨時更新您的問題。
我之所以將其發佈在這裡是因為它是蛋白質組學數據,但是我刪除了上下文,因為我認為它對這個問題並不重要。我認為您認為這屬於統計數據是正確的,因此我將在此處發布我的問題,並在此處根據情況更新問題。謝謝!
上下文對於生物信息學問題總是很有幫助的。通常情況下,有多個服務於相同目的的工具,並且最佳工具(或多個工具)可以根據問題的性質進行更改。上下文還有助於識別核心問題與問題不匹配的時間(即[XY問題](http://xyproblem.info/));在這裡似乎不是這種情況,但是將來在問問題時要牢記。