題:
如何在肽質譜法中將測得的比率與計算的比率進行比較?
Max Jonatan Karlsson
2017-06-09 20:09:55 UTC
view on stackexchange narkive permalink
我在樣品(1)和具有這些內標以及約30種肽的樣品(2)中有兩組不同的內標。每個肽具有這些標準中的一種。從樣品1中,我可以獲得標準品1(S1)與標準品2(S2)之間的真實比率,從樣品2中,我可以獲得分析物(L)與每種標準品之間的比率:

樣品1:S1 / S2

樣品2:L / S1,L / S2

I因此,我可以根據樣品2中測得的比率來計算比率S1 / S2。重複進行5次技術重複(即,向LC-質譜儀進樣5次),因此一種特定分析物的S1 / S2比看起來像這樣(模擬數據):

 測得的計算值0 .967 0.9871.007 0.9671.044 1.0121.041 1.0251.048 1.046  

我想將測得的比率與計算得出的比率進行比較,以查看我的數據採集中是否存在任何偏差。由於計算出的比率和測得的比率來自不同的樣本,因此重複項不是“鏈接”的,因此無法使用例如Bland Altman分析。我應該使用某種方差分析嗎?還是您有其他建議?

我還想對所有30種肽的比率進行總體評估,以了解不同肽的偏倚是否不同。我該怎麼辦?

任何輸入將不勝感激。

麥克斯·喬納森·卡爾森(Max Jonatan Karlsson),您好,感謝您的提問,並歡迎您訪問生物信息學堆棧交換。我對這個問題的第一眼乍看表明它可能是一個純粹的統計問題,因此在stats Stack Exchange,[Cross Validated](https://stats.stackexchange.com/)上更合適。如果您可以提供更多背景/故事來說明計算機科學和/或生物學知識將如何幫助解決該問題(例如,您正在計算數千個此類統計信息),請隨時更新您的問題。
我之所以將其發佈在這裡是因為它是蛋白質組學數據,但是我刪除了上下文,因為我認為它對這個問題並不重要。我認為您認為這屬於統計數據是正確的,因此我將在此處發布我的問題,並在此處根據情況更新問題。謝謝!
上下文對於生物信息學問題總是很有幫助的。通常情況下,有多個服務於相同目的的工具,並且最佳工具(或多個工具)可以根據問題的性質進行更改。上下文還有助於識別核心問題與問題不匹配的時間(即[XY問題](http://xyproblem.info/));在這裡似乎不是這種情況,但是將來在問問題時要牢記。
一 回答:
winni2k
2017-06-10 20:40:21 UTC
view on stackexchange narkive permalink

從統計的角度來看,比率之所以令人討厭,是因為比率的採樣分佈的方差隨著對分子和分母進行採樣以創建比率而減小。如果您可以分別獲得分子和分母,那麼您絕對應該這樣做,並查看基於計數的檢驗,例如卡方檢驗,Fisher精確檢驗或泊松回歸。

也就是說,如果滿足假設,則在兩個樣本的情況下t檢驗將是適當的。您需要檢查兩個樣本是否均呈正態分佈,最好是通過qq-plot進行檢查。您還需要檢查兩個樣本的方差,並選擇t檢驗的變體,該變體假設或不假設方差相等。

如果樣本不是正態分佈的,那麼下一個方法是 Mann-Whitney U測試。



該問答將自動從英語翻譯而來。原始內容可在stackexchange上找到,我們感謝它分發的cc by-sa 3.0許可。
Loading...