ERCC插入是為RNA-Seq開發的一組合成對照。我對使用它來標準化我的RNA-Seq樣本感興趣。特別是,我想使用附加功能消除技術偏見和任何不應該屬於我的分析的變化。
該網站未提供有關如何執行此操作的任何詳細信息。
問題::可能的歸一化策略是什麼?您能簡要描述一下嗎?
ERCC插入是為RNA-Seq開發的一組合成對照。我對使用它來標準化我的RNA-Seq樣本感興趣。特別是,我想使用附加功能消除技術偏見和任何不應該屬於我的分析的變化。
該網站未提供有關如何執行此操作的任何詳細信息。
問題::可能的歸一化策略是什麼?您能簡要描述一下嗎?
您可以考慮使用 RUVSeq。以下是 2013 Nature Biotechnology出版物的摘錄:
我們評估了外部RNA控制聯盟(ERCC)插入控制的性能,並研究了直接使用它們進行歸一化。我們顯示,刺入信號不夠可靠,無法在標準的全局縮放或基於回歸的標準化過程中使用。我們提出了一種標準化策略,稱為“消除不必要的變異(RUV)”,它可以通過對合適的一組對照基因(例如ERCC刺入基因)或樣品(例如復製文庫)進行因子分析來調整有害的技術效果。
RUVSeq本質上適合表達式數據的廣義線性模型(GLM),其中表達式矩陣$ Y $是$ m $ x $ n $矩陣,其中$ m $是樣本數$ n $個基因的數量。模型歸結為
$ Y = X * \ beta + Z * \ gamma + W * \ alpha + \ epsilon $
,其中$ X $描述了感興趣的條件(例如治療與對照),$ Z $描述觀察到的協變量(例如性別),$ W $描述未觀察到的協變量(例如批次,溫度,實驗室)。 $ \ beta $,$ \ gamma $和$ \ alpha $是參數矩陣,記錄$ X $,$ Z $和$ W $的貢獻,而$ \ epsilon $是隨機噪聲。對於經過精心挑選的基因(例如ERCC插入基因,管家基因或技術複製品)的子集,我們可以假設$ X $和$ Z $為零,並找到$ W $-樣本中的“不需要的變異”。
我們已在所有RNASeq數據中添加了ERCC插件,以防萬一其他人將來發現它有用。但是,我從未在自己的分析中使用過它,因為我想不出可以使用它的合理方式。
ERCC的典型建議是按輸入RNA的量成比例添加它,但這是假設不同細胞的總細胞RNA計數相似(通過查看單細胞RNASeq結果可證明是錯誤的)。結果比從原始讀物中採樣到的“看家”基因集要好。