題:
如何在R中的基因列表上進行功能分析?
J0HN_TIT0R
2017-06-12 22:45:52 UTC
view on stackexchange narkive permalink

從RNA序列實驗中,我有2種樣品條件的大約17000個基因id,根據與對照相比它們的log2倍變化進行排列。我需要對它們進行批註,但是我以前從未做過批註,並且想知道如何在R中進行此批註。

我對所涉及基因的途徑的上調和下調感興趣。我也想獲得豐富和p值分析。我很感興趣R中是否存在與PANTHER類似的軟件包以進行此分析。我一直在閱讀不同的註釋程序如何更好或更壞。似乎PANTHER比DAVID更好,所以我想知道是否有一個軟件包可以在R中提供類似PANTHER的分析。

似乎有多個軟件包可用,是否有任何突出的軟件包?最好?

我主要對人類樣品和註釋途徑感興趣。

我已使用該信息更新了您的問題。您目前擁有哪些基因ID(例如Ensembl,refseq等)?
您如何定義最佳?您想知道什麼,協調的基因,下調或上調的途徑?您想要GSEA單樣本還是整體樣本,有競爭性還是非競爭性?對我來說,這個問題就像我有一個數字列表,我想進行一些操作以獲得最重要的數字,哪種方法可用?
@J0HN_TIT0R回答評論者使用@暱稱。請[編輯]問題以包括此新信息。
就目前而言,這個問題是無法回答的。 @J0HN_TIT0R您沒有提供足夠的背景信息來了解*感興趣的功能以及原因。:這在很大程度上決定了我們可以推薦的濃縮和富集工具。另外,在SE上不建議有關“最佳工具”的問題,因為它們主要基於意見。
三 答案:
Devon Ryan
2017-06-13 02:52:41 UTC
view on stackexchange narkive permalink

注意,我避免討論“最佳”,因為這幾乎不可能回答。

您的問題實際上可以分為兩個部分:

  1. 什麼是路徑分析的好工具(理想情況下在R中)?
  2. 什麼是路徑信息的良好來源?
  3. ol>

    對於(1),有幾種不同的可能性,但我更喜歡使用limma或goseq(獨立的生物導體包裝)中的烤肉或攝像頭。在這些工具中,我認為烤或goseq所做的與黑豹所做的最相似,因為它們沒有競爭力。但是,由於基因之間確實存在相關性,因此我更喜歡像相機提供的競爭性測試。

    對於(2),您的選擇基本上是 KEGG reactome。 KEGG是有問題的,因為您最近需要任何遠程許可(有一些R軟件包可以解決這個問題,但是我不知道它們在法律上有多嚴謹)。鑑於此,reactome可能是您最好的選擇。

    所有這些都寫完了,最好的數據庫就是 IPA的用途。這是一種商業產品(我沒有從屬關係),但是您可以獲得一個演示許可證,該許可證至少可以使用幾個星期。如果您要進行相對頻繁的分析,那麼花一些現金購買許可證(也許可以與附近的團體共享)是很有意義的。

    無論使用什麼,都可能要使用 pathview,它可以產生與途徑豐富相關的易於解釋的圖。

我不同意IPA是最好的(我認為您想避免答案中的“最好”)。 IPA是商業性的,不是透明的,而是黑匣子。您必須相信,該公司在將數據庫隱藏在幕後的過程中做得很好,這實際上不是科學的方法。只是我的想法。
llrs
2017-06-13 20:23:02 UTC
view on stackexchange narkive permalink

您請求的工具與 PANTHER類似,但在R中。首先,PANTHER(蛋白質分析通過進化關係)工具基於與進化相關的蛋白質,基因本體(分子功能和生物學)進行分類

AFAIK。R中沒有一個工具可以將所有這些都集成到一個工具中,但是有幾個軟件包可以完成這些工作。但是,我幾次使用它後發現,它是基於基因本體論的。基因本體論(GO)並非途徑,但是我找到的用於GO的最佳工具是 topGO(有點難用,但對於深入了解生物學很有用),可以測試術語中的表示形式給定列表。

Erik
2018-05-04 03:28:30 UTC
view on stackexchange narkive permalink

我會選擇topGO軟件包。管道中的邏輯步驟將是:

1)用以下變量構建矩陣:

| gene_ID | GO_ID | GO_term_description |您可以輸入uniprot ID列表到uniprotkb並在列表/文件中檢索每個基因的GO註釋

2)過濾器,列出在差異表達分析中捕獲的基因,即使它們沒有差異表達。此過濾器由DESeq / Sleuth定義,“至少在49%的文庫中有至少4個讀取計數”

3)將此基因列表定義為gene_universe

4)定義您的設置基因並獲取gene_ID,如果可能,還可以獲取您感興趣的基因的排名得分(p-val / FDR)

5)繪製圖表並獲取豐富的GO項表(這些無需執行校正分析即可按p值進行排名

注意:您將需要一些數據操作功能;我會閱讀“ tidyverse”文檔 ​​p>



該問答將自動從英語翻譯而來。原始內容可在stackexchange上找到,我們感謝它分發的cc by-sa 3.0許可。
Loading...