我有一個轉錄因子列表,我感興趣的是找出與該轉錄因子形成轉錄因子復合物的結果可能轉錄哪些基因。
關於好的數據庫的任何想法?我已經看到ENCODE託管來自CHIPseq實驗的數據,但是我不確定是否可以從該站點找到有關交互作用的結論。我正在尋找具有已知或推定的轉錄/基因相互作用的數據庫。
在此先感謝
。我有一個轉錄因子列表,我感興趣的是找出與該轉錄因子形成轉錄因子復合物的結果可能轉錄哪些基因。
關於好的數據庫的任何想法?我已經看到ENCODE託管來自CHIPseq實驗的數據,但是我不確定是否可以從該站點找到有關交互作用的結論。我正在尋找具有已知或推定的轉錄/基因相互作用的數據庫。
在此先感謝
。MSigDB具有一個與轉錄因子靶標相對應的基因集(C3:TFT)。
Harmonizome具有從中提取的基因的功能性術語超過一百種公共可用資源。
iRegulon採用基於序列的方法來查找轉錄因子靶標。有一個Cytoscape應用程序可用於查找給定基因列表的調節子或特定轉錄因子的靶標。
轉錄因子結合位點是通過使用位置權重矩陣(PWM)的集合來預測的來自許多來源,包括Jaspar和TRANSFAC。
iRegulon:從基因列表到使用大型主題和跟踪集合PLoS Comput Biol的基因調控網絡。 2014年7月24日; 10(7):e1003731。 doi: 10.1371 / journal.pcbi.1003731。 eCollection 2014年7月。
通常,有兩種選擇來識別轉錄因子的靶標:實驗(ChIP-seq)和基於序列的預測。
產生轉錄因子結合數據並量化其在整個基因組中的峰的多個項目。這樣做的好處是,您知道綁定實際上發生了,這與主題預測相反。但是您需要進行相應的實驗。
您已經提到過 ENCODE,它可能是此類數據的最大產生者。 NIH的 Roadmap Epigenomics是另一種方法,但是它只關注TF。
如果您有基因列表,並且想知道可能涉及哪個轉錄因子,則可以對已知TF靶標中的基因進行富集測試。 ChEA(ChIP富集分析)數據庫做到了這一點。
另一種可能性是查看結合基元並查看您的基因列表是否包含這些。但是,如果染色質堆積或啟動子的甲基化狀態不利,則它們將在給定的組織或細胞類型中失活。
例如, JASPAR和 TRANSFAC數據庫或 MSigDB基序基因集(如漢堡所述)。您還可以使用Ensembl基因組數據庫( BioMart, REST)查詢這些功能。
您最有可能希望執行的分析是計算基因列表中的富集,例如可以從兩種情況下的差異表達中得到。
最方便的方法是使用 Enrichr平台,該平台是一個接受基因列表並可以計算ChEA,JASPAR,TRANSFAC等。您也可以下載其基因集。