題:
具有常見癌症突變的GRCh38 vcf文件
719016
2017-06-15 16:56:52 UTC
view on stackexchange narkive permalink

GRCh38程序集上是否有一個vcf文件,該文件帶有可以下載的常見癌症突變?也許是來自國際最大的癌症基因組學聯盟之一?

我的意思是,我的意思是發現了在不同類型的癌症中都會復發的突變。

您將如何定義呢? > 1種癌症類型中有任何變體嗎?有多少患者?那麼,您是否需要排除僅在一種癌症中發現的變異?這些應該僅僅是因果變體嗎?如果在三名不同的癌症患者中發現了一個變異體,但與他們的癌症絕對沒有聯繫,該怎麼辦?是的,這不僅是可能的,而且幾乎肯定會發生,因為許多變體在人群中非常普遍。您是否想通過變體頻率來限制它?請[編輯]您的問題並縮小範圍。
@terdon聽起來您好像在假設他正在進行種群遺傳學,事實可能並非如此。在癌症遺傳學中,他們通常只關心體細胞變異,因此會自動排除“變異在人群中非常普遍”。我想這個問題真正需要的是對種係與體細胞突變的澄清。
三 答案:
burger
2017-06-18 22:04:43 UTC
view on stackexchange narkive permalink

如果您正在尋找癌症突變,則主要資源是COSMIC,它們提供GRCh38 VCF。下載頁面在這裡: http://cancer.sanger.ac.uk/cosmic/download

由您決定如何定義“ common”,但是VCF包含許多您可以使用的信息。

terdon
2017-06-15 17:55:47 UTC
view on stackexchange narkive permalink

您的問題沒有提供足夠的信息來解答特定問題,但這應該是一個開始。

  1. 從NCBI獲取描述Clinvar中所有變體的VCF文件: p>

      wget ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/vcf_GRCh38/clinvar.vcf.gz  
  2. 提取其VCF行中包含“ cancer”一詞的所有變體:

      zgrep -iE'^#| CLNDBN = [^;] * cancer'clinvar.vcf.gz > Cancer.vcf  
  3. ol>

    現在,您可能應該根據變異頻率,癌症類型等進一步過濾,但這應該是一個好的開始。

gringer
2017-06-15 18:22:39 UTC
view on stackexchange narkive permalink

尋找與癌症相關的變體的麻煩在於,很難從致病變體中找出虛假的影響(例如種族)。如果您對大多數癌症類型中涉及的基因感興趣,那麼NanoString面板的註釋就相當不錯:

這些頁面的“支持文檔”部分具有指向帶有基因列表和探針的Excel文件的鏈接。序列。儘管這些列表沒有提供有關破壞功能的變體的信息,但我仍在努力思考為什麼提前知道為什麼有用,除非其目的是通過CRISPR或類似方法誘導癌症。 >



該問答將自動從英語翻譯而來。原始內容可在stackexchange上找到,我們感謝它分發的cc by-sa 3.0許可。
Loading...