我試用了免費版本的InsideDNA,這些是我的注意事項:
wget
查詢很慢,而 scp
受阻。但是,這些可能是可以解決的問題。總的來說,我認為InsideDNA對於沒有自己的計算基礎結構的團體可能有用,並且可以輕鬆地在團體之間共享資源。提供的軟件包似乎並不昂貴,但是我遇到了一些問題,而且我不知道他們的系統管理員支持會如何。
我沒有使用過Amazon服務,因此無法發表評論除了其網站上的詳細信息。還有一些其他公司,例如 Genestack和 DNAnexus,但我也沒有直接對其進行測試。
我不確定您要執行哪種生物信息學任務,因此很難給出好的建議。
如果您專門從事統計遺傳學工作,我可以推薦冰雹 [1]。 Hail是用於分析數十TB規模的遺傳數據的開源工具。 Hail的大多數用戶都是在由Google Cloud Platform Dataproc集群支持的Jupyter筆記本電腦中進行科學實驗的。 Hail使您可以執行各種統計遺傳學任務,包括:
以專門了解如何將Hail與Google Cloud結合使用在平台筆記本和Jupyter筆記本上,我強烈建議 Liam的Hail論壇帖子中有關其云工具存儲庫的信息。
下面是 Hail教程中的一個示例使用Hail進行質量控制並顯示個人的前兩個主要成分的散點圖:
from hail import * import m atplotlib.pyplot作為pltimport matplotlib.patches作為mpatcheshc = HailContext()table = hc.import_table('data / 1kg_annotations.txt',impute = True).key_by('Sample')common_vds =(hc.read('data / 1kg .vds').annotate_samples_table(table,root ='sa').sample_qc().filter_samples_expr('sa.qc.dpMean > = 4 && sa.qc.callRate > = 0.97')(let .filter_genotype =((g.isHomRef && ab < = 0.1)中的g.ad [1] / g.ad.sum()
(例如g.isHet && ab > = 0.25 && ab < = 0.75)|| (g.isHomVar && ab > = 0.9))''')).variant_qc().filter_variants_expr('va.qc.AF > 0.01').ld_prune(memory_per_core = 512,num_cores =(4)) 'sa.pca',k = 5,特徵值='global.eigen')pca_table = pca.samples_table()。to_pandas()colors = {'AFR':'green','AMR':'red','EAS ':“黑色”,“ EUR”:“藍色”,“ SAS”:“青色”} plt.scatter(pca_table [“ sa.pca.PC1”],pca_table [“ sa.pca.PC2”],c = pca_table [“ sa.SuperPopulation”]。map(colors),alpha = .5)plt.xlim(-0.6,0.6)plt.xlabel(“ PC1”)plt.ylabel(“ PC2”)legend_entries = [mpatches.Patch (color = c,label = pheno)表示pheno,c在colors.items()] plt.legend(handles = legend_entries,loc = 2)plt.show()
[1 ]免責聲明:我在冰雹上工作
根據您的應用程序和用途,您可能有興趣簽出 CyVerse。它是由NSF資助的一項計劃,可為您提供數據存儲,高性能計算資源以及對常用工具的輕鬆訪問。據我所知,一旦您擁有帳戶,便可以免費使用。我通常還會遇到將其與植物和微生物基因組學一起使用的情況,因此不確定如何將其與人類基因組學項目一起使用。但至少值得一試。 :)
這確實取決於您要執行的操作,但是我知道一些以下服務。
Google有一個名為 Google Genomics的API。
“ SNPedia是研究人類遺傳學的維基百科。“ snpedia.com
” Promethease是建立個人DNA報告的文獻檢索系統“ promethease.com
“將DNA與來自不同種群的參考數據進行比較” dna.land
,還有CyDAS項目,該項目的API可以分析ISCN公式。按照他們的網站的網站:他們的API“讓您分析染色體核型,以便從染色體核型及其中的重排中提取幾乎所有信息:染色體物質的得失,斷裂點,連接處……”這是一項免費服務,但我不知道它的最新情況。
DNAnexus- http://dnanexus.com
BaseSpace- http://basespace.illumina.com
七橋基因組學- http://www.sbgenomics.com
Curverse http://curoverse.com
InsideDNA http://insidena.me/