題:
有哪些可用於生物信息學的雲計算服務?
Peter
2017-06-12 16:51:35 UTC
view on stackexchange narkive permalink

我正在尋找可用於進行生物信息學的雲計算服務。我發現的一個例子是 InsideDNA,當然還有 Amazon。對它們的一些描述將不勝感激。

您還能提及Google計算,並進一步指定您真正想了解的內容嗎?正如我所期望的那樣,否則最終將被關閉。
您想將計算機服務用於什麼?您可以使用大學,研究所或其他學術機構嗎?造成台式機或筆記本電腦不合適的特殊原因嗎?
您對哪種計算感興趣?有專門的生物信息學公司將計算外包給谷歌云或亞馬遜。我認為對於不同類型的計算,您應該聯繫其他公司。
目前,這只是一個理論上的問題,因為我大學的計算設備足以進行RNA序列數據分析。我只是在尋找提供此服務的公司的簡單列表,因為簡單的搜索不會返回很多。在理想的環境中,我不依賴於預安裝的軟件(即可以安裝軟件),命令行(bash)的交互速度很快,而且我可以信任公司進行備份等,因此,我對安裝位置也很感興趣供應商,已經有多長時間了,以及他們擁有的計算資源。
我認為這不是一個好問題,因為沒有一個好的答案(或者至少答案應該是列表,而不是一個提供程序),所以我將鏈接我知道的提供程序:[DNAnexus](https:/ /www.dnanexus.com /)(私人)和[Vital-it](http://www.vital-it.ch/)(學術)
這篇文章太廣泛了。
相關文章:https://www.biostars.org/p/86463/
您打算進行哪種生物信息學分析?
@arupgsh參閱我的評論
我之所以擱置它,是因為要求這樣的列表確實不是非常適合問答格式,更適合諸如可以進行討論的論壇之類的問題。請參閱[此舊博客文章](https://stackoverflow.blog/2010/11/23/qa-is-hard-lets-go-shopping/),以了解考慮此類問題的一般原理。
七 答案:
Chris_Rands
2017-06-12 17:51:04 UTC
view on stackexchange narkive permalink

我試用了免費版本的InsideDNA,這些是我的注意事項:

  • 費用:一支5人的團隊(存儲容量為50TB)/月225美元/月,或10TB的存儲空間每月45美元/月適用於個人(假設6個月的套餐: https://insidena.me/pricing)。
  • 安裝的軟件:大約600種生物信息學工具和標準命令行工具;某些缺少的常用工具(如 CD-HIT),但應該可以應要求安裝。
  • 作業:提交的每個作業最多32個CPU和208 RAM。測試工作通常可以進行,儘管較大的測試工作會失敗。
  • 其他要點:命令行有時很慢, wget 查詢很慢,而 scp 受阻。但是,這些可能是可以解決的問題。

總的來說,我認為InsideDNA對於沒有自己的計算基礎結構的團體可能有用,並且可以輕鬆地在團體之間共享資源。提供的軟件包似乎並不昂貴,但是我遇到了一些問題,而且我不知道他們的系統管理員支持會如何。

我沒有使用過Amazon服務,因此無法發表評論除了其網站上的詳細信息。還有一些其他公司,例如 Genestack DNAnexus,但我也沒有直接對其進行測試。

Daniel King
2017-07-25 18:07:46 UTC
view on stackexchange narkive permalink

我不確定您要執行哪種生物信息學任務,因此很難給出好的建議。

如果您專門從事統計遺傳學工作,我可以推薦冰雹 [1]。 Hail是用於分析數十TB規模的遺傳數據的開源工具。 Hail的大多數用戶都是在由Google Cloud Platform Dataproc集群支持的Jupyter筆記本電腦中進行科學實驗的。 Hail使您可以執行各種統計遺傳學任務,包括:

  • 用於質量控制的過濾和聚合
  • 子集,線性回歸,線性混合模型回歸和線性負擔測試
  • 用於計算各種相關性的度量的實用程序
  • 主要成分分析
  • 變量拆分
  • 從多種格式導入/導出,包括PLINK ,VCF和BGEN,以及
  • 一個Python API,該API允許使用matplotlib之類的庫來繪製分析結果

以專門了解如何將Hail與Google Cloud結合使用在平台筆記本和Jupyter筆記本上,我強烈建議 Liam的Hail論壇帖子中有關其云工具存儲庫的信息

下面是 Hail教程中的一個示例使用Hail進行質量控制並顯示個人的前兩個主要成分的散點圖:

  from hail import * import m atplotlib.pyplot作為pltimport matplotlib.patches作為mpatcheshc = HailContext()table = hc.import_table('data / 1kg_annotations.txt',impute = True).key_by('Sample')common_vds =(hc.read('data / 1kg .vds').annotate_samples_table(table,root ='sa').sample_qc().filter_samples_expr('sa.qc.dpMean > = 4 && sa.qc.callRate > = 0.97')(let .filter_genotype =((g.isHomRef && ab < = 0.1)中的g.ad [1] / g.ad.sum()
(例如g.isHet && ab > = 0.25 && ab < = 0.75)|| (g.isHomVar && ab > = 0.9))''')).variant_qc().filter_variants_expr('va.qc.AF > 0.01').ld_prune(memory_per_core = 512,num_cores =(4)) 'sa.pca',k = 5,特徵值='global.eigen')pca_table = pca.samples_table()。to_pandas()colors = {'AFR':'green','AMR':'red','EAS ':“黑色”,“ EUR”:“藍色”,“ SAS”:“青色”} plt.scatter(pca_table [“ sa.pca.PC1”],pca_table [“ sa.pca.PC2”],c = pca_table [“ sa.SuperPopulation”]。map(colors),alpha = .5)plt.xlim(-0.6,0.6)plt.xlabel(“ PC1”)plt.ylabel(“ PC2”)legend_entries = [mpatches.Patch (color = c,label = pheno)表示pheno,c在colors.items()] plt.legend(handles = legend_entries,loc = 2)plt.show() 

[1 ]免責聲明:我在冰雹上工作

G_Hannigan
2017-06-12 18:56:06 UTC
view on stackexchange narkive permalink

根據您的應用程序和用途,您可能有興趣簽出 CyVerse。它是由NSF資助的一項計劃,可為您提供數據存儲,高性能計算資源以及對常用工具的輕鬆訪問。據我所知,一旦您擁有帳戶,便可以免費使用。我通常還會遇到將其與植物和微生物基因組學一起使用的情況,因此不確定如何將其與人類基因組學項目一起使用。但至少值得一試。 :)

更多信息: http://www.cyverse.org/about

woemler
2017-06-14 01:46:40 UTC
view on stackexchange narkive permalink

這確實取決於您要執行的操作,但是我知道一些以下服務。

exaudio
2017-06-13 01:17:58 UTC
view on stackexchange narkive permalink

Google Genomics

Google有一個名為 Google Genomics的API。

SNPedia

“ SNPedia是研究人類遺傳學的維基百科。“ snpedia.com

Promethease

” Promethease是建立個人DNA報告的文獻檢索系統“ promethease.com

DNA Land

“將DNA與來自不同種群的參考數據進行比較” dna.land

CyDAS項目

,還有CyDAS項目,該項目的API可以分析ISCN公式。按照他們的網站的網站:他們的API“讓您分析染色體核型,以便從染色體核型及其中的重排中提取幾乎所有信息:染色體物質的得失,斷裂點,連接處……”這是一項免費服務,但我不知道它的最新情況。

alpha_989
2017-08-07 03:47:17 UTC
view on stackexchange narkive permalink

有很多噸。在每個人都提到的優秀作品之上

  1. iRods

  2. Arvados

  3. Galaxy

  4. ol>
Galaxy和iRods都不是雲計算服務。我懷疑Arvados也不是,但我從未使用過它。


該問答將自動從英語翻譯而來。原始內容可在stackexchange上找到,我們感謝它分發的cc by-sa 3.0許可。
Loading...