題:
下載多個SRA文件
user2300940
2017-10-17 00:23:49 UTC
view on stackexchange narkive permalink

我想從以下項目下載所有SRA文件。是否可以同時下載所有SRA文件?

您可以使用R / Bioconductor軟件包[SRAdb](https://www.bioconductor.org/packages/release/bioc/html/SRAdb.html)
@JohnBlischak如果擴展解釋SRAdb如何幫助回答問題,則可能是一個答案
五 答案:
benn
2017-10-17 12:46:11 UTC
view on stackexchange narkive permalink

快速瀏覽一下您的鏈接,可以知道SRR編號從SRR837819到SRR837856。您可以使用sratoolkit中的fastq-dump,並在bash中對其進行for循環。

這樣的方法應該起作用:

  for((i = 19;我< = 56; i ++))做fastq-dump --accession SRR8378 $ idone  

在閱讀 Devon Ryan的答案後,我意識到您要求SRA文件而不是fastq。也可以通過預取sratoolkit來完成:

  for((i = 19; i < = 56; i ++))做預取SRR8378 $ idone  
Eric A Brenner
2017-10-17 04:35:59 UTC
view on stackexchange narkive permalink

假設您最終只想要fastq文件,並且知道SRR(運行)編號,那麼我可以從此處下載它們: ftp://ftp.sra.ebi.ac.uk/vol1/fastq/

關於下載多個文件,我剛剛使用了多個wget命令。我不知道一種將所有文件下載到一個壓縮文件夾或其他任何文件中的方法:/

Devon Ryan
2017-10-17 13:19:28 UTC
view on stackexchange narkive permalink

我建議您按照 Eric A Brenner的答案中的建議進行操作,然後下載fastq文件。但是,如果由於某些原因確實要使用SRA文件,請注意,您可以使用 parallel-fastq-dump來加快處理速度。一定要遵循有關使用 prefetch 的建議。

您需要將其與 b.nota的答案結合起來(例如,將命令放入 for 循環)。

Kai Fung
2020-04-24 03:06:45 UTC
view on stackexchange narkive permalink

我能夠使用 Entrez Direct和SRA工具包找到解決方案:)如果您有項目編號或 SRA項目編號,則您的名稱為SRP022054對於36個SRA,在這種情況下,您可以使用esearch進行查詢,並使用這種襯裡將其通過管道傳送到SRA工具包中:

esearch -db sra -query SRP022054 | efetch --format運行信息|切-d','-f 1 | grep SRR |頭-5 | xargs fastq-dump --skip-technical --readids --read-filter pass --dumpbase --split-3

rightskewed
2020-04-24 08:36:29 UTC
view on stackexchange narkive permalink

您可以使用 pysradb下載整個項目:

  pysradb下載-p SRP022054  

它保留相同的架構作為SRA。



該問答將自動從英語翻譯而來。原始內容可在stackexchange上找到,我們感謝它分發的cc by-sa 3.0許可。
Loading...