andresito
2018-03-20 23:08:44 UTC
我有一個這樣的fasta文件:
>Id1ATCCTT>Id2ATTTTCCC>Id3TTTCCCCAAAA>Id4CCCTTTAAA
我想刪除具有以下ID的序列。 > Id2Id3
ID位於.txt文件中,文本文件將用於匹配和刪除這些序列。
我的輸出應該是這樣的 fasta
文件
>Id1ATCCTT>Id4CCCTTTAAA
但是我想要 awk
和/或 sed
和/或 bash
(沒有python或perl)。
我該怎麼做?
為什麼要限制語言?
確實:使用正確的工具完成工作。除非您可以對輸入文件做出非常嚴格的假設,否則請使用適當的FASTA解析器,而不要使用一些黑手黨的混蛋。
如果在截止日期之前完成工作,則使用您想使用的任何工具。與Unix工具相比,許多解析器的速度都慢得多,但是我承認,它們在理解事物如何工作方面花了很多精力。