檢測具有高度微生物相似性的人類蛋白質部分

bluescholar1212

2017-06-08 03:30:55 UTC

view on stackexchange narkive permalink

我是生物信息學的新來者，需要幫助解決問題。

我的目標是列出人類蛋白質列表，並鑑定區段（長度為13-17aa））與微生物序列高度相似。理想情況下，我想從FASTA序列列表開始，並有一種簡單的方法來生成每種蛋白質的相應高相似性片段的輸出。

有沒有我應該知道的現有工具或軟件

這將使我的生活更輕鬆嗎？

加載：）您能否[編輯]您的問題並告訴我們，我）您正在談論多少序列； ii）您是否已經有人類蛋白質序列或僅具有其名稱； iii）如果您只是在尋找簡單的序列同源性，或者您將使用該同源性推斷功能同源性（在這種情況下，應考慮蛋白質結構域）； iv）為什麼要特別指定13-17aa？ v）什麼微生物種類？任何？具體的？

嗨，bluescholar1212，謝謝您的提問，並歡迎您參加生物信息學堆棧交換。生物信息學是一個廣闊的領域，可以包括許多不同的程序，這些程序可以使您的生活更輕鬆，幾乎所有這些程序都與微生物同源性無關。在您提出的問題中更加具體可以對答題者有很大幫助，因為它可以使他們回答而不會走錯路。您對哪種輸出感興趣？您已經提到存在一個問題，但尚未說明該問題是什麼。關於您要解決的問題，您的情況如何？

歡迎來到Bioinformatics.SE！只是要弄亂頭髮：）…您需要謹慎使用諸如“高同源性”之類的術語。序列是同源的（共有譜系）或非同源的。序列相似性是同源性的常用代理，因此**高相似性**是適當的。但是沒有同源性的滑動尺度。一些序列對是如此相似，以至於唯一可行的解釋是共有血統。有些差異如此之大，以至於顯然沒有同源性。中間有一些灰色區域，但這僅表示不確定性。希望這有道理！

我同意@daniel-standage,，沒有“高度同源性”或“高同源性片段”。這些片段是否同源。這就像說懷孕程度很高。也許您可以將術語替換為“高同源性”？

@DanielStandage由於我們正在分裂頭髮，如果您回到足夠遠的距離，如果您接受了生命的單一起源，那麼所有序列都有共同的祖先

@Chris_Rands確實足夠。 :-)

@DanielStandage充分說明！這是一個好而重要的一點。我對序列相似性很高的區域感興趣，這不一定意味著您指出的同源性。

-1