bluescholar1212
2017-07-27 03:03:37 UTC
我試圖以類似於Web BLAST爆炸打擊分佈圖的圖形顯示方式可視化BLAST搜索結果。
例如,通過我的BLAST搜索:
,除了我希望該圖包含信息,包括有關我的查詢序列中所有6139命中分佈的信息。
由於這是大量序列,可以直觀地顯示分佈,因此我正在考慮使用某個區域的點擊次數得分,並且輸出類似於:
如果要使用BLAST +命令行工具運行blast,並將結果讀入R,則應繪製輸出的哪些部分以重新創建圖形顯示的分佈?理想情況下,我想製作一個可重用的對象,該對象可以對任何BLAST輸入進行等效繪製。
謝謝。
您如何獲得區域點擊次數的分數?我認為您應該首先獲得分數並在R中繪製分數和區域。
爆炸輸出將使用哪種格式?標準規範之一,還是您願意定義自己的規範?這會標出查詢中每個位置的匹配數或它們的得分嗎?還是他們的整體身份?示例軸上的“保護”到底是什麼?
@terdon我不喜歡任何特定類型的爆炸輸出,並且願意為這個問題定義自己的爆炸輸出。我認為我會選擇繪製每個位置的點擊數而不是得分。該[link](https://bcbio.wordpress.com/2009/02/07/automated-protein-conservation-display-from-blast-alignments/)提供了用於在我的環境中製作保護區的方法的說明詳細發布。
但是,如果您不考慮相關HSP的質量,則給定位置的命中數是無用的信息。您似乎想繪製保護區,如果這樣,那是錯誤的方法。例如,您可能在第12位有幾百個匹配,但如果那幾百個都很小並且保存得很差,那麼它們就無關緊要了。
我不想策劃保護措施。我想知道給定人類蛋白質的哪些區域與細菌序列最相似。如果這是我的問題,那麼尺寸/保護度是否一定重要?