當前位置:
首頁 > 最新 > 蛋白基因組學在微生物研究中應用

蛋白基因組學在微生物研究中應用

近些年,二代測序技術的發展揭示了越來越多的微生物全基因組序列,提供了豐富基因層面信息。基於質譜的蛋白組技術進一步提供了蛋白層面的數據,在基因注釋、蛋白表達等研究中展現出很強的實力。

蛋白基因組學(proteogenomics)的概念首次在2004年由George Church團隊提出,他們利用這一技術改進了支原體肺炎的基因組注釋。蛋白基因組學整合了基因組和蛋白質組數據,是多組學(multi-omics)的重要研究方法之一。

目前在微生物研究中,蛋白基因組學主要用來輔助基因組注釋,研究蛋白組的複雜性,如新的蛋白編碼區域(包括小編碼閱讀框),同時可以幫助發現新的翻譯起始位點,轉錄本isoform以及序列變異。下面我們就結合案例來說明:

方向一

矯正已有的基因組

儘管基因測序技術的發展使得越來越多的物種基因組公佈於眾,基於生物信息預測的基因識別和功能注釋仍然存在很多盲點。一方面,除了非編碼基因,假基因等「垃圾」DNA被重新認識和研究外,編碼基因的注釋依然存在很多的缺失和錯誤。

蛋白質基因組學利用質譜數據比對多個來源的蛋白翻譯資料庫,新注釋:1)確認以前注釋的ORFs;2)結合質譜數據對相似的ORFs進行修正;3)發現未注釋的ORFs。這種基於質譜的蛋白數據比單獨依靠基因組的結果更為明確和可信,因此將蛋白質譜的數據與基因組數據整合可以極大地提高基因組注釋。

中文題目:蛋白質基因組學補充注釋布魯氏菌疫苗株基因組

發表期刊:BMC genomics

影響因子:3.729

發表時間:2017

內容概述:

本文採用蛋白質譜技術對布魯氏菌疫苗株104 M進行研究,通過搜索UniProt和自建菌株的6 frame翻譯庫,通過篩選2個以上unique肽段,共鑒定到1729個蛋白,佔UniProt蛋白(3072個)的56.3%;質譜數據通過搜索6 frame翻譯庫再去比對布魯氏菌疫苗株104M,有74個肽段不能匹配,結果發現了6個新的編碼區和修正了3個已存在的閱讀框。總之,蛋白質譜提供了蛋白層面的信息,對已有基因組的注釋信息進行很好的校正(圖1)。

圖1.研究技術流程圖

方向二

非傳統編碼區域的蛋白研究

如上所述,蛋白基因組學在基因編碼區建立資料庫,進而對質譜數據進行搜庫,鑒定出一些公認長的蛋白,從而可以幫助重新注釋一些序列。除此之外,還可以通過基因組不同區域序列信息(UTR,noncoding-RNA區,基因間區等),建立特定的3框或6框讀碼翻譯的蛋白庫(如已建立的TISdb,HaltORF,UTRdb,uORFdb以及sORFdb等),進而在非傳統編碼區域中發現一些新的蛋白。

中文題目:蛋白基因組學發現酵母中新的蛋白

發表期刊:J Proteome Res

影響因子:4.268

發表時間:2015

內容概述:

作為一種模式生物,酵母基因組比較小,相對預測的ORF也較簡單,基因組的注釋也相對比較成熟。但是通過蛋白質基因組研究仍能發現酵母基因組的一些新的特徵。本文通過建立基因間區(intergenic regions)的特殊資料庫,利用質譜數據比對,發現一些新的未注釋的小ORFs(

圖2.蛋白質基因組發現酵母新的功能性小肽

方向三

菌株間變異比較研究

基因組測序揭示了同種微生物不同分離株(isolate)之間大量的遺傳多態性,可能引起不同的臨床表型。蛋白質組學數據能從蛋白層面提供菌株的差異信息,對基因測序進行很好的補充。然而,常規蛋白組學資料庫通常基於某一種菌株參考基因組,因此無法比較菌株間的蛋白水平變異,從而影響對菌株表型和致病力的深入研究。

中文題目:蛋白基因組學研究臨床分離菌株的變異

發表期刊:J Proteome Res

影響因子:4.268

發表時間:2017

內容概述:

結核分枝桿菌(Mycobacterium tuberculosis)有大量不同的菌株(strain),呈現出不同毒力特徵。實驗株H37Rv全基因組測序完成並不能完全解釋致病性機制和菌株間毒力的差異,因此,近年來多種結核分枝桿菌M. tuberculosiscomplex的全基因組的測序完成,揭示了不同菌株間存在大量的遺傳多態性。

蛋白質組學數據能從蛋白層面提供菌株的差異信息,對基因測序進行很好的補充。然而,只針對H37Rv參考基因組翻譯的蛋白庫的搜索,一方面無法比較菌株間的蛋白水平變異;另一方面,還會降低蛋白鑒定的靈敏度,同時容易鑒定出很多假陽性的蛋白。

本文對結核分枝桿菌臨床分離株(SAWC3517和SAWC3651)的基因組和蛋白組同時測序,通過比對自定義(bespoke)的菌株特異蛋白資料庫(strain-specific proteome databases),共鑒定了59個單氨基酸變異的蛋白,佔總的非同義突變SNV的9%,同時鑒定到29個新的蛋白。通過整合基因組和蛋白組數據,可以進一步了解臨床分離株的變異與表型差異以及致病機理。

實驗設計:

圖3.蛋白基因組學研究菌株變異流程圖

總之,將基因組學和蛋白組學整合一起的蛋白基因組學能夠相互補充,會在微生物領域得到越來越多的應用。一方面,通過測序技術建立各種自定義的蛋白庫,能夠更好地鑒定各種菌株蛋白和差異;另一方面,質譜數據也能對已知基因組序列進行校正以及發現新的編碼區域。

參考文獻:

Zai, X., et al. (2017). A comprehensive proteogenomic study of the human Brucella vaccine strain 104 M. BMC Genomics 18(1): 402.

Yagoub, D., et al. (2015). Proteogenomic Discovery of a Small, Novel Protein in Yeast Reveals a Strategy for the Detection of Unannotated Short Open Reading Frames." J Proteome Res 14(12): 5038-5047.

Heunis, T., et al. (2017). Proteogenomic Investigation of Strain Variation in Clinical Mycobacterium tuberculosis Isolates. J Proteome Res 16(10): 3841-3851.


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 美吉生物 的精彩文章:

這不是一張簡單的圖譜,你的子孫18代,都將由它來定

TAG:美吉生物 |