當前位置:
首頁 > 最新 > 中國人類基因組研究有望「彎道超車」

中國人類基因組研究有望「彎道超車」

屬於中國人自己獨特的基因「密碼」有望被精準破譯。近日,由哈爾濱工業大學牽頭的國家重點研發計劃精準醫學研究重點專項之「中國十萬人基因組計劃暨中國人群多組學參比資料庫與分析系統建設」項目正式啟動,並進入為期4年的項目實施階段。

「這是我國科學家首次完全自主實施的國家級人類全基因組項目。」項目負責人、哈工大生物信息技術研究院院長王亞東在啟動會上介紹,項目組將選取十萬中國自然人群作為研究對象,進行基因組、暴露組、表型組等組學研究,揭示中國人群特有基因組變異、變異頻率及其影響,最終繪製完成屬於國人自己的基因組變異圖譜和多組學健康地圖。

「目前,我國在人類基因組研究方面的總體科學影響力,還不能認為是達到了國際領先水平。」 中國科學院上海生命科學研究院生物醫學大數據中心首席科學家、中國科學院院士趙國屏評價道,「在組學研究進入大數據時代這個關鍵時刻,結合精準醫療方向實施『中國人群多組學參比資料庫與分析系統建設』這一大研究計劃,輔以正在開展的大規模人群隊列研究和正在籌劃中的『人類表型組』計劃,是我們實現『彎道超車』的大好機遇。」

為什麼要選定「十萬人」

人類基因組變異多數都是無害的,但也有些變異可導致疾病,如癌症、心腦血管疾病、糖尿病等。中國十萬人基因組計劃就是要比較全面而精準地鑒定中國人的基因組變異及相關的其他組學(包括表型組)數據,形成比較完善的基因組變異參比資料庫。這個基本數據基礎,將大大促進我國科學和醫學工作者,鑒定與不同人群表型(包括各種複雜疾病)相關的基因組變異,以利於疾病防治,保證全民健康。

「我國尚未建立高精度的中國人參考基因組,大量精準醫學前沿研究缺少參考數據,已經成為我國精準醫學發展的重大瓶頸問題。」王亞東坦言,啟動中國十萬人基因組計劃就是瞄準了這一瓶頸問題。

王亞東表示,該計劃將構建世界級精度中國人參考基因組和多組學參比資料庫,這是我國精準醫學發展的重要基礎,將滿足精準醫學研究的關鍵共性需求,有助於挖掘健康和疾病的遺傳與環境風險因素的相關性、建立精準的疾病防治方案。

那麼,為什麼要選定十萬人作為參比人群?實際上,「研究環境和基因相互作用對健康的影響,研究腫瘤等重大疾病易感性的個體遺傳差異,罕見變異(頻率低於千分之五)可能是重要的研究對象。」王亞東在接受媒體採訪時指出,我國人口接近14億,遺傳結構複雜,根據統計遺傳學理論,要達到本項目精確地鑒定罕見變異的目標,即變異檢測的精度達到萬分之一,十萬人只是一個最小限度的基因組測序數量。

那這十萬人又是如何選取出來的呢?一方面是依託精準醫學研究專項等國家科研項目,從已有的研究隊列中選取樣本;另一方面,項目還將建立一個開放的平台,志願者也可以參與其中。

為了保證樣本的全面性和多樣性,項目基本涵蓋了我國東北、西北、華北、華中、華東、華南、西南7大地區的漢族樣本。同時,還選擇了包括藏族、蒙古族、壯族、回族、滿族等9個人口數量在500萬以上的少數民族群體,在接下來的項目推動過程中,將逐步擴展到56個民族。

實施過程將面臨重大挑戰

人類約有2.5萬個基因,要想把十萬人每個人體內的基因密碼全部解開,面臨的首要挑戰就是十萬人基因組變異檢測的計算複雜性和質量控制。

趙國屏對《中國科學報》記者解釋道,全基因組是指全部30億鹼基長的人類基因組序列。只有通過包括全基因組測序又高於現在常用的二代測序的方法,才能夠發現基因組上的單核苷酸變異(SNV)、插入/缺失變異(INDEL)和結構變異(SV)等所有基因組變異。

「在過去的基因組計劃,雖然GWAS(全基因組關聯分析)研究曾經用到萬人以上的樣本,但全基因組測序的計劃從未有如此大的樣本。」趙國屏表示,該項目產生的數據規模巨大,數據總量可達到10PB,從基因組測序數據中檢測基因組變異的計算量巨大,可達到2000萬CPU小時,需要建立高效的計算分析平台完成所有數據分析工作。

除此之外,目前,國際上的基因組變異檢測方法準確率較低,其中SNP準確率低於99%,INDEL準確率低於95%,SV準確率低於90%。如何確保此次項目數據分析的準確度也是一大難點。

「因此,我們需要建立高效的計算分析平台完成所有數據分析工作,研發更高精度的基因組分析演算法、軟體和工作流,以及基因組變異檢測的質量控制體系,確保基因組變異檢測的準確性。」王亞東說。

面對龐大數據演算法方面的挑戰,上海交通大學Bio-X研究院院長、中國科學院院士賀林則建議,除了演算法改進和計算機能力的更新,未來側重點還應考慮放在對海量「垃圾」序列的劃界和處理上。

除此之外,賀林還對《中國科學報》記者指出,中國十萬人基因組計劃完成之後,立即面對的是如何解讀所得到的大量序列數據與健康和疾病之間的關係。建立遺傳諮詢行業被認為是唯一出路,然而在我國的職業大典上,至今還找不到遺傳諮詢師這一職業。

集中力量實現「彎道超車」

繼成功繪製人類基因組測序「中國卷」和水稻基因組圖譜後,進入本世紀以來,我國科學家繼續向著生命科學的深處進軍,繼續參與了人類基因組新計劃HapMap計劃、腫瘤基因組計劃和千人基因組計劃,並且在成功完成HapMap計劃的基礎上,針對若干重大疾病,大規模地開展GWAS研究工作,獲得了可喜的成就。

據趙國屏介紹,在過去二十年里,利用人類基因組研究的技術與知識,中國微生物(包括病毒)基因組研究進展迅速,在傳染病防控的基礎研究與臨床應用方面迅速走向國際前沿。另外,中國在幹細胞、腫瘤防治、胎兒遺傳疾病早期檢測、慢性病代謝病防治方面的進步也有目共睹,其中幹細胞的研究已經達到了國際前沿水平。但是,我國在基因組,特別是人類基因組研究方面的總體科學影響力,還達不到國際領先的水平。

趙國屏認為,對基因組的研究,本質上是對基因型的認識。我們目前所使用的關於人類基因組的比較系統和可靠的基礎數據,大部分是由以西方人群為主的國際研究項目所提供,這對於服務中國人的健康與醫藥事業是不適應的。另一方面,以往國際項目對於相應表型信息的採集,基本上是項目導向,比較分散難以整合,再加上其中亞洲人樣本有限,也更為開展基因型與表型的相關分析帶來了基礎性的問題。

「造成這個問題的根本原因就是我們在過去二十年中,對於我們自己產生的基因組數據的整合、交互和共享沒有組織並實施持之以恆的大規模的工程性管理、支撐、服務、研究和開發工作。」趙國屏再次強調說。

而此次啟動的中國十萬人基因組計劃正好給了我們「彎道超車」的大好機遇。中國人「多組學」相關項目的整合,為中國人類基因組研究走向工程化,為中國人類基因組數據能夠真正在整合與共享基礎上實現高效的挖掘與研發創造了條件。相信這個項目的紮實推進,一定能為我國健康事業和生命科學研究事業作出根本性的貢獻。

據悉,該項目設立五個課題,分別由哈爾濱工業大學、復旦大學、中國科學院北京基因組研究所、華中科技大學、中國科學院上海生命科學研究院等五個科研單位領銜,將有20個大學、科研院所和企業的166位專家學者參與到項目中。

「現在我國測序設計和分析能力是有的,但力量卻是分散的,這次項目是一個機會,希望能夠把力量集中起來。現在,在籌備的過程中,也看到了這方面希望。」趙國屏說。(編輯:p_vhehwang)


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 中國科學報 的精彩文章:

諾獎得主的「0」引用論文:被引率當中的那些玄機

TAG:中國科學報 |