當前位置:
首頁 > 知識 > 全基因組關聯研究十年蹤跡,下一個十年要去哪裡?

全基因組關聯研究十年蹤跡,下一個十年要去哪裡?

全基因組關聯分析,是繼「人類基因組計劃(Human genome project, HGP)」和「人類基因組單體型圖計劃(The international haplotype map project, HapMap)」之後,在高通量基因分型時代下,蓬勃發展起來的研究方法。

該方法至今已有10年歷史(才10年呀~),昆士蘭大學的Peter M. Visscher等人在Cell旗下期刊AJHG發表了一篇大綜述,回顧了這十年的成果與進展,並討論了目前的一些短板,提出解決設想,對下一個十年的發展提出了一些希望。

五年前,還是這個組,還是這位Visscher教授,還是在老地方,發了個五年回顧,真是像結婚紀念般真愛。現在已是十年蹤跡十年心,在這位老情人眼裡,GWAS的風韻有什麼變化呢?

GWAS的基本原理

GWAS是一種實驗設計方法,利用SNP晶元掃描樣本獲得的數據,通過統計分析找到全基因組範圍內,病例組和對照組有差異的SNP位點的等位基因或基因型,再根據連鎖不平衡(LD)關係,推測可能的疾病易感基因。

但也不僅限於SNP晶元數據,利用全基因組測序數據(WGS)做的分析也是GWAS,區別除成本之外,僅在於變異在基因組中的分布密度及其最小等位基因頻率(MAF)譜。

GWAS預測性狀與基因的關聯,也取決於多種因素的影響,主要有:1)性狀受多少個位點的影響;2)這些位點的等位基因頻率和它們效應量的聯合分布情況;3)實驗的樣本量;4)用於GWAS分析的全基因組變異平台;5)研究的性狀或疾病的異質性。其中;最後一點和該性狀的生物學特性及診斷或評價的精確度有關,而效應量又是未知的。

要達到較好的統計功效,這些因素都不得不考慮。下圖是在各個因素作用下,依據哈代-溫伯格平衡法則,I型錯誤率控制在5×10-8,達到80%的統計功效時所需的樣本量:

最小樣本量

眾多GWAS研究的共同成果

這十年,GWAS研究取得的成果已經遍及生物學的各個領域,其研究的複雜性狀也覆蓋甚廣,包括常見疾病,疾病風險因素,腦影像學表型,基因表達量和DNA甲基化,還有社會及行為學特徵。人們意識到,複雜性狀通常具有高度多基因遺傳的特徵。

SNP-性狀關聯發現的時間線

圖中只有SNP關聯最多的三個性狀/疾病才用標籤表示出來,中間的數字是那一年發現的有統計學差異的SNP數量。統計學差異是指P < 5 × 10-8。樣本量越大,可能發現的有意義的SNP也越多。例如2009年發現了第一個和精神分裂傾向相關的SNP位點,用了3000個病例樣本,而2014年有了35000個病例樣本,則檢測到108個位點。

其次,這些研究還發現,基因的多效性是普遍存在的。人群中變異的數量很大,但還是有限,然而每個性狀都和成百上千個變異相關,則表明它們可能有一些共同的致病變異。這也已經得到了一些研究證據的支持。這也提示,孤立地研究疾病或性狀,可能導向錯誤的干預方式。

此外,研究過程中也衍生出新的實驗設計方法和工具。比如從一個發現樣本庫中找到疾病的風險變異作為自變數(predictor),再在另一個獨立樣本庫中用這些SNP為每個個體建立多基因風險評分(Ploygenic risk score, PRS)。PRS在過去5年中已經廣泛運用,為新的實驗設計帶來便利,也造就了新發現。

不得不說,數據共享在這其中扮演著很重要的角色,是基因測繪研究領域的一大特色。數據共享不僅使研究者能夠更方便地獲得更多的研究素材,同時也衍生出許多新的統計學演算法,這些新的演算法又反過來催生了更多新的發現,簡直是量變到質變的飛躍。不過目前的數據主要來自歐洲,作者希望將來能有來自其他民族的基因組數據加入。

最後要提醒的是,GWAS從設計上來說,並不能明確鑒定基因靶點或機制,這和傳統的家系研究不一樣,變異、靶基因和機制(蛋白質的改變)同時鑒定。它的數學特徵也決定了,接下來的功能研究未必能照搬孟德爾遺傳病的那一套,而需要開發新的方法。

但也很值得欣慰,過去5年中,的確見到了一些比較高明的實驗策略,能夠發現GWAS關聯的靶基因。其中方法開發上較為多產的一個領域,是融合GWAS和表達數量性狀基因座(eQTL)研究的數據,來鑒定轉錄本和複雜性狀的聯繫。

這些研究的目的最終都是要實現臨床轉換的,雖然從基礎到臨床還有很長的路要走,但我們也已看到了一些成功的例子,包括GWAS對藥物開發的直接貢獻,這也提示我們有很多條路可走。

GWAS研究結果與已知的藥物靶點

除了藥物之外,像精神分裂症這種從來沒依賴過生物標誌物診斷的疾病,GWAS是第一次提供了量化的選擇,也算是扭轉三觀的貢獻。

看看現在,想想未來

目前的GWAS研究大多基於SNP晶元,而這些晶元多是為常見變異而設計的,並不能覆蓋人群中的所有變異。可以預見,未來的GWAS研究會漸漸轉向以WGS數據為基礎。不過如果成本沒降、預算又有限的情況下,可能還是會從晶元+擴大樣本量角度去提高研究的效力。

如果仍以目前常用的SNP晶元為技術,下一個十年應該可以預測的進步包括,發現更多的變異或基因靶點與一個或多個性狀的關聯;或解釋更多的基因變異;建立更精確的基因預測模型;能更好地評估疾病的異質性,並將疾病的基因診斷導向特定的治療方法。但未來的GWAS的數據很可能從SNP晶元向WGS轉變,尤其是常見疾病的研究。

15年前,研究的局限因素在於基因分型技術,現在卻變成了能與基因數據相關聯的表型描述符,從而使疾病的分層診斷與治療方法貫穿起來。將來的研究要更注重從生物學上理解這些基因關聯,並轉化成以病人為中心的結果,比如更好的診斷與治療方法(所謂「sequence to consequence」)。

參考資料:

1.10 Years of GWAS Discovery: Biology, Function, and Translation

2.Five Years of GWAS Discovery

3.全基因組關聯研究現狀

合作微信:helixlife6

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 解螺旋 的精彩文章:

阿茲海默病進展盤點:一些另類的研究視角
60+項研究告訴你,其實運動並不減肥!
如何讓最新文獻主動送上門?
這些樣本凍存和復甦的坑,怎麼破?
盤點 | CRISPR的十大經典應用

TAG:解螺旋 |

您可能感興趣

神仙姐姐和段譽時隔21年再合作,原來他們當年在劇組關係這麼好
幾組關鍵詞帶你回味這不一樣的軍營「旺年」
100年《我的世界》會變成啥樣?一組關於樹的動圖,真實的可怕
精選一組關於姓氏的趣知識;中國僅有一個十字姓
知乎下架,豆瓣八組關停
一組關於緣分的照片,只因為剛好遇見你
精選一組關於城市的冷知識,世界級城市有那三個?
顏值天團來到蘑菇屋,節目組關掉濾鏡,大家顏值怎麼樣呢
精選一組關於英國的趣知識;十五位英國首相可追溯到同一個祖先
一組關島土著居民的生活照,他們在島上生活了3500多年
這組關於母親的照片,每張都能令我們留下眼淚來!
這組關於母親的照片,每張都能令我們留下眼淚!
全基因組關聯的meta分析研究確定了多種長壽基因
一組關於非洲的知識;四百年的黑奴貿易至少使非洲損失1億人口
精選一組關於大英帝國的冷知識;世界上第二個「日不落」帝國
一組關於「禽獸」的艷照,看了之後真的沒忍住!
這是組關於死刑犯最後一餐的攝影作品
一組關於繡球花人像拍攝及後期思路分享
備孕女性的6組關鍵數字,你若輕鬆掌握,好孕自然來
一組關於男生與女生的區別區,簡直太形象了,尤其是第一張,扎心了