單基因遺傳病中變異的效應與疾病的機制
前言
隨著 NGS 技術,特別是全外顯子組測序 (WES) 和全基因組測序 (WGS) 越來越廣泛地應用於單基因遺傳病的檢測,如何從眾多變異中找到導致患者疾病的遺傳原因成為該技術應用非常重要和關鍵的環節。這需要我們理解所關注疾病的遺傳機制,弄清所用的檢測技術是否涵蓋的其大多數致病機制以及後續分析中應該關注哪一類變異。變異的類型及其可能造成的生物學危害性是基因檢測從業者耳熟能詳的必備知識,但是關於變異在蛋白水平造成的效應和疾病的機制,過去所見總結並不多,小編粗略總結,與各位同仁分享。本總僅限於單基因遺傳病相關的基因和變異,不涉及目前並未知與疾病相關的非必須基因 (non-essential genes) 和未對蛋白造成影響的中性 (neutral) 變異。本文只簡略敘述了常見的喪失功能 (LOF) 致病和較罕見的致病效應,較詳細敘述了獲得功能 (GOF) 致病這種常出現卻容易被忽略的機制,不算系統,但頗具針對性。才疏學淺,有不當之處,歡迎各位同行批評指正。
從核酸改變角度,變異可以分為很多類型,包括錯義變異、同義變異、無義變異、移碼變異、起始密碼子變異、延長變異、剪接位點變異、氨基酸缺失/插入、非編碼區變異、外顯子缺失/重複、基因缺失/重複、融合基因等。從對蛋白影響的角度,這些變異最終可以歸為影響蛋白的結構,或者影響蛋白的劑量,造成蛋白功能的喪失、改變或者獲得,或者蛋白表達時空的改變,從而造成疾病。了解單基因病的致病機制,是疾病檢測和遺傳數據分析的前提。只有明確疾病的致病機理,在此基礎上選擇合適檢測方法和並在分析關注合適的變異,才能有效找出導致疾病的遺傳原因。
喪失功能——最常見的致病機制
喪失功能(loss of function, LOF)是最常見的致病機制,絕大多數單基因遺傳病都是因為基因 LOF 造成的。LOF 可以是變異造成蛋白結構破壞,也可以是變異造成蛋白劑量減少,歸根到底,二者都是造成正常的蛋白減少。起始密碼子變異、無義變異、移碼變異、剪接位點變異、外顯子缺失、基因缺失常常導致蛋白 LOF(ACMG標準PVS1,其限制性見ACMG詳細說明),其他形式的變異(延長變異、錯義變異、氨基酸框內插入缺失)也有可能導致蛋白 LOF。值得一提的是,一些變異從核酸改變角度看造成蛋白結構改變,可能因為一些細胞內的生物機制而實際造成了蛋白劑量的減少。比如,無義變異介導的mRNA剪接(nonsense-mediated mRNA decay, NMD),延長變異造成的mRNA降解(non-stopdecay),其他變異也能因影響 mRNA 或蛋白的穩定性而造成蛋白劑量的減少。有些基因需要兩個正常等位基因表達才能維持功能,一個等位基因 LOF 便會造成疾病,這種情況被稱為單倍性不足(haploinsufficiency),造成的疾病為顯性(dominant)遺傳。有些基因只要有一個正常等位基因表達便足以維持功能,只有兩個等位基因都 LOF 才導致疾病,這種情況被稱為單倍型充足(haplosufficiency),導致的疾病為隱性(recessive)遺傳。
顯性抑制
顯性抑制(dominant negative, DN)可以歸為特殊的功能喪失,也可以被單獨作為一種變異效應,指變異不僅導致蛋白自己功能喪失,還干擾正常蛋白的功能。因此,ND 的效應要嚴重於單個等位基因 LOF,並且此類變異造成的疾病多為顯性遺傳。舉個例子,GH1基因 LOF 的變異導致常染色隱性遺傳(AR)的孤立性生長激素缺乏症1A型,即需要兩個等位基因發生 LOF 變異才表現癥狀;而GH1基因的 DN 的變異導致常染色顯性遺傳(AD)的孤立性生長激素缺乏症2型,一個等位基因發生此類變異即表現癥狀。再如,AD遺傳的Emery-Dreifuss型肌營養不良2型是由LMNA基因突變造成,該基因的LOF 變異造成晚髮型的疾病,而該基因的DN 變異造成了更嚴重的早髮型疾病。
獲得功能
目前已知有一百多個單基因遺傳病是由於基因獲得功能 (gain of function, GOF)的變異造成的,GOF 可以是蛋白結構改變而發生蛋白功能激活,也可以是影響蛋白的表達或者降解而造成蛋白劑量升高。對於因基因 GOF 造成的疾病,LOF不能作為變異致病的依據,且致病變異常常集中表現為一種變異類型,或者集中於特定位點,容易形成熱點突變,此類疾病多為顯性遺傳。下面分別對各種變異類型造成蛋白 GOF 而導致疾病一一進行舉例說明。
獲得功能——調控區域變異導致蛋白的劑量升高
ANKRD26基因突變導致AD遺傳的血小板減少症2型,目前已知的幾個致病變異都位於該基因的5』UTR的保守位點,研究表明這幾個變異造成ANKRD26表達升高,從而造成疾病。
獲得功能——錯義變異影響蛋白修飾導致蛋白劑量升高
AFF4基因編碼一個轉錄延伸因子,調節基因的轉錄,該基因突變造成AD遺傳的CHOPS綜合征。研究發現,目前已知的三個致病變異(T254S, T254A, R258W),均導致蛋白泛素化降解障礙,造成蛋白劑量升高,進而造成其轉錄調控的下游基因表達升高,導致疾病。
獲得功能——基因重複導致蛋白的劑量升高
Lubs 型 X 連鎖智力低下,是由MECP2基因重複造成的,為 X 染色體連鎖隱性遺傳,該病占不明原因的男嬰智力低下的1%。該病的致病機製為MECP2基因重複造成蛋白劑量升高。值得一提的是,MECP2基因編碼的蛋白在細胞中的功能對其劑量高度敏感。在女性中,MECP2雜合 LOF 造成 Rett 綜合征,患者癥狀因 X 染色體失活偏移 (Skewed X-inactivation) 造成 MECP2 蛋白表達差異而癥狀嚴重程度不同,而男性MECP2半合子 LOF 因沒有正常 MECP2 蛋白表達而造成胚胎致死。男性 MECP2 基因重複導致 Lubs 型 X 連鎖智力低下。
獲得功能——錯義變異影響蛋白活性
錯義變異改變蛋白活性,也是蛋白獲得功能獲的一種方式,多見於酶、離子通道、信號通路蛋白中。很多免疫系統疾病是由於基因的激活變異造成。以NLRC4基因突變導致的自身炎症伴嬰兒小腸結腸炎為例,NLRC4基因編碼的蛋白介導炎症反應,野生型的 NLRC4蛋白在正常狀態下處於自抑制狀態,可以被細菌的鞭毛蛋白激活而啟動下游的炎症反應,但是變異 T337S 或 V341A 造成NLRC4蛋白結構改變為組成型激活狀態,持續激活下游的炎症反應,從而造成 AD 遺傳的自身炎症伴嬰兒小腸結腸炎。
獲得功能——融合基因
融合基因也是造成蛋白獲得功能一個原因,融合基因可以產生於染色體間的易位 (translocation)、染色體內部的缺失 (deletion) 或者染色體內部的倒位 (inversion)。這種變異形式常見於腫瘤和血液腫瘤中,例如圖中 FIP1L1-PDGRA 融合形成一個組成型激活的酪氨酸激酶,而造成特發性嗜曙紅細胞過多綜合征。融合基因造成獲得功能的效應在單基因遺傳病中很少見,小編未找到例子。
新功能/蛋白毒性—— 鹼基重複
蛋白毒性,也是單基因遺傳病的一個重要機制。一部分鹼基重複造成的疾病的機製為重複的氨基酸造成了具有細胞毒性的蛋白。比如Huntington病是由HTT基因編碼框內 CAG 重複造成的。重複造成連續的谷氨醯胺 (Gln) 殘基,正常人中CAG 重複次數小於 27 次,當 CAG 的重複次數大於 35 次,便會造成 Huntingtin病。細胞機制研究表明,野生型huntingtin 蛋白在細胞發育中發揮重要的作用,被認為參與腦源性神經營養因子的轉錄調控,阻止procaspase 9的降解,並且參與膜泡的運輸和釋放。而達到致病級別的huntingtin蛋白被蛋白酶切割後會造成一系列毒性作用,滯留正常的蛋白(包括正常的huntingtin的蛋白),引起線粒體功能異常和氧脅迫壓力,改變神經遞質的釋放和受體的功能,激活caspases啟動凋亡級聯反應、與核因子相互作用導致轉錄失調,從而造成Huntington病的癥狀。
異位表達
異位表達常常出現在腫瘤中,在單基因遺傳病中並不多見,但也存在這樣的例子。糖皮質激素可治療的醛固酮增多症是由CYP11B1/CYP11B2基因融合造成。CYP11B1和CYP11B2位於8號染色體上,二者呈串聯排列,序列上有95%的相似度,因姐妹染色體間的非平衡交叉而產生CYP11B1/CYP11B2融合基因,融合的基因具有CYP11B1的5" 端 和CYP11B2的編碼區。正常的 CYP11B2 基因的轉錄受血管緊張素激活,表達於腎上腺球狀帶,融合基因的對促腎上腺皮質激素敏感,表達於腎上腺束狀帶,導致醛固酮合成增多。
基因變異導致疾病的多效性
由於基因變異的不同的效應,因此,同一個基因不同效應的變異可以導致不同的疾病,這種情況叫等位基因病(allelic diseases)。根據omim網站的統計,目前已有1000多個基因對應兩種或以上個疾病表型。例如FGFR1基因在腦、顱面骨、四肢骨的發育和生長、促性腺釋放激素神經元細胞的形成、存活和遷移以及嗅覺神經元中發揮重要的作用,該基因不同類型的GOF 變異導致腦顱皮膚脂肪過多症、Pfeiffer 綜合征,DN 變異導致Hartsfield 綜合征,LOF 變異導致促性腺激素分泌不足的性腺功能低下症,伴或不伴嗅覺喪失2型。
結語
基於大規模平行測序(massively parallel signature sequencing, MPSS)的 NGS技術在遺傳病領域的廣泛應用,讓我們可以同時檢測很多基因,甚至所有基因或者整個基因組上的變異。相比過去的 Sanger 測序,檢測的效力得到了極大的提高,但同時分析的挑戰也相應地提高了。一次 WES 檢測可以得到個幾萬個變異,就算過濾掉通常不致病的變異,仍然有數十、上百個變異需要分析,患者癥狀的複雜性和非特異性又會增加分析中干擾。比如,ANKRD26 基因 LOF 是可以容忍的,但是該基因 5"UTR 突變引起的基因表達量上調導致 AD 遺傳的血小板減少症 2 型,如果不清楚或未注意這個機制,遇到一個有相似癥狀的患者剛好攜帶 ANKRD26 的 LOF 突變,就有可能錯把這個突變當成致病突變,而忽略了真正的致病突變,或者為非遺傳病患者做出了假陽性的診斷。 因此,深入的理解檢測所涵蓋基因的致病機制,知道檢測的局限性和需要重點關注的變異是提高分析的準確性和靈敏度的關鍵環節。
對基因的注釋,不僅要包括基因與疾病對應關係的注釋,還應包括基因突變導致疾病的機制的注釋,比如 LOF, GOF, DN,或者其他機制。比如,針對鹼基序列重複導致的疾病,目前的基於 MPSS 的 NGS 技術不能很好的檢測寡鹼基重複次數,這不僅意味著如果懷疑這類機制導致的疾病,需要使用其他檢測手段來彌補,還意味著在分析 NGS 的變異數據時,可以暫不考慮這些基因上的變異。再如,對於 GOF 導致的疾病,相比關注通常的 LOF 變異,更該關注可能導致 GOF 的變異,或者根據過去已報道的致病變異的規律推測所關注變異致病的可能性。DN 效應的變異通常也不是 LOF 的變異類型,此外,DN 效應可以幫助解釋不符合常見的遺傳方式情況,比如通常隱性遺傳的疾病,卻只發現了一個致病變異,但並不是所有 DN 的情況都被 omim 記錄,有時需要參考文獻來確定一個變異是否導致 DN 效應。
對以上機製做詳細的注釋可以幫助提高分析的準確性和靈敏度,避免假陽性或假陰性。然而,對所有的基因突變致病機制都做注釋不是一蹴而就的工作,還需要日常的積累和維護,甚至很多基因致病的機制還不清楚。decipher 資料庫 (https://decipher.sanger.ac.uk/ddd#ddgenes)收錄了部分基因的致病機制,可供參考。如果還未對所有分析基因的致病機製做充分的注釋,至少在每份變異數據時,對懷疑陽性的基因變異和疾病,需要查閱資料庫和文獻、參考該基因已知的致病變異,確定致病的機制是否符合。
TAG:zz遺傳與基因組學 |