當前位置:
首頁 > 最新 > 基因組編寫:當前進展及應用

基因組編寫:當前進展及應用

摘要:合成生物學的終極目標是實現根據特定商業和醫療等需求構建具有相關特性的細胞或生物體。對於一個人工構建的細胞而言,最重要的部分即為合成的基因組。我們需要開發新技術以能夠實現構建相應基因組的目標。近期報道的合成酵母基因組項目即是這一領域的一項里程碑式的成果。在這篇綜述中,我們將簡要介紹如何利用DNA從頭合成技術和基因編輯技術構建人工基因組。在此基礎上,我們總結了相關領域的重要研究進展並列舉了一些應用案例。文末,我們討論了這一領域面臨的一些挑戰,並對發展前景作出展望。

關鍵詞:合成生物學、基因組編寫、基因編輯、生物倫理、生物安全

引言

長久以來,生物學家致力於研究生物體的生理代謝過程及機理,但仍有許多基礎的問題有待解決。例如,細胞基因組如何調控整個細胞的代謝網路?單細胞生物如何演化為多細胞生物?從這種意義上講,傳統生物學研究致力於回答特定的生物學表型是如何由特定基因調控的。然而,合成生物學研究則走了一條相反的路,即通過改造或從頭合成的方法構建一個特定的基因組,從而使對應的生物體有相應的生物學特性。正如Richard Feynman所言:「What I cannot create, Ido not understand」。合成生物學的終極目標是能夠根據人類需求設計構建相應的細胞或者生物體(圖1)[1]。合成生物學的成功,很大程度上依賴於人工構建基因組技術的發展。目前,多個從頭合成基因組的研究項目正在實施中[2]。相應的,除了採用從頭合成基因組的方法以外,合成生物學研究也致力於開發新技術從而能夠調控或改造現有生物體的代謝和生理過程[3,4]。這些工程化改造過的有機體或細胞可以用來生產藥物、化合物、生物燃料、食物等等。

從總體上講,合成生物學包含兩個層面的內容[5]:(1)構建含有真正意義的從頭合成的基因組的生物體,例如含有完全合成的基因組的合成細胞;(2)對自然界存在的生物體進行改造以使之具所有設計的特性。代謝工程改造可以改造生物體或細胞的內源性的代謝通路,亦可以增加新的代謝通路。通過使用複雜的基因電路(genetic circuits),可以對目標生物體的代謝進行精準調控。為了達到以上目標,或多或少都要用到「基因組編寫(genome writing)」技術。要實現基因組編寫的目標,主要通過兩類技術手段達成,即為「基因合成技術(de novogenome synthesis)」和「基因編輯技術(genome editing)」[5]。基因合成技術能夠滿足大尺度、多位點、高複雜度基因編組寫的目標,而基因編輯技術則能夠滿足小尺度、精細的基因組編寫的任務。在這篇綜述里,我們以基因組編寫為主題,重點介紹了基因合成技術和基因編輯技術,並簡要總結了基因組編寫技術在基礎科研和產業應用方面的重要成果。最後,介紹了當前遇到的難題和未來發展的趨勢。

圖1 傳統生物學和合成生物學之間的關係

傳統生物學主要研究基因組是如何調控細胞生理過程和代謝。相對應的,合成生物學則致力於設計構建特定基因組,以使相應生物體有設計的生物學功能。黃色圓角矩形代表細胞膜,該細胞包含多種不同的代謝通路,分別用不同顏色代表。在所示的代謝路徑中,圓形代表代謝物,矩形代表一個特定的酶,箭頭代表酶反應的方向。

基因組編寫是通過DNA合成和基因編輯實現的

從頭合成和組裝技術

大尺度基因組合成通常起始於組裝從頭合成的短的DNA oligo,這些oligo通過退火後互補配對再通過PCR可以得到最低維度的DNA片段原料,這些片段通常小於2Kb。此後,經歷逐級多輪組裝得到最終完整的全合成基因組。組裝分為四個層級:Kb級別組裝,Mb級別的組裝,染色體級別的組裝,基因組級別組裝。Kb級別組裝可以使用的方法有Gibson assembly,Golden-gate assembly。Gibson組裝原理與同源重組過程類似,適合常規序列但不適用於高度重複性序列,通常能夠組裝5個以下的DNA片段[6]。Golden-gate組裝使用酶切-連接方法克隆,適合各種類型序列包括高度重複序列;但要求相關序列里沒有對應的酶切位點,通常能夠組裝9個以下的DNA片段[7]。Mb級別組裝目前需要藉助細菌或酵母等細胞,將預先組裝的Kb級片段在細胞內組裝起來,使用的方法有SwAP-In(switching auxotrophies progressivelyfor integration)(在酵母中)[8]等。染色體級別組裝需要藉助酵母人工染色體等工具,並通過細胞-細胞融合的方式實現整合[9]。基因組級別組裝可以藉助有性生殖(雜交)或MMCT(microcell-mediated chromosome transfer)等技術手段實現[10]。通過化學試劑處理供體細胞,從而可以製備含有單條染色體的微細胞(microcell),而後通過將微細胞和宿主細胞融合,人工染色體可以整合到宿主細胞基因組中[10]。

基因編輯技術

從頭合成和組裝一個基因組在大多數情況下並非必要,而利用基因編輯技術對現有的基因組進行微小改造則是更加實用的方法。經典的基因編輯技術在原理上基於兩點[11]:首先,利用人工核酸酶在基因組特定位點製造DNA雙鏈斷裂(double-stranded breaks,DSB);隨後,細胞啟動DNA損傷修復機制,在修復DSB的過程中引入突變。可以應用的人工核酸酶種類很多,常用的有ZFNs (zinc finger nucleases)、TALENs (transcriptionactivator-like effector nucleases)和CRISPR/Cas (clusteredregularly-interspaced short palindromic repeats/CRISPR-associated protein)[12]。他們都具有高度的靶向靈活性,可以高效地在基因組中製造DSB。不同的是,ZFNs和TALENs是純蛋白,依賴蛋白與DNA互作實現靶向DNA,設計和構建難度較大;而CRISPR/Cas則是蛋白與RNA的複合物,利用鹼基互補配對原則實現靶向DNA,非常易於設計和構建。DSB修復有兩種主要機制,NHEJ(non-homologous end joining)和HR (homology-directed repair)[13]。NHEJ修復不依賴Donor,修復後在DNA斷裂位點可以引入InDel變異。HR則是依賴於Donor的修復,可以實現精準修復或者在切割位點處引入精準的變異。同時,對這些人工核酸酶進行工程化改造,保留其靶向DNA特性而去除其核酸酶特性後,再與其他效能蛋白融合就能達到特殊的目的。例如,將dCas9與甲基化修飾酶融合,可以在基因組特定位點實施表觀遺傳修飾[14,15]。將dCas9與AID(activation-induced cytidine deaminase)酶融合,可以特異性突變單一鹼基[16]。此外,可以綜合運用兩種方法,以降低成本提高效率。例如,可以對已有的基因組進行編輯,而後以此為原料進行大基因組組裝。此外,藉助於基因編輯技術可以更高效地實現大片段DNA的整合。

基因組合成項目加深了人們對於生物體生命過程的理解

對於必備基因的理解

毫無疑問,最雄心勃勃的基因組編寫項目無疑是人工合成細胞,其核心內容是人工合成基因組。合成基因組的需求引申出一個基礎性問題:Gene essentiality。根據必要性可以將細胞的生理代謝分為兩類[17]:一類是必須的基礎代謝,這些代謝必不可少,缺少了細胞就會死亡。另一類是細胞/物種特異性代謝,為非必需(或限定條件下必需)的代謝通路,這是區分不同細胞類型和物種的最主要特性。在演化過程中,原初的細胞結構和功能變得越來越複雜,單細胞生物又演化出多細胞生物,乃至產生高等的動物和植物。細胞內代謝經歷翻天覆地的變化,衍生出一系列複雜的次生代謝機制,以保障對環境的適應。合成基因組首先面臨的問題是,對細胞代謝進行區分和梳理。即區分細胞中哪些代謝是共有的、必須的,哪些是獨有的、非必需的。去除非必需的代謝通路後得到的基因組就是最小基因組,含有最小基因組的細胞是構成一個底盤工程細胞。隨後,只要在這些最小基因組上,添加特定的代理通路模塊和行為調控模塊就可以獲得具有設定特性的工程細胞。2016年,Hutchison等人報道了JCVI-syn3.0項目,這一項目構建了第一個完全人工合成的最小基因組,這是一個里程碑事件[18]。這一項目合成的最小Mycoplasma mycoides基因組大小為531kb包含473個基因。

改造遺傳編碼和解碼規則

基因組編寫技術不必須遵循現有的的遺傳編碼和解碼規則,而是可以使用新的規則從而創造出自然界不存在的新的生命形態[19]。自然界的生物雖然存在各種各樣的差別,但其基因組都是由A、T、C、G四種脫氧核糖核酸構成,而其蛋白質也是由相同的20種基本氨基酸組成。然而,科學家通過在DNA中摻入人工鹼基對,使得構成DNA的元件不再局限於ATGC四種。採用同樣的策略,也可以改變蛋白編碼規則。通過改變codon規則,並使轉運RNA能夠轉運非天然氨基酸進而摻入到合成的多肽中,從而得到含有非天然氨基酸的新蛋白。這將使得蛋白的合成不局限於20種主要的天然氨基酸。2013年,Lajoie等人在新合成的大腸桿菌基因組中,將TAG密碼子換為TAA密碼子,然後利用空出的TAG密碼子,與非天然氨基酸關聯起來[20]。2017年,Zhang等人將人工合成的新的脫氧核糖核酸摻入到大腸桿菌質粒中,並使其正常轉錄和翻譯成GFP蛋白,這成功實現了改寫遺傳規則的目標[19]。通過對生命編碼和解碼規則的改寫,將能夠創造出自然界不存在的、種類更加豐富、擁有特殊屬性的超級生物體。

構建包含合成/嵌合基因組的人造生物體

從頭合成基因組是對人類對生命機制理解正確性和全面性的一次綜合檢驗。這個過程可以幫助人們發現或重新理解過去未發現或未充分理解的機制和現象。不同類型的細胞在代謝和生理的層面差異巨大,其基因組結構和功能蛋白也顯著不同。不同來源的細胞雖然存在各種各樣的差異,但其生理過程的基本結構卻是相似的[17]。例如,所有的細胞都有能量代謝機制、DNA複製機制、DNA損傷修復機制、RNA轉錄機制、蛋白翻譯機制、細胞周期調控機制等;這些機制在不同細胞中分別由不同的功能分子完成。通過人工合成生物體的研究,可以更深入地理解不同生物體的同一代謝通路中不同功能分子之間的異同,及相互之間的可替代性。這對於以後的工程化改造和應用具有重要意義。近年來,多個人工合成基因組項目已經完成或正在實施中,涉及病毒、原核生物(細菌)、真核生物(酵母)以及哺乳動物(小鼠)(表1)[8,18,21,22,24?29]。其中,小鼠免疫系統人源化是一個經典案例。科學家使用人類的免疫系統基因區段質換小鼠基因組中相應的基因區段,從而獲得具有正常免疫系統並能夠生產人源化抗體的小鼠[23,24]。

表1 基因組合成項目總結

基因組編寫技術的發展驅動了商業化應用的

誕生

細胞的代謝通路的運轉主要受到其基因組的控制。基因組編寫技術可以在不同尺度上改寫基因組信息,對生物體進行改造從而開發出具有商業價值的應用。此處,我們將列舉基於合成生物技術的、具有潛在商業價值的應用案例(圖2)。(1)構建超級工程細胞,在此基礎上添加不同的「功能模塊」以解決不同的問題[18]。人工合成的超級工程細胞只保留最基礎的必備代謝途徑和調控通路,以提高細胞代謝效率和降低無意義的損耗。根據不同的需要,再添加一種或多種代謝通路[30,31]。例如,如需生產生物能源,則可添加乙醇代謝通路;如需生產抗瘧疾藥物,則可添加青蒿素合成的代謝通路[32]。(2)基因和細胞治療[33?36]。將有遺傳缺陷的幹細胞從病人體內分離出來,通過基因編輯等方法在體外將有害變異修正。之後,將遺傳修正的細胞回輸到病人體內從而治癒疾病。除了修復有缺陷的基因以外,還可以對基因組實施更加精細的遺傳操控。2017年,Nissim等人報道了使用整合了AND邏輯門的免疫細胞來特異性殺滅癌細胞的成果[36]。(3)構建人源化動物模型。使用基因編輯技術,我們可以構建人源化動物模型以滿足不同的需求[23,24,37]。例如,構建免疫系統人源化小鼠來開發人源化抗體,構建人源化豬用於人類器官移植。(4)人類遺傳突變體高通量功能研究[38,39]。基因組測序成本快速下降造成海量的基因組數據被生產出來。然而,由於人類基因組中的絕大多數基因的突變體都缺乏功能注釋,使得難以從人類基因組測序數據中挖掘到足夠多的有價值信息。在基因組編寫技術快速發展的今天,針對重要的致病基因可以高效低成本地合成大量突變體,藉助Deep mutational scanning等方法進行功能研究,這些結果將大大助力個人基因組測序項目及精準醫療的快速發展[38]。

圖2 基因組編寫技術相關應用案例

A.包含設計的代謝通路的工程細胞。根據不同的應用需求,將不同的代謝通路或者基因電路加入到特定的含有最小基因組的底盤細胞中。B.人源化動物模型。人源化小鼠用於開發人源化抗體,人源化豬用於器官移植。C.用工程化改造的細胞來治療人類疾病。首先,將幹細胞分離並在體外作出改造,而後回輸到病人體內治療疾病。D.Deep mutational scanning技術原理示意圖。首先針對要研究的基因構建一個合成的突變體庫並包裝為病毒。感染宿主細胞以後,陽性感染的細胞被分選出來進行功能判斷分析(Assay)。分析後,細胞可被分離為兩個群體,即為有功能群體和無功能群體。而後通過克隆突變體序列並進行高通量測序確定每個群體中突變體的類型。結合複雜的數學模型分析,可以為每一個突變體的突變效應賦值。根據分析結果可以繪製可視化圖表,例如熱圖。

問題與展望

自新世紀開始,合成生物學經歷了快速的發展,至今已經取得豐碩的成果。未來,合成生物學發展需要在以下兩個方面做出努力。(1)從基礎科研的角度看,需要進一步深化對細胞生理過程和代謝的理解。對自然界現有生物生理代謝的研究是開展各種工程化改造和應用的前提條件。地球上有超過八百萬種不同的生物,其中有許多是複雜的多細胞生物,這些多細胞生物的細胞類型和功能也各不相同。然而,這些細胞有著基本類似的基礎代謝通路,但同時又有各自特異的代謝路徑。所有這些代謝通路是由哪些因子構成,相關的因子之間又有何種聯繫?還需要做大量的基礎研究來回答這些問題。(2)從技術發展角度看,需要解決成本和效率的問題。在大尺度範圍上,實施一個大規模基因組合成項目成本和代價依然高昂,未來需要開發新的技術方法以降低成本。在小尺度範圍上,目前基因編輯技術在實施精準編輯方面效率依然低下。基於DSB的基因編輯,不可避免地需要藉助於細胞自身的DNA損傷修復機制來完成。由於難以對DNA損傷修復過程實施精準控制,造成精準編輯(基於HR)的效率依然低下;並且,還伴隨有脫靶引起的風險。(3)生物倫理和生物安全方面的憂慮 [40,41]。合成生物學技術發展使得構建人獸嵌合基因組成為可能。可以通過將人源基因組片段整合到動物基因組中構建嵌合體生物,或者反其道而行之。隨著技術的發展,將很難判定這些嵌合生物體究竟是人是獸。並且,據報道合成的病毒與天然病毒有相同的感染力[21]。犯罪分子或恐怖分子可以利用合成的致病微生物來危害公共安全。因此,我們必須採取措施防範合成生物學技術被被濫用,防止使用合成生物學技術來製備有毒、有感染性或其他有危害性的生物體或物質。

總的來講,合成生物的誕生標誌著生物學研究進行一個新的時代。相對而言,物理和化學等學科有相對簡明的運行規律。對於生物學研究而言,每個物種都是一個結構和功能極其複雜的黑盒子。充分認識和理解規律是一切應用的前提。在過去的一個世紀中,生物學經歷了極其快速的發展,人類對生物遺傳和發育的機制的理解已經非常深刻。同時,測序技術、DNA合成技術、基因編輯技術等技術快速發展。這一切為合成生物學的誕生奠定了重要的基礎。未來,在合成基因組的引領下,結合基因電路技術、新的遺傳編碼和解碼技術,我們將有可能根據人類主觀意志改造生物,同時也可能做到讓那些滅絕的生物復活。

利益衝突

本文所有作者共同承諾,本文沒有相關利益衝突。

致謝


本文由作者提供,英文原文來源:Yueqiang Wang, YueShen, Ying Gu, Shida Zhu, Ye Yin. Genome writing: current progress and related applications.Genomics Proteomics Bioinformatics 2018,16(1):10?16。引用請參考以上格式,英文全文詳見https://www.sciencedirect.com/science/article/pii/S1672022918300056。

作者信息如下:

王躍強1,2,4,5,沈玥1,2,3,4,5,顧穎1,2,3,4,5,朱師達1,4,尹燁6,7,8,*

註:壓題圖片來源於網路。

Genomics, Proteomics & Bioinformatics(基因組蛋白質組與生物信息學報,簡稱GPB):創刊於2003年,是由中國科學院主管,中科院北京基因組所與中國遺傳學會共同主辦的英文版核心期刊。目前GPB為雙月刊,由Elsevier以開放獲取(Open Access)的模式出版,刊載來自世界範圍內組學、生物信息學及相關領域的優質稿件。GPB連續五年(2013–2017)獲得「中國最具國際影響力學術期刊」稱號,連續兩期獲得「中國科技期刊國際影響力提升計劃」項目資助(2013–2018)。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 GPBees 的精彩文章:

TAG:GPBees |