當前位置:
首頁 > 最新 > 轟動性成果,6篇Nature Genetics及2篇Nature Biotec文章同時闡述棉花基因組學進展

轟動性成果,6篇Nature Genetics及2篇Nature Biotec文章同時闡述棉花基因組學進展

iNature:2018年5月8日,國際著名期刊Nature Genetics在線背靠背發表了2篇棉花高通量基因組測序,這2文章分別是:河北農業大學華北作物種質資源研究與利用教育部重點實驗室馬峙英教授團隊聯合中國農業科學院棉花研究所杜雄明研究員團隊,以及諾禾致源生物信息科技有限公司、安陽工學院、新疆農業科學院、長江大學、蘇州科技大學、甘肅農業科學院等單位的科研人員,完成的「Resequencing a core collection of upland cotton identifies genomicvariation and loci influencing fiber quality and yield」,標誌著我國在棉花基因組變異和纖維性狀遺傳領域取得重大進展,棉花核心種質重要性狀表型、基因組變異和分子標記鑒定以及新基因發掘躍居國際領先行列,為深化作物基因組研究提供了重要依據,為棉花重要性狀定向育種提供了較為精準的標記和基因資源;武漢大學朱玉賢院士團隊和中國農科院棉花研究所李付廣所長團隊,杜雄明課題組及農科院農業基因組研究所合作的題為「Resequencing of 243 diploid cotton accessions based on an updatedA genome identifies the genetic basis of key agronomic traits」的研究論文,該文利用三代PacBio測序和Hi-C技術,對亞洲棉參考基因組進行了精細組裝,同時對243份亞洲棉和草棉群體進行了重測序,結合兩年針對重要農藝性狀的田間調查數據,通過 GWAS和QTL技術鑒定到了與種子油含量、抗病能力、棉纖維發育等相關的調控位點。同時iNature整理了近幾年的棉花大基因組測序文章,我們發現,中國學者突破性的貢獻了6篇:4篇Nature Genetics及2篇Nature Biotechnology文章。如果在加上今天的2篇Nature Genetics,就已經達到了8篇,這在某種程度上說明了中國在棉花領域處於領先水平。8篇文章具體解讀如下,希望對你有用。

棉花


背景介紹

棉花屬共包括46個二倍體棉種和5個四倍體棉種, 所有的二倍體棉花物種均可能由1個共同的祖先進化而來, 隨後分化為8個基因組, 包括A、B、C、D、E、F、G和K, 而所有的四倍體棉花種均是由A基因組亞洲棉和D基因組雷蒙德氏棉進行種間雜交加倍形成。解碼棉花基因組能夠深入了解棉種起源進化及棉花重要農藝性狀形成的遺傳基礎。因此, 由中國農業科學院棉花研究所牽頭, 分別對二倍體棉種雷蒙德氏棉和亞洲棉進行了基因組測序, 並隨後完成了四倍體棉種陸地棉的全基因組測序。

2012年, Wang等和Paterson等分別完成了棉花D基因組雷蒙德氏棉 (Gossypium raimondii) 的全基因組測序工作。利用全基因組鳥槍法 (Whole genome shotgun, WGS) 測序得到78.7Gb的數據, 測序深度為103.6倍, 利用遺傳連鎖圖譜上的1369個分子標記, 將73%的組裝序列錨定到染色體上, 總大小為567.2 Mb, 一共含有40 976個編碼蛋白的基因, 其中92.2%的基因通過轉錄組數據得到了驗證。

2014年, Li等完成了棉花A基因組亞洲棉 (Gossypium arboreum) 石系亞1號的全基因組測序及組裝工作。同樣採用全基因組鳥槍法測序得到193.6 Gb的數據, 測序深度是112.6倍, 利用高解析度的遺傳圖譜將90.4%的組裝序列錨定到13條染色體上, 組裝後的G.arboreum的基因組大小為1694 Mb, 其中各種形式的重複序列佔總基因組的68.5%, 預測含有41 330個編碼蛋白的基因, 其中96%的基因通過轉錄組數據得到了驗證。

棉花A組和D組基因組測序的完成, 為棉花栽培品種陸地棉的全基因組測序奠定了很好的基礎。2015年, Li等和Zhang等分別獨立完成了異源四倍體棉花品種陸地棉 (Gossypium hirsutum) TM-1的全基因組測序及組裝。採用全基因組鳥槍法測序、人工細菌染色體文庫測序及高解析度遺傳圖譜3種方法相結合, 組裝得到陸地棉的基因組大小為2173 Mb, 88.5% (1923 Mb) 的基因組錨定到26條染色體上, 其中At為1170Mb, Dt為753 Mb。一共預測有76 943個基因, 其中72 142個基因分布在染色體上, 35 056個基因分布在At基因組上, 37 086分布在Dt基因組上。G.arboreum和G.hirsutum的共線性較高, 分別覆蓋了A和At基因組的68.2%和65.9%;G raimondii和G.hirsutum的共線性更高, 分別覆蓋了D和Dt基因組的91.9%和88.8%。同源基因丟失比較發現, Dt丟失643對同源基因, At丟失了478對同源基因, 說明D基因在進化過程中基因丟失更嚴重。而四倍體棉花基因中At和Dt基因組丟失同源基因的數目分別為523和461對, 二倍體棉花A基因組和D基因組丟失同源基因數目分別為234和390對, 說明四倍體棉花丟失基因的頻率高於二倍體棉花, 而且在AD基因組雜交形成四倍體的過程中At基因組丟失了更多的基因。

棉花異源四倍體栽培品種有陸地棉和海島棉2種。由於海島棉產量低, 因此種植面積不到陸地棉的1%;但是, 海島棉能夠產生超長纖維, 纖維品質及抗病性都明顯優於陸地棉。為了更好地分析這些差異形成分子機制, Yuan等和Liu等採用全基因組鳥槍法測序、人工細菌染色體文庫測序及高解析度遺傳圖譜3種方法相結合, 分別對海島棉品種3-79和Xinhai 21進行了全基因組測序及組裝, 結果:3-79全基因組大小為2.57 Gb, 編碼80 876個蛋白質, 含有63.2%的重複序列;而Xinhai 21基因組大小為2.47 Gb, 編碼76 526個蛋白質, 含有69.11%的重複序列。


2018年,馬峙英等研究組的「Resequencing a core collection of upland cotton identifies genomic variation and loci influencing fiber quality and yield」

陸地棉(AADD,2n=52)是重要的天然纖維作物,因其適應性廣和高產特性,在世界範圍內廣泛種植,佔全球棉花的90%以上。長期的自然選擇和人工選育產生了大量的陸地棉種質資源,深入挖掘不同種類種質資源特別是核心種質的基因組變異仍是一項重要的研究工作。隨著人們需求的不斷增加和紡織工藝的改進,對棉花纖維品質提出了更高的要求,深化對種質資源表型變異的分子基礎研究和優異遺傳變異位點發掘,實現棉花品質、產量等重要性狀的有效選擇與改良提高仍然是棉花育種的重大科學問題。

該項研究首次完成了來自於中國、美國、澳大利亞等主要植棉國419份陸地棉核心種質(代表中國棉花種質資源庫7362份陸地棉)的基因組重測序,平均測序深度達6.55倍,鑒定出3,665,030個SNP,發現A亞組(At)上的SNP數量是D亞組(Dt)的2.3倍,但二者SNP密度很相似。群體遺傳多樣性(θπ=5.39×10-4)高於已報道的陸地棉地方品種(2.59×10-4)和現代改良品種(1.79×10-4),表明該核心種質群體為育種提供了相對寬泛的遺傳基礎。該項研究發現,現代品種比早期品種的核苷酸多樣性降低了8.6%,提供了人工馴化選擇導致棉花遺傳多樣性降低的直接分子證據。通過比較核心種質與陸地棉野生種系全基因組功能基因SNP變異,首次發現23,876個(33.88%)基因無任何SNP變異,表明這些基因在長期馴化過程中高度保守,33,899(40.10%)和6,957(9.87%)個基因分別表現為SNP變異數減少和增加,暗示這些基因應是育種改良予以重點關注的基因。

該項研究2014-2015年在黃河流域、長江流域和西北內陸三大棉區的6個地點共12個環境,鑒定了纖維長度、強度、鈴重、衣分等13個纖維品質和產量性狀,獲得了近20萬個表型數據。基於3,665,030個SNP的全基因組關聯分析,共鑒定出11,026個與13個性狀顯著關聯的SNP(性狀間去重後為7,383個),其中,大量SNP位點可以至少在3個環境中重複檢測,首次發現與纖維品質關聯的SNP數量遠多於纖維產量SNP,Dt亞組染色體較At亞組染色體存在更多的性狀關聯SNP。明確了不同性狀遺傳位點分布的重點染色體,發現Dt03存在大量控制開花的重要遺傳位點,94.6%與開花期關聯的SNP位於該染色體;與纖維長度顯著關聯的SNP主要位於Dt11(45.5%)和At10(40.9%),纖維強度主要位於At07(53.2%)和Dt11(32.5%);鈴重、籽指分別主要位於At02(57.1%)和At07(68.5%)。

該項研究共鑒定出7,398個基因(性狀間去重後為4820個)。結合4個差異較大的棉花品種纖維發育不同時期的轉錄組分析,發現3,089個(64.1%)基因在纖維發育的不同階段高表達,其中存在著許多與開花期(纖維起始)、纖維長度(伸長)和纖維強度(細胞壁加厚)有關的新基因。進一步通過不同單倍型品種基因定量表達、基因超表達和基因沉默試驗,首次鑒定出棉花開花/纖維起始新基因GhCIP1、GhUCE,纖維長度(伸長)新基因GhFL1、GhFL2,以及1個纖維強度(次生壁加厚)新基因Gh_A07G1769。

該研究還從7,383個顯著相關的SNPs中鑒定出5,753個優異位點。進一步評價野生種系、早期品種和現代品種的優異位點頻率(FEA),發現在馴化過程中,所有性狀FEA顯著增加(4.5%~45.4%),特別是主要產量性狀如衣分、鈴重、衣指和單鈴纖維重,而在育種選擇過程中,這些位點增加較少(0.2%~7.0%),這一發現與馴化過程中提高纖維產量作為選擇目標、現代育種中將纖維品質和產量同時作為改良目標相一致,反映了重要性狀表型選擇保留優異遺傳位點的分子進化。

河北農大馬峙英、王省芬、張艷、張桂寅、吳立強、李志坤,中棉所何守朴、孫君靈,諾禾致源劉志浩為論文的同等貢獻第一作者。河北農大馬峙英、王省芬,中棉所杜雄明,諾禾致源田仕林為論文通訊作者。該項研究得到國家現代農業產業技術體系、河北省科技支撐重點計劃、國家重大科技專項、國家重點研發計劃的資助。


2018年,朱玉賢等人的「Resequencing of 243 diploid cotton accessions based on an updatedA genome identifies the genetic basis of key agronomic traits」

棉花是全球最重要的經濟作物之一,目前廣泛栽培的陸地棉和海島棉為異源四倍體AD基因組,是由二倍體A基因組亞洲棉或草棉和D基因組雷蒙德氏棉的相似種雜交馴化而來的。朱玉賢院士團隊及中棉所自2012年合作解析了二倍體D基因組雷蒙德氏棉(Nature Genetics,2012),二倍體A基因組亞洲棉(Nature Genetics,2014),異源四倍體AD基因組陸地棉(NatureBiotechnology, 2015)。此次升級後的亞洲棉參考基因組相比較於之前公布的亞洲棉基因組,在基因組完整度,組裝和掛載質量上均有明顯的提升。組裝的contig從原版基因組的40,381條減少到8,223條,組裝指標N50從原版本的665.8 kb提升到1100 kb,其中發現約佔棉花基因組85.39%的為轉座子,這也說明亞洲棉基因組高度的複雜性。

基於高質量的參考基因組,研究團隊對230份亞洲棉群體和13份草棉群體進行重測序,獲得包含17,883,108 SNPs和2,470,515 插入或者缺失的基因組變異圖譜,利用SNP構建了系統發育樹和群體結構,結果顯示,草棉和亞洲棉群體具有明顯差異;中國的亞洲棉最開始分布於中國南方,後續才被引入到黃河流域和長江流域。中國南北顯著的氣候差異使不同區域的棉花群體的一些性狀具有明顯的地域分布特徵,例如,抗枯萎病能力,單株果節數,棉鈴重量,開花時間等。

研究團隊對棉花抗枯萎病的GWAS分析定位到谷胱甘肽轉移酶GSTF9基因的啟動子上,通過抑制該基因的表達使抗病的品種表現出易感病的性狀,這充分說明了GaGSTF9基因負責調控了棉花抗枯萎病的性狀。同時研究發現棉花抗枯萎病性狀受到了地域選擇影響,黃河流域和長江流域的亞洲棉普遍都表現出抗棉花枯萎病的性狀,而長江流域以南的亞洲棉表現出易感病的性狀。此外,研究團隊對控制棉花種子油含量變化和棉花纖維起始等性狀也定位到了相關的基因,並進行了詳細的研究,這些新的發現為棉花育種提供了新的思路。

據悉,中國農科院棉花所杜雄明研究員、北京大學博士黃蓋、棉花所博士何守朴、楊召恩、孫高飛、馬雄風及農科院基因組所李楠為該論文的共同第一作者。武漢大學朱玉賢院士、棉花所李付廣所長、農科院基因組所林濤為共同通訊作者。該研究得到了國家自然科學基金項目和科技部、農業部、農科院及廣東省領軍人才項目支出與資助。

2012年,朱玉賢及王俊等研究組的「The draft genome of a diploid cotton Gossypium raimondii.」


該基因組含有40,976個蛋白質編碼基因,其中92.2%通過轉錄組數據進一步證實。觀察到大約13-20萬年前eudicots共享的六倍體化事件以及棉花特異性全基因組重複的證據。


https://www.nature.com/articles/ng.2371


2014年,朱玉賢及王俊等研究組的「Genome sequence of the cultivated cotton Gossypium arboreum.」

棉花基因組複雜的異源四倍體性質(AADD; 2n = 52)使得遺傳,基因組和功能分析極具挑戰性。2014年,朱玉賢及王俊等研究組測序並組裝了Gossypium arboreum(AA; 2n = 26)基因組,這是A亞基因組的假定貢獻者。

通過雙末端測序獲得總計193.6Gb的覆蓋基因組112.9倍。朱玉賢及王俊等研究組在13個假染色體上進一步錨定和定向組裝的90.4%,發現68.5%的基因組被重複的DNA序列佔據。朱玉賢及王俊等研究組預測了G. arboreum中的41,330個蛋白質編碼基因。在物種形成前,G. arboreum和Gossypium raimondii共享兩個全基因組重複。在過去的500萬年中插入長末端重複序列是造成這些基因組大小的差異的原因。比較轉錄組研究表明,核苷酸結合位點(NBS)編碼基因家族在抵抗黃萎病菌和乙烯參與棉花纖維細胞發育中的關鍵作用。

https://www.nature.com/articles/ng.2987


2015年,朱玉賢等研究組的「Genome sequence of cultivated Upland cotton (Gossypium hirsutum TM-1) provides insights into genome evolution.」

由於其複合異源四倍體(AtDt)基因組,棉花已被證明難以測序。在這裡,朱玉賢等研究組使用由5倍BAC-BAC序列和高解析度遺傳圖譜輔助的配對末端序列產生基因組草圖。

在朱玉賢等研究組的組裝中,2,173-Mb支架中88.5%覆蓋AtDt基因組的89.6%?96.7%,錨定並定向至26個假染色體。將這種陸地棉AtDt基因組與已測序的二倍體棉花(AA)和雷蒙德斯棉(DD)基因組進行比較揭示了保守的基因順序。

重複序列佔AtDt基因組的67.2%,源自Dt的轉座元件(TEs)似乎比從At更加活躍。 AtDt基因組大小在異源多倍化後發生。 A或At基因組可能已經經歷了纖維性狀的正面選擇。纖維素合成酶(CesA)和1-氨基環丙烷-1-羧酸氧化酶1和3(ACO1,3)的不同調節機制的協同進化對於增強陸地棉中的纖維生產可能是重要的。

https://www.nature.com/articles/nbt.3208


2015年,南京農業大學的「Asymmetric subgenome selection and cis-regulatory divergence during cotton domestication.」

陸地棉是多倍體作物馴化和轉基因改良的模式。 在這裡,南京農業大學的研究人員測序了異源四倍體陸地棉。 通過整合全基因組鳥槍法槍讀數,細菌人工染色體(BAC)末端序列和基因型逐個測序遺傳圖譜的TM-1基因組。

研究人員組裝並注釋了32,032個A亞基因組基因和34,402個D亞基因組基因。 在A亞基因組中比在D亞基因組中更常見的是結構重排,基因缺失,被破壞的基因和序列發散,這表明不對稱進化。 然而,在亞基因組之間未發現全基因組表達優勢。 選擇和馴化的基因組標記與用於A亞基因組中的纖維改良和D亞基因組中的應激耐受性的正選基因(PSG)相關。 該草案基因組序列為工程優質棉花品系提供了資源。

https://www.nature.com/articles/nbt.3207#auth-53

2017年,華中農業大學張獻龍等研究組的「Asymmetric subgenome selection and cis-regulatory divergence during cotton domestication.」

比較群體基因組學為揭示作物馴化的遺傳史提供了極好的機會。陸地棉(Gossypium hirsutum)長期以來一直是重要的經濟作物,但缺乏對人類選擇效應的全基因組和進化的理解。

在這裡,華中農業大學張獻龍等研究組描述了352個野生和馴化棉花種質的變異圖。張獻龍等研究組掃描了93次馴化掃描,佔據74 Mb的A亞基因組和104 Mb的D亞基因組,並通過全基因組關聯研究鑒定了19個與纖維品質相關的候選基因位點。

張獻龍等研究組提供證據顯示不對稱亞基因組馴化定向選擇長纖維。對DNA酶I超敏感位點和3D基因組結構的分析,將功能性變體與基因轉錄相聯繫,證明馴化對順式調節分歧的影響。這項研究為主要作物的基因組織,調控和適應的演變提供了新的見解,並且應該成為基因組棉花改良的豐富資源。

https://www.nature.com/articles/ng.3807


2017年,中國農科院棉花所杜雄明等研究組的「Genomic analyses in cottonidentify signatures of selection and loci associated with fiber quality andyield traits.」

陸地棉(Gossypium hirsutum)是世界上最重要的天然纖維作物。棉花栽培品種的整體遺傳多樣性和改良過程中發生的遺傳變化知之甚少。在這裡,中國農科院棉花所杜雄明等研究組報告了基於318個地方品種和現代改良品種或品系的全基因組重新測序的現代改良陸地棉綜合基因組評估。

杜雄明等研究組發現皮棉產量的相關位點多於纖維品質,這表明皮棉產量比其他性狀具有更強的選擇特徵。杜雄明等研究組發現兩個乙烯通路相關基因與改良品種的皮棉產量增加有關。杜雄明等研究組評估了歷史釋放品種組中每個等位基因的群體頻率,發現54.8%的全基因組關聯研究(GWAS)等位基因被檢測出來自三個地方品種:Deltapine 15,Stoneville 2B和Uganda Mian。杜雄明等研究組的研究結果為改良棉花品種和進一步對多倍體作物進行分析提供了基因組學基礎。

https://www.nature.com/articles/ng.3887

註:iPlants公眾號由iNature公眾號及PaperRSS公眾號支持運行,歡迎植物學領域的同行們關注,長按下面的二維碼可直接關注。

微信加群

公眾號熱點推送回顧

版權聲明


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 iNature 的精彩文章:

浙江大學張傳溪研究組在褐飛虱的蛋白質組學取得重大進展
浙江大學郭國驥剛發完Cell,現在又下一城,在單細胞測序領域取得重大進展

TAG:iNature |