當前位置:
首頁 > 最新 > 66個水稻泛基因組文獻分享

66個水稻泛基因組文獻分享

Genomes of 13 domesticated and wild rice relatives highlight genetic conservation, turnover and innovation across the genusOryza【2018.1.22】

摘要

稻屬是研究分子進化的模型植物。使用跨越稻屬發育樹的13個參考基因組,結果顯示儘管很少有大規模染色體重排加速物種多樣化,卻被許多物種特異性新元素的出現和轉換所反映,包括轉座子,以及潛在的新的編碼和非編碼基因。研究解決了稻屬系統發生有爭議的地方,包括兩個馴化物種的年輕"AA"亞族中表現在不同染色體間複雜的滲入歷史。這項研究強調了功能性偶聯抗病基因的流行,鑒定許多潛在用於未來作物保護的新單倍型。最後,隨著IR 8"奇蹟水稻"完整組裝的公布,這項研究標誌著現代水稻研究的一個里程碑,它緩解了饑荒並驅動了亞洲的綠色革命。

結果

1.13個基因組數據

兩個馴化物種達到了參考基因組水平的組裝(IR 8和N22),7個野生物種((Oryza rufipogon,Oryza nivara,Oryza barthii,O. glumaepatula,Oryza meridionalis,Oryza punctata和L. perrieri)用短的或者長的readsreads來組裝(如表1)。這些組裝和其他4個已經發表的基因組用一致的注釋方法來減少方法誤差。

表113個水稻物種的組裝和注釋統計

2.物種樹

稻屬的系統發育關係是很明確的,但是AA基因組間包括兩個馴化物種之間的關係還很模糊,因為很多的基因樹不一致。我們使用10個Oryza基因組中的6,015個單拷貝直系同源基因,構建物種進化樹,它支持兩個獨立的粳稻和秈稻的起源。推測的AA物種的年齡小於2.5百萬年(圖1b),之前基因流的足跡在AA物種之間可能仍然是可檢測的。

圖1b

3.核型保護

泛稻屬中多倍化事件引起的水稻中12號染色體核型與其他現存稻屬植物相比在水稻中偏差較小。運用同線性圖和全基因組比對,我們發現外群L. perrieri有許多小的倒位與O. sativa相比。為了估計稻屬中這類事件的發生率,作者重點關注該物種樹中至少有兩個連續物種共有的倒位事件,同時儘可能減少由於組裝錯誤造成的物種特有的事件。Brachypodium distachyon作為外群,我們確定了9個著絲粒的倒位,長度從60到300 kb,包含多達19個基因(圖2).估計這種倒置事件大概160萬年出現一次,但是,這個比率並不是恆定的,因為在FF基因組和AA-BB的祖先的分化只有一次事件。

圖2 稻屬譜系內的染色體倒位事件

4.TE多樣化迅速消除機制

TEs的選擇性擴增和缺失在稻屬基因組和染色體進化中起著關鍵作用。重複,包括TEs,占基因組的27-50%。 每個物種可以用它長末端重複-反轉錄轉座子(LTR-RTs)的多樣性來區分。LTR-RTs的比較注釋和系統發育分析鑒定了幾個物種特異性的置換爆發,大多數在過去的250萬年內。因為它的平均年齡很小,不同物種的LTR-RT是不同的。LTR-RT的快速丟失可以大大降低TE多樣性和限制基因組大小增加。在八個最密切相關的AA物種中追蹤75個直系同源LTR-RT基因,平均缺失率為3.62kb /百萬年的。

這些結果強化了TEs是重要基因組進化的驅動力的概念,因為它們促進基因間區域的快速更新。然而,並非所有的TEs行為都相同,微型終端重複反轉錄轉座子(TRIMs)

位於基因附近,在所有13種基因組中高度保守。

5.Indels基因組進化和馴化的驅動

八種最密切相關的AA基因組成對比較,根據基因組比較確定了216,059-699,587個indels。與以前在Oryza和Arabidopsis中的情況一致,短indel很受歡迎。為了更好地理解indel動態和在馴化中的作用,我們擴大了這項研究,以包括20個O. glaberrima的栽培種和其19個野生祖先O.barthii。用中等深度重新測序,我們鑒定了O.blaberrima中有162,267個的indel,O.barthii中有448,000個。π在O.barthii(0.622 / kb)中要高於O.blaberrima(0.446 / kb),與O. glaberrima馴化期間的遺傳瓶頸和強烈選擇一致。實驗表明馴化物種中多態性插入子的固定率遠高於其祖先。這些觀察結果大致類似於觀察到的亞洲栽培稻及其祖先的SNP數據。

6.物種間特有的基因家族

研究確定了21,448個預測的基因家族,可以分為四個年齡段(圖3a)。最古老的群體,至少可以追溯到被子植物的共同祖先,包括62%的基因只有29%的家族。

圖3a

編碼長度表現出明顯的年齡依賴性,中等長度提升了幾倍從最小的增加到最老的。即使排除了被子植物共享的基因外,情況仍然如此(圖3b)。觀察到的年齡依賴性,在擬南芥中也有發現。當定性評估和定量評估時(圖3b),基因表達與年齡呈正相關。再次,在分析中排除來源於被子植物的基因並沒有改變這一發現。

圖3b

7.LincRNA基因作為遺傳新型的來源

研究發現了數千個不與蛋白質編碼基因重疊的lincRNA。L.perrieri具有比任何稻屬更多的lincRNAs,而兩種馴化物種O.sativa和O. glaberrima,顯著少於野生祖先。大多數lincRNA家族最近都在進化,大多數是物種特異性的。與脊椎動物相似,lincRNAs富集TE衍生的序列,特別是來自DNA轉座子和LTR-RTs序列。

8.抗病基因的進化

大多數植物病害抗性基因編碼能直接或間接識別的細胞內核苷酸結合的亮氨酸重複序列(NLR)受體。NIR在水稻群體中是多變的,研究確定了5,408個候選NLR基因,範圍從O. brachyantha中的237到O. sativavg.indica中的535個,分布在28個亞科(圖4a)。此外,秈稻和粳稻的NLR增幅與其野生祖先相比明顯較高,與人工選擇增加NLR多樣性相一致。如先前報道的,大多數NLR基因是位置聚類的,在第11號染色體上具有最大的密度,現在擴展到了Leersia屬。

圖4a.三個物種中的NB-ARC區域的最大似然樹

參考文獻

Stein J C, Yu Y, Copetti D, et al. Genomes of 13 domesticated and wild rice relatives highlight genetic conservation, turnover and innovation across the genus Oryza[J]. Nature Genetics, 2018, 7(1).


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 生信人 的精彩文章:

甲基化450k晶元數據的處理和分析軟體匯總

TAG:生信人 |