遺傳發育所在核糖體RNA基因拷貝數變異和表達調控方面獲進展
核糖體是細胞中最重要的細胞器之一,負責將細胞轉錄出來的信使RNA(messenger RNA,簡稱「mRNA」)翻譯成蛋白質。真核生物的核糖體,主要由4種核糖體 RNA(rRNA)和80多種核糖體蛋白組成。其中,45S rRNA基因位點通過轉錄加工可以產生18S、5.8S和25S rRNA;而5SrRNA基因位點行使5S rRNA的轉錄。隨後,25S、5.8S以及5S RNA結合核糖體蛋白形成核糖體大亞基,同時18S RNA與其他核糖體蛋白形成核糖體小亞基,最終組裝成細胞中的「蛋白加工工廠」。
在絕大多數真核生物的基因組內,不論45S rRNA基因還是5S rRNA基因都在染色體上以多拷貝串聯重複的形式存在。然而,這種高度串聯重複結構存在的生物學意義目前並沒有明確結論。之前,唯一一項對於45S rRNA基因拷貝數變異的大規模研究發生在人類群體中,研究表明人基因組內45S基因位點在個體間存在廣泛變異,並且發現其拷貝數與眾多基因的表達調控顯著相關。然而,對於45S rRNA基因拷貝數如何調控基因表達並沒有任何闡述。
中國科學院遺傳與發育生物學研究所陳明生研究組博士李博,通過利用玉米一個高多態性的育種群體(maize 282 diversity panel)重測序數據,對每個玉米的自交系的45S rRNA以及其它高度串聯重複元件的基因拷貝數進行準確估算,發現玉米群體中45S rRNA存在廣泛變異(1,061~17,347 copy),並且受到玉米群體結構的影響(圖1)。廣泛遺傳力分析表明這些串聯重複元件具有較高的遺傳力,然而再利用GWAS分析時,卻很難定位已知的遺傳位點,表現出常見的「遺傳力丟失」現象(missing heritability)。為了在玉米群體中重複人類核糖體拷貝數變異與基因表達的關係,研究人員利用該群體的7個不同組織材料大約2,100個轉錄組數據,對45S的拷貝數與基因表達水平進行了相關分析。然而,在所有7個組織內,並沒有鑒定出大量受到45S拷貝數調控的基因。
研究人員隨後將目光轉向了45S rRNA基因的表達。眾所周知,核糖體RNA的轉錄本占細胞總RNA的80%以上,在進行mRNA測序時,最重要的就是將rRNA污染去除。然而,通過一種3』mRNA-seq技術,可以無需對核糖體RNA預先進行分離,因為只有具有poly(A)尾的成熟mRNA才會被反轉並測序。令人奇怪的是,研究人員卻在測序數據中發現了大量來源於rRNA的序列數據。深入分析發現,這些數據應該是源於45S基因序列中存在許多類似於poly(A)的序列片段,通過與引物上的poly(T)不完全匹配後完成了對45S轉錄本的部分區域的測序(圖2)。值得注意的是,這種現象在2100個測序文庫的數據分析中完美重複,因此該數據可以用來對rRNA的表達水平進行定量分析。利用該數據,研究人員首次對rRNA的表達水平在群體、不同組織以及不同發育時期的差異表達進行了分析,發現核糖體RNA(45S rRNA)的表達並不像人們之前想像的那麼保守,而是存在著廣泛的變異。
研究人員隨後又將45S rRNA的表達水平與各個組織中的基因表達水平進行了共表達分析,結果發現大量的與45S rRNA共表達的基因,GO分析顯示與核糖體合成相關的基因數量顯著,其中包括大量的核糖體蛋白基因(r-protein genes)。此外,不同組織中都存在與自身發育相關的共表達基因,比如在幼苗的根部和芽部,大量的抗性基因與45S rRNA表達量顯著相關,表明在幼苗發育時期需要構建大量的防禦系統來保護自身的生存。
最後,研究人員將45S rRNA的拷貝數以及表達水平與群體的田間性狀進行了相關分析,發現兩者都與開花相關性狀顯著相關;然而,後續分析表明兩者可能是通過不同的途徑對開花性狀進行了干預。
該研究在8月30日的Genome Research在線發表(DOI:10.1101/gr.229716.117)。李博為文章第一作者,陳明生與李博為該論文的共同通訊作者。美國康奈爾大學教授Edward Buckler及其團隊為該研究的順利完成提供了支持。該論文得到國家自然科學基金項目的資助。
論文信息:Bo Li*, Karl Kremling, Penghao Wu, Robert Bukowski, Maria Romay, En Xie, Edward Buckler, and Mingsheng Chen* (2018) Co-regulation of ribosomal RNA with hundreds of genes contributes to phenotypic variations. Genome Research. doi:10.1101/gr.229716.117(*為共同通訊作者)
圖1. 各種高度串聯重複序列在玉米群體中的拷貝數變異。A)45S rRNA;B)5S rRNA,以及玉米knob區域中的兩種串聯重複序列;C)Knob 180; D)Knob TR1。
圖2. 利用3』mRNA sequencing技術可以獲得45S rRNA表達的定量分析。A)將RNA-seq數據比對到45S rRNA基因位點上可以發現5個明顯的Peak區,這些都是來源於45S rRNA的測序reads;B)玉米45S的結構圖;C)序列分析發現Peak區附近多AAA串聯序列,可能是導致與poly(T)匹配並被測序的主要原因。
中國生物技術網誠邀生物領域科學家在我們的平台上,發表和介紹國內外原創的科研成果。
本公眾號由中國科學院微生物研究所信息中心承辦
微信公眾號:中國生物技術網
TAG:中國生物技術網 |