五加科植物葉綠體基因組結構與進化分析
葉綠體是綠色植物進行光合作用的細胞器,具有合成蛋白質、澱粉、色素等功能,普遍存在於真核自養生物中,尤其是藻類和陸生植物,其基因組可自主遺傳[1]。在被子植物中,葉綠體基因組比較保守,其結構大多為雙鏈環形,具有4個區域,即2個序列相同方向相反的重複區(inverted repeats,IRB/IRA)、1個大單拷貝區(large single copy,LSC)和1個小單拷貝區(small single copy,SSC)[2]。一般情況下,基因組大小為120~180 kb,有100~120類編碼基因,包含70~88類蛋白編碼基因,30~32類tRNA,4類rRNA[3]。
五加科是傘形目下的一個大科,包含2個亞科45個屬,有1 400多種植物,多為珍貴的藥用植物,如人蔘Panax ginsengC. A. Mey.、三七Panax notoginseng
(Burkill)F. H. Chen ex C. Chow、刺五加Eleutherococcus senticosus(Ruper. et Maxim.)Maxim.、刺楸Kalopanax septemlobus(Thunb.) Koidz.等,具有抗腫瘤、血糖調節、抗衰老等多種藥理作用[4],受到人們的極大關注。葉綠體的基因數量、基因順序以及結構組成都相對穩定[5];所含的信息量大,進化速率適中[6];基因組序列長度較短,易獲取,且沒有核基因與線粒體基因複雜[7];使其成為植物系統發育分析的最佳選擇,為物種間的親緣關係分析提供可靠的信息。
本研究通過對五加科20種植物的葉綠體基因組的比較分析,揭示了葉綠體基因組的結構特徵與IR區的邊界擴張與收縮問題,展示了20個物種的進化關係,為進一步研究該科物種的遺傳背景、藥用植物鑒定、資源保護與開發利用奠下基礎。
1材料
GenBank中已發表的五加科植物葉綠體基因組。
2方法
2.1數據的收集
在GenBank中檢索已發表葉綠體基因組的五加科植物,共計20個物種(表1),下載基因組序列,獲取注釋信息。
2.2數據統計
利用Excel統計20種五加科植物葉綠體基因組的大小、GC量、LSC、SSC、IR的長度等基本結構特徵信息。對於未知LSC/SSC/IRs邊界信息的植物葉綠體基因組(如無梗五加、屏邊三七、遼東楤木等)使用Blast進行自身序列比對,先確認IRs的長度與邊界,最後獲取LSC和SSC的長度信息。
2.3系統進化樹的構建與分析
使用ClustalX 2.0做多重序列比對,選擇默認參數,序列間的差異度使用Jukes-Canter校正。採用MEGA 4.0中的NJ(neighbor-joining)法構制系統進化樹,Bootstrapmethod進行重複檢驗,重複1000次,選擇傘形科當歸(表1)作為外類群。
3結果與分析
3.1五加科葉綠體基因組結構基本特徵
20種五加科植物的葉綠體基因組大小不盡相同,八角金盤最小,長155 613bp,馬蹄參最大,長157522 bp,相差約2 kb。其中LSC佔總長度的絕大部分,其差異也最大,大小在86 028~87640 bp,最大者是馬蹄參,最小者是波緣楤木,相差約1.5 kb。SSC在17 867~18 247 bp,僅相差380 bp。2個IR區長度為25 629~26 180 bp,各物種間的具有差異。大部分物種的IR區長度相同,僅有西洋參的IRB與IRA不相同,兩者之間相差4個鹼基。GC量均分布在38.00%左右,同屬之間,差異較小,五加屬的3個葉綠體基因組GC量完全一致,鵝掌柴屬差異最大,為0.10%。不同屬間的最大差異為0.32%(表2)。
3.2基因數量分析
總基因在123~133個(表2),13個植物有132個基因,3個有131個基因,波緣楤木基因樹最多,有133個,而鵝掌柴的基因最少,有123個。其中rRNA最保守,數量均為8個。蛋白編碼基因主要為87個,僅有5個物種是86個。它們在進化過程中均出現了基因替換現象,由cemA基因替換了原有ycf10基因(在某些物種中注釋為ORF229)。僅有4個物種發生了基因丟失,大葉三七和野三七還丟失ycf15基因,西洋參丟失petD基因,鵝掌柴丟失rps16基因和psbN基因。
蛋白編碼基因總體差異較小,因此總基因數的差異主要是由tRNA基因引起。大部分物種的tRNA是37個,波緣楤木最多38個,鵝掌柴最少29個,具有差異的主要基因是trnG與trnI。
3.3IR邊界變化分析
葉綠體基因組為環形結構,IR與LSC和SSC存在4個邊界,即IRB-LSC、IRB-SSC、IRA-SSC和IRA-LSC。在基因組進化過程中,IR邊界會發生擴張與收縮,使某些基因進入IR區或單拷貝區。通過研究發現,五加科葉綠體基因組的4個邊界相對較保守(圖1)。所有物種的IRB-LSC邊界均在rps19基因內,且rps19基因序列大部分在LSC區,野三七的rps19基因在IRB區的序列長度為111 bp,其餘僅有16~54 bp。大部分物種的IRB-SSC邊界處於ycf1假基因或ycf1上,三七和穗序鵝掌柴的ycf1假基因在IRB內部。所有物種的IRA-SSC邊界均處於ycf1基因上,ycf1基因存在於IRA內的序列長度在1 429~1 652 bp,差異較小。IRA-LSC邊界與LCS上的trnH連續或具有較短的間隔,間隔為2~18 bp。
3.4系統發育分析
20種五加科植物的葉綠體基因組經過全局比對,以當歸作為外類群,構制建了系統進化樹(圖2),其中18個節點,支持率最低為70%,14個為100%,其餘3個均在90%以上,可信度較高。
從圖2中可以看出,馬蹄參(多蕊木族,馬蹄參屬)是五加科植物中最早分離出來的物種,與其他物種的親緣關係較遠,其餘的19種五加科植物聚到2支進化枝,I進化枝和II進化枝。人蔘屬(人蔘族)和楤木屬(楤木族)的人蔘、三七、屏邊三七等8個物種聚到I進化枝,楤木屬的2個物種先分離出來,與人蔘屬的3個分支成姐妹關係。II進化枝則為多蕊木族物種,包含刺五加、八角金盤、樹參等7個屬的11個物種,其中鵝掌柴屬物種較早分離,與其他6個屬的9個物種形成的分支形成姐妹關係。
4討論
被子植物的葉綠體基因組大小在120~180 kb,IR區的大小在20~30 kb[3]。20種五加科植物的葉綠體基因組大小在155~158 kb,IR區長25~27 kb,與被子植物葉綠體基因組特徵相吻合。與近緣物種當歸相比,基因組增大,而IR區有所減小。通過比較發現,20個基因組大小差異度約為2 kb,而LSC、SSC與IR 4個區域的差異呈現為LSC(約1.5 kb)>IR(551 bp)>SSC(380 bp),因此整個基因組長度的差異主要是由LSC的差異引起。
葉綠體基因組上的基因轉換能力較高,能保證2個IR區序列的一致與穩定,增強了葉綠體基因組的穩定性和保守性[8]。本研究中,已測序完成的20個五加科植物,分類於10個屬中,屬間與屬內的葉綠體基因組IR區差異都很小,屬內最大差異僅260 bp,屬間差異為551 bp。天竺葵屬[9]IR區長達75 kb,柳杉[10]IR區僅114 bp,豌豆[11]IR區丟失,五加科葉綠體基因組並未出現這些IR區過長或過短甚至丟失的現象,整體比較穩定與一致。
葉綠體基因組中存在一個普遍的進化現象,即4個IR邊界發生擴張與收縮事件使相同植物群體或不同植物群體的整個葉綠體基因組大小出現差異或較大差異。在獼猴桃[12]中,rps19基因沒有進入IR區,整個基因位於LSC區,不是IRB-LSC邊界基因。而在五加科中,rps19基因是綠體基因組IRB-LSC的邊界基因,且該邊界均在其內部。rps19基因進入IRB區的序列大部分在16~54 bp,僅野三七較長,111 bp,整體比十字花本科[13]短。IRA-SSC邊界與LSC上的trnH基因存在~18 bp的間隔,而在單子葉植物中,如蘭科的文心蘭和蝴蝶蘭,禾本科的水稻、大麥、剪股穎等[14]植物葉綠體的這2個邊界發生擴張,使rps19與trnH完全進入IR區,由一個拷貝變成了2個拷貝,而之後大麥與剪股穎的這2個邊界又發生了收縮事件,使rps19與trnH回到了LSC區。IRB-SSC邊界和IRA-SSC邊界幾乎都位於ycf1或ycf1假基因上,由於邊界的擴張,導致三七和穗序鵝掌柴的ycf1假基因全部進入到IRB中,又IRA-SSC邊界的收縮或擴張,使ycf1在IRA中的長度存在一定差異,這2個邊界都不同於單子葉植物高粱、玉米、甘蔗等[14]。這都表明雙子葉植物與單子葉植物的葉綠體基因組邊界具有較大差異[15]。
本研究利用五加科植物葉綠體全基因組序列構建了10個屬20個物種的系統進化樹,結果表明,該進化樹的解析度較高,各節點也獲得了較高的支持率,每個屬之間呈現出較為明確的發育關係。其中不同屬的梁王茶與刺楸聚為一枝,且獲得較高支持率,95%,說明兩者之間的親緣關係很近,高於同其他屬的物種,與Li等[16]的研究結果一致。馬蹄參位於進化樹的基部進化枝,應是五加科的原始類群物種。
參考文獻(略)
來 源:宋 菊,龍月紅,林麗梅,尹 峰,邢朝斌. 五加科植物葉綠體基因組結構與進化分析 [J]. 中草藥, 2017, 48(24):5070-5075.
TAG:中草藥雜誌社 |