環狀RNA表達的細胞類型特異性特徵
摘要
在人和小鼠基因組的很多位點存在環狀rna的轉錄,許多的這些位點,主要的RNA亞型是一個環狀。使用環狀RNA識別的改進的計算方法,在果蠅和人基因組中發現廣泛環狀RNA表達,環狀RNA大概佔poly(A)RNA數量的1%。從ENCODE數據的分析顯示,環狀RNA的表達,單個基因中環狀rna與線性rna轉錄本的比率,以及circular rna亞型的剪接模型都是細胞類型特異性的,這些結果表明環狀rna是基因表達的組成性的,保守的,並且是調節的功能。
在人類和小鼠細胞中環狀RNA的普遍表達已經被一系列高通量測序技術確認,Rnase R 處理,並去除核糖體RNA,結合先前發布的信息學演算法識別環狀rna。以前的報告中絕大多數描述的圓形亞型(1025/1319)也是通過Rnase R 處理的rna深度測序鑒定。文章描述了一個較為系統的生物信息學和統計學的全基因組研究,顯著擴大了人類細胞中識別的環狀RNA,並揭示環狀RNA的表達被顯著調控。
數據:
從ENCODE資料庫下載原始 fastq文件,獲得15種細胞類型中的每一種的2個重複, 文章獲得了所有長poly(A)-reads。
環狀RNA的識別:
文章創建了所有UCSC已知基因注釋錯排外顯子 -外顯子junction的自定義資料庫。通過映射來自無poly(A)的RNA的配對末端測序read,檢測到數千種不同的環狀RNA同種型,包括許多其中多個環狀同種型從相同基因座轉錄的情況。分析要求一個read(read1)映射到診斷外顯子x - 外顯子y結點處(y
結果:
1、不同細胞類型中環狀rna的改進檢測
相比以前的方法該方法改進的靈敏度能夠確定數千個先前未報告的環狀亞型和一些非常小的環狀RNA,在15個細胞類型中,在FDR值為0.025條件下, 8466個基因的注釋外顯子邊界發現了46866個不同的基因內剪接junctions,檢測到白血病細胞系K562中有最多的環狀RNA表達相關的基因(16559個不同的環狀特異性剪接junctions)。在胎兒肺成纖維細胞系AG04450中發現了11590個不同的環狀特異性剪接junctions,在人成纖維細胞系BJ中識別了7771個junctions.
2 、驗證
文章用了Rnase R核糖核酸外切酶,來測試預測出的環狀rna。所有的預測環狀rna耐受消化而預測的線性rna是對Rnase R 高度敏感,證明了文章計算方法特異識別環狀rna。
3.環狀和線性rna亞型的相對丰度
文章分析以確定每個環狀RNA相比於其同源線性RNA的相對丰度。這就需要估計每一個線性RNA的相對丰度,每個環狀RNA的相對丰度。同時需要一個等量因子或歸一化常數將1測量單元的線性rna的分子數量與1測量單元環狀rna的分子數量相關聯。對於線性rna丰度,以RPKM為計算單位。環狀亞型的丰度用比對到亞型節點的read對的數量來估計。丰度估計表明,研究的3個細胞系環狀rna分子大約佔poly(A)分子的1%。每個細胞系大約50個基因狀亞型比線性亞型含量豐富,對於部分環狀亞型基因,環狀亞型的丰度大約為線性亞型的5%-10%。
4、環狀亞型的調控
文章使用了ENCODE印記細胞系rna-seq數據研究環狀rna表達調控。並用qPCR定量環狀rna表達差異。qPCR測試基因CYP24A1,PVT1,LPAR1和LINC00340對環狀rna表達具有細胞差異性。而A549、AG04450、及Hela細胞系中FAT1、HIPK3基因環狀rna表達有一個穩定水平。
5、環狀rna 亞型剪接位點選擇的差異性
一個基因編碼多個可變剪接環狀亞型,為研究形成環狀rna的剪接受體及供體的模型特徵,文章把剪接位點對分為3類,」定型「類、」proximal 「類、及」組合「類,大部分有環狀亞型(定型類)的基因,一個單一的剪接受體、供體對被優選形成環狀rna亞型,CYP24A1、MCU基因,每個基因中只有一個剪接異構體被優選。
6、環狀rna異構體剪接位點的選擇被調控
作者發現環狀rna受體與供體使用模型具有細胞類型的特異性選擇,NHLF中識別的唯一的RNF19B亞型在其他細胞系中未檢測到,相反的,在其他細胞系中RNF19B主導亞型在NHLF中未檢測到。
7、環狀rna跨物種的進化保守性
文章最後還分析了跨物種的保守性,文章的研究結果,人類環狀RNA表達基因的小鼠直向同源本身更有可能編碼環形RNA,與類似的環狀RNA保守的獨立分析是一致的,並支持環狀RNA具有進化保守功能的假說。雖然環狀rna的丰度、普遍存在、潛在的發育調控都表明了環狀rna的重要作用,但它的性質及機制仍未得到充分解釋。
參考文獻:
Cell-typespecific features of circular RNA expression.
TAG:計算表觀遺傳學 |