當前位置:
首頁 > 知識 > 基因晶元小知識

基因晶元小知識

基因晶元小知識



分類比較分析主要是比較兩組或多組的已知樣本類型的晶元實驗,來尋找出與條件相關的特異性基因或顯著差異表達的基因(differentially expressed genes, DEGs)。

分類比較中有兩個因素至關重要:樣本配對和對重複實驗取均值。如果欲比較的實驗樣本是配對的,那麼必須選擇配對t-檢驗。舉例來說,如果實驗是在每個病人的原發性癌症組織和轉移後癌症組織上進行的,那麼配對t-檢驗更為合適且能夠提高分析的統計學效力。如果在某些RNA樣本進行了多次技術重複,那麼該分析必須從那批技術重複中選擇一個用來分析或使用均值。當然對於重複實驗晶元取均值最嚴謹的方法是通過使用散點圖觀察各技術重複實驗間的相關情況,從而剔除質量較差的實驗晶元,再而使用均值。分類比較分析中每組至少兩個樣本每組至少兩個樣本,否則無法計算P值。


1.二分類比較分析


t 檢驗可用於兩個生物條件下多個樣本的差異表達基因的篩選。當 t達到根據可信度選擇的標準時,比較的兩組樣本被認為存在差異。實驗資料是配對的,那麼選擇配對t檢驗。三分類及以上的比較分析就是把F-檢驗應用與以上所述的二分類比較分析。這種針對一個基因的單變數分析就是經典統計學上的均值差異比較,適用於正態分布,方差齊性的連續性資料。


2.統計學校正

由於晶元包含了成千上萬的基因,那麼對每個基因採用單變數分析會產生較多的假陽性。舉例來說,假設我們設定0.001為顯著性標準。如果晶元包含8000個基因,那麼我們得到的差異基因列表中有8個會屬於假陽性。如果列表含80個基因,那麼其中就有十分之一的基因為假陽性。如果我們獲得了一張24個差異基因的列表,那麼就會有大約三分之一的基因為假陽性。如此之多的假陽性基因會給解釋和實驗驗證帶來極大的麻煩。但如果顯著性標準設置的太低,可能會篩選不到差異基因和產生較多的假陰性錯誤,即實際差異表達的基因被錯誤地認為沒有差異表達。所以需要對p值採用多重檢驗校正來解決這問題。一般有兩種方式,一種是單變數置換校正,第二種是多元置換校正。


單變數置換檢驗在每個基因上單獨進行,Benjami&Hochberg方法被用於這種估計。Benjamini於1995年提出一種方法,通過控制FDR(False Discovery Rate)來決定P值的域值. 假設你挑選了R個差異表達的基因,其中有S個是真正有差異表達的,另外有V個其實是沒有差異表達的,是假陽性的。實踐中希望錯誤比例Q=V/R平均而言不能超過某個預先設定的值(比如0.05),在統計學上,這也就等價於控制FDR不能超過5%。設總共有m個候選基因,每個基因對應的p值從小到大排列分別是p(1),p(2),...,p(m),則若想控制FDR不能超過q,則只需找到最大的正整數i,使得 p(i)


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 Freescience 的精彩文章:

TAG:Freescience |

您可能感興趣

戶外小知識
普洱茶小知識
鯤育小課堂 UI基礎小知識
軋輥指標小知識
小知識 質感塗料
漲知識:「光緒元寶」的鑒偽方法
小暑養生小知識
血型知識小科普
珠寶基礎知識大全,你知道多少?
幼犬餵養小知識
小平錢 方孔錢的基本鑒定知識!
大清銅幣光緒元寶鑒定知識大全
轉奶小知識你知多少?
植物知識小科普
你所糾結的護膚小知識,讓契璣科普科普困擾小仙女們的護膚小知識吧!
知識就是基礎設施
健身必讀小知識!
中國四大名玉基礎知識!
中醫基礎知識