如何使用Ensembl資料庫對基因變異進行分類
每日生物評論
資訊/技術/知識/智慧
www.bio-review.com
儘管我們對基因組的知識與日俱增,而且是巨大的飛躍,我們有時也需要提醒自己,DNA在1869年首次被分離,但它的分子結構直到1953年才被確定,直到1983年,PCR反應才對科學界產生了影響。所以即時飛速發展,我們仍然是基因領域的嬰兒,當你在分析整個基因組時,你會強烈感覺到這個事實。基因變異的分類是基因組學中一個特別具有挑戰性的領域。基因變異就是對給定DNA序列的改變,基因變異可以是良性的,致病的,或者是未知的。
為什麼研究和分類這些變異很重要? 雖然許多基因變異不會轉化為疾病或易感疾病,但也有一些與嚴重疾病有關,如各種癌症、血友病、神經纖維瘤病和早衰症(一種以加速老化為特徵的疾病)。因此,對基因變異進行分類是極其重要的,因為知道它們的生理影響可能有助於區分健康個體和那些易患某些疾病的人,例如癌症。這可能有助於篩查項目、先發制人的醫學和更好的患者預後。
為什麼很難對基因變異進行分類? --- 我們每個人DNA中都儲存著大量的信息。
科學家們一直致力於基因變異的研究,數以百計的人類基因組已經被測序,有許多公共資料庫中有許多已知的與許多疾病有關的基因變異。還有一些功能研究試圖破譯某些基因變異對產生的蛋白質的影響,那些不能正常運作的蛋白質可能會導致疾病。本文介紹一個研究基因變異的工具—Ensembl資料庫。
Ensembl是開始你的基因變異分析旅程的一個很好的方法,這個資料庫可以讓你接觸到來自許多物種的數千個基因。你可以在方框區域輸入基因的名字,表現型,或者其他任何術語。Ensembl會給你很多關於你的基因或表現型的信息,同時也提供一些其他資源的鏈接,比如UniProt和NCBI。
在搜索目的基因之後,將會得到一個如下的輸出頁面。在這裡,你將找到基因的描述,別名(A),基因組的位置(B),以及其他重要的信息,包括相關的表型(C)。
你還將看到一個轉錄表(B),在其中可以找到目的基因的轉錄本。在這個表格中,你將發現蛋白質編碼的轉錄本、非編碼轉錄本和拼接基因變異。在Biotype專欄中,您將找到一個顏色方案分類,金色和一致編碼序列(CCDS)的轉錄本都是經過審查的高質量的轉錄本,藍色的是非編碼轉錄本,而紅色的或者直接來自Ensembl的自動標註通道,或者Vega/Havana的人工管理。
更重要的是,它告訴你哪些轉錄本是蛋白質編碼,並提供它們的NCBI參考序列。例如BRCA2 基因, 在RefSeq 欄有NCBI 參考序列,NM_000059和NP_000050. NM_ 代表mRNA, NP_ 代表蛋白, 打開超鏈接,你將被帶到NCBI核苷酸資料庫中,以獲得特定的mRNA/蛋白質。在這裡,你會發現FASTA序列,文獻提到的序列,外顯子和作者等信息。
在左邊的欄上(C),你將會有許多選擇引導你獲取寶貴的信息,例如序列、比較基因組學、相關的表型(包括已知的基因變體)。
GIF
TAG:每日生物評論 |