研究遺傳變異,可能你缺這樣一個資料庫!
最新
06-07
在研究遺傳變異的過程中,相信大家都會用到一些資料庫來查找相關的基因,來了解更多的信息。那今天,我們就給大家介紹一個遺傳資源資料庫吧,希望能幫到大家~
Genome Aggregation Database:
簡稱gnomAD,是由各國研究者聯合發展起來的基因組突變頻率資料庫。其目的是彙集和協調來自眾多大規模測序計劃的全外顯子組和全基因組測序數據,為廣泛的科學研究團體匯總數據。
該資料庫提供的數據集包括123136個個體的全外顯子組測序數據和15496個個體的全基因組測序數據,這些數據來源於各種疾病研究項目及大型人群測序項目。
首頁如下
我們可以通過這個資料庫直接搜索自己需要了解的基因。
那今天就以PCSK4為例,進行說明。
這是基因的一個簡單介紹。
我們還可以看見基因上每個位點的覆蓋信息圖,其中全基因組數據的測序深度用綠線表示,外顯子數據深度為藍色部分。
變異注釋表格記錄了變異位點,來源,注釋信息,變異flags,變異等位基因數,等位基因總數,等位基因頻率等信息。我們也可以直接選擇基因進入了解。
還有一點大家可以注意一下,這個資料庫展示的等位基因數默認是只計數了高質量的基因型,即通過了設定的閾值(GQ>=20,DP>=10,雜合基因型allele balance >0.2)的,原始的等位基因數可通過AC_raw查看。
我們也可以對全外顯子組,全基因組變異vcf文件及覆蓋度的數據進行下載。
最後告訴大家喔,該資料庫去除了攜帶有嚴重兒童疾病的患者及其父母的基因組數據,可以很好的應用於單基因遺傳病人群頻率的查詢。對於評估罕見位點的致病性,如果某位點在該資料庫未見報道,則致病幾率增大。
GIF
TAG:賽哲生物股份 |