當前位置:
首頁 > 最新 > IBS在遺傳分析中的運用

IBS在遺傳分析中的運用

歡迎關注"生信修鍊手冊"!

遺傳學中,在描述等位基因的同源關係時,會有IBD和IBS兩個概念。

IBD 全稱 Identity By Descent, 又叫做血緣同源,指的是兩個個體中共有的等位基因來源於共同祖先;IBS全稱Identity By Descent, 又叫做狀態同源,指的是兩個個體中共有的等位基因序列相同。

在家係數據中,由於有父代的分型數據, IBD運用的很多,在自然群體中,則通常使用IBS。本篇文章主要介紹IBS在數據分析中的運用。

IBS 本身只是個定性的概念,為了定量, 提出了IBS state的概念。對於一個SNP位點而言,IBS state 的值為兩個個體中相同的allel個數。對於二倍體生物而言,IBS 取值包括0,1,2 三種,示意圖如下

基於SNP分型結果, 我們可以計算樣本間的IBS距離。IBS距離的計算公式如下

距離可以衡量樣本間的相似性,根據IBS distance距離矩陣,可以對樣本進行MDS分析。

以下截圖來自一篇文獻,在該文獻中,基於樣本間的IBS距離矩陣,通過MDS分析,對樣本組成進行了探究。文獻鏈接如下

https://www.ncbi.nlm.nih.gov/pubmed/21347369

通過MDS 分析對樣本構成可以有一個清楚的認識,也可以用於剔除明顯偏離群體的樣本。

在實際的數據分析中,可以藉助軟體來計算IBS距離矩陣,用法如下

默認情況下會生成文件,是一個距離矩陣,可以用R語言讀取,然後進行MDS分析。

R語言中MDS分析的代碼如下

最終會生成如下的圖片

不同的群體用不同顏色表示,可以看到, 所有樣本分成了兩大類。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 生信修鍊手冊 的精彩文章:

plink PED 文件格式介紹

TAG:生信修鍊手冊 |