中科院北京生科院趙方慶團隊發表識別非編碼區致病性變異的新成果
2018年7月11日,國際學術期刊Genome Medicine發表了中國科學院北京生命科學研究院趙方慶團隊題為「Prioritization and functional assessment of noncoding variantsassociated with complex diseases」的最新研究成果。如何解讀與複雜疾病有關的遺傳變異,尤其是非編碼區變異,是疾病遺傳學領域的一個巨大挑戰。現有方法在評估非編碼區致病性變異方面存在著假陽性率過高、敏感度不夠等問題。該研究首次提出一種全新的基於人群等位基因頻率譜的監督集成演算法(PAFA),實現對複雜疾病和性狀相關的遺傳變異進行打分識別及功能性評估。
為了解決現有方法在識別非編碼區功能性變異方面面臨的靈敏度低、可靠性差的問題,PAFA演算法引入了豐富的知識庫,包括基因組注釋、進化保守度指標和人口水平特徵。特別是新引入的人群等位基因頻率特徵值,使得PAFA可以通過計算固定指數和離散度得分,對群體內部及群體間的差異性和多樣性進行評估,從而能夠在大量的背景變異中有效識別出與複雜疾病有關的功能性變異。此外,PAFA更加合理有效地對訓練集進行了數據清洗。它從ClinVar、千人基因組計劃和GWASdb等多個權威資料庫中獲取訓練數據,並針對不同來源的變異採取了多重過濾策略。此外,該團隊構建了一個友好的在線集成平台,訪問地址:http://159.226.67.237:8080/pafa。此平台不僅允許用戶利用PAFA對變異進行評估,而且通過整合豐富的功能組學數據,為遺傳變異提供全面的功能性注釋。
通過一系列綜合測評分析,PAFA無論對於編碼區還是非編碼區的變異,都表現出更為出色的功能評估效果。尤其是對於非編碼區致病變異的識別方面,比現有方法擁有更高的敏感度和特異度。通過對不同訓練特徵進行留一法交叉驗證,發現群體等位基因頻率特徵的引入,可以顯著提高對非編碼區致病變異的識別效率。此外,合理地整合和清洗多種訓練集,將會在區分癌症相關的頻發變異(recurrent variant)和非頻發變異方面取得更好的效果。
該工作由趙方慶課題組的研究生周琳完成,得到了國家自然科學基金委和中國科學院的經費支持。
PAFA的方法流程
中國生物技術網誠邀生物領域科學家在我們的平台上,發表和介紹國內外原創的科研成果。
本公眾號由中國科學院微生物研究所信息中心承辦
微信公眾號:中國生物技術網
※「壓力過大」與自體免疫疾病相關聯
※研究發現:「正念冥想」和「放鬆反應」對大腦功能的不同作用
TAG:中國生物技術網 |