Science:震驚!公共資料庫存在非常高的測序錯誤
本文系生物谷原創編譯,歡迎分享,轉載須授權!
在一項新的研究中,來自新英格蘭生物學實驗室公司(New England Biolabs Inc., 簡稱NEB)的一個研究團隊發現儲存在公共資料庫中的DNA測序樣品具有比期待中更高的低頻突變錯誤率(low-frequency mutation error rate)。他們描述了他們如何開發出一種能夠計算DNA測序樣品中錯誤率的演算法,以及當在兩種公共基因組資料庫中運行時,它揭示了什麼。相關研究結果發表在2017年2月17日的Science期刊上,論文標題為「DNA damage is a pervasive cause of sequencing errors, directly confounding variant identification」。
當研究DNA在導致癌性腫瘤(cancerous tumor)的細胞突變中的作用時,研究人員依賴於儲存測序信息的資料庫的準確性,比如當嘗試著找出趨勢時,依賴於這些資料庫中的信息尋找共性的那些研究人員。這些研究涉及對發生低頻突變的不同人的基因組與總體人口的基因組進行比較,並且利用他們發現的結果構建癌症數據集。但是如今,NEB團隊開展的這項研究對公共資料庫的準確性提出質疑。
為了測量一種給定的數據集的準確率,NEB團隊開發出一種演算法,該演算法能夠被用來計算因測序過程期間發生DNA損傷而表現出突變(不是自然發生的突變)的序列數量。該團隊隨後利用他們的演算法計算幾種公共資料庫(最為知名的是千人基因組計劃和TCGA資料庫的一部分)的錯誤率,他們報道他們發現這兩種知名資料庫的錯誤率分別是41%和73%。
NEB團隊注意到他們的演算法不能夠揭示出這些非自然發生的DNA損傷的來源,但是提出它可能是由於在進行測序之前使用的某些樣品製備技術導致的。他們也指出為測序儀開發出的其他演算法能夠測試它們自己的測序錯誤,但是由於缺乏非常有說服力的理由,它們並沒有被廣泛地使用。他們指出DNA測序儀開始這樣做了。他們也注意到已在開發的新工具可能有助在製備期間讓DNA損傷最小化,而且它們的使用可能改進公共資料庫的準確性。
原始出處:
Lixin Chen, Pingfang Liu, Thomas C. Evans Jr. et al. DNA damage is a pervasive cause of sequencing errors, directly confounding variant identification. Science, 17 Feb 2017, 355(6326):752-756, doi:10.1126/science.aai8690.
※手機如何幫助科學家66地搞科研?
※2017年2月10日Science期刊精華
※南大前所長高翔教授:什麼樣的動物模型能真正反應人的疾病?
※多篇亮點研究闡明HIV新葯研發突破性進展
TAG:生物谷 |
※Nucleic Acids Res:利用新的引物資料庫快速檢測和識別RNA病毒
※Rimini Street宣布推出由McAfee支持的Rimini Street高級資料庫安全
※經驗帖!被蘋果macOS High Sierra坑到資料全毀後的一點心得
※AMD Radeon Vega FE現身CompuBench資料庫,已進入測試階段
※On Center Software擴大其Quick Bid 資料庫以納入U
※內存資料庫大PK,Redis VS Tarantool誰是性能最強者?
※iPhone用戶遭殃!iCloud被刪除資料蘋果竟保留
※Blockchain DB,區塊鏈資料庫
※Facebook 會使用 Apollo 取代 MySQL 資料庫嗎?
※Postgres中更好的資料庫遷移
※黑客組織聲稱入侵 Sony PlayStation Network 盜取客戶資料
※mysql資料庫中 case when語句使用
※python連接sql server資料庫實現增刪改查
※iPhone8疑云:看了這些資料,我懷疑iPhone8沒了
※xtrabackup備份mysql資料庫的使用方法
※FileMaker 16發布:增強Mac和iOS資料庫
※iOS11將內置文件管理器?蘋果App Store資料庫驚現官方Files App
※Red Velvet Wendy生日快樂及詳細資料
※ABP從入門到精通(2):aspnet-zero-core 使用MySql資料庫