Science:那些年我們發現的突變,有可能是錯的!
新年送福利:關注 "解螺旋" 微信公眾號,回復關鍵詞"2月"可索取2017年2月資源包:生信分析軟體與文獻。
作者:麥子(轉載請註:解螺旋·醫生科研助手)
近期Science上的一篇報告說,有時候你在DNA樣本中發現序列變異好雞凍,但其實有可能並不是真的,而是樣本預處理時造成的損傷。新英格蘭生物實驗室(New England Biolabs, NEB)的一組研究人員設計了一種演算法來評估這類損傷的程度,然後在公共基因組資料庫如千人基因組(1000 Genomes)和TCGA中測試時,發現問題好像蠻嚴重的0.0
人為造成的變異有多普遍?
眾所周知,從古樣本或福爾馬林固定、石蠟包埋組織中提取的DNA很容易斷裂或受到化學修飾,從而造成生物機體內根本不存在的「突變」。但最近有證據表明,其實任何DNA樣品都有這類人為造成突變的風險。DNA超聲波降解法——用聲波的能量處理DNA片段,以備擴增和測序——已知可能誘導氧化損傷,造成這種「突變」。
NEB的Laurence Ettwiller和同事們開發了一種演算法,稱為全局失衡值(Global Imbalance Value, GIV),正是利用這一現象,即超聲波降解過程中造成的氧化損傷,是把鳥嘌呤轉化成8-羥基鳥嘌呤,而後者在序列讀取過程中會出現類似胸腺嘧啶的表現和行為,造成誤讀。對比兩條互補鏈上讀取的序列,就會發現轉化過的鳥嘌呤無法配對:一條鏈讀出了胸腺嘧啶,互補鏈卻讀出了跟鳥嘌呤配對的胞嘧啶。但自然出現的鳥嘌呤-胸腺嘧啶突變,也會在互補鏈上同時突變成與胸腺嘧啶互補的腺嘌呤。這個演算法就是比較2條鏈的序列讀取數據中胸腺嘧啶的錯配(或失衡)的程度,來計算人為損傷程度。
人為損傷造成的變異和體內自然變異的區別
多數情況下,這類突變都只是在極少的樣品中出現,不會造成太大的問題。但,紐約紀念斯隆凱特琳癌症中心的分子腫瘤學家Marc Ladanyi解釋道:「在癌症生物學研究中,越來越強調檢測亞克隆突變,當然還有血漿游離腫瘤DNA的突變。」兩者在細胞樣品中的比例本來就很小。
Ladanyi並沒有參與這項研究,他說:「當在如此低的等位基因頻率下處理變異時,這種人為造成的突變就不得不考慮了。這篇文章是一個很好的提示,要好好防犯人為因素的影響。」
當研究者把GIV應用於千人基因組(1000 Genomes)和TCGA資料庫時,它檢測到千人基因組資料庫中有41%的數據得到的GIVG-T≥1.5,表明有人為損傷,而TCGA則有73%的序列GIVG-T≥2,提示嚴重損傷。這意味著,那些年我們觀察到的G-T突變,很有可能是錯的。
「這損傷可比我們預期的普遍多了,」本文的共同作者之一,NEB的Thomas Evans說,這類錯誤很可能會擾亂對真實的低頻體細胞突變的識別。
TCGA中GIVG-T分值分布情況
亡羊補牢
雖然數據顯得有些凄涼,但現在好好把GIV利用起來也不晚。Ettwiller說,「人們可以用它來檢查自己的樣本,那些損傷太嚴重的就可以被揪出來了。」 一個樣品的GIV評分也可以用來設定閾值,鑒定潛在的低頻鳥嘌呤變異。——所以現在GIV演算法可作為一個質控步驟,其相關程序已經能在GitHub上免費獲取(https://github.com/Ettwiller/Damage-estimator),用Perl語言做分析,用R語言作圖。
此外,研究者也提出了建議,即在測序之前先修復一下損傷。在DNA樣品製備過程中加入DNA修復酶,氧化損傷就會有所改善。
不過這還被Ladanyi吐槽:「這篇文章提供了一種技術解決方案,那就是用這類酶混合物製備DNA。但研究者是NEB的,所以還得用NEB的修複試劑盒,所以自然而然就有了利益衝突。」
至於這一點,Ettwiller說,研究組確實使用NEB的酶來修復他們的受損DNA樣品,但他們也沒斷言說這個試盒適用於所有的DNA製備過程。
Evans說,「我們的確賣DNA修複試劑盒,但我們可沒用什麼浮誇的廣告語,這不是我們的畫風。我們還會繼續對它進行評估。」
參考資料:
1.Abundant Sequence Errors in Public Databases
2.L. Chen et al., 「DNA damage is a pervasive cause of sequencing errors, directly confounding variant identification,」 Science, 355: 752-56, 2017.
投稿郵箱: tougao@helixlife.com.cn
合作微信:helixlife6
※佳偶天成,科研愛情兩不誤!
※財富人生:一個拉開一年3240億美元生物技術產業世界大門的男人
※發3-5分SCI的4個路徑,專為臨床醫生設計
※過年與國自然何以兼顧——春節標書寫作攻略
※circRNA的高分文章到底做了些啥?
TAG:解螺旋 |
※Science子刊新發現:這個基因突變後,既長壽,還長高?
※這些cosplay總能讓畫風突變
※Cell:別怪夜貓子自制力差,他們可能是基因突變了!
※Nature:為何有些人吃高脂肪飲食卻不會得心臟病?可能在於APOC3功能性缺失突變
※如何尋找對有益的基因突變?Science有新招
※Science子刊:「睡眠基因」突變,難以好眠
※看慣了陳喬恩的言情劇和中二少女心,這次突變Shirley有點難適應
※Science:人類機體不斷發展的自然選擇往往能夠有效抵禦誘發損傷的遺傳突變
※Cell Rep:單一HIV突變就可誘導不同的T細胞免疫反應
※Nature Methods最新發表的」CRISPR-Cas9可引起數百個位點突變「可信嗎?
※PNAS:這個基因發生突變,讓有些人喝酒到「無法自拔」
※Nat Commun:手機檢測致癌突變,測序它也行!
※PLoS Comput Biol:重磅!新方法發現數千個與癌症相關的新基因突變!
※Science:多數癌症基因突變或因「壞運氣」
※J Virol:突變的蛋白讓病毒傳播更加猖獗
※潑冷水!Nature子刊「大發現」:CRISPR可引發數百種「意外突變」!
※Science重大發現:1天1包煙有多可怕?每年150個突變!
※Cell觀點質疑GWAS:將疾病完全歸結於核心基因突變,這樣真的對嗎?
※Cell:「夜貓子」也是一種病 罪魁禍首竟是基因突變!