當前位置:
首頁 > 知識 > 基因組分析工具箱GATK4開源

基因組分析工具箱GATK4開源

2017年5月24日發佈於馬薩諸塞州劍橋市


隸屬麻省理工學院和哈佛大學的博德研究所(Broad Institute)發布了第四版基因組分析工具箱GATK4(Genome Analysis Toolkit 4),並將該業界領先的工具包源代碼開放。該軟體包內含新工具和重建的架構。現在GATK網站已公布GATK4的Alpha版本,Beta版本預計在6月中旬推出。博德研究所的工程師稱,為促進當今的生物信息技術(Bio-IT)發展,本次更新會以開源形式發布。


該版本基於新架構開發,大幅精簡了獨立工具,並對性能增強技術(如Apache SparkTM)提供了支持。新框架帶來了並行計算上的提升,以雲部署為依託讓大容量基因數據分析比以往更便捷、更快速、更高效。

基因組分析工具箱GATK4開源
Credit:123RF


「我們希望消除傳統的規模壁壘,給所有用戶提供相同的高水平數據質量。」作為第一個GATK軟體包的創造者之一,博德研究所的數據科學工程高級總監Eric Banks說:「多虧了雲計算的迅速普及,研究人員終於可以逃離基礎設施對進度的阻礙,尤其是在一些小型機構和新興公司。」


今天,世界上已經有45,000家學術和商業用戶在GATK上運行了數百萬計的分析項目。在SNP識別、種序DNA 插入缺失標記、RNA序列數據領域,GATK已然成為業界標準。為提升分析工具的性能,GATK4拓展了分析範圍,加入了拷貝數和結構變異分析。這將有助於生殖與體細胞的研究應用。


GATK4的開源要歸功於博德研究所和英特爾公司的合作。現在,世界各地的研究者們都可以用GATK4對龐雜的基因數據進行高速分析了。

在英特爾-博德數據工程中心,軟體工程師和研究人員花費了數月時間重構、優化,並最終共享了這些新工具以幫助科學家整合與處理數據。GATK4的誕生得益於這些合作。工程師們在實踐中共同優化相關軟硬體,以使其有能力處理所有研究數據集——不管它們儲存在個人設備、公共資料庫還是混合雲端。


各方評價

「把GATK4開源顯然是團隊的下一步打算,這是支持生物醫學社區的最有效方式。我們希望它能繼續發展創新,幫助研究人員在未來人類健康領域取得突破。」


——Geraldine Van der Auwera,博德研究所數據科學工程組對外宣傳與交流副董事

「這是生物醫學研究史上可圈可點的一筆,用來分析數百萬人基因的軟體將更加易懂而可靠。公開GATK的源代碼直接鼓勵了全球的方法創新、數據復用和數據再處理。」

——Ewan Birney,EMBL-EBI董事、全球基因組與衛生聯盟(GA4GH)主席

「GATK對生殖與癌症分析至關重要,將GATK開源將會增進交流,造福生物醫學社群。」


——Robert L. Grossman,芝加哥大學生物醫學信息學專家

「GATK的開源對於開放式基因組研究是一個大推動,同時也會推動廣泛意義上的開放式科研。它不僅讓一個關鍵工具觸手可及,還為其他領域已有項目的開源化做了示範。」


——Jeremy Freeman,陳-扎克伯格研究所(CZI)計算生物學經理

「開源是生物醫學高效科研的基礎。它消除了共享共建的障礙,讓復演、復產和再混合成為可能。博德研究所的GATK項目在可擴展性、敏感性和特定變數函數調用上世界領先,開源的GATK4將讓Blue Collar Bioinformatics一類的框架向所有的研究者開放。」


——Brad Chapman,哈佛大學 T.H. Chan 公共衛生學院研究科學家

「Cloudera一直是開放源代碼的支持者,我們將支持GATK的資料庫在Apache Spark? 和Cloudera上流暢運行。GATK將被Spark和眾多開源軟體繼續支持,並繼續擴大和增強基因數據科學家之間的合作。」


——Tom White, Cloudera數據科學家、Apache Hadoop PMC成員

「這是基因組科學的一大步,它的性能提升與可擴展性為生物技術、製藥等所有研究領域提供了機會。在英特爾的新參考架構下,GATK4將達到五倍於早期版本的速度。」


——Jason Waxman,英特爾數據中心解決方案部副總裁兼總經理

「我們已經和博德研究所合作了三年。作為開源科技的強力支持者,我們相信GATK的開源將幫助所有的基因科學家。作為英特爾的合作者之一,我們尤其期待看到研究者們用英特爾Xeon Scalable系列處理器在谷歌雲上流暢運行GATK4。」


——Ilia Tulchinsky,Google Cloud醫療工程負責人

「GATK是生命科學應用最廣泛的軟體包之一,我們的團隊曾和博德方面做了很多加速Azure的運行速度的工作。開源模式將大大促進我們的合作,我們為能夠能繼續擴大我們在GATK -Azure上的合作感到Excited。」


——Geralyn Miller, 微軟人工智慧&科研部總監

「隨著GATK4的開源,我們將有機會創造一個全球性的社區。研究者們將一起協作,推進生物信息學的技術發展,」 「我們期待著與廣大所帶來的基於雲服務的客戶在中國GATK基因組的緊密合作,以及持續的GATK研發。」


——Hong Tang,阿里巴巴集團的雲計算部首席架構師

除了提供開源軟體之外,博德研究所還會給用戶提供技術支持、培訓並在用戶社區內擴大服務範圍。和博德研究所的其他基因分析工具一樣,GATK4可以在博德雲端數據分析平台FireCloud上獲取。


關於博德研究所


麻省理工-哈佛大學博德研究所(Broad Institute of MIT and Harvard)成立於2004年,旨在幫助當代科學家發展現代醫學。其研究方向有:描述生物體所有分子構成及其聯繫、探索人類主要疾病的分子機理、開發高效診斷和治療方法、向學術界公開新的發現、工具、方法以及開放數據。


博德研究所由麻省理工學院、哈佛大學、哈佛附屬醫院以及高瞻遠矚的洛杉磯慈善家Eli 和Edythe L. Broad建立。博德研究所組成人員來自MIT和哈佛大學的進行生物醫學研究的教職工與學生。該研究所與全球40多個國家的100多個私人與公共機構有合作關係。


更多信息請訪問網站https://www.broadinstitute.org。


For more information, contact:
Broad Institute of MIT and Harvard
Lee McGuire
617-714-8600
lmcguire@broadinstitute.org


本文譯自 broadinstitute.org,由譯者 下弦の月 基於創作共用協議(BY-NC)發布。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 煎蛋 的精彩文章:

依賴於時空幾何和拓撲的黑體力
發霉啦:在幫我男朋友減肥了5個月之後
反烏托邦設備:AI提醒你AI正在扮演人類
好奇的AI通過探索遊戲世界和犯錯來學習
一天五杯咖啡,肝癌風險降低50%

TAG:煎蛋 |

您可能感興趣

石溪大學:DLATK:差別語言分析工具箱
隨身攜帶可以揣兜里的工具箱,SOG PA2001-CP多功能工具鉗測評
Electra 越獄工具箱 支持全系iOS11 64位設備 更新b9版本
資源|DMLC團隊發布GluonCV和GluonNLP:兩種簡單易用的DL工具箱
資源 | DMLC團隊發布GluonCV和GluonNLP:兩種簡單易用的DL工具箱
HRBP工具箱:共創會
使用SSD Utility工具箱監測和優化東芝RC100性能
萊特曼Charge ALX工具鉗:一把多功能工具鉗=整個工具箱
小米MIX3手機MIUI10.2.1.0穩定版灰度推送,支持遊戲和視頻工具箱
資源 | 一個基於PyTorch的目標檢測工具箱,商湯聯合港中文開源mmdetection
MIUI10 4月3日內測更新內容:新版充電特效,遊戲工具箱回歸!
常用的EEG信號處理的工具箱
不用寫代碼,就能訓練測試深度學習模型!Uber開源AI工具箱Ludwig
一個基於PyTorch的目標檢測工具箱,商湯聯合港中文開源mmdetection
基於PyTorch的目標檢測工具箱,商湯聯合港中文開源mmdetection
Chrome擴展推薦:WEB前端助手,前端人員的最全工具箱
深入對比數據科學工具箱:SparkR vs Sparklyr
OpenMMLab 第二版發布:吸引業界「目光」的史上最完整的目標檢測工具箱
【玩轉路由】小米路由器安裝Misstar Tools工具箱——科學上網
日本東京個人基因分析公司創始人高橋翔子啟動個人遺傳分析工具箱