當前位置:
首頁 > 新聞 > 遺傳分析走向大眾:計算生物學家為分析解釋遺傳測序數據開發平台

遺傳分析走向大眾:計算生物學家為分析解釋遺傳測序數據開發平台

遺傳分析走向大眾:計算生物學家為分析解釋遺傳測序數據開發平台



我們可以在現場獲得可操作信息,從而讓我們很快地就如何向前推進做出決策。

對於設法治療無明顯致病原因患者的醫生來說,基因測序技術可能會為他們指點迷津。但大量的信息也會使其很難快速找到答案。


兩三年前,位於秘魯利馬的美國海軍醫學研究六所(NAMRU-6)的醫生必須將其測序數據送往美國分析,這一過程可能會花費數周,對於需要做出緊急決策的治療來說時間過長。「如果你可以做的全部是獲得數據後將其運往美國,它幾乎是無用的。」領導該中心遺傳和病原體發現研究所的Mariana Leguia說。


但現在Leguia不再需要等待分析結果,她可以在幾天甚至幾小時內得到結果,而且她在自己的實驗室內就可以這樣做。她的研究所會利用授權基因組學專業技術的發展(EDGE,一種隱藏了常見微生物基因組任務的生物信息工具,如序列組裝和物種鑒定),讓用戶生成高質量的分析結果。「我們可以在現場獲得可操作信息,從而讓我們很快地就如何向前推進做出決策。」Leguia說。


EDGE並非用單擊界面簡化信息學的首個工具。實際上,它缺乏已經建立的選擇如Galaxy和億明達的BaseSpace平台的靈活性和視野。但它的簡單性正在吸引那些可能迴避生物信息學的用戶。「曾用過(EDGE)的人永遠不會再因為學習命令行工具而煩惱。」喬治亞州亞特蘭大美國疾控中心將EDGE用於病毒病原體研究的Clinton Paden說。正因如此,它代表了民主化基因組信息學的一個案例——這一案例有助純生物學家加速對這一領域的吸收。

領域內的信息學


美國新墨西哥州洛斯阿拉莫斯國家實驗室(LANL)帶領研發該軟體的Patrick Chain說,創建EDGE是為了設法讓迅速增長的低成本DNA序列的可獲得性與讓數據合理化相對缺乏的專門技能相一致。位於馬里蘭州的美國海軍醫學研究中心生物防禦研究理事會(BDRD)計算生物學家Joe Anderson說,它的設計目的是用於缺乏生物信息學領域技能的設備。


它還具備開源和獨立性,只要一次點擊就可從原始序列讀取到物種鑒定和種系發展,為微生物遺傳學提供端到端的分析。Anderson說,這一系統運行價格也相對低廉,因為建議的硬體配置(256千兆位元組的內存和64個處理器)的購買價格低於1萬美元。這意味著能夠承擔得起開展序列項目的大多數實驗室都能支付得起該硬體。「這並非扔錢,它足夠便宜。」Anderson說。該設施不會依賴互聯網連接而能夠通過發電機驅動也有裨益。


擁有可靠互聯網連接的用戶能夠將該系統裝備到雲網路。英國伯明翰大學生物信息學家Nicholas Loman指出他幫助研發的微生物生物信息學雲基礎設施(CLIMB)就是如此。CLIMB是一種專門致力於英國微生物基因組研究學者的免費服務。


CLIMB受到英國醫學研究理事會840萬英鎊的支持,並融合了若干信息學工具,包括測序資料庫和一種叫做基因組學虛擬實驗室的分析工作台。「我的確在考慮將EDGE作為一種可能性的選擇。」Loman說。

總體而言,BDRD 基因組學和生物信息學負責人Theron Hamilton說,EDGE可正式安裝在美國國防部以及與其合作的18個國家實驗室中,可被用於南極洲之外的任何大陸。


其中之一是位於柬埔寨金邊的NAMRU-2設施,它利用該系統跟蹤昆蟲傳播的疾病。「這並非傳統上你去做生物信息學研究的地方。」Anderson說。但EDGE正在改變這一局面。「我意識到的一件事是,如果你給研究人員工具,不加干涉,他們會讓你驚奇。」Anderson說。


簡易性通道


最新的1.5版本EDGE於2016年10月發布,包含54個第三方工具。所有的構建包括算式、資料庫、虛擬工具和參考基因組,均覆蓋在一個可驅動6個相互連接的分析模塊的伺服器上:序列清理、組裝和注釋、與參照基因組對比、分類鑒定、進化分析以及PCR引物設計。Chain說,包括RNA分析和病原體鑒定在內的其他模塊將被添加到即將到來的EDGE2.0版本中。


去年11月,Chain和同事在一項研究中驗證了EDGE的能力,他們利用該平台組裝、分類和繪製了炭疽桿菌和鼠疫桿菌的進化關係;釐清了一個模擬人類的微生物組;分析了一系列人體臨床樣本,包括埃博拉病毒和大腸桿菌感染案例。不過利用該系統的首篇研究論文實際上比這早幾個月。Leguia的實驗室曾利用EDGE優化了登革熱病毒全基因組測序方法,該研究成果去年6月發表。

用戶可利用位於LANL伺服器上的一個免費演示樣本探索這些以及其他數據。希望分析自己序列的研究人員必須在他們的系統中安裝這一軟體。Chain說,該代碼可從GitHub上免費下載,Docker集合以及虛擬機影像也可以獲得,但可能需要一名信息技術專家進行安裝。人們還可以微調源代碼添加其他工具和工作流程,但Chain坦言這超過了很多用戶的能力範圍。他說,簡化這一流程的機制正在開發過程中。


擁有計算機科學背景的Paden說,該工具的簡易性使得計算生物學更容易被研究人員接近,通常研究人員很容易被生物信息學研究的常規工具嚇到。


Chain說,該團隊讓EDGE部分開放獲取是因為擔心未來的資助,這也會影響未來的發展計劃。「可持續性是我們需要考慮的一個問題。」Chain說,「這正是為什麼我們在嘗試讓第三方實施者更容易使其項目即插即用,就像使用Docker那樣。」


大量的工具

EDGE並非首個提供用戶友好型界面的生物信息學系統。Galaxy最初於2005年發布,它讓研究人員可以組裝基於網路界面的大量靈活且免費的軟體工具箱。用戶可通過不同方式將這些工具結合以解決他們想到的任何問題。


但Galaxy可能會嚇退用戶。不像EDGE生成的圖解表示法,如系統樹或是分層餅圖,Galaxy的產出通常會表現為處理數據文檔的形式,用戶需要在別的地方將其視覺化。


「Galaxy更像一個沒有餐廳的廚房。」賓夕法尼亞州費城兒童醫院生物醫學和健康信息學部軟體研發專家Jeremy Leipzig說。「該系統並不能真正以一種吸引人的方式傳遞輸出。」他說,「利用EDGE,他們可以真正地考慮報告看起來像什麼。」


澳大利亞阿德萊德大學生物信息學家Nathan Watson-Haigh說,EDGE有助緩解超負荷工作的生物信息學家的壓力。但他警示EDGE依然是一種複雜的生物信息工具,在計算機方面有經驗的生物學家在過分確信其結果之前諮詢一位專家更加明智。


加州大學聖迭戈分校計算生物學和生物信息學中心代理主任Kathleen Fisch補充說,正如用任何工具一樣,他們需要了解該算式在做什麼,不同的參數如何影響輸出。「你能運行該工具並不意味著你應該運行該工具。」他說。


隨著生物信息學工具變得比以往更加容易上手,信息學可能會摘掉其複雜性的名頭。對於生物學家來說,這將會導致更廣泛的採用和民主化。


中國生物技術網誠邀生物領域科學家在我們的平台上,發表和介紹國內外原創的科研成果。


本公眾號由中國科學院微生物研究所信息中心承辦


微信公眾號:中國生物技術網


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 中國生物技術網 的精彩文章:

科研經費:想說愛你不容易
汪鴻儒博士Genome Research文章:野生稻並沒那麼「野」!
第二批審核啟動!衛計委發布關於加強幹細胞臨床研究備案與監管工作的通知
CFDA:四款藥物被警告!一個是大品種

TAG:中國生物技術網 |

您可能感興趣

用分析法做好數據分析判斷
選擇性清除分析在牛的遺傳進化分析中的應用
肝癌分析揭示了遺傳因素
青島能源所微生物組大數據分析工具開發獲進展
匯總:生活中大數據分析案例以及背後的技術原理
大數據分析之:解放我們的勞動
門店零售數據分析基礎
大數據分析之店鋪運營分析 新手必備
鏈家大數據多維分析引擎實踐
細菌DNA指紋圖譜分析發現其傳播的驚人秘密!
事業編資料分析考試:資料分析概念大盤點
深入淺出數據結構C語言版——有關排序演算法的分析
美國大眾傳媒專業申請分析
大數據分析 邏輯判斷 下周這樣走!
能對決策產生影響的數據分析才是有意義的數據分析
張建嶺做客易科學,開設《多孔材料的孔分析理論及數據分析》
計算機專業就業趨勢分析
職場剖析:企業分析、市場分析、財務分析,三個方面解讀公司前景
電視劇熱度平台傳播分析