當基因遇上雲計算 讓疾病預防再簡單一點
生命基線在成立之初就非常重視技術的使用。最開始選擇自建數據中心,隨著基因幫交易量的逐漸增長,雲也成為開展業務的主要動力。簡基則因涉及基因數據+健康數據,這些高敏感數據並不會上雲,但云可以幫助解析基因數據的演算法模型研發。
至頂網CIO與應用頻道 03月22日 人物訪談(文/王聰彬):2017年,畢業於德國馬克思普朗克生態化學研究所,師從美國科學院院士Ian. T. Baldwin教授的凌之浩回國短暫停留,這一次他對國內基因發展環境有了新的感受。
「歐洲雖然生活安穩悠閑,但相對發展空間有限,國內基因科技領域環境成長迅速,充滿著想像和無限可能。」在他看來每個地方都有吸引人的地方,最終他選擇回到成都,進入成都生命基線科技有限公司(以下簡稱生命基線)擔任COO,邁出了從科研到企業轉型的一步。
成都生命基線科技有限公司COO凌之浩
生命基線是一家服務於生命科學行業的高科技企業,自創始之日起即專註於用互聯網技術加速生命科學研究。目前主要有兩大業務,第一、「簡基」,以基因檢測和精準體檢為前端,提供健康風控服務,主要針對企業員工。第二、「基因幫」,提供試劑耗材和NGS服務的一站式線上平台,主要針對全國範圍的高校、科研院所科研人員。
在基因領域,BT(生物技術)與IT(信息技術)融合的力量可以說是無人不知,無人不曉。人類基因組計劃期間,一位不按常理出牌的科學狂人克雷格·文特爾(Craig Venter)使用超級計算機以一己之力,兩年就追上6國合作的研究進度。
生命基線也不例外,在成立之初就非常重視技術的使用。最開始選擇自建數據中心,隨著基因幫交易量的逐漸增長,雲也成為開展業務的主要動力。簡基則因涉及基因數據+健康數據,這些高敏感數據並不會上雲,但云可以幫助解析基因數據的演算法模型研發。
目前生命基線將整個重心都放在簡基上,主要覆蓋川渝地區實現快速突破,因為其中涉及到體檢等合作方參與實現服務閉環,在形成模式後也可將其複製到其他地域。按凌之浩的話說,未來基因檢測最終會回歸到本質——信息服務,提供更精準可靠的數據解讀,讓更多人關注疾病預防。
「簡基」讓疾病預防提上日程
「人類基因組計劃」共6國參與,花費13年38億美金。而現在一個全基因組測序,只需要數天六百美金就可以完成,這就是基因測序領域常說的超摩爾定律。
2013年,安吉麗娜朱莉通過基因檢測到自己有BRCA1基因的突變,同時她有癌症的家族病史(其母親,祖母,曾祖母都因癌症去世),因此她到80歲患乳腺癌的幾率高達87%,因此她決定採取主動預防的方式,進行預防性雙側乳腺切除手術以降低患癌風險,這也讓基因檢測一夜被大眾熟知。
隨著國內消費級基因檢測的發展,2017年,生命基線也進入這一領域,創立JanGene(簡基)品牌。在消費級基因檢測領域高同質化的當下,簡基希望真正幫助用戶制定「落地」的疾病預防方案,以基因檢測為前端,配合健康風險問卷系統,確立用戶個體化的精準體檢方案,並根據多維數據持續提供長期的疾病預防指導。
簡基可以說是凌之浩與團隊一手一腳培育出來的業務。2018年中旬,經過一年多時間高強度的產品研發以及數個版本的迭代,他終於對自己親自開發的產品第一次有了認同感,並自討腰包一口氣給自己的家人全都購買了產品。
在簡基發展的過程中,凌之浩也遇到過一個非常有借鑒意義的案例。一位有前列腺癌家族病史,但當時自己並無任何癥狀的用戶,通過簡基的基因檢測結果發現其相關檢測位點具有有害突變,提示該用戶患前列腺癌的風險要高於正常人群,基於此,簡基在為其定製的精準體檢方案中特意加入了前列腺特異抗原(PSA)的檢測,在隨後的三次檢測結果中,均發現其PSA的指標明顯高於正常值且在持續上升。基於此,簡基建議其進行進一步的醫學檢測,通過影像學檢測發現其體內的前列腺結節,並進一步通過穿刺活檢確診為早期前列腺原位癌(並無轉移),最後及時做了根治性切除手術,現在預後情況良好,各項指標均為正常。
正是這一案例讓凌之浩對基因檢測在疾病預防上的意義有了進一步的認識,從基因數據開始,對高風險疾病早關注、早預防。
當然疾病的發生與否其實都可以算作是一個表型,而表型都是由遺傳+環境因素共同決定,在基因檢測的同時簡基還會配合輔助健康問卷調查,為用戶制定個體化的精準體檢方案,之後由體檢合作方進行體檢,並最終通過三維數據進行解析並持續提供健康風控服務。
「基因幫」搭建科研服務的橋樑
因為SienceEXChange在線科研服務交易平台的成功,也讓生命基線萌生建立在線交易平台的設想,把優秀的資源集中起來,再分發給研究人員和有科研需求的醫院醫生。
這也是在簡基之前,2015年就產生的基因幫,其致力解決科研人員在科研過程中各個環節的需求,提供基因測序及測序數據分析服務。科研人員在平台上提交需求,基因幫進行工程師匹配,雙方取得聯繫,明確收費和交付時間。在這個過程中基因幫作為一個第三方平台,將對項目預付款、項目進度進行把控和監管。
「大部分科研工作者專註於實驗研究和探索生物學規律,分析工作通常是與公司合作進行。」凌之浩介紹到,基因幫不僅覆蓋了基因組學,還有像蛋白組學、轉錄組學、代謝組學等數據分析服務,而且華大基因、諾禾致源等公司也入住了平台。
最開始基因幫通過本地數據中心為科研機構提供服務,機房託管了6台伺服器,隨著交易量的增長,越來越多的分析樣本已經很難滿足,有時甚至需要同時開啟幾百甚至上千台伺服器來滿足計算需求。而且大數據分析場景中的高通量數據傳輸以及如何將結果已更加高效方式呈現給終端用戶也是客戶面臨的問題,生命基線也開始尋求通過雲來繼續提供優質服務。
在陸陸續續使用了超算和一些雲計算平台後,基因幫最終在半年前正式切換到AWS。對於選擇亞馬遜AWS的原因,凌之浩開玩笑說,因為公司的對面就是AWS。其實選擇AWS出於成本和服務兩方面因素考慮。
通過數百台Amazon EC2 Spot實例基因幫獲得所需要的計算能力,使用命令行工具,配合EC2,以及啟動腳本來進行快速的部署,利用S3來儲存樣本數據和最終結果。基因幫可以在 Amazon EC2 Spot實例請求中指定出價,從而選擇願意為實例支付的每小時價格,這一模式非常適合測試和開發環境。
現在幾分鐘就可以部署上百台伺服器實現計算分析任務,並在計算完成後自動關閉實例。根據業務需求自動的進行彈性擴展所需要的實例,極大的降低了運維的壓力。
目前基因幫已經與眾多高等院校和機構合作,包括四川大學華西醫院、成都中醫藥大學、四川農業大學、浙江大學等全國範圍的高校與科研院所。同時基因幫還推出了「試劑耗材商城」、「測序商城」、「基因幫生物雲」等服務,使得業務日益豐富。
※漫長的尋找終得正果,英特爾選定Robert Swan為第七任首席執行官
※AI和AI對話?我們需要一個新的API
TAG:至頂網 |