D輪融資3000萬,基因AI公司Sophia Genetics憑什麼入選2017年最聰明的50家公司?
在最新的一期《麻省理工科技評論》評選出的2017年最聰明的50家公司中,除了大家耳熟能詳Google、Apple、Amazon、Alibaba等巨頭,以及NVdia、Telsa、SpaceX等明星公司外,還有一家看似不起眼的公司引起了我們的注意——Sophia Genetics。
這是一家總部位於瑞士洛桑的的生物醫藥公司,成立於2011年,主營業務是幫助醫療機構建立基因分析系統,協助其利用機器學習技術分析患者基因數據,給出診療建議。2017年9月該公司拿到歐洲知名風投機構Balderton的3000萬美元的D輪融資。
過去兩年里AI和基因熱度不減,這兩個領域似乎在世界範圍內都不是新鮮事,為何唯獨選擇了Sophia Genetics?
智能,平台與隱私
智能
當我們對給定樣本測序完畢後,基因測序診斷分析一般要經過三個步驟:序列比對(Alignment)—變體識別(Variant Calling)—診斷預測(predictions)。
每一個部分都有對應的通用演算法。但是由於基因種類太多,這些通用演算法的效果並不讓人十分滿意。
Sophia Genetics於是抓住了這個痛點,研製出了三款以人工智慧為基礎的基因分析專利技術:PEPPER, MUSKAT 和 MOKA,分別是為了識別單核苷酸多態性變異與刪除(SNP and INDEL),識別拷貝變異數(CNV)以及對基因的變異進行嚴重性的評估。
(編者注:單核苷酸多態性變異,鹼基的刪除,拷貝變異都是基因突變的種類。分析基因,很大程度上就是在找到這些突變基因,並且評估他們會帶來的潛在危險。)
由於筆者未能在網上找到其專利數據,因此不能做出進一步分析,但是根據官網顯示,這些技術能夠實現99%以上的準確率。
Sophia Genetics CEO Dr. Jurgi Camblong
Sophia Genetics的聯合創始人之一,現任CEO Jurgi Camblong博士在一次採訪中談到,智能演算法作為企業的核心技術,他們投入了大量精力進行研發。
為了得到適用範圍更廣的演算法,他們花費幾年時間組織專家一起標註了來自10000名患者的近50000條基因信息,從最底層開始設計演算法,以求完全理解每一個細節。
功夫沒有白費,Sohpia公司智能演算法對基因變體的分類準確率由原來的85%上升到99%。
Jurgi 面對媒體採訪時,表示「正是這種一步步從底層開始建立模型,融合專業知識,力求了解每一個細節的技術堅持,讓他們和領域內其他的公司區分開來。」
投資方Balderton的合伙人James Wise也對媒體表示,Sophia Genetics 最吸引他們的一點在於,他們的演算法能夠處理來自各種不同測序儀的基因數據,並且給出的預測已經達到可供臨床使用的準確率。
目前,Sophia Genetics主打腫瘤,遺傳性癌症,心血管疾病,代謝疾病,兒科疾病五大門類的基因輔助診斷與智能預測。
涉及的疾病診斷門類
(來源:Sophia Genetics 官網)
平台
如果說對技術的執著是Sophia Genetics能夠脫穎而出的底氣與資本,準確把握醫院需求,建立共享平台則是其對未來的憧憬與投資。
Sophia DDM是公司推出的一款平台。DDM代表 Data-Driven for Medicine (以數據驅動醫療),反映了公司的願景。
上述提到的智能演算法,都包含在這款平台上。Sophia Genetics瞄準的是B端的醫療機構,其核心業務就是通過幫助那些有測序條件的醫療機構,接入SophiaDDM平台,從而使得醫務工作人員能夠快速準確得對基因進行分析。
在醫生上傳基因數據的同時,其實也同時貢獻了一條新的基因數據,並且很有可能會給出自己的診斷結果。
這樣一來,隨著使用DDM平台進行分析的人數越來越多,後台積累的標註過的數據也越多,底層的智能演算法,得益於高質量的數據,表現也會越來越好,由此形成了一個良性循環。
當被問到為何要如此堅定的推進平台,提供軟體服務,Camblong 表示,隨著測序成本的不斷下降,人們獲取自己的基因信息也變得越發容易,這也就意味著市場上必然會有大量的對於快速、準確的基因分析演算法的需求。
好的基因分析演算法離不開專業知識和優質的數據。因此,如果能夠與醫院建立良好的聯繫,幫助醫院建立系統,去分析患者的基因數據,這樣一方面得到了患者的數據,另外一方面還能夠利用醫生的專業知識對基因進行標註。
平台連接的醫院越多,儲存的基因數據,凝結的專業知識也越多,由此訓練出的演算法更加智能,能夠吸引的醫院也更多。這是一個自激過程。
當然,Camblong 坦言,這個過程並不輕鬆。
這是一個先有雞還是先有蛋的過程—也就是說,如何在診斷演算法表現並不突出的情況下,和醫院建立好的聯繫?Camblong給的答案是,發現醫院當時在基因分析中面臨的最大問題,先解決這個痛點!
在當時2011年,他們發現的痛點的是,醫院裡採集的基因數據精度太低了,雜訊太大。因此團隊便在早期專門設計演算法來解決提高採集基因數據的準確率。早期的幫助於是換來了醫院的長期信賴與支持。
2011年公司成立。從2014年初推出平台,到2014年底平台上就有了50家醫院。而現在,這個數字已經上升到了400。
這400家醫院分部於全世界55個國家,截至發稿,官網上顯示,已經有167000名患者通過DDM平台得到了診斷。
Sophia Genetics號稱要推進基因測序分析的「去中心化」,要建立世界上最大的臨床基因社區,讓基因密碼真正服務於臨床診斷,幫助更多的患者儘早擺脫病魔。
對一個尚處在D輪融資階段的公司來說,這個願景十分遠大,但是我們卻確實能夠看到Sophia Genetics在一步步得推進自己的平台帝國。
隱私
在平台共享基因數據,這個想法很讓人心動。但是,隨之帶來最大的麻煩就是基因數據的隱私安全問題。
自從基因分析走入人們視線以來,有關基因數據的隱私安全,倫理道德的討論就不絕於耳。Sophia Genetics也想到了這一點,隱私安全是它的第三項法寶。最後簡單介紹一下Sophia Genetics在用戶數據隱私上的考量。
Sophia Genetics的信息安全管理體系拿到了ISO27001的國際認證。
同時,它和洛桑聯邦理工學院信息安全相關專家,斯坦福大學的生物醫學專家正在共同研發一款能夠保障在全球範圍內儲存獲取平台上基因數據的信息安全技術(SECRAM, Selective retrieval on Encrypted and Compressed Reference-oriented Alignment Map,有專利信息)。
公司承諾,所有的私密信息都將在私有的數據中心,至少保存5年,同時嚴格限制讀取。所有患者的個人信息將不會以任何形式披露。
Camblong 表示,在這個行業已經有一些公司做了不好的示範,沒能保護好患者的數據,公司因此非常重視隱私問題。
Sophia Genetics也永遠不會考慮面向C端個人客戶,他們堅信,大的醫療機構始終能夠吸納更多客戶,與這些大型醫療機構打交道也會讓信息安保流程更加可靠。
尾聲
在被問到對公司未來發展的規劃時,Camblong談到,希望在推進DDM平台的同時,強化多層次醫療數據的處理能力。
具體來說,希望能夠綜合醫學影像數據和基因數據,從而從多個角度為臨床提供參考和決策信息。
比如,藉助影像數據和基因信息,醫生可以得知腫瘤在未來的一段時間內的生長情況,由此決定是否要立刻實施手術。這也是所謂精準醫療的應用場景。
Sophia在希臘語中是智慧的意思,我們也衷心希望,未來有那麼一天,能像Jurgi Camblong 希望的那樣,我們能夠參透基因密碼告訴我們的所有信息,從而更好得戰勝病魔,面對未來。
參考信息:
https://techcrunch.com/2017/09/13/balderton-joins-30m-series-d-for-big-data-biotech-platform-play-sophia-genetics/
文|王曉行
添加時請註明:姓名-公司-職位
後台發送關鍵詞即可獲得相關好文
網站、公眾號等轉載請聯繫授權
近期推薦
聲明:動脈網所刊載內容之知識產權為動脈網及相關權利人專屬所有或持有。文中出現的採訪數據均由受訪者提供並確認。未經許可,禁止進行轉載、摘編、複製及建立鏡像等任何使用。
※李天天:理解行業級需求,構建丁香通未來
※利益和規範的博弈:葯企垂涎基層1300多億藥品市場,醫保限額成最大阻力
TAG:動脈vcbeat |