不要總羨慕人工智慧專業好，生物狗也可以跨界玩轉 AI

知識 05-01

4 月 19 日。

上海浦東，博雅酒店。

一場激烈廝殺落下最終句點。

歷時 89 天，1,150 位選手，735 種結果，來自北京大學和北京某科技公司的 MDL 團隊衝破重圍，一舉奪魁，「默克」逆合成反應預測大賽落下帷幕。

「默克」逆合成反應預測大賽合照

作為國內鮮有的生命科學與人工智慧的跨領域大賽，「默克」逆合成反應預測大賽吸引了各大高校企業的精尖人才，為這兩個領域之間的結合打開了一扇窗。

經過層層角逐，最終 6 支團隊晉級決賽，路演當天更是熱鬧非常，大賽邀請了 5 位重量級評委、數十名大眾評委和多位媒體老師們親臨現場，見證冠亞季軍的誕生。

大賽排名由 5 位重量級評審根據現場路演展示共同商議得出，他們用專業的目光給出了最佳答案。

評審團隊

Christina 問小芳

默克生命科學科研與應用解決方案數據分析主管/豐富的跨行業數據分析與項目管理經驗/精益六西格瑪黑帶，PMP

Robin Zou 鄒傳新

現任默克生命科學數據科學家/華東理工大學上海市新葯設計重點實驗室，計算機輔助藥物設計專業碩士研究生，隨後在諾華生物醫學研究中心擔任藥物研發大數據專家多年，有豐富的藥物化學和機器學習演算法知識與經驗，熟知藥物研發大數據。

Weina Yang 楊微娜

默克生命科學科研解決方案市場部產品經理。2008 年畢業於英國倫敦大學瑪麗皇后學院，曾在英國諾丁漢大學和復旦大學從事博士後研究， 2011 年加入 Sigma-Aldrich 市場部。

Xiangwei Fan 范向偉

2015 年在上海交通大學讀研究生之際, 便創立了「和鯨科技」（原「科賽網」）, 2017 年獲得 AI 領域的專業投資機構線性資本和翊翎資本的聯合投資 , 2018 年入選為福布斯「30 Under 30 精英榜」, 比一般創業者步伐更快的他 , 目前已將「和鯨科技」打造為國內領先的數據科學協同創新平台。

Hong-Kai XIONG 熊紅凱

上海交通大學特聘教授，電子工程系教授，計算機科學與工程系兼職教授，致遠學院副院長。國家傑出青年科學基金獲得者，教育部長江學者特聘教授，國家「萬人計劃」科技創新領軍人才，科技部創中青年科技創新領軍人才，教育部新世紀優秀人才，上海市優秀學術帶頭人，上海市曙光學者，上海市青年科技英才，國家寶鋼優秀教師獎，上海市技術發明獎一等獎（2 次，均排名第 1）。IEEE 高級會員、IEEE Transactions on CSVT 編委。中國圖像與圖形學學會理事。

直擊盛典現場

首先，大賽由默克生命科學中國區董事總經理、科研解決方案中國區副總裁Steve Vermant先生進行開場致詞。

Mr. Steve Vermant 正在為決賽路演致詞

6 組團隊分別就各自的作品進行展示。

選手正在展示團隊作品

新華社、中新社、上海熱線、網易、China Daily、好奇心日報、生物谷、數據商業家等媒體老師們也來到現場，聚焦這場智慧與思維的比拼。

媒體老師們正在現場聆聽決賽路演

默克生命科學數據科學家鄒傳新（Robin Zou）正在點評

默克生命科學數據科學家鄒傳新（Robin Zou）表示：

本次大賽是默克結合自身業務，以開放的姿態與國內頂尖高校、企業的人才共同探索 AI 在化學領域的應用。大賽湧現了很多優秀作品，我們共同見證了 AI 前沿技術在化學合成分析上展現出的巨大潛力，也更加期待 AI Chemistry 技術能在未來更好地融合。

默克生命科學的Synthia可以被認為是在模仿人類化學家的思維模式工作，而且這個化學家的腦容量非常大，但目前尚不具備自我學習能力，無法發現新的有機反應。如果可以結合Al的深度自我學習能力，相信未來可以為更多目標分子提供更多的創新型策略。

福利預告——文末還可以馬上體驗 Synthia 為你的科研帶來的便捷！

聚焦決戰之師

大賽英雄榜

一等獎

MDL 團隊

二等獎

DDDC 團隊

三等獎

楊 lab 的六學小分隊

Fudan-Panacea

一等獎

MDL 團隊

一等獎由來自北京大學「分子設計實驗室」和北京望石智慧科技有限公司的MDL 團隊摘得，成員的背景涵蓋化學、化學信息學、藥物信息學與計算機。

他們的作品基於深度學習模型 DeepRetroReact，直接來預測反應物，並基於反應規則來預測可能的候選反應物，再對生成的反應物進行打分，設計策略選取最佳的反應物組合。團隊採用機器翻譯的 Transformer 模型作為核心架構，根據 product 和 reagent 為每個反應加上反應類型標籤，並加入了 atom 的信息，確保得到的結果在化學形式上更加合理。

MDL 團隊表示：

首先要感謝隊友進行的模型構建和協作，也非常感謝這次比賽，大賽競爭動力很足，大家也一直在靠團隊的力量解決問題，最後還要感謝老師的支持。

用計算去理解生物和化學的世界，會大幅提升研究效率，如今技術的提升更是讓我們能夠認識化學世界，並對真實行業發展有所改變，也希望有更多和默克一樣有實力和社會責任感的公司開展結合學術和工業生產的探索。

二等獎

DDDC 團隊

二等獎由來自中國科學院上海藥物研究所藥物發現與設計中心的DDDC 團隊摘得。團隊成員長期致力於探索機器學習與人工智慧前沿技術在藥物設計方法學及計算機輔助藥物設計中的應用。

DDDC 團隊使用了圖卷積神經網路，將反應條件作為信息引入模型指導逆合成預測，使每個原子的特徵編碼存有周圍環境的信息，之後對每一種反應試劑組合進行了可訓練的特徵編碼，再將原子對中兩個原子的特徵及反應試劑特徵整合在一起，對每一種可能的原子對變化的概率進行預測，進而預測出反應物。

三等獎

楊 lab 的六學小分隊

Fudan-Panacea

三等獎由楊 lab 的六學小分隊團隊和Fudan-Panacea團隊共同摘得。

楊 lab 的六學小分隊成員來自中山大學，具備信息技術與科學和生物統計背景；Fudan-Panacea團隊成員來自復旦大學，具備計算機科學與技術和藥物化學背景。

楊 lab 的六學小分隊的方案首先對數據進行了標準化，轉化成 SMILES 格式，再構建字典，得到分子向量；在演算法模型方面，他們選擇了基於 Attention 的 Encoder - Decoder 模型，增加了 Attention 機制，以期在預測過程中更好地注意到化合物分隔符「.」的存在，得到更多的正確的化合物個數。

Fudan-Panacea團隊設計了基於 Seq2Seq 模型的逆合成反應預測演算法，它以Seq2Seq 模型為基礎，結合了數據處理、數據編碼以及結果改善等方面的功能創新。該團隊也使用了 Attention 機制，增強模型的精度；同時採用原子編碼的方式，提高訓練速度，並使用 teacher forcing 技術對模型進行訓練，有效加速了 Seq2Seq 模型的收斂速度。

··· ···

回溯遠古時代，人類便已經開始摸索生命、探索自我。

幹細胞治療、基因組療法、精準醫療等近年來興起的新技術，讓人類對生命科學的發展有了新的認識，但它與人工智慧的結合依然路漫漫。換個角度來說，這也是孕育新機會的沃土。

歷時近三個月的比賽結束了，大賽組委會選擇這一個難度高且冷門的主題時，從未預料到大家的似火熱情，而選手們也交出了這份令人驚喜的答卷，我們有理由相信，人工智慧與生命科學的未來將會在你們手中熠熠生輝。

關於 Synthia

在前文中，提到了默克生命科學基於逆合成反應原理的反應路線預測軟體 Synthia，那麼這到底是一款怎樣的軟體呢？

簡單來說，這是一款基於目標產物逆推給出較優化合成反應路線的軟體，它強大在哪裡？

1. 反應資料庫龐大：基於文獻，科學家整理了 1,000 萬個化學物質和反應，70,000 個反應規則；

2. 簡單高效：只需將目標分子輸入 Synthia，即可迅速得出反應路線；

3. 結果充實：綜合操作難度、化合物結果複雜度、路線合理性進行推薦，得到了基於成本、底物易得性、步驟數等影響因素篩選出的反應路線，幫助科學家迅速預測出合理的反應路徑。

文章及圖片來源：默克生命科學

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！