當前位置:
首頁 > 最新 > Waller教授團隊Nature發文:深度神經網路和符號人工智慧助力化學合成

Waller教授團隊Nature發文:深度神經網路和符號人工智慧助力化學合成

複雜化合物的合成路線設計一直是化學合成工作者關心的重點。選擇恰當的合成路線可以事半功倍,而考慮不周的合成路線則會遇到重重困難。自合成大師E. J. Corey在上世紀60年代提出逆合成分析以來,不斷有科研人員在計算機輔助合成設計(Computer-assisted synthesis planning)的道路上做出努力。近日,上海大學量子與分子結構國際中心(ICQMS)的Mark Waller教授及其團隊在Nature雜誌上發表了題為「Planning chemical syntheses with deep neural networks and symbolic AI」的研究論文,為解決該問題又前進了一步。

傳統的計算機輔助合成設計往往運行速度慢,經常給出不合理結果。定義層級式的合成路線存在著諸多困難:1、逆合成分析中化學鍵切斷的位置沒有統一的標準,不同的化學家傾向選擇不同的策略來分解複雜分子;2、儘管在逆合成分析中,複雜化合物被轉化成簡單的砌塊(building-block),但是有時也會增加保護基變相的提高砌塊的複雜度;3、前體的價格、易獲得程度也決定了化學鍵切斷位點的優劣。因而不到分析的最後一步,無法判斷整個合成路線的優劣程度。

逆合成分析示意圖目標分子分子1,採用不同的轉化方式可以以獲得不同的合成路線,這些合成路線組合起來稱之為搜索樹(Search tree)圖片來源:Nature.

Mark Waller教授團隊同時使用三種不同的神經網路並結合蒙特卡洛樹搜索(Monte Carlo tree search,MCTS)組成了一種新的人工智慧演算法(3N-MCTS),用來發現恰當的逆合成路線。蒙特卡洛數搜索作為搜索逆合成路線的框架,三種神經網路分別應用在搜索節點的拓展(Expansion展示(Rollout中。第一種神經網路稱為拓展策略網路(expansion policy network,用來搜索可能的化學鍵斷裂方式;第二種神經網路稱為篩選網路(filter network,用來對反應的可行性做出判斷;第三種神經網路稱為展示策略網路(rollout policy network,用來在展示中應用隨機採樣方法對搜索節點進行評價打分。研究人員採用Reaxy資料庫中記錄的2015年之前的化學反應作為知識集合來對這些網路進行訓練,並應用2015年之後的記錄來對模型進行驗證和測試。

蒙特卡洛樹搜索(Monte Carlo tree search,MCTS)演算法是該程序的核心部分。應用該演算法,無需對全局條件進行搜索,而是建立不對稱的搜索樹,從而快速得到較優解。

蒙特卡洛樹搜索示意圖a.合成設計應用蒙特卡洛樹搜索;b.拓展策略程序圖片來源:Nature.

蒙特卡洛樹搜索(MCTS)是一個不斷迭代的過程,每次迭代可以分為四步:

(1)選擇(Selection:從根節點(目標分子)開始,演算法會選擇評分最高的節點進行展示(Rollout,步驟3)或者拓展(Expansion,步驟2)。如果該節點是第一次評估,則進入展示步驟,若是第二次評估,則進入拓展步驟;

(2)拓展(Expansion:在搜索樹中創建新的節點,拓展的步驟如上圖b中所示,包括分子編碼、擴展策略網路搜索、保留k個最優轉變方式、篩選網路,最終得到最可能的反應成為新的節點;

(3)展示(Rollout:該節點內包含的合成砌塊的轉化方式進行隨機採樣,直至得到可獲得的起始原料或達到既定的搜索上限;

(4)更新(Update:在由根節點到成功獲得起始原料的父節點上增加一個評分,作為本次決策的結果。

研究結果表明:相比之前的計算機輔助合成設計的方法,如最佳優先搜索(best first search,BFS)等方法,3N-MCTS在搜索速度、得到有效搜索的比例上都有明顯提升。若限制單個分子5秒的時間內搜索得到路線,3N-MCTS可以解決80%左右的複雜分子合成路線。

在隨後的雙盲實驗中,45名有機合成人員對9個複雜分子的文獻報道合成路線和3N-MCTS設計的合成路線進行判斷,有57%的人員選擇3N-MCTS設計的路線,43%的人員選擇了文獻報道路線,兩者之間並無統計學差異(P-value = 0.26)。這表明3N-MCTS的設計路線已經達到了和化學家相近的程度!

儘管目前科學家在計算機輔助合成設計已經邁出了非常耀眼的一步,但是仍然有許多問題亟待解決:

深度學習需要大量的樣本,已有的資料庫仍需要更多的化學反應實例。深度學習同樣需要陰性數據進行訓練,然而這些反應資料庫中的陽性數據(可行路線)遠遠高於陰性數據(不可行路線)。在不對稱合成、對映異構體、非對映異構體的選擇合成路線預測還存在一定的障礙。目前的人工智慧還是基於已有的數據,對一些反應機理、三維結構或是構象異構體對複雜化合物合成的影響還無法考慮。當然,目前的方法只是提供了一個可能的路線,而對反應的條件還是無法做出準確的預測。

人工智慧並不會完全取代合成化學家。合成化學家在實際科研中會發現新的反應,拓展化學的理論基礎。但AI必將成為化學家強有力的助手,幫助化學家更快、更好地發現合成路線!

參考文獻:Segler, M. H.; Preuss, M.; Waller, M. P., Planning chemical syntheses with deep neural networks and symbolic AI. Nature 2018, 555 (7698), 604.

科研有樂趣!

計算有樂趣!

ComputArt

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 ComputArt計算有樂趣 的精彩文章:

TAG:ComputArt計算有樂趣 |