當前位置:
首頁 > 知識 > 下一步,AI 要審你的論文了?

下一步,AI 要審你的論文了?

AI 已經在圍棋上戰勝了人類,接下來還會進軍醫療、駕駛、社會服務等領域。對於科研人員來說,還有一個值得關注的話題:你投出去的論文會交給 AI 來處理嗎?

來源網易科技/Wired

編輯 張士超

同行評審有其缺陷。人類(即便是科學家也)有偏向、懶惰和自私。而且即使是科學工作者,有時候數學也會不很靈光。所以不可避免的是,有人提議將人工從同行評審中剔除,以人工智慧取而代之。計算機以其公正、不知疲倦和無自我身份定位著稱,而且它們天生精通算數。科學家並不只是乾等著 AI 專家來參與科研同行評審,期刊出版商已經在著手相關事宜。

最近,一個名為「ScienceIE」的競賽為程序開發者設下挑戰。參賽團隊需要開發程序,要求這些程序能夠從科學論文的句子中提取基本事實,並將其同其他論文所提取的基本事實進行比較。「項目的大目標是幫助科學家和從業者更快速地獲得有關其研究領域的知識。」倫敦大學學院博士後 AI 研究員、競賽設計者 Isabelle Augenstein 說。

競賽涉及到處理自然人類語言,這是諸多人工智慧難題之一。參賽者設計程序要解決三個子任務:閱讀每篇論文並確定其關鍵概念,按類型組織關鍵詞,以及識別不同關鍵短語之間的關係。這次競賽不僅僅是一場學術活動:Augenstein 與世界最大的科學出版商之一的 Elsevier 簽訂了為期兩年的合同,為後者的圖書館開發計算機工具。

Elsevier 出版超過2500種不同期刊。每個期刊的編輯都必須為每篇論文找到合適的審稿人。(2015年,70萬同行評審人員在 Elsevier 上評審了超過180萬份稿件,其中40萬份最終出版。)「能夠評審論文的人通常僅限於該領域的專家。」數字地圖公司 Descartes 的 CEO 邁克·沃倫(Mike Warren)說。「你將這麼一小群擁有博士學位的專家按學科和子學科進行細分,最後,全世界可能只有100人有資格審閱某論文。」Augenstein 幫助 Elsevier 使用科技手段為每篇論文自動尋找合適的審稿人。

Elsevier 開發了一套名為「Evise」的自動化工具來幫助進行同行評審。該程序能夠檢查抄襲(這只是搜索和匹配功能,還談不上 AI),為審稿做最基礎的把關。此外還有處理作者、編輯和審稿人之間的工作流程。另外幾家主要的出版商也都有輔助同行評審的自動化軟體。Springer-Nature 當下正在測試一個名為「StatReviewer」的軟體,確保每份來稿具有完整、準確的統計數據

不過這些同行在展示能力和願景上並不像 Elsevier 這麼開放。「我們正在探索更宏偉的任務,」Augenstein 說。「當你對一篇論文有疑問,機器學習模型能夠通讀論文並回答你的問題。」

不過並非所有人都沉醉於「機器人博士」的前景。今年年初,芬蘭赫爾辛基大學環境政策教授 Janne Hukkinen 和 Elsevier 雜誌《生態經濟學》的編輯為 WIRED 撰寫了一篇警示性文章,文中設想未來可能會有完全自動化的 AI 同行評審:

「通過查詢出版商的審稿人資料庫,分析過往評審中審稿人和編輯之間的交流,並識別從提交到最終編輯拍板這一整個流程中稿件的變化,學習型演算法完全可以接管從最初提交到最終決定的整個評審過程。更重要的是,將人工從同行評審之中剔除,能夠減輕力求開放的學者與反對開放的商業出版商之間的緊張關係。」

按照 Hukkinen 的邏輯,一個能夠勝任同行評審的 AI 同樣也可以動筆寫論文。最終,人類將成為科研中的遺留系統——冗餘、低效且過時。他最終的觀點是:「不經人類產生的新知將會動搖人類文化的基礎。」

不過 Hukkinen 的警惕有點憂慮過早。「儘管 AI 在象棋、圍棋和撲克這樣的遊戲中取得巨大成功,但仍然不能理解大多數普通的英文句子,更別說科學文本了。」艾倫人工智慧研究所(Allen Institute for Artificial Intelligence)首席執行官Oren Etzioni 說。ScienceIE 競賽團隊的實例或可為其提供佐證:最終獲勝的團隊在三個子任務挑戰中的得分只有43%。

充斥著被動句式的科學論文晦澀至極,即便是在人腦看來也很難理解。所描述的對象經常隱身於層層前述之後,被動句式在日常語言面前顯得深奧難懂。語言學家將任何人類所寫的東西稱為「自然語言」,而自然語言在計算機科學家看來實在是一團亂麻。

「自然語言給 AI 帶來的一大難題是其模糊性。」紐約大學計算機科學家 Ernest Davis 說。斯坦福大學名譽計算機科學家 Terry Winograd 有一個經典的歧義例子:

市議會拒絕給示威者許可,因為他們(擔心/主張)暴力。

The city councilmen refused the demonstrators a permit because they [feared/advocated] violence.

這句子你我都能看明白,動詞「擔心」暗示了「他們」指的是「市議會」而非示威者。我們輕而易舉地明白:示威者「主張」暴力;市議會「擔心」暴力。但是一個計算機大腦可是會在此花費經年累月的時間最終也還是搞不清楚到底哪個動詞指向哪個代詞。這種類型的歧義只是自然語言纏結的一個縮影,同形異義詞和敘事邏輯將讓 AI 更加困擾。

這還沒涉及科學論文中的具體問題,比如將文本論點同數據模式進行連接等。即便在純數學論文中這一需求也很常見。「從英語到數學中的形式邏輯不是我們能自動化的。」Davis 說。「這是最簡單的工作之一。它是高度限制性的,而我們理解目標。」心理學等同數學比較遠的學科更是如此。」在心理學論文中,我們幾乎無法檢查其論證的合理性。」Davis 說。「我們不知道如何以計算機能用的方式來表達一個實驗。」

當然,一個完全自動的 AI 同行評審不僅需要對人類有所了解,還必須對其進行深入思考。「說起 AI 問題,同行評審可能是最難的一部分。因為同行評審最重要的職責是確保研究新穎,沒有重複前人老路。」沃倫說。計算機程序能夠查閱文獻,找出那些問題仍懸而未決。但它可能無力辨認顛覆性的科學新發現。

俄勒岡州立大學 AI 研究員 Tom Dietterich 說:「也許我么只是需要改變科學出版的方式。別把我們的研究用英語寫成一個故事,應該把我們的意見和論據套入一個類似資料庫的正規架構中,比如一個涵蓋人類在某主題下所有知識的資料庫。」換句話說,同行評審 AI 化是途徑而非解決方案。在這一點上,人們所要重新編程的不是計算機,而是人類行為。

點擊展開全文

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 科研圈 的精彩文章:

南方科技大學生物系饒楓課題組招聘博士後
是時候關注一個真正懂你懂科研的學術公號了

TAG:科研圈 |

您可能感興趣

你看的每一篇Nature論文,都是這樣出爐的!
評審不給錢,看論文還要漲價?UCLA:我們決定抵制柳葉刀、細胞
AI頂會ICLR找來論壇和推特網友當論文評審,這樣真的靠譜?
這個機器學習論文大眾評審網站,要讓每篇arXiv論文都得到討論
一篇論文寫完之後,你還要做的幾件事
漫畫 | 你看的每一篇Nature論文,都是這樣出爐的!
這不是我要的評審結果!NIPS 2018論文評審出爐:哀聲一片
論文不會寫嗎?這些要點你一定需要掌握!
ACL新政禁止投稿論文在arXiv公開,我們到底需要什麼樣的雙盲評審?
你的論文能否中頂會?這篇分析同行評審結果的論文可幫助你
CVPR論文經不起複現推敲?是學術會議水了還是我飄了
論文寫累了?我在這裡等你
論文代寫?連BBC都看不下去了!
去你的拖延症,我要發論文!
論文想法跟別人撞車了,我還要不要繼續?
畢業論文的後記,一定要寫得這麼雷人嗎?
論文最愛的變分自編碼器,不了解一下?
一篇論文能走多遠?你該重視這一步!
霍金的最後一篇論文告訴了我們什麼?
他是MIT破格錄取的天才,卻為何燒了自己的絕世論文?