Salesforce公布自然語言處理重大進展，一個模型搞定十項任務

新聞 06-22

本文由人工智慧觀察編譯

譯者：Sandy

幾年前，通過語音對手機提問來在互聯網上找到答案基本是不可能的，因為計算機在理解人類語言方面並不是很出色。

如今，由於機器學習方面的進步，我們開始逐漸意識到谷歌助理或蘋果Siri在對我們的問題進行應答方面基本已經沒有太大的問題了。不過，不可否認，這一進展是極其艱難的，需要對非常具體的自然語言處理任務進行強化培訓，比如將文本翻譯成語音，對感嘆詞或者理解代詞的引用進行分析，等等。這也是Salesforce的研究人員正在著手解決的問題。

本周三，他們發布了一篇論文，概述了一種可以同時處理10個獨立自然語言處理（NLP）任務的單一模型的方法。從本質上說，這一研究是充滿挑戰的。據了解，這一模型被稱為「自然語言十項全能（Natural Language Decathlon）」，簡稱「decaNLP」。

通過將該模型與「多任務問題應答網路（Multitask Question Answering Network；MQAN）」進行結合，可以同時學習10項任務，包括問答、機器翻譯、摘要、自然語言推理、情感分析、語義角色標註、關係抽取、目標導向對話、語義分析、常識代詞消解。

Salesforce的首席科學家Richard Socher在接受採訪時說：「我們的模型好比是NLP領域的瑞士軍刀。」換句話說，研究人員和開發人員實際上只需使用一種工具，而不必為那些任務中的每一項使用一種工具，那些任務需要無法用於其他任何任務的超級定製的模型。最終，這一模型可能會帶來更有能力的聊天機器人，讓它們可以更自然地與人進行交談。

Socher與ImageNet做了一個類比，這是一個標籤圖像資料庫，被認為開啟了深度學習的革命，使得圖像識別方面取得了突破。但是對於NLP，並不能通過一項任務就能進行定義。對此，Socher稱：「在NLP領域，其實不存在所有研究人員都認為：如果你在這個方面取得進展，它就會整體上改善NLP的單一任務。」

Salesforce的研究人員，包括Bryan McCann，Nitish Shirish Keskar和Caiming Xiong，提出的方法就是將這每一項任務都視作一個回答問題的問題。Socher解釋說，「問題回答其實是非常寬泛的——你可以隨便問任何問題——該研究相當於提供了解決幾個任務的單一模型。」

另外，MQAN允許進行所謂的「零樣本」（zero-shot）學習，這意味著該模型可以處理以前未見過的任務或未經過培訓的任務。「把它應用到一個全新的任務上，這是以前從未有過的，」McCann表示。「遇到換個方式來表述或意義上略有變化，大多數模型就無能為力，現在我們的模型做到了。」

他補充說，具體到實際應用，面對並不完全是已經學會的短語，聊天機器人可以做出極準確的答覆，更像是人們平常交談那樣。

事實上，Salesforce的這一研究也代表了著名人工智慧研究員Yoshua Bengio的觀點，他是蒙特利爾大學計算機科學與運籌學系教授，與Socher在機器學習領域展開過合作。

他表示：「自從大約二十年前我開始致力於表示自然語言的辭彙嵌入以來，我的目標就是，同樣的表示法應該可用於所有自然語言任務。這篇論文中將所有這些任務表示為回答問題的想法至關重要，但這還不夠。論文作者搞出了自然語言十項全能，為這個目標定義一個基準，並引入了最終使這個夢想有可能實現的架構上的創新。」

（文中圖片來自網路）

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 人工智慧觀察 的精彩文章:

※對標亞馬遜！微軟推出無人商店自動結賬技術，欲與沃爾瑪合作
※Uber用AI可識別醉酒乘客，但又引發隱私和安全風險

TAG:人工智慧觀察 |