FAIR 實驗室的 ICLR 2017:理解對話是一場漫長的博弈
雷鋒網按:在 ICLR 2017 舉辦之際,FAIR實驗室撰文展示了團隊在理解對話所做的研究和貢獻,雷鋒網進行編譯,未經許可不得轉載。
建立一個有效的對話系統在 Facebook 的人工智慧研究中心(FAIR),理解對話一直被認為是一個宏大和長期的 AI 研究目標。
一個真正有效的對話系統應該是一項輔助性的技術,這個系統很可能包括一個可以用自然語言與人類交流的與聊天機器人類似的系統。它可以幫助人們更好地理解周圍的世界,更有效地和周圍的人進行交流,消除溝通上的障礙。隨著數字化內容的不斷增多,研發此類技術將會變得越來越重要。
嘗試著去理解和解釋對話並不是一個新奇的想法。早在 20 年前,就有人嘗試著去建造一台人類可以與之交流並且可以教它學習如何去對話的機器。它們結合了技術和工程,但是使用預編程的腳本響應就顯得視野十分狹窄了。
多虧了近年來機器學習技術的發展,機器學習技術讓 AI 智能體與人類用自然語言交流成為了一個更加現實的想法,得到了學術界和工業界的廣泛關注。
然而,現在的大多數對話系統仍然是腳本化的:它們的自然語言理解的模塊可能是基於機器學習的,但是它們的應答內容通常是由 if/then 語句或規則引擎來決定的。儘管相對於數十年前已經取得了進步,但是在很大程度上還是依據其巨大的文本資料庫來創建它們的回答。
應對兩端的挑戰
與聊天機器人進行自然語言的對話仍然是一個挑戰,這將需要一系列研究上的突破。 FAIR 選擇從兩個方向來解決這個問題:一般的 AI 和機器通過交流進行推理以及在當前的對話系統中進行研究。並從實際使用的聊天機器人中吸取經驗。 FAIR 的優勢在於跨越兩種方法的所遇到的多樣性。從長期的類似於 CommAI intiative 的基礎性研究,到短期的類似於 FastText 和 Facebook M 的應用型嘗試。通過這些努力,再加上團隊在 AI 頻譜、從深度學習 NLP 到增強學習、計算機視覺和工程方面的專業知識, FAIR 希望能夠取得有意義的自然語言對話進展。
FAIR 在對話方面工作的重要一點是, 團隊如何將它置於一個明確的基礎之中:
強大的基礎: 針對於 NLP 問題的高級學習系統應該展現出比傳統方法更好地性能。為了達到這個目的, FAIR 構建了 FastText, 用相對簡單和容易理解的技巧來提供可達到的最佳效果。
清晰的評估:評價一個對話系統是一個很困難的問題。FAIR 提出了一個更好的工具來做到這一點。在 ICLR 2017,Facebook 與學術界分享了它們的發現和工具。其中包括訓練和評估推理模型的 CommAI environment,以及可用於測試端對端對話模型的 bAbI. 由於 FAIR 與 Facebook M 的合作,這些工具已經在實際生產條件下進行了測試。
開放的研究:FAIR 通過會議或者預印的方式公開了其幾乎所有的研究工作。同樣地,代碼和數據,包括上面提到的兩個評估舉措也作為開放源碼發布了。正如在 FAIR 有多種多樣的工作一樣,AI 社區也有著極大的多樣性。 FAIR 相信通過開放式的對話、共享工具和研究將會帶來更大的進步。
通過共享知識來獲取進步
在 ICLR, FAIR 提供了 7 篇論文來說明 FAIR 對話研究的質量、創新和廣度。Lazaridou 等人 [6] 和 CommAI 團隊 [1] 提出了使系統能夠發現和使用基本溝通技巧的方向,是邁向強人工智慧的第一步。Li 等人提出了 2 篇關於端對端對話系統如何使用現場對話來提升自身性能的論文 [2,5]。Bordes 等人將 bAbI 引入到面向目標場景中的端對端對話系統的測試。 FAIR 也展示了 Grave 等人和 Henaff 等人關於機器閱讀的兩篇論文,他們的研究實現了通過機器推動文本閱讀的界限。
參考文獻[1] CommAI: Evaluating the First Steps Towards a Useful General AI,M Baroni, A Joulin, A Jabri, G Kruszewski, A Lazaridou, K Simonic, T Mikolov
[2] Dialogue Learning With Human-In-The-Loop, J Li, AH Miller, S Chopra, MA Ranzato, J Weston
[3] Improving Neural Language Models with a Continuous Cache, E Grave, A Joulin, N Usunier
[4] Learning End-to-end Goal-oriented Dialog, A Bordes, YL Boureau, J Weston
[5] Learning Through Dialogue Interactions, J Li, AH Miller, S Chopra, MA Ranzato, J Weston
[6] Multi-Agent Cooperation and the Emergence of (Natural) Language, A Lazaridou, A Peysakhovich, M Baroni
[7]「Tracking the World State with Recurrent Entity Networks,」M Henaff, J Weston, A Szlam, A Bordes, Y LeCun
via research.fb,雷鋒網編譯
※龍芯推出新一代處理器,離 Intel 還有多大差距?
※福利 | 和雷鋒網一起,去清華 x-lab 傾聽科技和資本的聲音
※專訪|這家傳統保險中介如何借力大數據優化「賣保險」流程?
※阿里華先勝對話依圖CEO朱瓏:創業公司沒錢、沒數據、沒資源,拿什麼跟BAT比?
※小米高級副總裁王翔:小米很忙,暫時不在美國賣手機
TAG:雷鋒網 |
※BMVC 2018 | 最佳學生論文:EPFL&FAIR提出QuaterNet,更好地解決人類動作建模問題
※HYPERADIO 對話 OBEY 創始人 Shepard Fairey
※FAIR&NYU開發XNLI語料庫:15種語言
※「我的幾百萬張貼紙,就是互聯網時代前的病毒式傳播」HYPERADIO 對話 OBEY 創始人 Shepard Fairey
※致敬!少數派!SHANGHAI ART BOOK FAIR
※2018《Seoul Baby Fair》蘇有珍到場出席
※2018《Seoul Baby Fair》李允美到場出席
※「舞力」出擊,跳給世界看| FAIRWHALE馬克華菲男裝 #WHATE
※CMU、NYU與FAIR共同提出GLoMo:遷移學習新範式
※AlphaZero:FAIR田淵棟首次開源超級圍棋AI
※實時評估世界盃球員的正確姿勢:FAIR今日開源DensePose
※別樣聯名!Disney x COACH 打造 「A Drark Fairy Tale」 系列
※Friday Surprise | Bye妊娠紋,Fairy送你貝嫂同款MAMA MIO!
※最佳學生論文:EPFL&FAIR提出QuaterNet,解決人類動作建模問題
※Hublot宇舶表推出Big Bang Meca-10 Shepard Fairey限量腕錶
※「全民體驗」AlphaZero:FAIR田淵棟首次開源超級圍棋AI
※燦爛的城市在Zhibo Fair的驚艷亮相,Mars2018黑色技術引起了人們的關注
※Toy Fair 2019:變形金剛電影工作室系列漂移非三變
※Toy Fair 2019:變形金剛圍城系列新玩具情報圖公開
※時尚圈大事件 | ELLE創刊三十周年,Fairy帶你去看119樓的高空紅毯!