阿里 90 後科學家研發,達摩院開源新一代 AI 演算法模型
整理 | 一一
出品 | AI科技大本營(ID:rgznai100)
7月5日,阿里達摩院宣布開源新一代人機對話模型ESIM。該演算法模型提出兩年多,已被200多篇論文引用,更曾在國際頂級對話系統評測大賽(DSTC7)上獲得雙料冠軍,將人機對話準確率的紀錄提升至94.1%。
ESIM模型還被用來評測一些新提出的數據集,比如來自紐約大學的MultiNLI數據集、最近大熱的來自華盛頓大學的SWAG數據集、NAACL19 Best Resource Paper常識知識QA數據集CommonsenseQA等等。
據介紹,比起業界使用最為廣泛的LSTM模型,ESIM人機對話回復模型回復準確率更高。採用全新ESIM模型的人機對話回復模型,比LSTM模型回復準確率提升25%(數據來自ICASSP2019論文中Ubuntu測試集數據)。
陳謙參加第七屆對話系統技術挑戰賽
ESIM模型最初由達摩院語音實驗室內的90後科學家陳謙(花名潭清)研發,他博士畢業於中科大,是達摩院中最年輕的科學家之一,也是2018屆的阿里星(阿里星是專門針對高校頂尖人才的一個培養計劃,從應屆畢業生中經過層層篩選,由技術帶頭人擔任主管,進行重點培養,每年的阿里星平均只有20人不到)。
在去年DSTC 7對話系統評測大賽上,ESIM在NOESIS賽道中從麻省理工學院、約翰霍普金斯大學、IBM研究院等近20支參賽隊伍中拿下該賽道兩項比賽的冠軍。NOESIS賽道考察AI的人機對話能力,要求AI根據給定的多輪人機對話歷史,從成百到上萬個句子中選出正確的回復。
ESIM模型的原理論文已於2017年發表在國際頂級自然語言處理會議ACL 2017,阿里巴巴此次開源的模型原理論文發表在了今年國際頂級語音會議ICASSP 2019上,在公開的標準數據集Ubuntu(英文)和E-commerce(中文)上均取得了目前最高的成績。
人機對話系統及其背後的認知智能,為讓機器快速準確理解人類的表達,ESIM給AI裝上一套「雷達」系統,賦予它實時檢索對話歷史、自動去除干擾信息的能力,使它能夠給出人類期待的回復。
目前,這一模型已在基於ESIM模型研發的智能語音點餐機、地鐵語音售票機等應用中落地,還可能將給智能客服、導航軟體、智能音箱等應用場景帶去改變。
開源地址
https://github.com/alibaba/esim-response-selection
論文鏈接
https://arxiv.org/pdf/1901.02609.pdf
【END】
※智能家居不「智能」
※開源正在蠶食 500 億美元的資料庫行業
TAG:CSDN |