當前位置:
首頁 > 科技 > 人工智慧閱讀理解大賽,阿里第一,微軟第二,它們都超過了人類

人工智慧閱讀理解大賽,阿里第一,微軟第二,它們都超過了人類

在由斯坦福大學發起的 SQuAD (Stanford Question Answering Dataset)文本閱讀理解挑戰賽中,來自阿里巴巴和微軟團隊的 AI 模型分別以高分戰勝了人類選手,位列榜單第一、二位。

馬先生和比先生的團隊真是一次次打破人們對他們的認知。

閱讀理解戰勝人類,聽起來簡單,做起來還是很不容易的。要知道,這需要很強的自然語言處理能力和對語言詞句的理解能力。想想你高中閱讀理解考多少分就明白了,哈哈!

而 AI 在這方面戰勝人類意味著什麼?意味著它們這種能力已經超過了人類閱讀理解界的大咖!

好,下面說說這個測試是咋回事。在這場閱讀測試中,斯坦福大學的自然語言計算組會先從 500 多篇維基百科文章中抽取出大量的數據集(包含 10 萬個問題),然後將一篇幾百字(平均 100 字,最多 800 字)的文章給標註者閱讀,讓標註人員提出最多 5 個基於文章內容的問題並提供正確答案。

選手可以利用這個數據集進行模擬訓練,然後在開放平台上提交自己的演算法用於評分。

這個測試相當權威,被認為是當前世界監測機器閱讀水平的最權威測試之一。這是因為 SQuAD 能夠提供的龐大的數據規模,並能檢測出 AI 模型是否有能力處理大量信息,並給出問題的準確答案。

看看比賽結果:來自阿里巴巴 iDST 團隊的 SLQA+ 模型最終取得了 82.440 的成績,超越了人類的 82.304 分;而晚一天參與挑戰的微軟亞洲研究院自然語言計算組的 R-NET+ 模型,也取得了 82.650 的戰績。

看看這個榜單,驚不驚喜!騰訊和科大訊飛也名列前茅。中國團隊相當厲害了。

AI 在回答客觀性問題上已經相當聰明了,可謂對答如流。這次,阿里巴巴團隊在 AI 上建立了一種「基於分層融合注意力機制」的深度神經網路模型,這讓 AI 獲得了模擬人類在閱讀理解文本時的一些思考、標註、通篇理解能力。

其實這種技術離我們並不遙遠,只是可能平時沒太注意。記得淘寶的阿里小蜜嘛,它就採用了這種機器學習閱讀理解技術。

當顧客對某個商品提出一些基礎性的問題時,阿里小蜜可以直接對商品詳情頁面中的信息進行閱讀和歸納,然後對顧客的問題進行解答。

阿里小蜜在雙 11、雙 12 大型購物節簡直就是人工客服的福星,把基礎性的問題交由阿里小蜜去解決,複雜問題再留給人工客服,不僅減少了人工客服的工作量,顧客也無需在買東西時等待。

除了電商零售行業之外,AI 語言理解技術也已應用於博物館講解、在線醫療問題解答等領域中,預計未來應用將更加廣泛。

說完阿里巴巴,再說說微軟。微軟最出名的就是旗下的兩個 AI 助手小娜(Cortana)和小冰了。尤其是小冰,已經超級中國化了,中國范兒十足,所以在國內應用也是相當廣。

京東小冰、東航小冰、敦煌小冰……小冰猶如孫悟空,七十二變自如轉換。再加上技術的進步,小冰已經經歷了幾代更新,不得不說,如今的小冰已經越來越「善解人意」,做出的回答越來越像人類的自然語言了。

AI 在閱讀理解方面都超過人類了!這次又該有一大波吃瓜群眾憂心忡忡, AI 是不是要取代人類了啊。TechPunk 想說的是作為不會犯錯的人工智慧,總有一天會打敗容易 bug 的人類。當然別緊張,人工智慧不一定稀罕取代你。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 TechPunk 的精彩文章:

AI演員的誕生:網紅機器人索菲亞有可能是個大騙子,她的巡迴騙人演出已經到中國站了

TAG:TechPunk |