歷史性大突破,AI閱讀能力首次超越人類!
在今年之前,人類在閱讀理解領域的能力成績為82.304,排在AI前面。但在今年的、由斯坦福大學發起的機器閱讀理解領域頂級賽事SQuAD,刷新排名之後,AI的閱讀能力歷史上首次超越人類!
也就是說,閱讀完一篇文章之後,再回答基於文章的問題,然後與標準答案進行對比,精準匹配的結果,AI比人類更厲害了。當然,這不是說AI在閱讀理解領域的能力已經完全超越人類,至少在模糊匹配上,人類還是排在AI之前,仍然領先2.5分。或者說當沒有標準答案的時候,人類還是比AI厲害。
而取得這樣成績的,就是來自阿里巴巴iDST團隊提交的SLQA +,憑藉82.440的精準率打破了世界紀錄,並且超越了人類82.304的成績。
這個「SQuAD」,是行業內公認的機器閱讀理解頂級賽事,吸引了包括谷歌、卡內基.梅隆大學、斯坦福大學、微軟亞洲研究院、艾倫研究院、IBM、Facebook等知名企業研究機構和高校的深度參與。
SQuAD比賽,會構建一個大規模的機器閱讀理解數據集(包含10萬個問題),文章來源於500多篇維基百科文章。人工智慧在閱讀完數據集中的一篇短文之後,需要回答若干個基於文章內容的問題,然後與標準答案進行比對,得出精確匹配(Exact Match)和模糊匹配(F1-score)的結果。
那麼,這樣的研究能夠對我們的生活工作提供什麼幫助,對於推動社會向更高層次的發展又有什麼作用?在這一點上,可以說充滿想像,像在寫作領域就大有可為。而事實上,這項技術已經在阿里巴巴內部被廣泛使用。
比如,每年雙11都會有大量的顧客對活動規則進行諮詢。阿里小蜜團隊通過使用司羅團隊的技術,讓機器直接對規則進行閱讀,為用戶提供規則解讀服務,是最自然的交互方式。
再比如,顧客還會針對單個商品詢問大量的基礎問題,而這些問題其實在商品詳情頁都是有答案的。現在通過機器閱讀理解技術,能夠讓機器對詳情頁中的商品描述文本進行更為智能地閱讀和回答,降低服務成本的同時提高購買轉化率。
AI的生長速度,不得不說速度驚人啊!
TAG:聚焦it |