AI2想從常識測試開始讓AI理解物理世界,數據集已公布
林鱗 編譯自 MIT Technology Review
量子位 出品 | 公眾號 QbitAI
到現在,智能音箱還是沒能擺脫「智障」的魔咒。或許,人工智慧需要一種全新的方法學習語言。
近日,坐落在西雅圖的艾倫人工智慧研究所(AI2)的研究人員發起了新項目AI2邏輯挑戰(AI2 Reasoning Challenge,ARC),他們將用小學難度水平的知識考驗AI系統,看看它們的常識水平在什麼「段位」。
在這項測試中,回答每一個問題都需都要了解物理世界的規律,否則將很難答對。
這是一些怎樣的神奇題目?來,我們現在看一道真題。
下面哪個選項中的物體,不是由自然生長的材料製成的?
A. 棉襯衫
B. 木椅
C. 塑料勺子
D. 草編的儲物筐
對人類來說,這道題再簡單不過。即使是小孩子,也能根據「常識」得到正確答案。
但對AI來說,難就難在這「常識」二字上。
「我們需要用常識填充語言和所能看到的世界之間的空白,從而組合成一個連貫的圖景,」ARC項目負責人Peter Clark說,「機器沒有這種常識,所能看到的全部世界就是能寫出來的那部分,因此通常會忽略一段文字背後的許多含義和假設。」
這項新測試,也是AI2最新計劃的一部分,即讓AI系統真正了解世界。雖然現在經常能看到「機器的理解能力超過人類」的類似報道,但從真正意義上說,機器和人類的差別還遠得很。
就拿今年一月微軟和阿里巴巴的AI在斯坦福問答數據集的表現超過人類這事來說,這些AI還無法回答更複雜的問題,也很難利用其他的知識來源。
再比如,昨天微軟宣布人工智慧新聞翻譯可以媲美人類,但如果處理如醫學注釋等不熟悉領域的對話或文本時,AI還將再次陷入困境。
目前,ARC項目的進展和相關的數據集已經公開,感興趣同學可以移步ARC項目的官網看看AI2是怎樣測試AI對物理世界的理解的。
大俠請接好項目地址:
http://data.allenai.org/arc/
還有一份AI2給出的相關研究報告,也請一同接好:
http://ai2-website.s3.amazonaws.com/publications/AI2ReasoningChallenge2018.pdf
—完—
加入社群
量子位AI社群15群開始招募啦,歡迎對AI感興趣的同學,加小助手微信qbitbot6入群;
此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。
進群請加小助手微信號qbitbot6,並務必備註相應群的關鍵詞~通過審核後我們將邀請進群。(專業群審核較嚴,敬請諒解)
誠摯招聘
量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。
※福特在邁阿密開始探索自動駕駛商業模式:先送比薩試試
※「Google,不許聯想」
TAG:量子位 |