中國學者為 AI 系統測了測智商,Google遙遙領先但仍不及6歲兒童
摘要:研究團隊表示,他們明年將進行第三次世界範圍內的 AI 智商測試。
如果你一直很好奇各大公司的人工智慧系統跟人類比起來到底有多聰明的話,今天你將收穫一份「標準」答案。
幾天前,一篇上傳到康奈爾大學網站上的論文吸引了媒體的注意,這篇題為《人工智慧的智商評測與智能等級研究》的論文由 3 位中國學者所著,出自中國科學院虛擬經濟與數據科學研究中心,研究者們在論文中分析了 Google、微軟必應、百度和蘋果 Siri 等系統,並且為人工智慧系統劃分了 7 個智能等級。
根據作者的闡述,該論文的部分研究成果如下:
人工智慧的 IQ
AI 到底有多聰明?隨著越來越多的人開始鼓吹人工智慧威脅論,人們也開始對這個問題表現出關心,而來自中國科學院的 3 位學者也關注到了這一問題,通過研究,他們提出為人工智慧系統建立一個標準的智能模型。
為了更好的分析 AI,人類等智能體的智能水平,我們把「知識的獲取,掌握,創新和反饋」又分成 15 個小分類,從更多維度評測 AI,人類的智能。
這 15 個小分類是「圖像、文字、聲音的識別和輸出,常識、計算、翻譯、排列,創作、挑選、猜測、發現等」。
簡單來說,就是給人類和機器的智能水平建立了一個統一的標尺。
在模型建立完成後,研究團隊在 2014 年和 2016 年兩次對世界範圍內的大公司人工智慧系統進行了智商測試。
在 2014 年的測試中,他們對世界 50 個 AI 系統和 3 個不同年齡段人類進行了測試,測試結果顯示 Google、百度和搜狗在這些這些系統中表現最佳,但對比人類仍相去甚遠。
隨後 2016 年,研究團隊對 Google、百度、搜狗和蘋果 Siri、微軟小冰等人工智慧系統進行了測試,目前工作仍在進行中,不過從已經完成的工作來看,Google 和百度等人工智慧系統比起兩年前已經有了大幅的提升,但相較人類 6 歲的兒童還有一定差距。
研究者之一的劉鋒在其博客中表示,「雖然人工智慧系統,這兩年得分增長很快。但在創造性這個大分類上,得分一直進展不大。而且這個分類的權重又比較高。」
人工智慧的 7 個智能等級
根據上面的人工智慧「標準智能模型」,論文還為智能系統劃分了 7 個智能等級,從 0 級到 6 級。
第 0 級系統,其基本特徵在理論上存在,但現實中並不存在這樣的人工智慧系統。
第 1 級系統,其基本特徵是無法與人類測試者進行信息交互。
第 2 級系統,其基本特徵是能夠與人類測試者進行交互,存在控制器和存儲器,但系統內部知識庫不能增長。
第 3 級系統,其基本特徵是除具備 2 級系統的特徵外,其控制器、存儲器中包含的程序或數據可不聯網進行升級或增加。
第 4 級系統,其基本特徵除了包含 3 級系統的特徵外,最重要的是可以通過網路與其他智能系統共享信息和知識。
第 5 級系統,最基本的特徵就是能夠創新創造,識別和鑒定創新創造對人類的價值,以及將創新創造產生的成果應用在人類的發展過程中。
第 6 級系統,最基本的特徵就是隨著時間的向前推進,並趨向於無窮點時,不斷創新創造產生新知識的智能系統其輸入輸出能力,知識的掌握和運用能力也將趨近於無窮大,按照基督教對於上帝的定義「全知和全能」,可以看出智能系統在不斷創新創造和不斷積累知識的情況下,在足夠的時間裡以人類為代表的智能系統將最終實現「全知全能」的狀態。
AlphaGo 屬於第 3 等級
規划了系統後,論文對去年至今大熱的圍棋 AI AlphaGo 做了分析與探討,他們認為,從公開的資料看,AlphaGo 雖然可以通過網路實現大量 CPU 和 GPU 協同工作,但是目前 Google 目前還沒有在互聯網上開放 AlphaGo 接受用戶的在線挑戰,所以該系統不具備第 4 級智能系統的條件。
論文作者認為,對人工智慧系統進行智商測試和分級有助於人們對智能系統進行分類和評判,同時也能為低等級的智能系統提供發展方向的參考。
研究團隊將在 2018 年進行第三次世界範圍內的 AI 系統智商測試,通過測試檢驗人工智慧的發展水平,並繪製出對比人類智力發展的曲線。
最後,今天下午論文作者之一劉鋒在自己的博客上對有關論文出處的誤解做了闢謠,他聲明該論文出處為中國科學院虛擬經濟與數據科學研究中心,研究者為該機構的劉鋒、石勇和劉穎,而不是很多媒體報道中的康奈爾大學。
文章插圖來源:劉鋒博客
頭圖來源:視覺中國
※可食用機器人問世?其實更像是「行走的補給箱」
※大自然不朽的擎天柱:巨型紅杉
※科學界的黑歷史,科技界計算錯誤導致八大悲劇!
※竟然有人為了潛水而不惜把耳膜戳破,也是奇葩了
TAG:極客公園 |