「Science」DeepMind關係推理ANN,在圖像理解中擊敗人類
新智元編譯
您要買的新家附近有多少個公園?和你的晚餐最配的葡萄酒是什麼?這些問題需要關係推理,這對於 AI 來說是難點。現在,谷歌 DeepMind 的研究人員已經開發了一種簡單的演算法來處理這種推理,而且它已經在複雜的圖像理解測試中打敗了人類。
人類通常相當擅長關係推理,一種使用邏輯來連接和比較位置、序列和其他實體的思維方法。但 AI 的兩種主要類型——統計和符號——要開發類似的能力一直很慢。統計型 AI 或機器學習在模式識別方面很厲害,但它並不使用邏輯。而符號型的 AI 可以使用預先制定的規則來理解關係,但是在臨場處理中表現並不好。
新的研究提出了一種方法來彌補這一鴻溝:用於關係推理的人工神經網路。類似於神經元在大腦中的連接方式,神經網路將微小的程序拼接在一起,協同地在數據中找到模式。它擁有處理圖像、分析語言甚至學習遊戲的專門架構。在這種情況下,新的「關係網路」設計用來比較各個場景中的每一對對象。DeepMind 的計算機科學家Timothy Lillicrap 表示:「我們在明確地迫使網路發現事物之間存在的關係。」
他和他的團隊通過幾項任務挑戰了他們的關係網路。第一個是回答關於單個圖像中對象之間的關係問題,比如立方體、球和圓柱體。舉例來說:「藍色的東西前面有一個物體; 它是否與灰色金屬球右邊微小的青色物體具有相同的形狀?」對於這個任務,關係網路與另外兩種類型的神經網路組合:一個用於識別圖像中的對象,一個解釋問題。在許多圖像和問題上,其他機器學習演算法在 42% 到 77% 的時間是正確的。人類取得了 92% 的好成績。新的關係網路組合則在 96% 的時間內是正確的,超過了人類得分。研究人員上周在 arXiv 上發表了一篇論文,公布了這一結果。
DeepMind 團隊還在基於語言的任務中試驗了這一神經網路。它收到了一系列陳述,如「Sandra 拿起了足球」和「Sandra 去了辦公室」,問題是:「足球在哪裡?」(辦公室)。它在大多數類型問題上與其它 AI 演算法表現近似,但它在推理問題上表現搶眼:「Lily 是天鵝。Lily 是白色的。Greg 是天鵝。Greg 是什麼顏色的?」(白色)。在這些問題上,關係網路得分為 98%,而其競爭演算法得分約為 45%。最後,該演算法分析了 10 個球跳動的動畫,其中一些通過不可見的彈簧或桿連接。僅使用運動模式,它能夠識別超過 90% 的連接。然後使用相同的訓練來識別由移動點所代表的人類。
「他們做法的優勢之一就是在概念上非常簡單」,波士頓大學計算機科學家 Kate Saenko 談到,她雖沒有參與這項工作,但本人也曾與人合作開發了一種用於回答關於圖像的複雜問題的演算法。Lillicrap 談到這種簡單,最大的優勢就是它包含在一個單一的等式里,可與其他網路結合,就像在對象比較任務中一樣。論文中稱之為「一個簡單的即插即用模塊」,使得系統的其他部分可專註於它們所擅長的工作。
「結果非常不錯」,斯坦福大學的計算機科學家 Justin Johnson 評論道,他參與開發了對象比較任務及其中一個應用效果良好的演算法。 Saenko 補充說,關係網路未來可以用於研究社交網路,分析監控畫面,或引導自動駕駛車。
Johnson也談到,為接近人類反應的靈活度,這一系統應學會應答更具挑戰性的問題。要實現這一點,就不能僅做兩個一組的對比,而是需要三個一組的對比,多組對比組的對比,或在一個更大範圍內的某些組的對比(基於效率)。「我希望可以實現自己生成策略的模型」,他表示:「 DeepMind 正在致力於一種特定類別推理的建模,並非普遍意義上的關係推理。但是向著正確方向邁進的及其重要的一步」。
原文地址:http://www.sciencemag.org/news/2017/06/computers-are-starting-reason-humans
※「不在谷歌?沒關係」不在大公司,如何做好深度學習
※「AI TOP 10」騰訊Angel正式開源;BAT伺服器總和不及亞馬遜一半;百度回應騰訊副總裁黃海跳槽百度
※谷歌開源移動設備視覺模型MobileNets
TAG:新智元 |
※如何理解 NVIDIA新GPU 架構 Turing的Tensor Core?
※深入理解 Web Server 原理與實踐:Nginx
※阿里CEO張勇:我們理解AI是Alibaba Intelligence
※MapReduce Shuffle深入理解
※Windows PowerShell進階 理解Module
※我所理解的#ShotoniPhone
※簡單理解Vue中的nextTick
※我所理解的 Smartisan OS
※快速理解Token,Cookie,Session
※Cookie,Session和Token概念的正確理解
※從One-hot,Word embedding到Transformer,一步步教你理解Bert
※理解 Linux 中的 /etc/services 文件
※Less與TypeScript的簡單理解與應用,並使用WebPack打包靜態頁面
※深入理解 ES Modules
※理解 OutOfMemoryError 異常
※Redhat Ceph存儲之「深入理解Ceph架構」
※理解並實現 ResNet(Keras)
※徹底理解 Node.js 中的回調(Callback)函數
※Foreign Policy:中美對國際秩序的理解迥異
※DeepMind發Nature子刊:通過元強化學習重新理解多巴胺