清華學神MIT的最新研究:讓AI學會了物理力學
來源:量子位
作者:問耕
智能觀 轉載
機器能自行理解我們這個物理世界的基本規則么?答案是能。
多年以來,麻省理工學院(MIT)的研究人員一直在尋求解釋和複製人類智能,而他們最近的研究成果,是如何讓AI智能體擁有認知世界的基本能力。
即:學會分辨不同的對象,以及推斷它們如何受到物理作用力的影響。
這包括幾個方面。首先是看到圖片後,能腦補其中物體的三維形狀;其次是判斷物體的物理特性,例如質量和摩擦力等;然後是推斷隨著時間推移,這些它們會如何被物理作用力改變,比方會發生何種位移。
在這個方向上,MIT博士生吳佳俊和團隊一起發表了四篇研究論文,這四篇論文入選了剛剛結束的NIPS,而且有兩篇被選為spotlight。
其中三篇論文談及如何從視覺和聽覺數據中,推斷出物體的物理結構。另外一篇,則是預測這些物體會如何發生變化。
「總而言之,我們已經能夠讓機器像人類一樣,掌握越來越多對物理世界的基本理解」,吳佳俊的導師Josh Tenenbaum教授表示。
腦補
首先要解決的問題是,如何正確認知這個世界。
挑戰在於,如何構建一個神經網路模型,能夠基於給定的二維圖片,腦補出隱藏在視線之外的物體形狀,最終還原構建出一個三維圖像。
這需要模型能看透物體間的相互遮擋,濾除混雜期間的視覺紋理、反射和陰影,推斷看不見的地方究竟是什麼形狀等。
顯然這是一個複雜的問題。參與這項研究的不止MIT學者,還有來自DeepMind、上海科技大學、上海交通大學的各路高手。
這些研究基於MIT神經科學家大衛·馬爾(David Marr)的理論。這位英年早逝的科學家認為,在解釋一個視覺場景時,大腦首先從觀察角度建立對象的2.5D草圖,然在在此基礎上,大腦繼續推斷出物體完整的三維形狀。
這不是一件易事。
吳佳俊和同事們為了訓練神經網路,會首先建立一個三維場景模型,然後再生成一張二維圖片。整個過程就像拍攝動畫電影似的。一旦有了數據,就能讓AI開始自學如何基於二維圖片,腦補出三維場景。
還有更有意思的挑戰。
比方,聽聲腦補。在另一篇論文中,他們訓練了一個系統,通過物體被丟棄時發出的聲音,推斷物體的形狀、材質以及跌落的高度。
物理
神經網路已經學會如何腦補一個三維世界,現在,是時候讓AI學習如何像人類一樣,掌握對真實世界物理作用力的直觀理解了。
研究人員一共交待了兩項任務。
其一,是估計撞球的運行速度,並據此預測撞球(們)發生撞擊後,後續的運動情況。其二,是分析堆疊的方塊靜態圖,並據此判斷這堆方塊是否會掉落,以及會落在何處?
吳佳俊為此開發了一種稱為場景XML的表示語言,可以定量描述視覺場景中物體的相對位置。神經網路首先學習使用這個語言輸入數據,然後把這個描述提供給一個物理引擎,這個引擎負責基於物理作用力進行建模。
物理引擎最終完成撞球和方塊運動的預測之後,信息被發送給圖形引擎,最終形成一張預測圖片。這張圖片會與真實場景的物理作用結果進行比較。
在測試中,MIT的研究超過了前人的成果。
「他們使用了物理工具來訓練生成模型」,南加州大學計算機科學助理教授Joseph Lim表示:「這個簡單而優雅的想法與最先進的深度學習技術結合,在與解釋物理世界相關的多項任務中展現了非常棒的結果。」
上述內容主要源自MIT News,原文地址:
http://news.mit.edu/2017/computer-systems
-predict-objects-responses-physical-forces-1214
吳佳俊
上面提及的四篇論文中,吳佳俊都有參與,其中兩篇是作為第一作者。
前面已經提到,吳佳俊現在是MIT的博士生。他的導師是Bill Freeman教授和Josh Tenenbaum教授。吳佳俊的研究方向主要為計算機視覺、機器學習和計算認知科學。
吳佳俊本科畢業於清華大學交叉信息研究院,導師為屠卓文教授。
2010年9月,18歲的吳佳俊通過全國信息學奧林匹克競賽從上海華東師範大學第二附屬中學保送至清華大學。
就讀清華期間,吳佳俊一度成為話題人物。當時吳佳俊正參選2013年清華大學本科生特等獎學金,他的一份個人履歷引起了廣泛的關注。其中最受關注的一項成就是:頂級會議CVPR 2014審稿人。
此後,吳佳俊時常被被外界冠以超強履歷、新一代學神等形容詞。
相關論文
最後,如果你對上述提及的四篇論文感興趣,可以前方吳佳俊的個人主頁查看,地址:jiajunwu.com。
— 完 —
想知道AI加教育領域有哪些最新研究成果?
想要AI領域更多的乾貨?
想了解更多專家的「智能觀」?
請在對話界面點擊「找找看」,去獲取你想要的內容吧。
有人問:你們為什麼要做智能觀?為什麼關注AI+教育?
我想,這不是一個選擇。
當AI開始顛覆各行各業時,我們首先想到了教育。未來是我們正在為之努力的地方,教育可以影響當下,改變未來。
我們用心觀察和記錄教育在這個時代的蛻變;努力把前沿的動態、最新的進展、先進的觀點帶到你面前,希望與你一起思考和探索。我們相信,長出AI翅膀的教育,會創造出無限可能。
※如何幫助學生提出重量級問題?這裡有7個策略
※DeepMind的最新版AlphaZero4小時統治了國際象棋界
※Photoshop使用AI增加了新功能,使圖像編輯更容易
※東北大學校長專訪:人機協作時代,高等教育應教什麼
TAG:智能觀 |