「跟著我左手右手一個慢動作」,李飛飛團隊造可學習人類的機械臂
學習似乎是只有人類才具備的特殊技能,但最近,智能機器人似乎也開始向人類學習和討教。
斯坦福大學李飛飛團隊的研究人員最新開發的機械臂,可以學習人類展示的拾取物體等操作,而且更有趣的是,機器人可以同時學習多種經驗。10 月 29 日該小組在瑞士蘇黎世召開的機器人學習大會上展示了他們的機械臂。
圖 | 研究人員調試機械臂(來源:斯坦福大學)
可以模仿人類動作的機器人
斯坦福大學研究人員訓練和測試的機械臂基於兩個框架,這兩個框架一起運作可以幫助機械臂更快更容易地學會一些基礎技能。其中 RoboTurk 框架可以讓人們實時引導機械臂完成任務,這一引導可通過智能手機或瀏覽器實現。而 SURREAL 則通過同時運行多項經驗學習來加速學習過程,這就允許機械臂同時學習多種任務。
「結合 RoboTurk 和 SURREAL,我們可以將從人類收集到的數據與大規模強化學習相結合,進而可以讓機器人做更多事。」Mandlekar 說,他是開發框架研究團隊的成員。
團隊成員計算機科學博士生 Yuke Zhu 展示了如何通過他 iPhone 上面的 app 對系統進行操作。他可以通過揮動手機指導機械臂對周圍環境進行交互和探索。但這往往需要大量的手臂揮動或大量數據。就像父母教孩子如何刷牙一樣,人們可以對機械臂展示如何做特定任務。
圖 | RoboTurk 可以對人類動作進行模仿(來源:機器人學習大會)
但這些教學並不是完美的,甚至有時指令會出錯。此外,「人類在機器人教學方面絕不是最佳選擇,」Zhu 說,「但目前這些經驗是機器人教學不可或缺的一部分。」
更快的平行學習
這些試驗無論是否失敗,都為我們提供了寶貴的信息。通過 RoboTurk 手機的演示信息將為機器人提供背景知識,並啟動它們的學習。而 SURREAL 則允許同時在全球範圍內運行數以千計的模擬訓練,以加速學習進程。
研究團隊成員計算機科學博士生 Linxi Fan 說,「有了 SURREAL,我們希望能加快機器人與環境互動的過程。」這些框架大大增加了可供機器人學習的數據量。
圖 | 人們可以通過網路連接對 RoboTurk 進行訓練(來源:機器人學習大會)
「通過對兩個框架的結合,我們提供了 AI 輔助的任務機制,通過這種機制可以讓人們遠離危險環境同時可以保持相似的任務執行水平。」博士後研究員 Animesh Garg 說,他參與了框架的開發。
該團隊還設想機器人在未來將成為日常生活中不可或缺的一部分:幫助人們做家務,在製造過程中幫助執行重複的裝配任務,或是完成可能對人類構成威脅的危險任務。
「你不用告訴機器人需要旋轉 20 度向前伸展 10 分米,」Zhu 說,「你只需要告訴機器人你想要拿一個放在廚房的蘋果。」
※李飛飛重返斯坦福後首個重大項目成立,倡議人性才是AI的核心
※蘋果兩款新 iPhone 今日開賣,供應鏈煩惱買氣欲振無力
TAG:DeepTech深科技 |