當前位置:
首頁 > 科技 > 在演算法中練習百年後,機器人的手能比你更靈活嗎?

在演算法中練習百年後,機器人的手能比你更靈活嗎?

編者按:位於矽谷的非營利組織OpenAI的研究人員開發的AI系統Dactyl能使機器手像人類一樣靈活操縱立方體。本文經授權譯自MIT Technology Review原標題為" An AI-driven robot hand spent a hundred years teaching itself to rotate a cube"的文章。

Dactyl AI的研究人員成功研究出一種自學演算法,它能讓機器人的手具有很高的靈活性。他們研究出的演算法使機器手能靈活地操縱一個立方體,這個過程在計算機模擬中相當於進行了百年的練習(儘管實際只有幾天的時間)。

機器人的手還遠不及人類的敏捷,而且如果想應用在工廠或倉庫里也顯得太笨拙了。即便如此,這項研究依然顯示了機器學習的潛力。它還表明,有一天,機器人可能會在虛擬世界中自學新技能,這將大大加快編程或訓練它們的進程。

這個機器人系統被稱為「Dactyl」,是由位於矽谷的非營利組織OpenAI的研究人員開發的。它使用了一個來自英國公司稱為「影子」的現成的機器手,一個普通的相機,以及一個已經掌握了一個龐大的多人在線視頻遊戲的DotA演算法,它使用了同樣的自學方法。

該演算法使用一種稱為強化學習的機器學習技術。Dactyl的任務是操縱一個立方體,把不同的面翻到上面來。通過不斷的試錯,會產生預期的結果。

視頻顯示,Dactyl能夠非常敏捷地旋轉立方體。它自動地找出了人類常用的幾個抓點。但這項研究也顯示了人工智慧還有很長的路要走:在經過了數百年的虛擬訓練之後,機器人成功地操縱了魔方的概率只有13/50,這遠遠超過了兒童所需要的時間。

麻省理工學院名譽教授、Rethink Robotics公司的創始人Rodney Brooks表示:「短期內,它不適合被應用於工業流程,但研究依然是一件好事。」 Rethink Robotics公司是一家生產更智能工業機器人的初創公司。

強化學習的靈感來自於動物通過積極反饋學習的方式。它最初在幾十年前就被提出了,但隨著人工神經網路的進步,在最近幾年才被證明是可行的。Alphabet旗下的DeepMind利用強化學習技術創建了AlphaGo。這是一個計算機程序,它學會了高超的技能來玩極其複雜和微妙的棋盤遊戲。

其他機器人研究人員對這種方法進行了一段時間的測試,但由於模仿現實世界的複雜性和不可預測性,他們一直難有突破。OpenAI的研究人員通過在虛擬世界中引入隨機變數來解決這個問題,這樣機器人就可以學習如何解釋諸如摩擦、機器人硬體噪音以及立方體部分處於視線之外的問題。

該機器人背後的工程師之一Alex Ray表示,通過賦予它更強的處理能力和引入更多的隨機性,可以提高Dactyl的性能。「我認為我們還沒有達到極限,」他說。Ray補充說,目前還沒有計劃將這項技術商業化。他的團隊專註於開發最強的通用學習方法。

「這很難做好,」密歇根大學專門研究機器操縱的專家Dmitry Berenson說,「目前還不清楚最新的機器學習方法將會帶來多大影響。我們付出了很多努力來為特定的任務提供合適的方法。」但他認為,模擬學習可能是非常有用的:「如果我們能夠真正地跨越『現實差距』,學習就會變得更加容易。

編譯組出品。譯者:劉麥麥 Jane,編輯:郝鵬程。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 36氪 的精彩文章:

鄰家大面積關店,被曝資金鏈斷裂,CEO回應「一言難盡」
最後半年窗口期,誰能成為下一個「現象級」小程序?

TAG:36氪 |