當前位置：

首頁 > 探索 > 機器學習加持：OpenAI機械手操控靈活性有了大幅提升

機器學習加持：OpenAI機械手操控靈活性有了大幅提升

探索 07-31

雖然機器人的靈活性還沒有達到接近人手的水平，但伊隆·馬斯克等科技大佬攜手創立的非營利組織 OpenAI，正在努力向這個目標抵近。最近，OpenAI 研究人員正在藉助人工智慧，來教導機器人像人類一樣靈巧地操縱物體。通常情況下，科學家們需要通過強化學習來實現這一目標，即讓 AI 反覆試驗學習過程，但這麼做相當耗費時間。

如果只是讓 AI 去學習怎麼玩視頻遊戲，只需要讓它以更快的速度玩遊戲就行了。但涉及真實任務時，就有些抓瞎了。

你不能等待機械手臂經過多年的練習，且它難以模擬世界上足夠準確的訓練課目。

有鑒於此，OpenAI 自行設定了一個任務，教機器人手來操縱一個六面立方體 —— 將它從一個位置移動到另一個位置，期間保持特定的一面朝上。

與早期研究一樣，他們首先儘可能地準確模擬這種環境，但下一步，他們會製造差異來搞亂模擬。

首先，研究人員添加了隨機的『視覺噪音』，改變虛擬機械手和立方體的顏色。

然後，隨機化立方體的大小、表面滑膩程度、重量、甚至模擬了不同的引力參數。

所有這一切，都是為了讓 AI 更好地理解在現實世界中操縱立方體的可能性。

雖然模擬無法將真實情況完全考慮進去，但有了足夠的變化，就允許它系統地學習針對意外事件的處理方法。參與 OpenAI 項目的 Matthias Plappert 解釋到：

改變模擬的引力，是一件相當有趣的事情。當 AI 系統（Dactyl）在控制真實的機器人手時，手的基部可能每次都處於不同的位置和角度。

如果較低偏低，意味著立方體更容易從手中掉落。為了教 Dactyl 處理這種變化，研究人員決定將模擬中的重力參數也隨機化。

如果不這樣，它就會因為不習慣而一直掉落物體。事實上，Dactyl 必須積累大約 100 年的經驗，才能達到最佳的表現。

反之，研究團隊必須耗費大量的計算能力 —— 大約 6144 個 CPU 和 8 組強大的 Nvidia V100 GPU 。

顯然，需求如此高的硬體，只有極少數的研究機構才能用上。不過 Plappert 表示，最終的結果，依然是相當值得的：

完成訓練後，Dactyl 能夠將立方體從一個位置移動到另一個位置，連續執行 50 次動作而不會出現掉落 —— 即便中位數的次數要小得多（只有 13 次）。

在學習移動立方體的過程中，Dactyl 甚至開發出了類似真人的行為，而所有這些都是在沒有人為知道的情況下習得的（只是幾十年如一日般的反覆試驗）。

Plappert 表示，這表明 OpenAI 的已經為模擬操控做到了極佳的優化。當你看到一台機器人試圖解決問題，本身就是一件很有趣的事情。

[編譯自：TheVerge]

稿源：cnBeta.COM

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 Science科學探索 的精彩文章:

※我們能否在太空中測量銀河系的加速度？
※科學家研發新型人造智能皮膚或讓機器人也有觸感

TAG:Science科學探索 |