當前位置:
首頁 > 最新 > OpenAI機械手成精了 無需訓練能自行掌握人類行為

OpenAI機械手成精了 無需訓練能自行掌握人類行為

騰訊科技訊 7月31日消息,據外媒報道,用手抓東西是嬰兒學會做的第一件事,但這絕不是一件簡單的事情,它會隨著人的成長而變得更加複雜多變,這種複雜性使得機器很難掌握人類的行為能力。

不過,美國連續創業家伊隆·馬斯克(Elon Musk)和薩姆·艾爾特曼(Sam Altman)支持的OpenAI公司研究人員,已經創造出一套系統,它不僅能像人類一樣抓握和操縱物體,而且還是自行領悟出這些行為能力的,根本無需人類教導。

許多機器人和機械手已經精通某些抓握或其他動作,比如工廠里的機器人可以比人類更靈巧地揮舞螺栓槍。但是幫助機器人完成這項任務的軟體很可能是手寫的,而且非常複雜。即使是在同一條生產線上,比如焊接,也需要一個全新的系統。

對於人類來說,拿起蘋果和拿起杯子似乎沒什麼區別。不過,差異是確實存在的,只是我們的大腦會自動填補空白,讓我們可以隨機應變,安全地握住不熟悉的物體。這是機器人遠遠落後於人類的領域。

此外,你不能僅僅通過訓練機器人去做人類能做的事,你必須提供數以百萬計的例子來充分展示,人類如何操控成千上萬個給定的物體。

OpenAI的研究人員認為,解決方案就是根本不使用人類數據。取而代之的是,他們讓計算機在模擬中反覆嘗試和失敗,慢慢地學習如何移動手指,以便它所掌握的對象能夠按照需要移動。

研究人員稱這套系統為Dactyl,他們只為其提供手指的位置和三種手持對象的攝像頭視角。但在訓練時,所有這些數據都是在虛擬環境中進行模擬的。

在這種環境中,計算機不需要實時工作。它可以在幾秒鐘內嘗試上千種不同的方法去抓住一個對象,分析結果並將數據轉發到下一次嘗試中。這隻機械手本身就像影子般靈巧的手,也比大多數機械手複雜。

除了需要了解的不同物體和姿勢之外,還有其他隨機參數,比如指尖的摩擦力、場景的顏色和燈光等等。你不能模擬現實中的每個方面,但是你可以確保系統不只是在一個藍色的房間里工作,或在帶有特殊標記的立方體上工作。

研究人員在這個問題上投入了大量的精力:6144個CPU和8個GPU,在50個小時內收集了大約100年的經驗。然後他們將這個系統首次應用到現實世界中,它展示了許多令人驚訝的類人行為。

我們在不經意間用手做的事情,比如把一個蘋果轉過來看看有沒有擦傷,或者把一杯咖啡遞給朋友時,需要用很多小技巧來穩定或移動物體。Dactyl重新創建了其中的幾個過程,例如用拇指和中指握住物體,而用剩下的手指將其旋轉到想要的方向。

這個系統的偉大之處在於它的運動的自然性,以及它們是通過反覆試驗而獨立完成的,它與任何特定的形狀或物體類型無關。就像人類一樣,Dactyl的確可以控制和操縱被放在它手裡的任何東西。

這種靈活性被稱為泛化,對於必須與現實世界交互的機器人來說,這一點很重要。對於世界上的每個物體和每種情況來說,手工編碼行為模式是不可能的,但是機器人能夠在依賴核心理解能力的前提下適應並填補這些空白。(編譯/金鹿)

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 看前沿科技 的精彩文章:

一文讀懂拼多多上市:創始人不敲鐘 中美兩地消費者代表同時敲鐘
拼多多上市首日漲逾40% 黃崢躋身全球富豪榜前100名

TAG:看前沿科技 |