當前位置:
首頁 > 科技 > CMU科學家們帶一群機器人開房,並收集了28,000種不同的姿勢

CMU科學家們帶一群機器人開房,並收集了28,000種不同的姿勢

機械栗 發自 凹非寺

量子位 出品 | 公眾號 QbitAI

來自卡耐基梅隆大學 (CMU) 的四個科學家,在一篇論文里說,他們帶著一群機器人去住Airbnb了。

也不知道,近來忙於應付紐約市政府的Airbnb,能不能感受到這一縷清風。

回歸正片,研究人員自然不是請機器人去度假。

他們覺得,機器人常年待在實驗室里,生活場景很單調,和現實也有差距。

這樣的話,訓練出來的技能,很難推廣到真實世界裡去。

只能在實驗室做任務的機器人,也不是CMU的人類們想要的。

「經濟適用」機

團隊決定,讓機器人參與更多的實戰,培養它們泛化能力。

於是,人們先造了一批「便宜」的機器人,就是把Dobot Magician機械臂改造了一下——

加上了雙軸手腕兩指電動夾具,還有移動底座

感測器方面,配置了英特爾R200 RGB攝像頭,以及幫攝像頭轉脖子的雲台。

至於機器人的大腦,筆記本而已,CPU是i5-8250U,RAM有8G。

研究人員說,每台「只要」三千美元,比別的 (兩萬美元的) 機器人經濟多了。

「經濟適用」房

然後,帶機器人去開房。

仔細選擇的不同環境

研究人員先在Airbnb上,開了六套房,是收集真實數據用的。

就像剛才說的,只用實驗室環境里的數據來訓練,就不是真正的訓練。

他們用Yolo模型做物體檢測,然後用「Robust-Grasp (魯棒抓取) 」神經網路結構 (詳見下文) ,來算出最佳的抓取姿勢。

就這樣,一共收集了28,000種不同的姿勢。

自製的數據集,取名為Home-LCA,後面三個字母,指的是「便宜的機械臂」。

機智的決策

剛才,簡要登場的「Robust-Grasp」神經網路,就是機器人做出機智抓取決策的關鍵。

結構分成三部分——

一是抓取預測網路(GPN) ,這裡用的是訓練好的ResNet-18。吃進像素圖 (Pixel Imagery) ,再決定用什麼姿勢抓取。

不過,用了便宜的機器人,收集的數據會有很多噪音,所以……

二是噪音建模網路(NMN) ,根據場景圖像機器人獲取的信息這兩組數據,把噪音分離出去。

三是邊緣化層(Narginalization Layer) ,把兩股數據流結合起來,以便給出更好的決策。

團隊用自製的Home-LCA數據集,訓練了這個網路,也用兩個實驗室數據集做陪練,看哪邊效果好。

實戰派vs溫室派

訓練完成之後,研究人員又在Airbnb上面,另外開了3套房,作為賽場。

所以說,賽前誰都沒有到過這些地方。

不知文中為何只有兩間測試房的照片

真正的抓取比賽開始了,參賽雙方分別是:

實戰派,用Home-LCA訓練的AI。

溫室派,用Lab-Baxter訓練的AI。

三個新房子

同在陌生的環境里,抓取陌生的物體,實戰派機器人的成功率遠遠超過溫室派。

這並不意外,畢竟在那之前,選手們還進行了另外一項比賽——

機器人做隨性抓取,AI來預測能不能抓取成功 (依靠位置和角度) 。

橫向對比,當訓練集與測試集來源不同,便知其泛化能力

結果,用Home-LCA數據集訓練的模型,在接受其他兩個數據集的測試時,預測正確率並沒有明顯差異,一直保持在70%上下 (見第3、5行) 。

而用Lab-Baxter和Lab-LCA數據集訓練的模型,換其他數據集測試,預測正確率便會從70%左右,下降至55%左右 (見第1、2、4行) 。

占卜婆婆

也就是說,實戰派處變不驚,泛化能力穩勝一籌。

野生,野長

果然,從模型訓練開始,就不能對機器人太溫柔。

不管是在模擬器里修鍊的機器人,還是用實驗室數據餵養的機器人,都容易對外界的艱險適應不能

到外面去吧

採集真實世界的數據,來訓練機器人的實際操作技能,它們便不會被困在實驗室里,寸步難行。

大概,這就是CMU在機器人能力的泛化上,為同仁們提供的一個思路吧。

論文傳送門:

https://arxiv.org/pdf/1807.07049.pdf

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 量子位 的精彩文章:

小米開源移動端深度學習框架MACE,自主研發,專為IoT設備優化
微軟總裁呼籲:AI刷臉,美國政府該管一管了

TAG:量子位 |