CMU科學家們帶一群機器人開房，並收集了28，000種不同的姿勢

科技 07-28

機械栗發自凹非寺

量子位出品 | 公眾號 QbitAI

來自卡耐基梅隆大學 (CMU) 的四個科學家，在一篇論文里說，他們帶著一群機器人去住Airbnb了。

也不知道，近來忙於應付紐約市政府的Airbnb，能不能感受到這一縷清風。

回歸正片，研究人員自然不是請機器人去度假。

他們覺得，機器人常年待在實驗室里，生活場景很單調，和現實也有差距。

這樣的話，訓練出來的技能，很難推廣到真實世界裡去。

只能在實驗室做任務的機器人，也不是CMU的人類們想要的。

「經濟適用」機

團隊決定，讓機器人參與更多的實戰，培養它們泛化能力。

於是，人們先造了一批「便宜」的機器人，就是把Dobot Magician機械臂改造了一下——

加上了雙軸手腕，兩指電動夾具，還有移動底座。

感測器方面，配置了英特爾R200 RGB攝像頭，以及幫攝像頭轉脖子的雲台。

至於機器人的大腦，筆記本而已，CPU是i5-8250U，RAM有8G。

研究人員說，每台「只要」三千美元，比別的 (兩萬美元的) 機器人經濟多了。

「經濟適用」房

然後，帶機器人去開房。

仔細選擇的不同環境

研究人員先在Airbnb上，開了六套房，是收集真實數據用的。

就像剛才說的，只用實驗室環境里的數據來訓練，就不是真正的訓練。

他們用Yolo模型做物體檢測，然後用「Robust-Grasp (魯棒抓取) 」神經網路結構 (詳見下文) ，來算出最佳的抓取姿勢。

就這樣，一共收集了28,000種不同的姿勢。

自製的數據集，取名為Home-LCA，後面三個字母，指的是「便宜的機械臂」。

機智的決策

剛才，簡要登場的「Robust-Grasp」神經網路，就是機器人做出機智抓取決策的關鍵。

結構分成三部分——

一是抓取預測網路(GPN) ，這裡用的是訓練好的ResNet-18。吃進像素圖 (Pixel Imagery) ，再決定用什麼姿勢抓取。

不過，用了便宜的機器人，收集的數據會有很多噪音，所以……

二是噪音建模網路(NMN) ，根據場景圖像和機器人獲取的信息這兩組數據，把噪音分離出去。

三是邊緣化層(Narginalization Layer) ，把兩股數據流結合起來，以便給出更好的決策。

團隊用自製的Home-LCA數據集，訓練了這個網路，也用兩個實驗室數據集做陪練，看哪邊效果好。

實戰派vs溫室派

訓練完成之後，研究人員又在Airbnb上面，另外開了3套房，作為賽場。

所以說，賽前誰都沒有到過這些地方。

不知文中為何只有兩間測試房的照片

真正的抓取比賽開始了，參賽雙方分別是：

實戰派，用Home-LCA訓練的AI。

溫室派，用Lab-Baxter訓練的AI。

三個新房子

同在陌生的環境里，抓取陌生的物體，實戰派機器人的成功率遠遠超過溫室派。

這並不意外，畢竟在那之前，選手們還進行了另外一項比賽——

機器人做隨性抓取，AI來預測能不能抓取成功 (依靠位置和角度) 。

橫向對比，當訓練集與測試集來源不同，便知其泛化能力

結果，用Home-LCA數據集訓練的模型，在接受其他兩個數據集的測試時，預測正確率並沒有明顯差異，一直保持在70%上下 (見第3、5行) 。

而用Lab-Baxter和Lab-LCA數據集訓練的模型，換其他數據集測試，預測正確率便會從70%左右，下降至55%左右 (見第1、2、4行) 。

占卜婆婆

也就是說，實戰派處變不驚，泛化能力穩勝一籌。

野生，野長

果然，從模型訓練開始，就不能對機器人太溫柔。

不管是在模擬器里修鍊的機器人，還是用實驗室數據餵養的機器人，都容易對外界的艱險適應不能。

到外面去吧

採集真實世界的數據，來訓練機器人的實際操作技能，它們便不會被困在實驗室里，寸步難行。

大概，這就是CMU在機器人能力的泛化上，為同仁們提供的一個思路吧。

論文傳送門：

https://arxiv.org/pdf/1807.07049.pdf

—完—

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 量子位 的精彩文章:

※小米開源移動端深度學習框架MACE，自主研發，專為IoT設備優化
※微軟總裁呼籲：AI刷臉，美國政府該管一管了

TAG:量子位 |