為讓機器人理解世界 科學家都做了什麼?
科幻小說中平行宇宙多是由與人類難以區分的機器人所組成的。這些機器人通常比我們更聰明、更敏捷、更強壯。他們似乎有能力做任何可以想像到的工作,從駕駛星際飛船、對抗外星人入侵,到清理垃圾以及烹飪美食。
當然,現實遠非幻想。除了工業環境之外,機器人仍未達到《傑森一家》中機器人的程度。公眾所接觸到的機器人似乎不過是一些尺寸過大的塑料玩具,它們被事先設定好執行一系列任務的程序,卻沒有能力與周圍的環境或他們的創造者進行有意義的互動。
套用PayPal聯合創始人、科技企業家Peter Thiel的話來說就是「我們本想要酷酷的機器人,但我們只得到了有著140字輸入限制的漢堡機器人Flippy」。但是,科學家們正在逐步取得進展,賦予機器人與人類一樣的能力,可以對周圍的環境進行觀察和反應。
該領域的一些最新進展是本月在年度機器人大會暨馬薩諸塞州劍橋科學與系統會議上所提出來的。這些論文深入探討了一些話題,包括如何讓機器人更健談,幫助他們理解語言的模糊性,以及幫助他們在複雜的空間中觀察和導航等。
優化的視覺
杜克大學的研究生Ben Burchfiel以及他的論文導師George Konidaris、布朗大學計算機科學助理教授,提出了一種演算法,從而讓機器能夠從更像人類的視角來看待這個世界。
在論文中,Burchfiel和Konidaris展示了他們如何能教會機器人識別物體並儘可能操縱三維物體——即使物品可能被遮住或放置在陌生的位置上,比如被打翻的茶壺。
研究人員對機器人的演算法進行了訓練,方式是對大約4,000種常見的家用物品進行3D掃描,如床鋪、椅子、桌子,甚至是馬桶。然後,他們測試了機器人以鳥類的視角觀察和分辨出900個新的3D物體的能力。相對於其他計算機視覺技術50%的正確率而言,該演算法在其75%的時間內做出了正確的猜測。
研究人員表示,他們的研究並不是訓練機器對3D物體進行分類的首例。他們的方法不同之處在於,他們對機器人學習物體分類的空間進行限制。
「想像一下所有可能的物體存在的空間,」研究人員解釋道:「這就是說,假如你有微型樂高積木,我告訴你,你可以隨意將它們粘在一起來創造不同的東西。你可以創造出很多東西!」
這種無限的可能性可能會最終帶來人或機器都不能夠識別的物體。
為了解決這個問題,研究人員使他們的演算法找到了一個更有限的空間,以容納它將要辨認的物體。通過在這個有限空間中工作——從數學上說,我們稱之為子空間——我們極大地簡化了分類任務。「正因為發現了這個空間使我們擁有了區別於以往的方法。」
服從命令
與此同時,布朗大學的兩名本科生找到了一種方法,可以讓機器人更好地理解方向,甚至在不同程度的抽象概念上也可以完成。
由Dilip Arumugam和Siddharth Karamcheti帶領的這項研究探討了如何訓練機器人理解自然語言的細微差別,以及隨後如何正確有效地遵循指令。
「問題在於,命令可以有不同的抽象級別,這可能會導致機器人無法有效地規劃其行為或根本無法完成任務。」Arumugam在一份新聞稿中說。
在這個項目中,年輕的研究人員提供了將虛擬機器人移動到在線域名的說明。該空間包括幾個房間和一把椅子,機器人被告知要從一個地方到另一個地方操縱。志願者向機器人發出各種指令,這些指令既有較為概括的,比如「把椅子帶到藍色房間」,也有一步一步的具體指令。
然後,研究人員使用指令資料庫來教系統理解不同的表達方式。這台機器不僅學會了遵循指令,還學會了識別不同抽象程度的話語。這是解決問題的能力,以最合適的方式解決這個問題的關鍵。
研究最終從虛擬環境進入了真實世界,使用了一個 和Roomba相似的機器人,90%的情況下,該機器人可以做到一秒內對指令做出反應。相反,當無法識別任務的特異性時,機器人需要20秒或更多秒的時間來計劃任務約50%的時間。
論文中提到的這種新機器學習技術的一個應用是在倉庫環境中工作的機器工人,但還有許多領域可以從一個更全能的機器中受益,這種機器能夠在具體操作和一般化任務之間無縫切換。
「其他可能受益於這樣系統的領域包括自動駕駛汽車、輔助機器人技術以及醫療機器人等。」Singularity Hub在回答一封郵件來信時這樣說。
還有更多值得期待
這些研究成果有助於幫助人們實現創造出可以像人類那樣看、聽和行動的類人機器人的理想。不過,這距離真正創造出類人機器人還有很長的路要走。
「我認為我們距離機器人可以像人類一樣進行交流還有很長一段路要走。我們目前所採取的學習模式還不能達到這一點,前面有很多障礙:從看似簡單的問題,比如如何處理從未見過的單詞,如何處理更困難、更複雜的問題,如何解決語言中固有的含糊性例如習語或比喻表達等。」
即使相對「話多」的聊天機器人也可能會被問的無言以對,因為未來人機談話可能變得更加複雜。根據Burchfiel的說法,人類的視力也是如此。
雖然深度學習技術極大地改善了模式匹配——谷歌能找到任何一張貓的照片——但人類的視力具有的能力遠不止於找東西。
「有兩個大領域我認為人工智慧認知還有很長的路要走:歸納性偏見和形式推理,」 Burchfiel說。他解釋道,前者本質上是人們用來幫助他們推理的背景知識。他使用大街上的一個水坑作為例子。例如,人們習慣於認為這是一灘水,而不是一塊玻璃。他說:「這種偏見可以解釋為什麼當看著雲的時候我們會認為看到了人臉,因為我們對於人臉有很強的偏好。」雖然乍一聽起來很簡單,但它卻為我們所做的大部分事情提供了動力。人類對自己期望看到的東西有一種非常直觀的理解,這讓認知變得更容易。
形式推理同樣重要。在Burchfiel的例子中,當一台機器學習了水向下流的原理後,它可以利用深度學習演算法計算出所有河流的流向。但它還沒有擁有人類將此知識擴展到其他事物上的能力,例如研究水在火星的管道系統里是如何運動的。
「在過去的幾十年里,我們做了很多這樣的形式推理……但我們還沒有找到如何將它與標準的機器學習方法結合起來以創造出一個在現實世界中有益的無縫化系統。」Burchfiel表示。機器人在人類身上還有很多東西需要學習,這應該會讓我們感覺良好,因為這證明人類才是地球上最複雜的。
選自:singularityhub 作者:Peter Rejcek 編譯:網易見外智能編譯機器人 審校:鬱郁 Ecale
※外星喵的地球之旅
※月球撤離裝置:金字塔狀太空擔架可運輸受傷宇航員
※它上面載有地球在宇宙的坐標,外星人發現它或對人類帶來致命影響
※若沒有月球,地球的一天將只有6小時,人類不可能存活到現在!
TAG:宇宙探索 |
※為什麼學數學?這是人類理解世界的秘訣
※學好理解,什麼都順了
※人工智慧不斷突破,讓「機器」理解這個世界!
※那些讓人難以理解的磚家
※胡適:想讓別人理解你,先學會理解別人
※理解了全世界又能怎樣,誰會理解你
※外星人嘗試著與人類建交?科學家:只是我們沒法理解!
※科學家發現存在「宇宙牆」你們怎麼理解呢?
※中年人理解這個世界,誰理解他們呢?
※心理學是一門科學嗎?如何理解心理學?
※如何理解科學和無神論?為何有很多科學解釋不了的事情?
※哈士奇這種神奇的寵物,我們人類怎麼能理解得了?
※人類為什麼會死?如何從科學上理解人類的生死?
※光速慢的就像蝸牛?科學家勾勒出的快子世界,它快到讓人無法理解
※怎麼正確理解「科學」呢?
※做人,要學會理解
※光速是龜速?科學家構畫的快子世界,有種快到讓人無法理解的感覺
※何超瓊為什麼不要孩子?原因讓人理解,網友:女強人的世界你不懂
※理解別人,也理解自己
※為什麼科學家發現到的系外行星那麼少?其實原因也不難理解