當前位置:
首頁 > 科技 > 當人工智慧擁有好奇心,結果可能沒你想像的那麼糟糕

當人工智慧擁有好奇心,結果可能沒你想像的那麼糟糕

關鍵時刻,第一時間送達

文 / 我堂堂一個熊貓

內容經授權轉載發布

好奇心,是人和人工智慧最顯著的差異之一。從我們睜開雙眼看這個世界開始,我們就在努力的了解著周圍的一切,我們了解世界的方式很多樣;一開始是試圖把所有東西放進嘴巴里,到後來我們走遍了這世界的每一個角落。

這也是生命中最美妙的東西,在滿足好奇心的過程中,我們獲得了快樂。人類了解一切,不是為了完成某一個目標,而僅僅是一種來自本能的衝動。

可人工智慧所做的,只有根據既定目標進行學習、搜索和計算。掃地機器人會探索周圍環境,可這不是因為好奇,而是為了建立房間中的SLAM以完成工作。這也是強人工智慧不會出現的證據之一:人類自己都沒弄明白「意識」為何會存在,更沒法將「本能」加在人工智慧頭上。

不過在現有技術下,我們能否讓人工智慧做出類似好奇的行為呢?比如給予無意義的探索行為一些獎勵,或者是把探索行為和完成工作相結合進行評分。

答案是可以。

GIF/86K

好奇心幫助人工智慧成為更棒的水管工

還記得我們第一次玩超級瑪麗的時候嗎?或許我們中很多人玩的都是小霸王學習機里的超級瑪麗式英語學習軟體。不管是什麼,進入遊戲的第一時間,我們通常都是試一試手柄上的每一個按鍵是做什麼的,然後跳來跳去,嘗試觸碰遊戲里的每一個小方塊。這就是好奇心最基本的表現。

那麼人工智慧在玩超級瑪麗時是怎樣的呢?通常情況下是應用了增強學習演算法,用正負反饋機制幫助人工智慧快速通關。踩死一隻烏龜,獲得正向反饋,掉入懸崖,獲得反向反饋。問題時,只要能夠繼續過關,人工智慧很難學會新的動作,這也就造成了遇到新的關卡時,人工智慧常常需要耗費很大力氣才能通過。

在一篇關於人工智慧好奇心的論文中提到,人工智慧利用傳統的增強學習方法訓練,在超級瑪麗的遊戲過程中,人工智慧卡在了遊戲的30%處,因為人工智慧需要越過一個坑,而想要越過那個坑,需要15到20個特定順序的按鍵操作。由於在墜落進坑裡時已經獲得了反向反饋,人工智慧常常在坑的位置止步不前。

上述論文的作者,來自UC Berkeley的研究團隊提出了一種新的思路,為人工智慧加入了內部好奇心構型。以自監督的方式,預測自身行動會造成何種結果,並將這種演算法稱作自監督預測演算法。

當外部反饋減少時,內部好奇心構型會激勵人工智慧通過探索環境去檢驗自我對於行動的預測。結果是,採取內部好奇心構型的人工智慧不會盲目重複那些有正向反饋的動作,而是開始了解遊戲環境,把握整體遊戲進程。最終戰勝了那個坑。

GIF/86K

好奇心不僅會害死貓,

還會讓人工智慧得多動症

接下來,在DeepMind計算機科學家Hester和德州大學奧斯汀分校的Peter Stone的研究中,同樣的概念被進一步的具象化。

在強化學習的基礎上,他們開發了一種名為TEXPLORE-VANIR的演算法。和自監督預測演算法不同的是,TEXPLORE-VANIR為人工智慧設立了內部獎勵機制,當人工智慧探索環境時,即使這種行為對達到最終目標沒有好處,人工智慧也會因為減少了外部環境的未知性而獲得來自內部的正向反饋。同時,在探索環境中發現了新事物時,人工智慧也會獲得正向反饋。

這麼聽起來,是不是很人類的好奇心非常相像了?

並且TEXPLORE-VANIR也讓人工智慧的好奇心不再止步於遊戲中。在關於機器人工作的實驗中,面臨多項工作安排,TEXPLORE-VANIR演算法能讓機器人表現更好。原因是面臨多項工作時,普通深度學習演算法會讓機器人不斷重複某一項工作中的動作,因為機器人曾經在完成這一項工作時獲得過正向反饋,當其他工作出現時,它還是會重複那些讓自己獲得過正向反饋的動作。這樣一來,就會浪費很多時間。

當人類表現出過度好奇時,會有怎樣的結果?最常見的,注意力無法集中,常常將手頭的工作半途而廢。同樣,人工智慧擁有好奇心後也會有同樣的表現。搭載TEXPLORE-VANIR演算法的機器人在一項給門開鎖的任務上表現較差,就是常常因為好奇而去探索環境,導致任務完成的延遲。甚至有學者稱,這是人工智慧的「多動症」。

這樣看來,如何平衡內部和外部的反饋將是如何讓人工智慧好奇心發揮作用的最大問題。

GIF/86K

沒有好奇心的人工智慧只是機器?

我們更關心的是,讓人工智慧擁有好奇心這件事究竟有什麼用?是為了他們在遊戲中更好的打敗我們?還是讓他們在執行任務時分心而變得低效?或者說讓他們更接近人類,可以更好的打敗我們?

電影超能查派中的人工智慧自己研發出了如何轉移意識,超越了電影中人類現有的科技水平

首先,好奇心會讓人工智慧在學習時更加高效。減少對外部環境反饋的依賴,意味著對已有數據的利用率更高。比如在機械手臂試圖抓起物品時,常常是把可能抓起物品姿勢都嘗試一遍,直到把物品抓起來。對於人來說,這是根本不能接受的低效,可換到了一個充著電的機器上,似乎就沒人在意了。可笑的是,人工智慧本應該替人類完成重複勞作的工作,結果卻是用更多的人工智慧重複勞作,代替人類的重複勞作。可有了好奇心,人工智慧可以先對環境、環境中的物體進行初步的了解,然後再加以行動,而不是無腦的用暴力窮舉解決問題。

其次,好奇心可以讓人工智慧更好的適應現實應用環境,畢竟現實和遊戲或者實驗不一樣,沒人會為人工智慧的每個動作打分。當缺少外部環境反饋時,好奇心驅使的內部反饋就可以發揮很大作用。只有可以自我驅動的AI,才能在真正意義上幫助到人類,發現那些我們在設立目標時沒有發現的事,而不是像所有機器一樣根據指令行動。

看到這裡,是不是加重了對人工智慧的恐懼?別擔心,大多數有關好奇心的演算法目前還都停留在實驗階段,一是上文提過的,由於無法平衡內部反饋和外部反饋,好奇心常常會降低人工智慧的工作效率。畢竟100%的專註,是所有機器的優勢。第二則是,傳統深度學習的「蘿蔔加大棒」政策已經能滿足當下很多人工智慧的應用。暴力窮舉雖然低效,但是十分有效。

但我們相信,不管以何種形式,未來的人工智慧一定會出現類似好奇心的機制,在更了解這個世界的前提下,更好的服務人類。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 騰訊科技 的精彩文章:

單車第一鎮的福與禍:有人兩個月賺30萬,但冬天到了
英偉達CEO黃仁勛:摩爾定律已過時 GPU將很快取代CPU
軟體行業去年為美國GDP貢獻1萬億美元 養活1000萬人
v-commerce時代到來 六成智能音箱用戶已使用語音購物
蘋果獲超聲壓力感測器專利 可用於實現屏下Touch ID

TAG:騰訊科技 |