當前位置:
首頁 > 科技 > 給 AI 賦予好奇心 可能機器人比你更沉迷電子遊戲

給 AI 賦予好奇心 可能機器人比你更沉迷電子遊戲

本文由騰訊數碼獨家發布

人工智慧強大的學習能力眾所周知,它們可以輕鬆學會各種需要的技能,但是截至目前,AI 的這些能力都是局限於生產力層面上,它們的存在是為了幫助人類更高效的分析處理數據,並完成相應工作,不過根據 Open AI(特斯拉創始人埃隆馬斯克旗下公司)的研究報告,他們對好奇心驅動的 AI 技術進行分析,在論文中提到,AI 模型其實完全可以在沒有任何「外在激勵」的情況下利用自己的好奇心培養想要的學習技能。

也就是說,在不告知 AI 清晰明確的目標情況下讓其按照自己的愛好自行發展學習能力,用發展心理學家的話說,就是讓人工智慧的內在動機(好奇心)作為行為的主要驅動力,給他們自由空間選擇學習對自己有用的技能,比如讓他們玩《我的世界》遊戲,讓他們在遊戲中發展自己的興趣,而不提供任何外在的激勵。

研發人員的目標是讓機器可以在不經過人類編程植入的情況下探索環境,也就是實現真正的機器的自動化,這類技術的應用領域非常廣闊,比如救援機器人在未知環境下展開的救援工作,為了學習這種內在激勵的深度學習效果,研發人員最初開始用視頻遊戲作為實驗,這些遊戲環境由於沒有限定性規則和相應酬賞,非常適合於激勵 AI 的自行探索能力,比如《 Pong 》這種經典的雙人彈球遊戲,讓人工智慧根據對該遊戲的興趣提高自己的能力,獲取更多的遊戲分數。

通過對《 Pong 》,《 超級馬里奧 》這類遊戲中,研究人員發現 AI 的確可以在沒有研發人員給定的明確目標下,也能夠在其中很快通過學習獲得遊戲技能提升,而 AI 玩家還可以在其中建立自己的遊戲風格,不斷突破自己的能力嘗試新的遊戲環境,比如在《打磚塊》這類遊戲中,當越多的磚塊被球擊中,磚塊的圖案越複雜,AI 玩家的探索好奇心就會越強,它們得到的分數也會越高,當 AI 玩家的生命快耗盡時,研發人員設法讓磚塊再次被重置為之前的均勻結構,在這種情況下 AI 的存活心理更加強,也就是說其內在的好奇心激勵效果發揮了明顯的作用。

僅僅通過好奇心激勵,AI 已經通過了《超級瑪麗奧》的 11 關關卡,而這都是在缺乏編程人員的目標設定條件下實現的,而且他們和人類一樣,在好奇心被激勵的同時也很容易分心,當研發人員讓兩個具有好奇心激勵的機器人來進行《Pong》彈球對抗時,他們發現機器人放棄了之前的贏得遊戲的目標,而是共同來合作看最終能實現多少擊球次數。

來源:thenextweb

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 科技酷玩探索家 的精彩文章:

不止是語音助手 這10台最古怪的亞馬遜 Alexa 設備還有奇特功效
為什麼遊戲手機做不走 三星可以在這幾個原因多反思

TAG:科技酷玩探索家 |