人工智慧一定要致力於打敗甚至「取代」人類嗎?人機合作或可達到最佳結果
作者:傑基·斯諾
(編譯|文飛)現在,計算機已經開始教會自己如何在遊戲中進行合作,目標是讓所有玩家達成最佳結果。研究人員說,此舉遠比訓練人工智慧(AI)在國際象棋或者跳棋等輸贏遊戲中獲勝更難。此項進展有助於加強人機合作。
二十年前,一台超級計算機在對戰中擊敗了國際象棋世界冠軍加里·卡斯帕羅夫(Garry Kasparov)。最近,AI研究人員開發的程序可以在更需要計算能力的遊戲中擊敗人類,例如圍棋和撲克。不過這些都屬於贏家通吃或者「零和」類的遊戲:一方獲勝,其餘全敗。在那些需要全員參與、玩家們一起努力收穫的合作遊戲領域,研究者所做甚少。即使在那些邏輯上要求玩家可以「背叛」同好來獲取個人所得的遊戲也是如此。
這類比賽包括懦夫遊戲(又稱鬥雞博弈,遊戲中兩輛車相向行駛,在最後一刻才轉向躲避),遊戲理論基於囚徒困境:兩個人被控有罪,如果兩人互相忠於對方拒絕認罪會得到輕判(例如1年刑期),如果其中一人背叛了另一方,就會無罪脫釋,而另一方刑期更長,例如3年。如果兩人互咬,則兩人都得到2年刑期的中等懲罰。如果只玩一輪,邏輯上會讓玩家背叛他的夥伴,但是如果反覆玩這個遊戲,人們會學會合作,這樣才能得到最輕的1年刑期。
美國猶他州普羅沃市楊百翰大學的計算機科學家雅各布·克蘭德爾(Jacob Crandall)和同事們想看看機器能否學會玩這樣的遊戲。研究人員把人類和機器放在一起玩電腦版的懦夫遊戲、囚徒困境和另外一個名為「alternator」的合作策略遊戲。成員包括兩人和兩台電腦,或者一人和一台電腦。研究人員測試了25種不同的機器學習演算法,AI程序可以自動搜索舉動和結果之間的相關性來提升表現。
令科學家苦惱的是,沒有演算法能夠實現合作。隨後他們受到進化生物學的啟發,他們想,何不引入人類合作的關鍵要素——溝通能力呢?於是他們增加了19個預先寫好的句子,例如「我要改變我的策略」、「我接受你的最新提議」、「你背叛了我」等等,這些句子可以在合作者之間往複發送。過了一段時間,計算機不得不使用它們的演算法根據遊戲上下文學會了這些短語的含義。
這次,25個演算法之中,一個名為S#(發音為S sharp)的演算法凸顯出來。給出一個先前未知的遊戲描述時,它在幾個回合內就學會了與夥伴合作。遊戲結束時,全機器團隊幾乎做到了在100%的時間進行合作,而人類只有平均60%的時間進行合作。克蘭德爾說:「機器學習演算法學會了忠誠」。
這種可信性對於演算法來說是一種福音,可應用在自動駕駛汽車、無人機甚至戰場武器方面進行決策。斯德哥爾摩KTH皇家理工學院的機器人科學家丹妮卡·克拉季奇說,迄今為止,達成這樣的合作不是目的,相反,大多數工作側重於創造可以超越人類能力的自主技術(從人臉識別到撲克遊戲),機器要做的不僅僅是競爭,更強調合作的機器人技術可能成為人工智慧發展的一個典型。
※中國科學家往農藥中加入一種常見的鹽,就可解決噴洒時農藥飛濺的大難題
※在恐龍骨骼中發現迄今為止最古老蛋白質
※地層深處「原住民」或能為氣候變化提供預警
※苦苦尋找的外星生命,或許會存在於地外行星的衛星上!
※人工智慧不止會下圍棋!天文學家將訓練它尋找宇宙中的「引力透鏡」
TAG:騰訊科普 |
※當智能機器人達到一定程度,它會「屠殺」人類嗎
※一千年內人類將會如何?會滅絕嗎,還是與機器結合達到不朽!
※你的運動是否可以達到最佳效果,而且你會休息嗎
※人工智慧達到以假亂真,真假難辨可能帶來嚴重後果
※有氧運動可提高人的耐力 長期堅持還可達到減肥效果
※現代最先進戰鬥機已達到極致 未來的戰鬥機還會怎樣的變化呢
※平板支撐沒做標準容易傷到核心肌肉群!只有這樣做,你才能達到效果!
※只有做到科學運動,才有可能達到減肥效果
※你真的會正確使用跑步機嗎?注意這幾點才能達到最好的鍛煉效果
※沒有訓練的多樣性就不可能達到令人滿意的效果
※雙人健身操不需要多幸苦就可以出汗,達到健身效果
※十大整容失敗的女名人,真的達到了令人「過目不忘」的效果
※男人精子達到這個標準才算優質!才能讓女人順利受孕!
※完全素食的人也不一定達到令人滿意的減肥效果
※它是保證腎臟健康唯一的法寶,人人都能輕鬆達到!
※腳是人們最重要的部位,如何泡腳能達到健腎助陽的效果呢?
※想要力量訓練達到效果,那你得遵循這些原則!否則腹肌、人魚線就別想了!
※鬼谷子智慧:凡事不強求,投人所好,反而更容易達到目的
※正確的動作,加上合理的重量及次數,才能達到你要的鍛煉效果