當前位置:
首頁 > 最新 > 重複囚徒困境——競爭、合作與進化

重複囚徒困境——競爭、合作與進化

Beautiful In White

 Love Always

Shane Filan 

00:00/03:52

全文2367字| 閱讀約需4分鐘

這兩天看到一款手機APP,叫《信任的進化》,這個APP講的是一本很有意思的書《合作的進化》,這是一本關於博弈論的書。

前普林斯頓大學數學系教授約翰·納什,是博弈論的創始人,其「納什均衡」是博弈論中的經典。

那「納什均衡」是什麼呢?

在決策中,個體無法橫向溝通,每個個體在猜測決策圈裡其他人的選擇後,做出自己認為最優的選擇。這樣的決策簡單組合起來,就叫納什均衡。

舉個例子,這是博弈論的非零和博弈中最具代表性的例子,叫「囚徒困境」。

囚徒困境講的是,兩名罪犯作案後被警察逮捕了,分別關在不同的房子里接受審訊。警察知道兩人有罪,但缺少足夠的證據。

於是警察告訴這兩人:如果你們都抵賴,各判刑2年;如果都坦白,各判8年;如果兩人中一人坦白而另一人抵賴,坦白的放出去,抵賴的判10年。

這促使罪犯將面臨兩種選擇:坦白或抵賴。

然而,不管同夥選擇什麼,另一名犯人的最優選擇是坦白。如果同夥抵賴、自己坦白的話就可以立刻回家了,抵賴卻要判2年,顯然坦白比抵賴好;如果同夥坦白、自己坦白的話判8年,比起抵賴要判10年,坦白還是比抵賴的好。結果,兩名嫌疑犯都選擇坦白,各判刑8年。

如果將兩人看作一個整體,兩人都抵賴,各判2年,顯然這是最好的結果,但他們都無法知道同夥是否會背叛自己,畢竟一人坦白另一人抵賴,坦白的可以即時獲釋。

囚徒困境所反映出的深刻問題是,個人的理性有時會導致集體的非理性。

場景1(囚徒困境)

那如果將囚徒困境中的抵賴看為合作,坦白看作背叛,而且甲乙兩人要做不止一次選擇,他們依然不知道對方會做什麼選擇,但他們可以知道對方上次做出了什麼選擇,那結果會是怎樣呢?

我們來假設一個場景,在你面前有一個錢罐子,可以選擇合作或背叛,如果你選擇合作,對方也選擇合作,那麼你們都可以從錢罐子中得到2枚金幣;如果你選擇背叛,對方選擇合作,那麼你能得到3枚金幣,對方卻要失去一枚金幣,反過來也是一樣;如果你們兩人都選擇背叛,將什麼都得不到,也不會失去任何金幣。

場景2(原型:重複囚徒困境)

在單次的選擇中,顯然是背叛的收益最高,因為背叛也不會失去任何東西。但如果你背叛了,對方卻選擇合作,你就能得到3枚金幣的收益。就算對方知道你不值得信任也沒有關係,反正也不會有下一次了。

但若需進行多次的選擇,雙方都選擇合作,才有更高的收益。譬如雙方進行20次的選擇,合作的收益有40枚金幣,但背叛沒有收益,就算成功背叛一次,也只有3枚金幣的收益。

在我們現實生活中,類似的合作與背叛也是很常見的,比如在旅遊區,旅遊區賣的什麼東西都比市場價高出好幾倍的,對於商家來說不宰白不宰,反正你剛到這地方旅遊,短時間內不會來第二次,你想報復回去,也是沒有辦法的。

可是在我們家附近的小商店呢,卻會賣物美價廉的商品,因為它需要與我們建立長期合作的信任關係,不然只要它背叛一次,我們就不會再去購買他們的商品了。

前兩年,王老吉與加多寶鬧得不可開交,就有人說,他們怎麼就不能像百事可樂與可口可樂那樣和和氣氣的?

其實在最早的時候,百事可樂與可口可樂也是惡性競爭的關係,兩家企業看到對方降價,自己也隨之降價,最瘋狂的時候,百事可樂只賣到可口可樂一半的價錢。後來他們發現這樣不行,兩敗俱傷,誰也沒討到好處,又建立起了合作關係,輪流降價,而且降價幅度都不超過10%。

在京東崛起以前,在線購書要麼去亞馬遜中國,要麼在噹噹網,如果有經常購書就會發現,他們就是輪流降價的,一會這個免郵費,一會那個免郵費,從來不同時免郵費。

還有一個特別有意思的例子,第一次世界大戰時,到處都打得一片狼藉,有那麼一個戰區卻異常和平,德軍與英軍在戰區對峙著,平時打仗還是打仗,到了中午,卻都很紳士的停火吃飯。後來還逐漸發展成每天有一個小時的停火時間,再後來還插了根旗子,說這個區域雙方的狙擊手都不可以射擊,最後居然兩軍在聖誕節當天都一塊踢上足球了。

對於國家來說,這兩隻軍隊的做法顯然不符合國家利益的,對於個人而言,誰也不想死,當然是選擇合作,都不發起進攻,這樣誰也不會死。

在《合作的進化》這本書中,講了很多的實驗例子,我們主要將它分為三類,第一類屬於「老好人」型,無論對方選擇什麼,自己都選擇合作;第二類「老流氓」型,無論對方選擇什麼,自己都選擇背叛;第三類是報復型,第一次會選擇合作,之後會根據對方上一次的選擇來做選擇,如果上一次對方選擇合作,那麼他依然選擇合作,如果對方上一次選擇背叛,那麼他這一次也會背叛,但是他不記仇,如果對方下次又重新選擇合作,那麼他依然能恢複合作關係。

當需要進行200次的選擇時,第一類的「老好人」型,是活不到200次實驗的,很早就會被淘汰掉;而「老流氓」在前期有很大的收益,但後來就不能持續發展,雖然沒有被淘汰,卻也是奄奄一息的樣子。

第三類的報復型,無論是在什麼時期,都有良好的發展,因為它具有四個特點,善良性、報復性、寬容性與清晰性。善良性是可以避免自己惹上不必要麻煩;報復性是讓對方明白,如果他背叛你也會背叛;寬容性是因為不記仇,只要你願意合作,我們依然能重新建立合作關係;清晰性是讓對方容易理解,有可能長期合作。

最近美國制裁中興鬧得熱火朝天,美國商務部禁止美國公司在未來的7年向中興出售電子元件,就有很多網友說,美國不厚道,他們要制裁中興,我們就制裁蘋果,說得義正言辭,大義凜然。

來源:DeepTech深科技

可能很多人不知道,這件事起因是美國制裁伊朗,只要採購他們的電子元件,都不允許銷售到伊朗,但是中興違反了協定,通過第三方的公司賣到了伊朗。

後來中興就被舉報了,東窗事發以後,美國給了他們處罰,可是中興沒有照辦,還將之前一些證據都銷毀掉,在這件事情上,中興等於是背叛了兩次,中興被制裁也是在情理之中。

所以,如果是在長期合作當中,我們不要首先背叛,不然對方也會背叛,這樣一來對雙方都沒有好處。但如果對方先背叛了,我們也不能忍著,也要報復回去,這樣才有利於長期的發展。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 微表情分析師 的精彩文章:

TAG:微表情分析師 |