博弈論告訴你，為什麼合作可以共贏

炸金花的機率是多少

20世紀30年代著名的棒球運動員利奧-杜羅切爾（Leo Durocher）曾說，“好人最後總是輸給蠢人”。這句話可能適用於棒球比賽，但在一般的現實生活中卻並非如此。在這篇文章中，我們用“博弈論”的數學思想來研究“囚徒困境”，它闡明瞭人們經常難以合作的原因。博弈論表明，善良且值得信賴的人具有戰略優勢，因為他們可以“改變遊戲規則”來避免囚徒困境，並讓所有人獲得更好的結果，也包括他自己。從博弈論的角度出發，真的是“好人好報”。

沒有誰是一座孤島，在大海里獨踞。

——約翰·多恩，十七世紀英國詩人

當人們談到“遊戲”時，人們往往說的是娛樂或體育活動，如跳棋、大富翁、足球、籃球等。遊戲的本質是博弈。在數學中，“博弈論”從更廣泛的意義上研究遊戲。

什麼是博弈

什麼是“博弈”？一般來說，要滿足兩個條件：（1）有一個以上的人在做決定（2）人們的決定相互影響。

我們在生活中所做的一切，都是博弈論意義上的博弈

。不論何時何地、不論我們做什麼，生活中的大小事幾乎都有博弈的存在。不信嗎？想一下你在上學的時候，你早上醒來時，你起床的速度對父母的影響，父母喊你起床的時間對你的影響——這就是一場博弈！包括接下來一天裡發生的事情，從教室到操場，你做出的每個選擇都會影響別人和自己。這就是一場場博弈！

如果你瞭解了博弈論的相關知識，你就可以在這些場合下找到更好的應對方式——不僅僅是為了“贏”什麼，而是為了改進人際關係、擁有快樂生活。

博弈論常用來研究人們在戰略情況下的行為方式，在經濟學、政治學、商業戰略、法律、創業和軍事等方面均有應用。就像物理學描述行星如何圍繞著太陽旋轉一樣，博弈論試圖描述人們如何在博弈中作出選擇。在博弈論中，數學是一個非常重要的工具，可用來分析各方動機、預測結果。有時候，博弈論做出的預測可能會非常出人意料，就像下面這個例子。

：和朋友聚餐

有8個人決定去一家漢堡店吃午飯，

他們選擇平分價錢（AA）

。選單上有兩個菜品：（1）價格為4塊錢的普通小漢堡和（2）價格為8塊錢的豪華大漢堡。不過，這8個人都覺得普通小漢堡值5塊錢，而豪華大漢堡值6塊錢。需要注意的是，在這裡，普通漢堡的價值高於它的價格（5>4），而豪華漢堡的價值低於它的價格（6<8）。這種情況下，豪華大漢堡顯然不划算——你要為你覺得只值6塊錢的東西付8塊錢。但博弈論預測，當大家一起吃飯時，所有8個人都會點豪華大漢堡。為什麼呢？

為了理解這個看起來出人意料的結果，讓我們從數學的角度來思考。設

為選擇豪華漢堡的人數，

為選擇普通漢堡的人數，

和

均為正整數，顯然

。豪華漢堡8塊錢，普通漢堡4塊錢，那麼總共花的錢就是

，也可以寫成

由於8個人決定平分花費，每個人要付總價格的

。那麼，每個人要付的錢是

當任何一個人選擇豪華漢堡時，他們獲得的價值收益從5塊上升到6塊，增加了1塊。但是，根據上面的公式可以發現，這個人只要多付5毛錢就行，因為多花的4塊錢平分到了8個人身上。因此，每個人都願意選擇多花“小錢”（5毛）得“大收益”（1塊），儘管這樣大家都為6塊錢的漢堡花了8塊錢。

那麼，要是有人還是選擇普通漢堡呢？雖然總共花的錢從64塊降到了60塊，但是在平分的情況下，每個人花了7。5元。

選擇普通漢堡的人要為5塊的普通漢堡付出7.5元，比付8塊得6塊的豪華漢堡還要差

。

看起來很奇怪，是吧？實際上，這是博弈論中最著名、研究最深入的一種戰略情況——囚徒困境的一個例子。

囚徒困境

普林斯頓大學的數學家、博弈論奠基學者阿爾伯特-塔克（Albert Tucker）早在1950年提出了囚徒困境的故事，以描述博弈論中一個意想不到的場景——

有時只做對自己最有利的事會使所有人的情況更差

。

有這樣一個場景。警方因故逮捕了兩名罪犯，我們稱他們為P1和P2，根據法律最高可以判處5年的刑期。不過，警方認為這兩人可能還犯下更嚴重的罪行——武裝搶劫，這一罪行最高可判20年。於是，審訊人員將兩名罪犯帶到不同的審訊室，並告訴每個罪犯：“現在是你們將功贖罪的機會，你們在監獄裡待多久取決於誰承認武裝搶劫。如果你們只有一個人認罪，認罪的人可以立即釋放，另一個人會待上20年；如果你們都不認罪，你們會待上5年；如果你們都認罪，你們都會待上10年。”那麼，我們會預估兩名犯人做出怎樣的行為呢？

圖1顯示了不同情況下P1將在監獄中度過的時間。請注意，無論P2怎麼做，P1最好選擇坦白：如果P2認罪，認罪可以讓P1在監獄中度過10年而不是20年；如果P2不認罪，認罪可以讓P1獲得自由，而不是在監獄中度過5年。無論是哪種情況，P1都有坦白的個人動機。當然，這個邏輯也適用於P2。因此，博弈論預測，兩個犯人都會招供，並且都會在監獄裡呆上10年——這是一個 “雙輸的結果”，因為如果他們都保持沉默，他們可能只用在監獄裡呆5年。

上面這張“收益代價表”展示了不同情況下第一名囚犯可能坐牢的時間。可以注意到，就像紅色箭頭所示，不論另一名囚犯作出什麼選擇，這名囚犯都有充分的動機來選擇認罪。

真實生活中的囚徒困境

你或許不會面臨審訊，但實際上，從博弈論的視角來看，生活中的許多情況也跟囚徒困境非常相似。為了向大家解釋清楚這一點，讓我們細化對“囚徒困境”的定義。

首先，我們需要知曉博弈論中的另一個重要概念——

佔優策略

（dominant strategy）。佔優策略是說，

不論其他人作出什麼行為，當前個體都能獲得自身的最高收益的一個可選擇的行為

。如果一場博弈符合囚徒困境的情形，那麼（1）每個參與人都有自己的佔優策略，且（2）當所有參與人都不選擇佔優策略時反而獲得最好結果。

這種囚徒困境的定義並

不限制博弈的參與人數

（經典理論一般認為只有兩個人，但是現在可以擴充套件到任意多數人）。比如，在上面的“吃漢堡”例子中，總共有8名參與人，所有人的佔優策略都是“豪華大漢堡”（對應囚徒困境中的“認罪”），結果所有人都得到了更差的結果（對應囚徒困境中“大家都多坐幾年牢”）。

除此以外，讓我們再看兩個囚徒困境的現例項子。

第一個例子

：每週末的時候，一群人出去野餐。假定他們只從自身利益出發，佔優策略則是不扔垃圾（因為收拾垃圾很費事）。但是，如果大家都這麼選擇，公園就會變成垃圾場。在這種情況下，不扔垃圾是所有人的佔優策略，但是最終會導致所有人得到更差的結果。

第二個例子

：當班裡有一個喜歡霸凌他人的小孩，ta會欺負班裡所有人。當ta欺負別人的時候，你會挺身而出嗎？只從每個人自己的自身利益角度來說，很可能不會——因為這樣會讓ta轉而欺負你。但是，如果沒有人這麼做，那麼霸凌就會一直持續。在這個情境下，每個小孩的佔優策略都是不要阻止霸凌者的，最終導致大家都得到更差的結果。（如果你遇到校園霸凌，請及時求助權威人士的幫助！）

如何擺脫囚徒困境？

己所不欲，勿施於人。在囚徒困境中，每個人都選擇做對自己最有利的事情得到的結果比每個人做出個人犧牲來幫助別人的結果要差。因此，

擺脫囚徒困境的一個方法是改變每個參與者的動機，使他們願意幫助他人。

例如，在扔垃圾的例子中，社群組織可以張貼海報宣傳並促使野餐的人“當一名好領居，扔掉你的垃圾”。透過宣傳、推廣“好領居”的所作所為，人們在看到宣傳海報的時候，為了讓自己成為“好領居”、避免被認為是“壞鄰居”，從而清理製造的垃圾。只要這些新的動機足以說服每個人去打掃，那麼公園會變得更乾淨、大家也會獲得比以前更好的結果。

早在十七世紀，醉酒的英國水手們往往會面臨嚴厲的懲罰——他們會被綁在船上的桅杆上，被下令由另一名船員用“九尾貓”的鞭子抽打。為了避免這種情形，水手們就私下達成協議，用撓後背表示輕抽對方來代替鞭子。只要大家都同意這個協議，那麼每個人在受罰的時候都只要輕輕地抽就行。

這種“你幫我我就幫你”的情形是一種相互的承諾，它也可以幫助參與者擺脫囚徒困境。

回到最初的囚徒困境的場景，兩名嫌疑人可以提前達成一個簡單協議：你不承認，我也不承認；但你承認了我也會承認。假設第二個人做出了這樣的承諾，第一個人選擇相信。那麼，第一個人的結果要麼是10年（都承認）要麼是5年（都不承認），這種情況下他會選擇不承認，從而獲得更好的收益。看起來囚徒困境破了（下圖）！

但是等下——要是第一個人不相信第二個人，認為第二個人可能背信棄義，怎麼辦？這種情況下，他還是會選擇承認，所以結果還是10年。兩個人還是困在囚徒困境中了。

那麼，問題來了：

你怎樣確保別人相信你的承諾？

最簡單有效的方法——

做一個誠實可敬的人。

如果別人知道你一諾千金且看中名望，他們更可能相信你說的。這樣，你能更好地運用承諾的作用，擺脫生活中的囚徒困境，讓自己和周圍的人生活得更舒服。

參考文獻

［1］ McAdams D （2017） Game Theory and Cooperation： How Putting Others First Can Help Everyone。 Front。 Young Minds。 5：66。 doi： 10。3389/frym。2017。00066

農林漁牧網

博弈論告訴你，為什麼合作可以共贏

相關文章