自私的基因-讀後感(無限賽局的利己)

閱讀時間 14 分鐘

自私的基因探討的是另一個角度的物競天擇,
主角不再是物種本身,而是更基礎的單位-「基因」 。
物種是基因為了自身的複製與繁衍,與其他基因合作發展出來的「求生機器」,
(雖然使用合作這個字眼,但基因本身沒有意識,合作只是剛好互相搭配有利的結果),
雖然作者努力使用淺顯的方式說明整個觀念,但本書讀起來還是常常需要停下來思考 。

作者認為以基因為主體解釋物種個體與群體的互利,相對比以物種本身合理的多,
物種間會合作還是傷害取決於對自身基因延續有無幫助,
如果幫助對方,對基因延續有利就會選擇幫助 ,
(其實也不是選擇,而是不幫助的基因繁衍較差,數量較難增加)

比如書中提到寄生蟲會不會幫助宿主,取決於寄生蟲本身的繁衍與宿主繁衍的出口是否相同,
如果宿主只是寄生蟲或者他後代的養分來源→寄生蟲會徹底掠奪
如果寄生蟲可以透過宿主繁衍後代一起繁衍 → 寄生蟲則會幫助宿主繁衍後代與生存 。

「夫仁者,己欲立而立人,己欲達而達人。能近取譬,可謂仁之方也已。」

–論語

「仁」是一種文化體現的形式,文化使人類不再單純受制於基因的天性
人類有時會做出對自身基因延續毫無幫助的大愛,有時也會做出對自身基因延續有害的惡。

人類獨特的特性之一,就是有預期的意識。
而人類獨具的另一個特質,可能就是容許純真而不令人感興趣的利他主義。
智人最強大的能力就是能夠「想像」還沒實際發生的未來,
透過故事與文化,讓我們有能力抗拒與生俱來的自私基因 。

但是 「 利他 」 真的就對自己這個個體不利嗎?
可以從作者舉例的一個模擬實驗來看看結果 。

賽局理論的困境

在它最早的版本「人類版」中,遊戲是這樣玩的:
有一位莊家要負責給兩個玩的人賞金。

假如我和你相對來玩,我們手中各有兩張卡片,是「合作」及「背叛」。
玩的時候你我都各選一張擺在桌上,將牌的正面朝下,所以我們不會互相影響對方。
事實上,我們應是同時出牌的。現在我們等著莊家把牌翻開。
兩人的輸贏不只是決定在自己所出的牌(自己知道),
而且決定在對方所出的牌(等莊家把牌翻開才知道)。

既然雙方各有兩張牌,就有四種可能的結果。
對於每一種結果,我們的賞罰如下(用$的符號是基於這遊戲發源於北美):

結果一:我們都出「合作」,莊家就各給我們$三百,這總數稱為互相合作的報償。
結果二:我們都出「背叛」,莊家就罰我們各$十,這稱作互相背叛的懲罰。
結果三:你出「合作」而我出「背叛」,莊家就給我$五百(背叛的誘惑),並罰你$一百(笨蛋)。
結果四:你出「背叛」而我出「合作」,莊家就給你$五百並罰我這笨蛋$一百。

錢的數量並無所謂,也無所謂收入多少或付出多少。
對於真正合格的囚犯的困境,最重要的,是它們的分級層次
背叛的誘惑應該比互相合作的報酬好,
互相合作的報酬應該比互相背叛的懲罰好,而互相背叛又比當笨蛋好。

依此可以算出一個無懈可擊的推理了,就是不論你做什麼,我一定背叛!
而你也會和我一樣心照不宣。當兩個理性的遊戲參與者相遇時,他們都會背叛,而且結果就是被罰或得到低分。
然而,兩人都完全明白,只有當他們都出合作時,雙方才會得到相當高分的報償。

囚徒版本的賽局

囚犯本是個特別的假想例子,在這例子中,籌碼並不是錢,而是坐監的刑期。
假想有兩個人在監牢裡,我們叫他們彼得森和摩里阿提,有合夥犯案的嫌疑。
他們被關在分開的牢房,而且被勸誘出賣他的同夥(背叛)。
結果如何,得看兩個囚犯所做的而定,而他們彼此都不知道對方做了什麼。

如果彼得森完全歸罪於摩里阿提,而摩里阿提保持沉默,使得這故事好像是真的(與他那位過去的,已經靠不住的朋友合作);
結果摩里阿提被判了極重的徒刑,而彼得森則屈服於背叛的試探,得以脫罪。
又如果他們都背叛對方,結果都被判有罪,這是互相背叛的懲罰;但是因為提供證據,都得到減刑。
如果他們互相合作,則因為證據不足,官方無法判他們重罪,
他們都只因小的罪行而得較少的徒刑,這是互相合作的報酬。

雖然稱較少的徒刑為報酬,似乎是有點古怪,但是對於可能在鐵窗內待更久的人來說,他是能體會的。
你會發現,雖然所付的不是錢而是監獄裡的刑期,
這遊戲的基本特徵仍然保存著(仍然有四種結果所期望的等級)。
如果你假想自己是囚犯,也假設兩人的動機都是追求自身的利益,
並且記得他們無法彼此串供,那麼你會發現每個人都只能出賣對方,因此注定都要判重刑。

背叛才是王道?

在簡單的囚犯的困境遊戲中,並沒有辦法確保對方是否可靠;
除非至少其中一人是聖徒般的笨蛋。
對這個世界而言,聖徒是太善良了,所以這遊戲注定要以互相背叛收場,
兩位參與遊戲的人都得到似是而非的可憐結果。

但是這個遊戲還有另外一種版本,
稱為「反覆的」「重複的」的囚犯的困境。
這種反覆的遊戲較為複雜,但在複雜中卻含有希望

書中第十章舉例過一種鳥,
需要互相幫對方把羽毛的扁蝨除去,正是在表演一種反覆的囚犯的困境遊戲
怎麼說呢?對每隻鳥而言,啄出自己身上的扁蝨是很重要的,
但是牠無法處理自己的頭頂,所以需要一個同伴來替牠處理。
看起來唯有牠在以後回報這份恩情才顯得公平。
雖然這項服務耗費的時間和精力不多,
但是假如有一隻鳥作弊,請別的鳥除蝨卻拒絕回報,
那麼牠不必付代價就得了所有的好處。

當列出各種結果,就會發現這正是一個囚犯的困境;
互相合作(啄出對方的扁蝨)是非常好的狀況,
但是還有另一種試探會更好,就是拒絕回報對方。
互相背叛(拒絕啄出對方的扁蝨)是相當糟的狀況,
但還有更不好的就是費力替別的鳥啄出蝨子,
而自己身上仍有蝨子。輸贏圖表請看下圖


但是,這只是個例子而已。你愈想它,就愈覺得人生滿是反覆的囚犯困境遊戲;
不只是人的生活,動物和植物的生活也是如此。

反覆遊戲提供足夠的策略領域,不像簡單的遊戲,很容易就可預期背叛是唯一合理的策略。
在簡單遊戲中,只有兩種可能的策略:合作及背叛。
然而,反覆遊戲允許一切的策略,並且沒有哪一個顯然是最好的

反覆遊戲使賽局變成無限

很顯然的,在反覆遊戲中,各種我們才智所及的策略都可使用,我們能否找出一個最好的來呢?
這是美國的政治社會學家愛梭羅德給自己設定的工作。
他有個娛樂性的想法,就是辦個競賽,向遊戲理論專家發出廣告,邀請他們投件。
每個專家的策略,就是預先用程式定下的行動規則,因此競賽的人可以用電腦語言來投件。
愛梭羅德總共收到十四件稿件,為了方便評等,他加了第十五件,
所謂的隨機策略(沒有策略的策略),就是簡單的隨機出合作或背叛,並且以此為底線
──如果有哪一個策略不比隨機策略好,那它一定是很差的策略。

愛梭羅德把十五種策略都轉換成同一種語言,並且在同一部大電腦內讓它們一一對壘,
每一種策略都和其他各種策略對陣過(包括它自己)。
既然有十五種策略,總共就有十五乘十五,也就是兩百二十五個不同的比賽在電腦上進行。
每場比賽有兩百回合,當每對玩過兩百回合後,就把輸贏總合結算,公布勝利者。

我們不在乎哪一種策略勝過哪一種特定對手
重要的是,哪一種策略在十五次遊戲的總合中,能累積最多「錢」
「錢」意指分數,是根據以下規則計算的:
互相合作,三分;背叛,五分;
互相背叛的懲罰,一分(相當於我們先前所說的輕微罰款):
被騙,零分(相當於先前所說的重罰)。

一種策略平均每場所得不會超過600多分 。
這是兩個參與遊戲者在兩百回合的遊戲中持續合作時,每人所能得的分數。
如果他們其中一人背叛過,很可能會得到少於六百分的分數,
因為另一個人將會報復(大部分參與的策略都設有某種程度的報復)。

要記得在比賽中的參賽者不是人,而是電腦程式:事先設定策略的程式
正因電腦程式沒有「意識」,就更類似於基因的運作,
它們的作者扮演如基因操控身體般的角色。
你可以把策略想成是它們作者的代理人。

有些策略是非常聰明的(當然遠不及它的主人),但令人訝異的是,
贏得比賽的那個策略,是所有策略中最簡單、表面上看來最不聰明的。
它名叫「一報還一報」(Tit for Tat),
是拉普波特(Anatol Rapoport)教授所提供的,他是多倫多大學的著名心理學家的遊戲理論家。
「一報還一報」以第一回合的合作為起始,然後每一回合都重複對手上一回合的動作。

一報還一報的遊戲有怎樣的過程呢?
就如我們所說的,會發生什麼事,要視對方的反應而定。
首先,假設對手也是個「一報還一報」的人
(請記得每種策略除了和另外十四種對玩之外,也和自己的複製版對玩),
每一個「一報還一報」策略都由合作開始
在下一步動作中,每一個遊戲者也都重複對方上一回合的動作,也就是合作。
雙方都繼續合作直到遊戲終了,得分當然都可以超過六百分的水準點。

「一報還一報」出線

善良寬恕是贏家

書中列舉了不少策略與 「一報還一報」 對壘的結果,這邊就不一一列出,
我們的興趣不在測試被提出的策略細節上,這也不是一本關於電腦程式員的書。
我們感興趣的是,根據某種類別將策略分級,並且測試各級的成敗。
最重要的一類策略,愛梭羅德稱之為「好」策略,它的定義是永遠不先背叛
「一報還一報」就是個例子,它有能力背叛,但它只有在報復時才如此。
天真的試探者和自責的試探者都被列為差勁的策略,
因為它們有時候會在毫無誘因的狀態下背叛

十五個進入比賽的策略中,有八個是好的。
很重要的,這八個就是得分前八名的策略,而那七個差勁的,分數遠在它們之後。
這似乎很令人確信,「好人」在這遊戲中表現得很好。

愛梭羅德還有另一個術語,就是「寬恕」
一個有寬恕性質的策略,雖然它可能會報復,但它的記憶是短暫的,會很快的複習一下舊的錯誤行為。
「一報還一報」是一個肯寬恕的策略,
它對於別人的背叛會立即輕輕的反擊一下,但是,之後它就讓事情過去了。

書中第十章裡提過一個小氣鬼策略則是完全無法寬恕的,
它的記憶會維持到遊戲終了,小氣鬼絕對不會忘記另一位遊戲者曾有的背叛行為,即使只有一次。
在演化中,小氣鬼會活著,因為他不像濫好人會一直被無償索取,
但小氣鬼也不會過得太好 。

不含寬恕性質的策略表現不是非常好的原因,
在於它們不肯中斷相互的責怪,即使對手已經自責了。

不嫉妒者超越零和

如同我們已知的,「一報還一報」是善良的,意味著從不主動背叛;
是寬恕的,意味著很容易忘卻對方過去的錯誤。

作者還介紹了愛梭羅德的另一個專業術語:「一報還一報」也是不嫉妒的。
亞瑞爾賴的嫉妒的意思,是努力要比別的參賽者賺更多的錢,而不只是從莊家得到大量金錢。
不嫉妒的意思就是,別的參賽者賺得和你一樣多時,你仍然很高興,而且樂於同時從莊家那裡贏錢。

「 一報還一報」從來沒有真正贏過一場遊戲,你想想看就會發現,
它從來沒有在任何一場遊戲中比對手得更高分,因為它從不背叛,除非報復時才如此。
它最常做的是和對方平手,它傾向於與人分享高分。

這讓我聯想起華頓商學院最受歡迎的談判課這本書
書裡提到談判成功的關鍵秘密之一,
就是要專注讓自己的利益最大化,而不是單純想讓對方利益最小化 ,
讓對方過的痛苦並不等於讓自己過得更好,

情感上也許有點難受,但別太介意對方收益比自己大,
合作而且不要計較當下對方收益比你高的人或物種 ,
把時間軸拉長的時候 , 常常是綜合收益最大的那一個 。

無限賽局

很多時候,我們會覺得這場考試定生死,
這張訂單定生死 ,今年考績定生死 , 所以周圍都是敵人 ,
可是把時間軸拉很長很長的話,多數都是 「 可合作對象 」 ,
有限賽局其實並不如想像的多,
無限賽局沒有時間限制。因為沒有終點線、沒有真正的結束,沒有人能真正「贏得」一場無限賽局
無限賽局的首要目標是不停玩下去,讓賽局持續下去。

商場就是不折不扣的無限賽局
我們不認識全部的玩家,而且隨時都可能有新玩家加入賽局。
玩家各自決定要採取什麼戰術或策略,沒有大家公認的一套固定規則,
除了遵守法律(就連法律也因地區而異)。

商場不像有限賽局,沒有預定的開始、中場或結束。
儘管有普遍使用的特定時程(例如會計年度),
大家會在這段時間內評估自己在眾多玩家之中的表現,
但這些時程都只是賽局中的階段里程碑,
沒有一個時間點能為賽局劃下句點,商業世界的賽局沒有終點線。

儘管企業參與的是一場不可能贏的賽局,
許多領導者仍然維持只求勝利的玩法,迄今仍宣稱自己「最厲害」或是「第一名」。
這種說法實在太常見,我們幾乎不曾停下來想一想其中某些說法有多荒謬。

人生不是零和遊戲也不是有限賽局

就如同我們的人生,在我們選擇或被迫退出以前,
我們會一直都在賽局裡,沒有結束,
就算贏過當下的對手,還有無盡的對手,
所以,換個思維,多嘗試與人合作讓自己的收益最大化,
當然,我們的善良也該有點鋒芒,
不要像傻瓜一樣無條件付出 。

我們可以參考 「 一報還一報」 的策略,
如果想要更多點寬恕, 「 兩報還一報」或 「 三報還一報」 也未嘗不可,

我們可以選擇先善良待人,但對方如果背叛你,
你就教訓跟背叛他 ,
如果他持續背叛 , 你就別給他什麼好臉色或是機會 。

假使他轉性,釋出善意,你就寬容的原諒他 ,
選擇持續合作 , 直到他再次背叛 。

不過,這只是一個參考,江山易改,本性難移
有許多的人或者組織文化就是充滿詭詐,不太值得合作,
這也是信任邊際:巴菲特經營波克夏的獲利模式裡提到的,
要找可信賴的人合作,
既然這是個無限賽局,有無盡的對手,當然也有無盡的合作對象,
慎選夥伴,別過度糾結於過去的錯誤選擇,

但首先,要努力先使我們自己成為 「 對的人」 。

相關書籍:
自私的基因
華頓商學院最受歡迎的談判課
無限賽局
信任邊際:巴菲特經營波克夏的獲利模式

FB留言