賽局理論:囚犯困境與信任關係

Posted By Mr. Thursday

今天要講的「囚犯困境」,和最近的減刑新聞沒關係,而是指一種賽局。囚犯困境(Prisonner’s Dilemma)是描述抓到兩位囚犯,然而因為證據不足,所以就把這兩位囚犯分開到不同的房間裡面審問,並且分別和他們說,如果提供對方犯罪的證據,而對方保持沉默的話,對方要做10年的牢,而你可以無罪釋放。如果你提供證據,他也提供證據,那麼你們兩個各坐5年的牢。如果你們兩個都保持沉默,那麼因為證據不足,你們兩個分別坐牢6個月(半年)。所以根據這個規則,和囚犯可能的選擇,化成一個結局的矩陣如下:

pd.jpg

0代表無罪釋放,-10代表坐牢10年,-5代表坐牢5年,-0.5代表坐牢半年。

甲方可以選擇沉默或是指認對方犯罪的證據,乙方也可以選擇沉默或是指認對方的證據。在甲乙兩方都不能串通的情形下,假設他們用理性來判斷,則甲乙兩方分別會做甚麼樣子的選擇呢?

我們先假想甲方的情況:甲方如果選擇沉默,那麼如果乙方也沉默,那麼需要坐牢半年,但是如果乙方這個時候提供有利證據,則他需要坐牢10年,所以最多可能要坐10年牢,平均可能要做5年左右的牢。甲方如果選擇指認對方,那麼如果乙方剛好選擇沉默,那們他就可以無罪釋放,乙方還要坐牢10年,如果乙方也提供證據,那麼兩人都坐牢5年,所以最多坐牢5年,平均來說也只要坐牢2.5年。所以算來算去,甲方會覺得提供證據比選擇沉默來的有利。乙方也是類似的情況,算了半天,也是覺得提供證據比選擇沉默來的有利。而這也正是抓到犯人的人想要的結果。然而就囚犯來說,其實如果兩方都沉默的話,兩方只要各坐半年牢,但是這個賽局的規則,卻讓他們選擇了兩方都做5年牢的結果。因此這個賽局就稱為「囚犯困境」了!

囚犯困境和信任有甚麼樣子的關係呢?這就和今日的網際網路有關係了。在網路上,我們通常有比較匿名的身分,每個人通常只用一個ID來代表,有些網站可以讓我們看到對方的照片,然而和現實生活仍舊差別許多,譬如說:我們聽不到對方講話的聲音和語調,這部分就失去許多判斷的資訊,同一句話「好厲害喔!」,用不同的語調,就代表了不同的意思,然而在網路上就失去了這份資訊。另外我們也看不到對方的表情,又失去了更多資訊。也許就一般的文章而言,我們並不需要這麼多資訊,然而當我們需要在網路的平台上面,進行交易,或是進行合作的時候,「信任」相關的資訊就很重要了!

然而因為網路上失去了生活中這麼多的資訊,每個人通常只有ID做代表,有時候連ID都可以輕易取得,雖然讓網路有「開放性」,卻也讓人與人之間難以建立「信任」關係。缺少信任的關係,在網路上的合作就常常落入剛才提到的「囚犯困境」裡面。譬如說今天一個共享資訊的平台上面,大家可以合作提供資訊,互相交流。然而當我們理性思考的時候,發現如果我花了很多時間分享資訊,對方卻沒有跟著分享資訊,不就變成自己損失,他人得益嗎?(原本想用霹靂火的台詞請自行代入XD)最後每個人都這樣子想,就變成沒有人要分享資訊了。然而如果大家提供資訊的話,會比大家都不提供資訊來的好,因此這就是一種分享資訊的「囚犯困境」了,只不過這邊的結局不是坐牢,而是分享資訊後的收穫與時間損失之間的衡量。

如果使用者彼此之間有信任的關係,那麼剛才囚犯困境的賽局,平衡點就會變成大家都分享資訊了,因為「信任」等於是提供額外的訊息,讓我們除了理性選擇之外,多了參考訊息來影響我們的行為。今日的Web2.0提倡使用者提供內容合作提供內容,另外還有一點是「人際網路」(Social Network)的建立,我個人認為「人際網路」的建立,就是為了要有「信任」的關係,如此一來在「分享」的場合,尤其在 Web2.0裡面分享是不可或缺的,有了「信任」關係,自然就能打破「囚犯困境」,進而促進分享了。

賽局最早是在經濟學裡面提到的,而囚犯困境是其中一種賽局。另外每個賽局還可以分成是否為「零和」(zero-sum)。所謂零和就是說一場比賽,甲輸了10元,乙就賺了10元。非零和的賽局則是可能有雙贏的情形,也就是說有可能甲贏了10元,乙也賺了10元。賽局的分析,在多重智慧代理人系統(multi-agent system)裡面也很重要。所謂智慧代理人(intelligent agent)就是一位代理人,像是每個人有一位個人秘書,只不過這位秘書是一個電腦程式,具有人工智慧,可以代理主人處理一些事情。當主人外出、忙碌、或是睡眠的時候,一些比較簡單的工作,主人可以放心交給代理人來完成。智慧型代理人可能需要一段時間來學習主人判斷的方式,以及主人的喜好,過一段時間就可以變成稱職的代理人。多重代理人(multi-agent system)則是在研究多個代理人之間互動的情形,譬如說機器人足球賽,隊員之間要如何協調,如何制定贏得比賽的策略。譬如說網路拍賣競標系統,怎樣子的競標規則可以避免惡性循環。互動整體系統規則的制定,就是多重智慧代理人系統(multi-agent system)要探討的範圍,而賽局就自然成了其中分析的一部分。信任關係的學習與建立,也在這一部分扮演適當的角色。

然而信任是甚麼樣子的東西呢?如果查韋氏字典可以查到5種定義,trust、trustworthiness、belief、confidence、和faith又有些許差別。因此依照不同的系統,不同的使用環境,信任又會有不同的定義,以及不同的應用。交友網站需要的信任,和網路拍賣需要的信任可能又有所不同。因此也不大容易定下一個標準答案,需要視情況而定了。

因此,無論是代理人幫忙,或是我們親自在網路中交易合作,「囚犯困境」會常常遇到,然而經由人際網路(Social Network)的建立,可以建立「信任」關係,進而讓網路上的「合作」和「分享」變成可能,Web2.0的目標也比較有機會達到了!當然Web2.0還有其他問題要考慮,像是獲利模式,以及上傳內容著作權的問題。由人際網路建立信任關係,是否真的可行也要再考慮(我們是否信任朋友的朋友?朋友的朋友的朋友的朋友?)。但是至少囚犯困境可以用信任來解決,至於非理性的情況,以及其他解決囚犯困境的可能方法,我們仍然可以繼續思考,直到找出解答為止!

延伸閱讀

喜歡這篇文章嗎? 分享出去給作者一點鼓勵吧!
  • 阿桂

    好精彩啊!

  • 阿桂

    好精彩啊!

  • 賽局 (game theory)最早並不是出現在經濟學,而是在數學中,應該說最早也是目前應用最廣的領域是在經濟學。

    文中提到的「信任」,破除囚犯困境,有點疑問。如果參與者都是理性的(指追求自身利益最大化是不變的原則),那你「信任」(believe)對方的行動,也是基於這個前提假設之下。這樣要如何破除囚犯困境?唯一的可能,就是溝通(communication)。

    拿Web2.0上的分享,對比囚犯困境的例子,是很有趣的想法,但是若沒有辦法定義出在Web2.0中參與者的策略(strategies)、收益(payoff)以及賽局的結構(structure),諸如對訊息(information)的了解,我覺得這樣的類比有點過於粗糙。

    不過賽局的應用層面和效果,真的很廣。如果討論這類的問題,就不應該錯過談論「平衡」(equilibrium),同等於如果找出一個賽局中的解。

  • 賽局 (game theory)最早並不是出現在經濟學,而是在數學中,應該說最早也是目前應用最廣的領域是在經濟學。

    文中提到的「信任」,破除囚犯困境,有點疑問。如果參與者都是理性的(指追求自身利益最大化是不變的原則),那你「信任」(believe)對方的行動,也是基於這個前提假設之下。這樣要如何破除囚犯困境?唯一的可能,就是溝通(communication)。

    拿Web2.0上的分享,對比囚犯困境的例子,是很有趣的想法,但是若沒有辦法定義出在Web2.0中參與者的策略(strategies)、收益(payoff)以及賽局的結構(structure),諸如對訊息(information)的了解,我覺得這樣的類比有點過於粗糙。

    不過賽局的應用層面和效果,真的很廣。如果討論這類的問題,就不應該錯過談論「平衡」(equilibrium),同等於如果找出一個賽局中的解。

  • 有關信任的部分
    因為囚犯困境是雙方無法直接溝通
    所以如果兩位囚犯以前認識
    就可以根據”過去經驗”形成”信任”了
    ——————————
    至於類比到網路上的分享過程
    除了認識的人可以用過去經驗形成信任以外
    不認識的人如果可以有”共同認識的人”(也就是人際網路了)
    彼此經過word-of-mouth”口耳相傳”形成”信任”
    ——————————
    所以我想類比囚犯困境到網路分享上面
    並且想在網路上透過1)雙方過去經驗 2)間接認識的他人經驗
    來建立”信任” 使得合作在沒有直接溝通的情況下變成可能了
    ——————————
    當然啦, 我還沒詳細寫出網路分享中的賽局結構
    我本身也沒有專門研究賽局理論
    不過在這邊先提一些比較常聽到的賽局例子(囚犯困境)
    讓各位先有個印象
    也讓各位先有個種子…
    有興趣的人再自行發芽囉 🙂

  • 有關信任的部分
    因為囚犯困境是雙方無法直接溝通
    所以如果兩位囚犯以前認識
    就可以根據”過去經驗”形成”信任”了
    ——————————
    至於類比到網路上的分享過程
    除了認識的人可以用過去經驗形成信任以外
    不認識的人如果可以有”共同認識的人”(也就是人際網路了)
    彼此經過word-of-mouth”口耳相傳”形成”信任”
    ——————————
    所以我想類比囚犯困境到網路分享上面
    並且想在網路上透過1)雙方過去經驗 2)間接認識的他人經驗
    來建立”信任” 使得合作在沒有直接溝通的情況下變成可能了
    ——————————
    當然啦, 我還沒詳細寫出網路分享中的賽局結構
    我本身也沒有專門研究賽局理論
    不過在這邊先提一些比較常聽到的賽局例子(囚犯困境)
    讓各位先有個印象
    也讓各位先有個種子…
    有興趣的人再自行發芽囉 🙂

  • Pingback: Top Posts « WordPress.com()

  • 信任與風險的概念有關,亦即,我信任你,是因為我相信你不會做出傷害我利益的舉動,所以我要承擔風險(你會傷害我的機率與對我的損失)。

  • 信任與風險的概念有關,亦即,我信任你,是因為我相信你不會做出傷害我利益的舉動,所以我要承擔風險(你會傷害我的機率與對我的損失)。

  • YLL

    這個月(2007/07)的科學人雜誌有篇標題為”賽局的破綻:骨董花瓶值多少?”的文章,就是在談賽局理論,有興趣的可以找來讀一下。

  • YLL

    這個月(2007/07)的科學人雜誌有篇標題為”賽局的破綻:骨董花瓶值多少?”的文章,就是在談賽局理論,有興趣的可以找來讀一下。

  • kalashnikov

    推 很喜歡這系列文章~~!!

  • kalashnikov

    推 很喜歡這系列文章~~!!

  • aug

    上面的「囚犯困境」是不是應該為
    有一方指認對方時則獲減刑
    而雙方都”信任”對方不會指認自己時,在雙方都沒有指認對方下則因證據不足而無罪釋放

    使得囚犯陷入指不指認對方的困境

  • aug

    上面的「囚犯困境」是不是應該為
    有一方指認對方時則獲減刑
    而雙方都”信任”對方不會指認自己時,在雙方都沒有指認對方下則因證據不足而無罪釋放

    使得囚犯陷入指不指認對方的困境

  • 記得賽局也分成兩種來看,
    一種是單次,另一種是多次。

    結果是,單次賽局中,採取背叛對方較有利,
    因為可避免掉最壞的狀況(自己採取合作,卻被反咬一口),
    甚至有可能拿到最多好處。
    但多次賽局,則採取合作才是雙方互利的長久之計,
    也就是文中所述的平衡點。

    我想,網際網路上,雖然大多以ID示人,
    但網路上的人際網路,比較像是一個多次賽局的情境,
    合作是長久之計啊…

  • 記得賽局也分成兩種來看,
    一種是單次,另一種是多次。

    結果是,單次賽局中,採取背叛對方較有利,
    因為可避免掉最壞的狀況(自己採取合作,卻被反咬一口),
    甚至有可能拿到最多好處。
    但多次賽局,則採取合作才是雙方互利的長久之計,
    也就是文中所述的平衡點。

    我想,網際網路上,雖然大多以ID示人,
    但網路上的人際網路,比較像是一個多次賽局的情境,
    合作是長久之計啊…

  • Pingback: Web 2.0 與教育 « Mr./Ms. Days - 網路, 資訊, 觀察, 生活()

  • To YLL
    謝謝補充我有空會去翻翻科學人雜誌參考參考!
    To kalashnikov
    謝謝!
    To aug
    囚犯困境過程就是如您所說的。至於困境應該是指他們不指認的話,雙方都比較好,但是因為在無法互相溝通的情況下,只能理性選擇到雙方都不好的情況了。
    To Hsin
    我之前讀了一篇paper,裡面模擬兩種agent,一種是TFT(tit-for-tat以牙還牙),另一種是利他主義(ultruistic),然後進行賽局,錢用光的就會消失,不過我忘記最後模擬的結果了,有空再找那篇paper來分享一下了。
    ——————-
    在多重代理人的課程裡面,也提到如果是互動有限次(finite),根據數學歸納法從最後一次倒推,變成每一次都要不合作才有最大利益。所以可能要無限次賽局,才有合作的可能(只有理性選擇的情況下)囉?
    ——————-
    不過長久之計我也認為合作才是永續經營之道囉! 🙂

  • To YLL
    謝謝補充我有空會去翻翻科學人雜誌參考參考!
    To kalashnikov
    謝謝!
    To aug
    囚犯困境過程就是如您所說的。至於困境應該是指他們不指認的話,雙方都比較好,但是因為在無法互相溝通的情況下,只能理性選擇到雙方都不好的情況了。
    To Hsin
    我之前讀了一篇paper,裡面模擬兩種agent,一種是TFT(tit-for-tat以牙還牙),另一種是利他主義(ultruistic),然後進行賽局,錢用光的就會消失,不過我忘記最後模擬的結果了,有空再找那篇paper來分享一下了。
    ——————-
    在多重代理人的課程裡面,也提到如果是互動有限次(finite),根據數學歸納法從最後一次倒推,變成每一次都要不合作才有最大利益。所以可能要無限次賽局,才有合作的可能(只有理性選擇的情況下)囉?
    ——————-
    不過長久之計我也認為合作才是永續經營之道囉! 🙂

  • 這個時候要提出產值理論與功耗理論

    舉例’:鋼鐵人舉起100公斤,需要1000瓦(假設他有10萬瓦)的電力,所以用了百分之一的能量,不能回復。但是索爾只需要百分之一的力氣就可以舉起這個重量,而且所消耗的能量在1分鐘之後可以全部恢復。
    所以同樣的產值,在不同人身上消耗的能量是不同的,無法相提並論。
    也就是說,每個人各有專長,不能比較。