賽局理論:囚犯困境與信任關係

Posted By Mr. Thursday

今天要講的「囚犯困境」,和最近的減刑新聞沒關係,而是指一種賽局。囚犯困境(Prisonner’s Dilemma)是描述抓到兩位囚犯,然而因為證據不足,所以就把這兩位囚犯分開到不同的房間裡面審問,並且分別和他們說,如果提供對方犯罪的證據,而對方保持沉默的話,對方要做10年的牢,而你可以無罪釋放。如果你提供證據,他也提供證據,那麼你們兩個各坐5年的牢。如果你們兩個都保持沉默,那麼因為證據不足,你們兩個分別坐牢6個月(半年)。所以根據這個規則,和囚犯可能的選擇,化成一個結局的矩陣如下:

pd.jpg

0代表無罪釋放,-10代表坐牢10年,-5代表坐牢5年,-0.5代表坐牢半年。

甲方可以選擇沉默或是指認對方犯罪的證據,乙方也可以選擇沉默或是指認對方的證據。在甲乙兩方都不能串通的情形下,假設他們用理性來判斷,則甲乙兩方分別會做甚麼樣子的選擇呢?

我們先假想甲方的情況:甲方如果選擇沉默,那麼如果乙方也沉默,那麼需要坐牢半年,但是如果乙方這個時候提供有利證據,則他需要坐牢10年,所以最多可能要坐10年牢,平均可能要做5年左右的牢。甲方如果選擇指認對方,那麼如果乙方剛好選擇沉默,那們他就可以無罪釋放,乙方還要坐牢10年,如果乙方也提供證據,那麼兩人都坐牢5年,所以最多坐牢5年,平均來說也只要坐牢2.5年。所以算來算去,甲方會覺得提供證據比選擇沉默來的有利。乙方也是類似的情況,算了半天,也是覺得提供證據比選擇沉默來的有利。而這也正是抓到犯人的人想要的結果。然而就囚犯來說,其實如果兩方都沉默的話,兩方只要各坐半年牢,但是這個賽局的規則,卻讓他們選擇了兩方都做5年牢的結果。因此這個賽局就稱為「囚犯困境」了!

囚犯困境和信任有甚麼樣子的關係呢?這就和今日的網際網路有關係了。在網路上,我們通常有比較匿名的身分,每個人通常只用一個ID來代表,有些網站可以讓我們看到對方的照片,然而和現實生活仍舊差別許多,譬如說:我們聽不到對方講話的聲音和語調,這部分就失去許多判斷的資訊,同一句話「好厲害喔!」,用不同的語調,就代表了不同的意思,然而在網路上就失去了這份資訊。另外我們也看不到對方的表情,又失去了更多資訊。也許就一般的文章而言,我們並不需要這麼多資訊,然而當我們需要在網路的平台上面,進行交易,或是進行合作的時候,「信任」相關的資訊就很重要了!

然而因為網路上失去了生活中這麼多的資訊,每個人通常只有ID做代表,有時候連ID都可以輕易取得,雖然讓網路有「開放性」,卻也讓人與人之間難以建立「信任」關係。缺少信任的關係,在網路上的合作就常常落入剛才提到的「囚犯困境」裡面。譬如說今天一個共享資訊的平台上面,大家可以合作提供資訊,互相交流。然而當我們理性思考的時候,發現如果我花了很多時間分享資訊,對方卻沒有跟著分享資訊,不就變成自己損失,他人得益嗎?(原本想用霹靂火的台詞請自行代入XD)最後每個人都這樣子想,就變成沒有人要分享資訊了。然而如果大家提供資訊的話,會比大家都不提供資訊來的好,因此這就是一種分享資訊的「囚犯困境」了,只不過這邊的結局不是坐牢,而是分享資訊後的收穫與時間損失之間的衡量。

如果使用者彼此之間有信任的關係,那麼剛才囚犯困境的賽局,平衡點就會變成大家都分享資訊了,因為「信任」等於是提供額外的訊息,讓我們除了理性選擇之外,多了參考訊息來影響我們的行為。今日的Web2.0提倡使用者提供內容合作提供內容,另外還有一點是「人際網路」(Social Network)的建立,我個人認為「人際網路」的建立,就是為了要有「信任」的關係,如此一來在「分享」的場合,尤其在 Web2.0裡面分享是不可或缺的,有了「信任」關係,自然就能打破「囚犯困境」,進而促進分享了。

賽局最早是在經濟學裡面提到的,而囚犯困境是其中一種賽局。另外每個賽局還可以分成是否為「零和」(zero-sum)。所謂零和就是說一場比賽,甲輸了10元,乙就賺了10元。非零和的賽局則是可能有雙贏的情形,也就是說有可能甲贏了10元,乙也賺了10元。賽局的分析,在多重智慧代理人系統(multi-agent system)裡面也很重要。所謂智慧代理人(intelligent agent)就是一位代理人,像是每個人有一位個人秘書,只不過這位秘書是一個電腦程式,具有人工智慧,可以代理主人處理一些事情。當主人外出、忙碌、或是睡眠的時候,一些比較簡單的工作,主人可以放心交給代理人來完成。智慧型代理人可能需要一段時間來學習主人判斷的方式,以及主人的喜好,過一段時間就可以變成稱職的代理人。多重代理人(multi-agent system)則是在研究多個代理人之間互動的情形,譬如說機器人足球賽,隊員之間要如何協調,如何制定贏得比賽的策略。譬如說網路拍賣競標系統,怎樣子的競標規則可以避免惡性循環。互動整體系統規則的制定,就是多重智慧代理人系統(multi-agent system)要探討的範圍,而賽局就自然成了其中分析的一部分。信任關係的學習與建立,也在這一部分扮演適當的角色。

然而信任是甚麼樣子的東西呢?如果查韋氏字典可以查到5種定義,trust、trustworthiness、belief、confidence、和faith又有些許差別。因此依照不同的系統,不同的使用環境,信任又會有不同的定義,以及不同的應用。交友網站需要的信任,和網路拍賣需要的信任可能又有所不同。因此也不大容易定下一個標準答案,需要視情況而定了。

因此,無論是代理人幫忙,或是我們親自在網路中交易合作,「囚犯困境」會常常遇到,然而經由人際網路(Social Network)的建立,可以建立「信任」關係,進而讓網路上的「合作」和「分享」變成可能,Web2.0的目標也比較有機會達到了!當然Web2.0還有其他問題要考慮,像是獲利模式,以及上傳內容著作權的問題。由人際網路建立信任關係,是否真的可行也要再考慮(我們是否信任朋友的朋友?朋友的朋友的朋友的朋友?)。但是至少囚犯困境可以用信任來解決,至於非理性的情況,以及其他解決囚犯困境的可能方法,我們仍然可以繼續思考,直到找出解答為止!

延伸閱讀

喜歡這篇文章嗎? 分享出去給作者一點鼓勵吧!