我對立法會協調的「囚徒困境」理解
立場新聞有一篇訪問戴耀廷的文章,以博弈論囚徒困境作喻,寓意只有各派合作才有望爭取更多議席,我猜想法應該不難明白。協調的過程中,類似的想法經常閃過腦海,但觀點卻有點不同,當真拿博奕論設想初選協調困局,我會得出三個結論:
1. 協調成功會得到更多議席,新人會有更多機會進佔席位;但現存政黨與素人無法合作,對現任議員反而不大影響。
2. 只有新人/現任議員一方願意協調,蝕底的不是願意協調一方,不協調一方反而因相近陣營爭相出選,分薄相近政治光譜支持。
3. 不選擇合作的原因是不信任對方的話,應該選擇多輪協調,以增加合作誘因。
這些觀點或許都不必用博弈論便可得出,但既然談起博弈論,為免下文太複雜,嚇怕大家,索性先把結論說出來好了,我絕對不是專家,歡迎專家賜教。
有利新人與否
關於現在的協調制度是有利傳統政黨還是新人的問題,本文不會用「素人」能否當選為命題,因為有素人不想被歸類為素人,有些參政多年還稱自己是素人,根本是建構出來的身分,無法拿來分類。我會把對局,也就是參與選舉的持分者分為新人和在任議員,關心的是新人有多大機會晉身立法會,那怕甚麼黨派也好。我假設說法亦與本土派利益相符,曾經聽過他們說,一可能終極目標,是取代議會的傳統政黨,不取代主流泛民,議會政治不會有新想像,不會硬起來抗爭。對我來說,本土派、素人、男神女神當選都無所謂,議會路線可以藉選舉期辯論,這裡只關心新人相對舊人有多大機會勝出。(註1)
不能否認的是,新人先天地比現任議員蝕底。無論知名度、議事經驗、往績,做過議員一定比未做過的好,這叫做現任優勢(incumbency advantage),是公認的選舉現象,何況現任議員在這次運動中,大部分也獲市民好評。新人也很難要求現任的人棄選讓路,以民主黨為例,側聞今屆預算只出選原本勝出的議席,你可以批評公民-民主兩大黨雄踞五區主導議會會出現甚麼問題,但總難扣上霸道、人家出選不合理的帽子。新人要吐氣揚眉,必須靠競爭,爭取市民認同。
(表一)
參照表(一),2016年立法會選舉,民主陣營在缺乏協調下直選和區議會(二)取得40席中的22席。(註2) 今屆沒有協調的話,可以預算所得議席相近,而現任議員基於優勢和反送中運動表現,很大機會連任,粗略綜合傳媒報道,尋求連任的大概都有18人,當作現任裡真的有人很不濟,有2人被淘汰了,加上不再尋求連任空出來的議席(4席),給新人進佔的議席只有6席。(註3) 筆者認為,要讓新人有較大空間晉身立法會,進佔新議席一定比和現任議員競爭容易,如果加上協調成功應得的新增2席 ,至少有8席予新人競爭。
把推算放到新人、舊人的對局裡面,會得出圖二的情景:
(圖二)
換言之,要有更多議會新面孔,理性選擇應該是支持協調。歸類新人、舊人的分析侷限是,無法全面計算政黨、素人參與協調的誘因,對政黨來說,新人的位置同樣可以是擴張的地方。但站在所有新人的理性選擇,應該是協調,增加競爭位置才是,仍覺得單憑一己之力可以勝出,是很進取,也很nash equilibrium。
不協調一方反而削弱勝算
另外,比例代表制有趣的地方是,有別於一般囚徒困境,相近陣營的人不互相協調,到頭來只會互搶選票。現在一種說法是,A 候選人不全然能盛載B 候選人主張,所以協調是消滅放棄者的聲音。第一,民主體制的落敗者,不見得勝出的人代表他們的主張;第二,比例代表制本身的設計便是彰顯社會不同陣營的聲音,提供的誘因反而是鼓勵相近陣營的人整合,即使是協調過程亦然。博弈論來說應該是還有子博弈之類的考慮,這裡筆者未敢深究,但正確的想法應該是A(可以是泛民/本土/素人)的支持是否足以成為勝出者的一員,而不是B是否統戰了我的主張。
真的要填充其餘方格,牽涉很多主觀考慮,未必正確,謹以九龍西為例分享一下。
a) 不協調一方的陣營代表交涉失敗,會各自派出候選名單,造成派員過多分票現象。比例代表制設計下是與光譜相近的對手競爭,影響自己派別的勝算,比影響對方派別還大。這裡假設大部分舊人都屬主流泛民,與新人有票源之別。
b) 有論調指舊人基於現任優勢,就算不參與協調,憑基本盤一定安全過關。但近日九龍西的案例說明,網上輿論對黃碧雲的批評,對現任形成一定程度的壓力;同時,政治光譜相近的工黨和民協同有意派人出選,沒有保證一定穩勝。(註4)
c) 若如右上角,新人不協調,他們頂多是混戰,很多「素人」表示有意參選,戶分相近選票,可能最後只得一席。分析未能顯示的是「素人」和「新人」分別,因為未能凝聚力量,新席位很可能由傳統政黨新人囊括,甚至有建制派看準票源分散,奪得議席,故以0.5表示風險。另一方面,左下角呈現的,卻是素人願意協調,但舊人不願協調的情景,都會出現一樣結果。九龍西比較多傳統政黨競爭,我假設分票問題一樣嚴重。
d) 任何無法協調的結果都會導致議席減少,無論只有一方成功協調,還是完全無法協調,都預想拿不回4席。
單以九龍西變化推演,我們便得到圖三的結果:
(圖三)
結果很明顯,除非我誤解了比例代表制,否則很難設想主動提出不協調是一個理性選擇。或許各方都好想成為坐二望三(2.5)的一方,可你的勝利是建立於對方協調失敗為前提,是己方不能控制的。
立場新聞的報道還有一點對協調機制的批評是,泛民終歸是難以信任,沒有人會知道關鍵時刻他們會否遵從承諾棄選。我沒有預知未來的水晶球,只能說根本地不信任的話,已無合作可言,不過要確保對方遵從承諾,博弈論便主張重複博弈以促進雙方有基礎合作。最初擬議選前無約束力投票,便是為了在棄選以外,多加一次機會讓各方慎思參選勝算。而且,敢一反承諾者,也很難再取信於政界。
要35+一點也不容易
最後想強調的是,要達成立法會過半的目標,一點也不容易。上表可以看見,地區直選聯同區議會(二)充分協調,24席已是很樂觀的結果,香港島我衷心希望多贏一席達4席,然而你不能排除第二個王維基參選,你都做不到團結,哪有資格呼籲別人集中支持?究竟有幾多人有議席非必然的憂患?還有11席要從傳統功能組別處拿回來,把陳沛然醫生算進我方,還要多爭至少3席。拓展傳統功能組別談何容易,直選失利一席,便要寄望傳統功能組別多一分。
不過所謂博弈論分析侷限亦甚多,不必把它奉為圭臬。有人會考慮怎樣的協調形式才較有利、有人甚至覺得不支持才最符合團隊的處境,這些都不是囚徒困境或本文能處理的範圍。正如Jonathan Wolff在最近一篇訪問說:「哲學家第一件事是學習聆聽多於言說」;「只有鞋匠懂得造鞋,但也只有消費者才懂得鞋哪兒軋腳。」(註5)
我們不必聽到有人不同意協調便撻伐,或許背後有其苦衷,又或者只是不同意某部分,聆聽,是制度建立之本。別只批評沒有調和的方向便好,那不會找到出路。
----------
註1:本文對新人舊人全無價值評斷。
註2:假設這就是不合作均衡(納殊均衡,Nash Equilbrium)
註3:假設現任議員繼續連任的話,有機會包括:民主黨(7席)、公民黨(4席)、人民力量(1席)、街工(1席)、熱血公民(1席)、香港眾志(1席)、小麗民主教室(1席, 加入了工黨)、朱凱廸(1席)=17席。這裡不計DQ喪失議席,新民主同盟范國威也參選的話,在任議員參選則共計18席。
同一政黨尋求新人接班,會被歸類失去現任優勢,權當新人類別。
註4:以新舊分類,缺點是難以分析傳統黨派新舊人參選多寡所帶來的分票問題,表格只是以九龍西為據推論議席起落。
註5:http://justice-everywhere.org/health/beyond-the-ivory-tower-with-jonathan-wolff/. "The first thing philosophers have to do is learn to listen rather than talk.""only the shoemaker can make the shoe, but only the customer knows where the shoe pinches."
nash均衡計算 在 管碧玲 (kuanbiling) Facebook 的最讚貼文
我的「覆鼎金均衡」與蘇起的「地動山搖」
獲得奧斯卡等幾個重要影展多項獎項,敘述數學家約翰納許(John Nash)一生受幻想精神病之苦,而在1994年榮獲諾貝爾經濟學獎的電影「美麗境界」A beautiful mind,電影故事美麗感人,電視屢屢重播,因此納許的故事廣為人知。
而納許榮獲諾貝爾經濟學獎的理由是他的理論對博弈理論的貢獻,納許均衡(Nash equilibrium)更是被認為是無所不在的均衡。也就是人類權衡輕重、計算厲害得失的理性抉擇無所不在。他的理論是什麼內容,很難以一兩個影像說明,在電影中並沒有特別著墨。納許均衡(Nash equilibrium)是指在包含兩個或以上參與者的非合作賽局(Non-cooperative game)中,假設每個參與者都知道其他參與者的均衡策略的情況下,沒有參與者可以通過改變自身策略使自身受益時的一個概念。
經濟學上傳統的典型理性均衡,其論述我試著簡單舉例說明:每一生產者需選擇合適的產量以獲得最大利潤,然而一個生產者的理想產量,取決於其他生產者的產量。當每一個生產者的理想產量,都需要根據已知其他生產者的產量來做出調整,以達到最大利潤時,一種均衡就出現了。這種均衡其實就是「理性抉擇」(Rational Choice) 的結果。
對於這些人類理性的抉擇,許多學者有許多的論述,諸如在分析均衡穩定的理性過程,還有一種「賽局」中「最適反應」或「最適抉擇」的動態均衡,也有「非合作性」的「零和賽局」,或「合作性」的「非零和賽局」。這些都是「博弈理論」或稱「賽局理論」(Game Theory)的基本分析架構。
在「零和賽局」中,賽局各方是不合作的。「非零和賽局」表示在不同策略組合下,參與賽局的各方,其得益之總和是不確定的變量,故又稱之為變和賽局。如果某些戰略的選取可以使各方利益之和變大,同時又能使各方的利益得到增加,那麼,就可能出現參加賽局的各方相互合作的局面。因此,在「非零和賽局」中,賽局各方存在合作的可能性。國際經濟中許多問題都屬於非零和賽局問題,即國際經濟中各方的利益並不是必然相互衝突的。也就是即使一部分有衝突,也並非表示一定有全面衝突。
「納許均衡」的定義更為廣泛,因為納許並沒有針對「形成哪種均衡最為理想」作出評判。納許的說法,「均衡點是當其餘參與者的策略保持不變時,能夠令參與者的混合策略最大化其收益的一個n元組」。
最近韓國瑜的研究所論文指導教授,同時也是他的國政顧問團兩岸組顧問蘇起,前不久才說蔡英文連任恐怕「地動山搖」,日前再打「恐嚇牌」表示他擔心若明年1月總統蔡英文連任「台灣會進入火山爆發」。他的說法只見恐嚇,卻沒有提出什麼具體的事實分析。
蘇起的說法,以賽局理論來解釋,他應該是基本假設蔡英文總統連任後,所有參與賽局的國內各方,或對岸各方,都是「非理性的」。國際、國內、對岸的各方利益都是零和的,都是不計任何代價與任何後果,會「變臉翻桌」。
我要問的是:習近平真的會在美中關係、兩岸關係中,不計中國內部複雜多方層層疊疊的利益與厲害,會忘記蔡總統已經在位一任了,只因蔡英文連任而已,就不顧一切暴衝爆走?我要問的是:蘇起所了解的習近平是如此嗎?還是這只是蘇起虛構連中方都不認一中各表的「九二共識」之後,又一次經不起分析的妄想虛構乎?
我在會期中,幾乎每天都會趕高鐵到立法院,我必經每天交通顛峰的兩個塞車路口:中正交流道北上匝道,及國道1進入國道10到左營高鐵站,必經的覆鼎金匝道。中正交流道北上匝道,至少有五條道路的車流會匯集到只有一線道的北上匝道,而覆鼎金匝道更是所有國1終點端開始,北上途中所有交流道、匝道要到左營高鐵站的車流的匯聚點,也是最後縮小到只有一條車道。
每天上下班時段,這些大塞的車流,每個在那裡塞車卡住的駕駛者,理論上都有「暴衝前進」、「賭氣不走」與「倒車亂迴」等各種抉擇。但是每天壅塞緊密、一車接一車,看似一團亂的團團塞車,為了各種不同各自的利益與厲害關係,最後都是排成一條直線,魚貫進入匝道,縱使緩慢,最後每一輛車,也都到達目的地了。縱使有擦撞,如不能私下解決,交通警察也都能來排除。
這也是一種均衡!這每天上演的均衡,我認為才是兩岸賽局的理性事實。我無以精確說明這種均衡完全符合那一種學說。所以我把這種每個駕駛者,每天上演的理性抉擇,稱為「覆鼎金均衡」。我可以跟蘇起打賭,蔡英文連任後,台灣、中國的各種關係與厲害,最後都會達致我說的「覆鼎金均衡」,而不是蘇起的「地動山搖」。
只打賭一塊雞排,和對台灣人民的一個道歉就好。
nash均衡計算 在 納許均衡計算-在PTT/IG/網紅社群上服務品牌流行穿搭-2022-08 ... 的推薦與評價
找納許均衡計算在Dcard與PTT討論/評價與推薦,提供nash equilibrium找法,nash均衡題目,賽局理論例子相關資訊,找納許均衡計算就在網路品牌潮流服飾穿搭. ... <看更多>
nash均衡計算 在 賽局理論篇:納許均衡Nash Equilibrium - Liao W.C. 的推薦與評價
Chinese 賽局與策略. written by LiaoWC on 2021-06-20. javier-allegue-barros-c7b-exxpoie-unsplash.jpg. 上回介紹了囚徒困境,我們用下圖表示了這個囚徒困境的情境 ... ... <看更多>
nash均衡計算 在 [考試] 混合策略Nash均衡一問- 看板Economics 的推薦與評價
來源:104年度台大研究所
科目:個體經濟學
問題:
複選題
Consider the normal form bellow. Suppose the row player uses a mixed
strategy and choose s1 with probability p, and the column player uses
a mixed strategy and choose t1 with probability q and t2 with
probability r. In a Nash equilibrium with the mixed strategies,
how will these two players play the game?
t1 t2 t3
s1 (1,2) (4 ,3) (2,1)
s2 (3,2) (-1,1) (0,0)
(A)p=1/3
(B)p=1/2
(C)q+r=1
(D)q=2/7
(E)q=5/7
我的想法:
我原本打算用極大化報酬的方式找出p、q和r,以下是我的計算過程:
Maxπrow = p*(1q+4r+2(1-q-r))+(1-p)*(3q-1r)
一階微分等於0得:-4q+3r+2=0
Maxπcolumn = q*(2p+2(1-p))+r*(3p+1(1-p))+(1-q-r)*(1p)
對q微分並令它等於0得:p=2
對r微分並令它等於0得:p=-1
得到的這兩個p都超怪的,但我已經算過很多遍了,每次都這樣。所以小弟想請問:
1.這樣的求解方向有錯嗎?
2.若無,請問是計算方式出了問題嗎?
拜託各位大大幫忙了,謝謝~~
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.134.9.192
※ 文章網址: https://www.ptt.cc/bbs/Economics/M.1439308185.A.F0C.html
... <看更多>