博弈論與制度
發(fā)布時間:2020-05-20 來源: 美文摘抄 點擊:
時間:2001年11月8日
地點:法學(xué)樓模擬法庭
主講:丁利(法學(xué)院法學(xué)博士、社科院經(jīng)濟所博士后)
評論人:柯榮住(光華工商研究所)
以下是丁利所講內(nèi)容:
我這次回法學(xué)院,不免有點尷尬,通常法學(xué)院的人問我,我就說我是搞經(jīng)濟學(xué)的,經(jīng)濟學(xué)院的人問我,我又說我是搞法學(xué)的。因為我研究的這個課題正好是兼跨了法學(xué)和經(jīng)濟學(xué)兩個科目。說得直接點,就是兩個學(xué)科都只學(xué)了點皮毛,腳踩兩只船。但是我想,法學(xué)跟經(jīng)濟學(xué)的差異并沒有我們想象中那么巨大,它們都是研究整體的社會的。我們劃分學(xué)科,是因為我們知道自己很無知,我們不可能象上帝那樣全知全能,所以我們才采用這樣一種方法,等于是盲人摸象一樣,來做局部的研究。而隨著我們研究的深入,我們開始了這種跨學(xué)科的探索。原因也是為了用一種更加超越的眼光來看這個社會。通常認為,法學(xué)和經(jīng)濟學(xué)是為了對象而存在的學(xué)科,它沒有固定的體系和理論。但是現(xiàn)在的經(jīng)濟學(xué),尤其是微觀經(jīng)濟學(xué),以及這里要講到的博弈論,已經(jīng)開始超過對現(xiàn)象的研究而進一步研究現(xiàn)象背后的更深規(guī)律。我們知道,博弈論其實是研究現(xiàn)實中的人,在具有一般理性的情況下,如何做出選擇的一個理論,F(xiàn)在的博弈論與十幾年前的博弈論已經(jīng)有了很大的不同。我個人認為,可以更好的運用于法學(xué)。微觀經(jīng)濟學(xué)有很多是研究制度的,制度才是它的核心問題。大家從微觀經(jīng)濟學(xué)的教科書結(jié)構(gòu)上就能看出,一開始個人理性,包括消費者行為、廠商行為,后面一部分以往是福利經(jīng)濟學(xué),現(xiàn)在通稱為機制設(shè)計。機制設(shè)計是什么呢?就是制度的規(guī)范問題,這需要以實證方法為基礎(chǔ)。每個人都有好壞判斷的標準,而所謂的社會選擇理論,也就是把個人的判斷標準通過一個途徑上升為社會的判斷標準,由此確立社會選擇函數(shù),或者社會選擇標準。我們知道,凡事都有直接實現(xiàn)和間接實現(xiàn)兩個途徑。我們生活在一個不完美的社會,所以不能象經(jīng)濟學(xué)模型分析的那樣,對一個社會的政策、人們的觀念有完全的了解,擁有所有必須的知識,因此,不能直接實現(xiàn)。所以要設(shè)計一個機制,來論證某種行動的可能性,也就是博弈。在這種博弈的環(huán)境下,理性的人都會選擇均衡,也就是說,選擇的結(jié)果需要在目標集合,如果實現(xiàn)了的話,就是完美。經(jīng)濟學(xué)就是這樣看的。亞當斯密當初對制度其實是涉及到了,他在論證經(jīng)濟領(lǐng)域中看不見的手的時候提到,每個商人都是利己主義者,都在自利的博弈,但是這種自利的博弈在一個有利于他們的環(huán)境中恰恰實現(xiàn)了看不見的手。下面我來講一些具體的東西。主要有兩方面:一個是個體理性,一個是均衡。
個體理性要研究的就是在博弈過程中個體與理性的互動,也就是interaction。研究表明,最終博弈的結(jié)果不取決于個人,而是社會眾人與外部環(huán)境。因為人們行動的時候,也就是博弈的時候,不僅要考慮個人利益的最大化,但是對手肯定也是這樣想的,所以他還要考慮到對手的想法,以及對手認為自己是怎么想的,對于一個博弈的結(jié)果,起決定作用的是知識和信仰。我們需要知道自己是知道什么,對手知道什么,對手知道自己知道什么。九四年的諾貝爾經(jīng)濟學(xué)得主提出了有名的NASH均衡,即一旦進入均衡狀態(tài),個體是有進無出的,沒有動力選擇其他行為。這個怎么理解呢?簡單舉囚徒困境的例子。兩個犯人,被分別審判,都知道坦白從寬、抗拒從嚴。倘若都招供了,那么兩個人都判三年;
倘若一個招了,另一個不招,則抗拒的那個被判五年,招了的那個態(tài)度好,只判一年;
倘若兩個人都不招,警察沒辦法,只能各判一年半。這個例子屬于NASH均衡中的單純的一次性博弈,它的結(jié)果必然是兩個人都招。因為一個人若是不招,對手若是招了,則自己就屬于抗拒,招在這里就有了動力,同理,另一個人也會這樣想的。故而兩個人各判三年的情況就是NASH均衡,是最合理的結(jié)果。
但是我們會發(fā)現(xiàn),這個結(jié)果沒有兩個人均不招各判一年半的結(jié)果好,但是這里有一個self-enforce的問題,招供在這里就是兩個人博弈的結(jié)果。這里用一個例子將直覺上的東西說清楚了。擴大到整個社會,就是社會選擇的問題。個人價值判定如何擴大為整個社會的價值判定,是有好多機制來實現(xiàn)的。例如投票,就是一個很好的方法可以將個人意志上升到集體意志。尤其是多數(shù)投票,1950年經(jīng)濟學(xué)家May就指出這是個非常良好的社會選擇方法。他認為,這個方法有三個特征和好處,第一是匿名信,就是說假如不看特殊的人,投票的結(jié)果是一樣的;
第二是目標中性,就是說判斷好壞的標準是一樣的,所以大家對一個事情的看法不論如何會中性的;
第三是正反因循,假如一個人在任上干得很好,下一次他仍然會被選中的,反之亦然。但我想,社會選擇理論跟這個仍不盡相同,以囚徒困境為例,都是被個人利益驅(qū)使,早在十八世紀,法國的數(shù)學(xué)家孔羅塞就提出了“投票悖論”:有甲、乙、丙三個人,面臨著A、B、C三種選擇,對這三中選擇的喜好程度,甲的排列是A、B、C,乙的排列是B、C、A,丙的排列是C、A、B,統(tǒng)計下來,勢必造成投票的悖論,這種不可能性告訴我們,在選擇方案超過兩個時,就需要將各種價值偏好都變成一個社會價值。當然雖然有悖論的存在,但多數(shù)情況還是能解決的,社會現(xiàn)象不可能有單一的好壞,而且一個人也不能持有多種價值判斷。有一個著名的“帕雷托自由不可能定理”,在囚徒困境的例子里,兩個煩人都招供,屬于帕雷托改善。帕雷托自由的定義是可以一個人說了算的事情,例如睡姿,個人當然有權(quán)決定自己到底是仰著睡還是側(cè)著睡,這就是帕雷托自由。但是在具體的社會選擇中,這種自由是不可能實現(xiàn)的?娎赵谝槐娟P(guān)于公共選擇的書中,舉了查泰來夫人的情人一事為例,說明這種選擇受到的各方面的力量,不可能實現(xiàn)自由。雖然社會選擇會遇到麻煩,例如功利主義和羅爾斯“正義論”的對比,前者以邊沁為代表,認為幸福就是個體利益的最大化,后者則是羅爾斯為代表,認為應(yīng)該是能讓弱者稍微強大。盡管如此,我們?nèi)匀灰M行某種社會選擇,確立某種社會目標,然后通過間接機制來實現(xiàn)它。這就涉及到如何看待法制的問題,我們說法制,其實就是一個制度,一個博弈的框架,一個Gameform,它制定規(guī)則,什么人來博弈,怎么博弈,博弈的結(jié)果會是怎么樣的,法律首先告訴了人們做什么事會獲得什么樣的結(jié)果。一旦進入博弈狀態(tài),起決定作用的就是個體的知識和信仰。機制設(shè)計者要使機制可行,必須讓結(jié)果是可預(yù)測的,可以自我實施,讓游戲沿著均衡的道路做下去。所以若把他引申開來,在經(jīng)濟領(lǐng)域中,則是個體理性的要求,最終結(jié)果要不差于不參加機制;
己利相容,結(jié)果個人要能從中獲利。實施機制,對知識要求不高,因為倘若大多數(shù)的人都沒有掌握博弈應(yīng)有的知識的話,那這個制度是有很大缺陷的。更多要求的是穩(wěn)健,人無完人,不能指望一個人一輩子永遠做正確的事情,所以一個好機制應(yīng)該有保護職能,不讓人因為小錯而吃大虧。以上是從規(guī)范角度看制度,一個制度就是一個自我實現(xiàn)的框架,由此引出了如何看待均衡的問題。
雖然人可以局部地主宰自己,例如自己的睡姿,但是不能任意選擇制度,若是可以的話,那么中美之間也就不存在什么差距了,感覺什么制度好,我們直接拿過來用就得了。知識論的理解是要人知道這是怎么回事,就是說博弈雙方都有一個common-knowledge,一個制度之所以能夠維持下去,就是因為這種公共知識的存在,但是它不是強要求,并不是要求所有的人都必須具備。而進化論的理解是,進化過程是通過學(xué)習(xí)、實踐逐漸趨向結(jié)果的一種選擇。學(xué)者阿瑟布林提出,最初的選擇是非常重要的,而且其中有用的選擇則會隨著時間和實踐過程逐漸強化,沿著某種路徑進入均衡狀態(tài)。均衡在這里就意味著自我實施。例如社會上都批判的貪贓枉法的事情,通常會說一句話:“換了是你,你也會這么做的!边@是因為一個包青天在當代是一個非均衡的存在,非均衡就意味著倒霉,所以自然要冒很大的風(fēng)險,而貪贓枉法則被看成是均衡的存在。所以我們才會更加地強調(diào)傳統(tǒng)、文化、道德這些東西,我們是否真的無法改變我們的生活呢?我覺得這是個見仁見智的問題,因為我們所謂的均衡,其實是學(xué)習(xí)的結(jié)果,但是我們不是機器人,不可能完全理性機械地行事,作為有智慧的生物,我們總會在制度的邊緣處采取一種非均衡策略,一開始可能是一種個體性的嘗試,但是倘若能夠把這種個體嘗試發(fā)展成一種集體嘗試,從而最終確立新的制度,那么我想,這也是社會進步的一個模式吧。那我今天就講這么多,其余的請柯榮住同學(xué)來補充。
以下是柯榮住所講內(nèi)容:
我是學(xué)經(jīng)濟的,對法律一竅不通,但是學(xué)經(jīng)濟的人又必須對此有了解,為什么呢?象丁利說的那樣,微觀經(jīng)濟學(xué)其時就是制度經(jīng)濟學(xué),所有的宏觀經(jīng)濟都在制度這個平臺上運行。一般人們有這樣一個印象,俗稱“經(jīng)濟學(xué)帝國主義”,就是說經(jīng)濟學(xué)對社會學(xué)、政治學(xué)、歷史學(xué)、人類學(xué)等等學(xué)科的滲透。在這里我提供一個我個人版本的理解。我們看待人類的行為,一般可以將它分為三個層次。第一個層次是微觀的心理運動,就是說一個人的心理狀態(tài),他是高興還是沮喪,是剛起床還是要去睡覺了,經(jīng)濟學(xué)家不關(guān)心這個,甚至不關(guān)心人跟動物有什么區(qū)別。第三個層次是騷亂,或者說革命,這類大群體的活動,也不是經(jīng)濟學(xué)家關(guān)心的問題,那他們關(guān)心什么呢?正是位于這兩個層次之間的廣闊空間,而且我們能發(fā)現(xiàn),這個中間層面正是社會發(fā)展中最穩(wěn)定的部分,一個人無論心情好壞,他去買白菜的時候總是會核計一下菜的價格,一個售貨員不論脾氣暴躁與否在當代職業(yè)培訓(xùn)中都要求微笑面對顧客。這個中間層次正是行為背后的穩(wěn)定行為,是可以反復(fù)出現(xiàn)的可被預(yù)測的層面。經(jīng)濟學(xué)家則以這個為基礎(chǔ),向兩邊擴展,你比如說犯罪,有的經(jīng)濟學(xué)家就認為它也是一個促進社會穩(wěn)定的因素,至于革命和騷亂,經(jīng)濟學(xué)家對東南亞金融危機帶來的恐慌也有很好的解釋分析模型。總而言之,是通過一種穩(wěn)定的原則來解決問題的,穩(wěn)定,也就是制度的均衡。
我對法律很不了解,但是我知道法律的一個基本的概念,即它是一個rule of game,至于說討論這個規(guī)則從哪里來,這是從發(fā)生學(xué)的意義來研究,我覺得沒有多大意義。例如子嗣平分制,我們追問這個現(xiàn)象是如何產(chǎn)生的話,很可能到最后來源于一種隨機現(xiàn)象,我們都知道,隨機事件是不能被預(yù)測的,也就不具有科學(xué)實證的意義。我們應(yīng)該關(guān)心的是,它已經(jīng)產(chǎn)生了,在將來是否會改變?這是用均衡的理論來做研究的一種方法,經(jīng)濟學(xué)是很務(wù)實的,所以只考慮現(xiàn)存現(xiàn)象的改變的可能性。制度一旦產(chǎn)生,倘若沒有改變的趨勢和可能性的話,則是均衡的。發(fā)生學(xué)運用的更多類似于構(gòu)造法,打個比方吧,一個房間里有張三、李四、王五三個人,傳統(tǒng)的發(fā)生學(xué)是研究這三個人從何地來,怎么來的,是騎自行車來的,還是打的來的,還是做公共汽車來的。而采用均衡理論,則只關(guān)注這些人是否還會呆在這個屋子,如此就帶給法學(xué)研究很多新視點?梢宰屛覀冏⒁獾絺體行為的改變,會對許多想當然的理論有很大突破。我自己看到過這樣一個案例,一個江西人,要將自己保存的文物捐給國家,但是當?shù)氐奈奈锉Wo所卻依照國家的規(guī)定,個人不許買賣文物,所以只能算是他依法上交,不算捐獻,但是如此一來,就有了一個矛盾,既然是保護文物,倘若不是他將這些文物買下來的話,就不能保護它們了。這里就是一個信息不對稱造成的矛盾,國家不可能對所有的人進行信息的普及。這是目標跟手段之間的互斥。法律之間也會出現(xiàn)這樣的狀況。再舉那個囚徒困境的例子,其實不僅僅是那兩個犯人在博弈,而是很多人都參與了博弈。首先是警察,他制定規(guī)則,就是坦白從寬、抗拒從嚴,讓兩個囚徒在這個規(guī)則下博弈,但是假設(shè)兩個囚徒后面有黑社會,他們也在進行博弈,他們設(shè)置的規(guī)則正好跟警察的相反,于是就變成了警察跟黑幫之間的博弈。此外,老百姓也會參與博弈,倘若他們都覺得這兩個犯人應(yīng)該受到懲罰,就會增加執(zhí)法的力度。我對法律是外行,說了些外行的話,但是總之,我覺得法律跟經(jīng)濟學(xué)的聯(lián)系會讓我們更加清晰深刻的認識這兩個學(xué)科的不足與長處。今天就說這么多吧。
熱點文章閱讀