大部分受過大學教育的人都瞭解契約精神的好處。一般來説,把時間用於監視和督促他人履行承諾勞心費力,而把這些時間用於工作、學習或休閒,能得到或短期或長期的好處。大家也都知道,單方面的守信至少在經濟上不合算。
考慮下面的單期博弈
不難發現,(守信,守信)和(不守信,不守信)都是純策略納什均衡。
如果一個序貫博弈的每一階段都是如上的博弈,那麼可以定義一個“冷酷策略”和相應的“臨界耐心水平”,使得大家一直守信——處於一個更好的均衡上。
下面我想利用這個博弈説明“坑生不坑熟”的風氣是如何形成的。簡單起見,假定任何個體都與熟人進行序貫博弈,而與生人進行單次博弈。社會總人口足夠多,以至於一個人的熟人圈子規模與社會總人口相比無限趨近於零。下面假定社會中存如下在三種人:
誰都坑(黑色人),比例為 a
誰都不坑(白色人),比例為 b
坑生不坑熟(灰色人),比例為 1-a-b
進一步做如下假設:
每個人一生與熟人進行 x 次博弈,與生人進行 y 次博弈
生人、熟人中三類人的比例與社會比例相同
每個人對熟人有完全信息,對生人完全沒有信息
折現率為 1
假設現在出現了一個聰明一些的人,他會根據熟人的類型選擇自己的策略,而面對生人時,他總選擇同一個純策略——坑或不坑。那麼他面對熟人時的選擇是:
面對黑色熟人,坑對方,得到支付 3ax
面對灰色或白色熟人,不坑對方,得到支付 10x(1-a)
面對生人時,他的支付為
總是選擇坑對方,支付為 3(a+b)y+8y(1-a-b)=8y-5(a+b)y
總是選擇不坑對方,支付為 -(a+b)y+10y(1-a-b)=10y-11(a+b)y
這個聰明些的人選擇“永遠坑生人”的條件是 2y-6(a+b)y<0,即 a+b>1/3
假如 a+b>1/3,且這個人更聰明一些,他可以選擇與哪些人成為熟人。容易發現,他會選擇與灰色人、白色人成為熟人。這樣他一生的總支付就變成了 10x+8y-5(a+b)y。
同時,這個人成為了一個灰色人,當然他是一個“聰明的灰色人”。他與普通灰色人的區別在於,他不會與黑色人成為熟人。
下面我要做一個可能不太合適的假設:“聰明的灰色人”只能由灰色人轉變而來。這個假設的好處是,對於黑色人來説,熟人的結構改變了,但對於白色人來説,熟人的結構沒有改變。
假設有比例為 s 的灰色人變成了“聰明的灰色人”,那麼對於黑色人,熟人結構變成了:
黑色:a/(a+(1-s)b+1-a-b)=a/(1-sb)
灰色:(1-s)b/(a+(1-s)b+1-a-b)=(b-sb)/(1-sb)
白色:(1-a-b)/(a+(1-s)b+1-a-b)=(1-a-b)/(1-sb)
那麼黑色人在熟人身上取得的支付為:
黑色:3ax/(1-sb)
灰色:8(b-sb)/(1-sb)
白色:8(1-a-b)/(1-sb)
黑色人在熟人身上取得的總支付為:(3ax+8x(1-a-sb))/1-sb=8x-5ax/(1-sb)
而黑色人在生人身上取得的總支付不變:3ay+8y(1-a)=8y-5ay。所以這時,聰明的灰色人越多,黑色人在熟人身上取得的總支付越少。如果所有灰色人都轉換為聰明的灰色人,那麼黑色人在熟人身上取得的總支付為:(3ax+8x(1-a-b))/1-b=8x-5ax/(1-b)
這樣一來,黑色人一生取得的總支付為:8(x+y)-5a(y+x/(1-b))
假設所有的灰色人都變聰明後,黑色人也開始變聰明:他們可以在 x+y 固定的前提下,選擇 x 和 y 的值。這樣一來,我們知道,黑色人的最優選擇是 x=0。促成這一選擇的原因是來自“聰明的灰色人”的懲罰——把黑色人踢出自己的熟人圈子。懲罰係數為 1/(1-b)。
現在假設有 w 比例的黑色人變聰明瞭,那麼不聰明的黑色人在熟人身上的收益分別為:
黑色:3(1-w)ax/(1-b-wa)
白色:8(1-b-a)x/(1-b-wa)
那麼不聰明的黑色人在熟人身上的總收益為:3(1-w)ax/(1-b-wa)+8(1-b-a)x/(1-b-wa)=8x-5(1-w)ax/(1-b-wa)
所以,不聰明的黑色人從社會中取得的總支付為:8x-5(1-w)ax/(1-b-wa)+8y-5ay=8(x+y)-5a((1-w)x/(1-b-wa)+y)=8(x+y)-5a[(1-w)x+(1-b-wa)y]/(1-b-wa)
這時,若(1-w)x/(1-b-wa)>y,那麼對於聰明的黑色人來説,維持 x=0 的選擇是正確的。反之,則聰明的黑色人會改變選擇。下面我們來看看(1-w)x/(1-b-wa)與 w 之間的關係:它對 w 的一階偏導數為:[(-x)(1-b-wa)-(-a)(1-w)x]/(1-b-wa)^2=(a+b-1)x/(1-b-wa)^2=<0
這個結果非常不好。因為(1-w)x/(1-b-wa)是單調的,所以即使我們能求出一個臨界值 w,它所代表的均衡也是不穩定的。這是因為如果與熟人博弈時,黑色人比例越低,黑色人的總收益也越高,在其次均收益超過了坑生人時,聰明的黑色人會選擇多與熟人博弈,但這又會反過來拉低熟人博弈的收益,如是往復。
假如我們對白色人也施加同樣的假設:白色人也可以在 x+y 給定的前提下選擇 x 和 y 的值,那麼白色人與熟人博弈的收益為:
黑色:-ax
白色:10(1-a-b)x
灰色:10bx
總收益為 10x-11ax
其與生人博弈的收益分別為
黑色:-ay
白色:10(1-a-b)y
灰色:-by
總收益為 10y-11(a+b)y
易知這時最優的 y=0,而且白色人有激勵去“變聰明”。
而這時無論黑色人是否聰明,其遇到的生人都只會幹一件事:坑你。這時無論是聰明還是不聰明的黑色人都會只跟熟人博弈。而由於所有的灰色人都變聰明瞭,黑色人的熟人中也不會出現灰色人,只會有黑色人和白色人。這時黑色人與熟人博弈的收益為
黑色:3a(x+y)/(1-b)
白色:8(1-b-a)(x+y)/(1-b)
黑色人從社會獲得的總收益為:8(x+y)-5a(x+y)/(1-b)=10
而白色人與熟人博弈的收益為:
黑色:-a(x+y)/(1-b)
白色:10(1-b-a)(x+y)/(1-b)
白色人從社會獲得的總收益為:10(x+y)-11a(x+y)(1-b)
這個變化發生後,灰色人的收益也改變了。因為他們在社會上只會遇到灰色人。但是我們暫時還沒有假設他們能改變 x 和 y,所以他們目前的收益是:
與熟人:10x
與生人:3y
總收益為 10x+3y=10(x+y)-7x
現在我們終於可以做一些好玩的事情了:在三類人的支付上都消去 10(x+y)後乘以 -1,我們得到三類人的“顏色懲罰”:
黑色人:(x+y)[2+5a/(1-b)]
白色人:(x+y)[11a/(1-b)]
灰色人:7x
容易知道,誰的“顏色懲罰”比較大,誰在社會中就混得越慘。
先比較黑色人和白色人:若 2>6a/(1-b),那麼黑色人比較慘,反之則白色人慘。意思就是黑色人越少,黑色人越慘;灰色人越少,黑色人越慘。
然後比較黑色人和灰色人。用黑色人的懲罰除以灰色人的懲罰,得到:
[2/7+5a/7(1-b)](1+y/x)
好玩的事情發生了:生人越多,黑色人越慘;黑色人越多,黑色人越慘;灰色人越多,黑色人還是越慘。
最後比較灰色人和白色人,白色人的懲罰除以灰色人的懲罰,得到:
[11a/7(1-b)](1+y/x)
白色人的境況和黑色人完全一樣。這意味着
人口流動性越大的地方,灰色人的優勢越明顯
壞人(黑 + 灰)越多的地方,越需要合作,即使是和壞人合作
如果壞人特別多,他們之間的內耗會使得好人反而取得生存優勢,儘管好人會被坑,但他們遇到好人後的正收益足夠彌補
這些結論可以用來為下面的事實提供直覺:
火車站、長途汽車站騙子多
黑手黨成員的義氣與忠誠
再烏煙瘴氣的地方也有好人
但是上面的分析沒有直接給出把欺詐社會轉化為誠信社會的方法。不過容易想到一個直觀的方法:降低不守信的支付。那麼如何降低呢?在人口足夠多時,依靠嚴刑峻法。在人口少,或者乾脆是一個小圈子時,也可以由“信譽”來替代立法執法。用“信譽”代替立法執法的一個例子是金融行業。各國的金融行業都經歷過野蠻生長期。隨着個人和機構信譽的逐漸建立,違約率高的個人和機構業務越來越少,這些機構的運營成本也越來越高。
但這並不意味着靠市場自發糾正違約行為就是最優作法。調整和建立信譽需要時間,各色人等“學聰明”也非一日之功。以“違約行為會被自發糾正”為由,無視自發糾正過程越長,社會中累積的福利損失就越多這一事實的論述,採信的價值不高。