五、博弈有术
由于囚徒困境的模型是如此有趣和简洁,不仅给人们留下了深刻的印象,而且迅速不胫而走,成为一个被人们广为谈论和研究的博弈模型。这一模型在针对借故推延型客户显得更有价值,因为它充分揭示了人的本性,即人所做的每一决策都是为了自己的利益最大化。
囚徒困境是博弈论中最基本的博弈模型,是担任斯坦福大学客座教授的数学家图克1950年提出来的。当时他给一些心理学家解释完全信息静态博弈问题,为了更形象地说明博弈过程,他用两个犯罪嫌疑人的故事构造了这一模型。
这一模型的过程这样的:两个共同偷窃的犯罪嫌疑人甲和乙被带进警察局,警方对两名犯罪嫌疑人实行隔离关押,隔离审讯,每个犯罪嫌疑人都无法观察到同伴的选择。警方怀疑他们作案,但手中并没有掌握确凿证据。于是明确地分别告知两名犯罪嫌疑人:对他们犯罪事实的认定及相应的量刑完全取决于他们自己的供认。如果其中一方与警方合作,供认偷窃之事,而另一方抵赖,供认方将不受惩罚,无罪释放,另一方则会被判重刑10年;如果双方都与警方合作共同供认,各被判刑5年;而如果双方均不认罪,因为警察找不到其他证据则无罪释放。
哪一种选择对犯罪嫌疑人更有利呢?
我们可以知道,每个犯罪嫌疑人都有两种可供选择的策略:供认或不供认,而且每个犯罪嫌疑人选择的最优策略不依赖于其同伙的策略选择。
如果甲选择抵赖,那么就可能会出现两种情况:如果乙选择供认,那么甲将被加重惩罚,判刑10年,而乙则无罪释放;如果乙也同样选择抵赖,那么他们两个都将因证据不足而被释放。很显然,这第二种结果对于两个人都是最有利的。但是,因为警方没有把两名嫌疑人放在一间囚室里,因而这种合作难以顺利进行,使得结果预测的不确定性加大,或者说增加了抵赖合作的风险性。
因此,基于人是理性的这一前提,由于犯罪嫌疑人不知道对方的想法,最理性的博弈策略,就是选择供认。这时的策略,我们可以称为占优策略,自愿坐牢的嫌疑人而如果所有参与人都有占优策略存在,那么博弈将在所有参与人的占优策略的基础上达到均衡,这种均衡称为占优策略均衡。
在囚徒困境中“甲供认,乙供认”的占优策略均衡中,不论所有其他参与人选择什么策略,一个参与人的优势策略都是他的最优策略。不管甲乙两人谁供认,都将得到减轻惩罚的结果。如果甲供认了,乙抵赖,甲将免于惩罚;如果乙也供认了,那么罪名各担一半。从甲个人看来,也减轻了惩罚;甲乙互换位置,结果依然是一样。显然,这一策略一定是所有其他参与人选择某一特定策略时该参与人的占优策略。