有一天,有一位富翁在家中被杀害,财物被窃取。警方在侦破这个恶性案件过程中,抓到了汤姆、杰瑞两个犯罪嫌疑人,并且从他们的住处搜出了被害人家中丢失的财物。但是,他们却矢口否认曾经杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西而已。 于是,警方将汤姆、杰瑞两个犯罪嫌疑人进行隔离审讯。因为这是发生在美国的案件,根据当地的法律,在证据不足的情况下,公诉方和犯罪嫌疑人可以进行讨价还价的“交易”。如果犯罪嫌疑人自动承认了某个控诉方没有证据证明的犯罪事实,那么将 “从轻发落”。 检察官分别对汤姆与杰瑞说:“你们的盗窃罪证据确凿,所以可以判你们1年监禁。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,我只判你3个月监禁,但你的同伙要被判10年监禁;如果你拒不坦白,而被同伙检举,那么你就将被判10年监禁,他只被判3个月监禁;但是,如果你们两人都坦白交代,那么你们都要被判5年监禁。” 尽管汤姆不知杰瑞是否招认,但他认为自己选招认最好。如果汤姆会选择招认,杰瑞也同样会选择招认,结果各被判刑5年;但如果两人都不招认(抵赖),结果是两人只各自被判刑1年,但这种结果通常是不会出现的。 用博弈论术语来说,汤姆或者杰瑞可以做出的选择被称为 “战略”(Strategies),如“招认”或者“抵赖”都是战略,也就是策略行为。对汤姆来说,尽管他不知道杰瑞是选择了“招认”还是“抵赖”,但他发现他自己选择“招认”是比选择“抵赖”为好的。也就是说,抵赖是相对于招认的劣势战略,汤姆不会选择劣势战略,他一般会选择“招认”的优势战略。 同样地,根据对称性,杰瑞也会选择“招认”。结果,汤姆、杰瑞两人都坦白交代了。 在博弈论中,汤姆和杰瑞是博弈的参与者,叫做“局中人” (Players)。当然,这是一个简单的博弈模型,在复杂的博弈中,参与者不止两个,战略也有很多。 汤姆和杰瑞作为博弈的参与者,在不同的策略组合下都会有一定的付出,用博弈论的术语来说,就是支付(Payoff),也就是付出的代价。有付出就有收益,因此,考察博弈中支付的多少往往就是考察收益的多少,支付与收益是一个问题的两个方面,而博弈中的收益可能为正,也可能为负。在囚徒困境中,汤姆和杰瑞都可能有1年监禁、5年监禁、10年监禁或者3个月监禁几种收益,至于结果是哪种,全靠他们各自的选择了。 汤姆和杰瑞所选择的战略构成的组合(招认,招认)和(抵赖,抵赖)都能实现博弈均衡(Equilibrium)。类似这种博弈均衡是 1994年诺贝尔经济学奖得主纳什(John F.Nash)论证的,所以被成为“纳什均衡”,这是一种非合作博弈的均衡。但这两个战略组合存在优劣之分,前者是优势战略,后者是劣势战略。汤姆和杰瑞一般都不会选择劣势战略“抵赖”,这被称为“剔除劣势战略的占优势战略均衡”。也就是“招认”是优于“抵赖”的好的战略。 囚徒的两难选择具有广泛而深刻的现实意义。现实社会中,各人追求利己行为而导致的最终结局是一个“纳什均衡”,像囚徒困境这种“纳什均衡”就是对所有人都不利的结局。两个囚徒在招认与抵赖策略上首先想到自己,这样他们必然要服较长的刑期。只有当他们都首先替对方着想时,或者相互合谋串供时,才可以得到最短时间的监禁的结果。 “纳什均衡”对亚当·斯密的“看不见的手”(市场机制)的原理提出挑战。按照亚当·斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。但从“纳什均衡”来看,“看不见的手”的原理存在一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。其实,两个囚徒的命运就是这样。 “纳什均衡”是非合作博弈的均衡,有时并不是对所有人都有利的均衡。所以,反过来更使我们看到:合作是好的“利己策略”,但合作必须符合以下黄金定律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是“己所不欲,勿施于人”,但前提是“人所不欲,勿施于我”。这样的合作才能形成一个和谐的良好的社会。P3-5