公元219年发生的襄樊之战,以蜀汉刘备部将关羽北伐曹魏,水淹七军、围困襄、樊两城开端,以东吴孙权部将吕蒙“白衣渡江”偷袭南郡,关羽败走麦城,身首异处结束。
这是一次典型的囚徒困境。
赤壁之战前,刘备与孙权结成联盟,约定共同对抗北方最强大的曹操,以获得合作收益。关羽北伐是针对曹操的军事行为,可以理解为刘备一方努力履行联盟的合作契约,执行合作策略。孙权一方趁刘备一方正努力执行合作策略,趁其毫无防范之机,偷袭了关羽的后方根据地,导致关羽兵败身死。孙权一方的偷袭不是针对曹操的军事行为,而是针对刘备的军事行为,是典型的执行了背叛策略。
(“,”左侧数值为刘备的收益,右侧数值为孙权的收益)
在单次的囚徒困境博弈模型中,若博弈双方同时选择合作,则各获得2收益;同时选择背叛,则各获得0收益;一方选择合作另一方选择背叛,合作方收益-1,背叛方收益3。同时选择合作能让集体获得最高收益,2+2=4。但是当一方选择合作给定时,另一方选择合作收益2,选择背叛收益3,2<3,对集体中的个体来说,当对方会选择合作时,其最佳策略是选择背叛。同时选择合作策略,对集体来说虽然是收益最高的策略,但对个体来说并不是——损害同伴的利益才能最大化自身利益。当一方努力履行合作契约时,另一方有很强的激励不履行合作契约,而是采取背叛策略。
作为孙权一方来说,当刘备一方努力履行合作契约时,其执行背叛的策略,的的确确能够获得最高收益——这从吕蒙能够轻而易举拿下南郡就可以证明——成本低、收益高。如果只考虑襄樊之战这一单次博弈,而不考虑未来,孙权偷袭南郡能得到最大收益,是最佳策略。
在单次的囚徒困境博弈模型中,实际上,无论对方选什么,选择背叛永远是最佳策略。上面我们已经分析了一方选择合作策略给定时,另一方的最佳策略是背叛。若一方选择背叛给定,则另一方选择合作收益-1,选择背叛收益0,-1<0,最佳策略依然是选择背叛。
作为刘备一方来说,似乎根本不该考虑履行合作契约,任何合作的举动都是劣选策略,只会降低自己的收益。关羽的北伐是愚蠢的,把刘备一方推到了一个注定大败亏输的境地——孙权若选择背叛,刘备选择合作的收益是最低的-1。
我见过很多夸赞孙权的偷袭多么明智,而讽刺关羽的北伐是多么愚蠢的言论。这些言论,包括我之前的分析,全部!都错!错!错!
真正出了昏招的孙权!
为什么?
因为以上我们分析的是单次囚徒困境博弈!所谓单次博弈,就是说博弈参与者在这次博弈之后就老死不相往来了,你遇不到我,我也找不到你,不会有下一次博弈了。但现实情况是,刘备就在西川,孙权就在江东,你能找到我,我想见你也很容易,今天这次博弈结束之后,明天还要接着博弈,并且不知道今后还有多少场博弈。
这种情况叫做无限次数重复博弈。
单次博弈与无限次数重复博弈有什么区别?后者是要考虑未来的,前者却不需要考虑。
未来会发生什么?
未来会发生收益!
这时一个新策略出现了,叫做“报复”。所谓报复,就是在上一局博弈中,甲方遭遇乙方背叛,那么在下一轮博弈中,甲方也要对乙方采用背叛策略。报复虽然针对的是过去的行为,目的却是为了获取更多的未来收益。
(“,”左侧数值为刘备的收益,右侧数值为孙权的收益)
在一个共有N轮博弈的重复博弈中,给定甲遭遇背叛就会在下一轮实施报复,不遭遇背叛就会一直合作。第n轮甲合作,乙背叛了,乙收益3;在第n+1轮,甲报复乙,选择背叛,乙无论如何选择,收益最高为0;两轮收益相加总和为3+0=3。第n轮甲合作,乙也选择合作,乙收益2;由于甲没有遭到背叛,所以第n+1轮甲会选合作,乙也选合作,收益2,;两轮收益相加总和为2+2=4。乙背叛甲的两轮收益总和为3,乙一直与甲合作两轮收益总和为4,3<4,因此比起背叛,乙更愿意跟甲合作。
现在给定甲永远不会实施报复,即,无论在第n轮乙采用什么策略,甲在第n+1轮依旧会选合作。第n轮,甲合作,乙合作,乙收益2;第二轮甲合作,乙合作,乙收益2;两轮相加,乙总共收益4。第n轮甲合作,乙背叛,乙收益3;第n+1轮甲合作,乙背叛,乙收益3;乙两轮收益相加总和为6。4<6,跟两轮合作相比,两轮背叛收益更高。实际上,我们还可以组成其他的策略组合,但是,只要甲永远选择合作,乙永远选择背叛所得的收益一定是最高的。因此,在甲不会报复的情况下,乙最佳选择永远是背叛,甲就永远无法得到合作收益。=
报复提高了背叛者的背叛成本,使背叛的收益小于合作,从而激励了人们履行合作契约。报复让自己更安全。当乙认为甲会对背叛行为进行报复的可能性越高的时候,就越不愿意背叛甲,反之,乙认为甲会对背叛行为进行报复的可能性越低,就越愿意背叛甲。
乙如何判断甲对背叛行为的进行报复的可能性?看他曾经报复的频率!曾经实施报复的频率越高,就说明未来会实施报复的概率也就越高;曾经实施报复的频率越低,就说明未来会实施报复的概率也就越低。
甲每一次的报复或不报复的决定,都关系着未来博弈中遭遇背叛的可能性。对这一次背叛行为实施了报复,在未来遭遇背叛的可能性就越低,未来合作收益也就越高;不对这一次背叛行为实施报复,在未来遭遇背叛的可能性就越高,未来合作收益也就越低。
为了降低未来博弈中博弈对手的背叛激励,获得尽可能多的未来收益,一定要尽可能对每一次背叛行为进行报复!
当孙权派吕蒙趁虚而入,占领南郡,导致关羽身死时,他就应该料想到,刘备绝不会善罢甘休,因为对背叛行为进行报复关系到未来。但孙权似乎并没有想到,最起码没有想到刘备实施报复的严重性。
公元221年,刘备亲自率领5万大军讨伐孙权,发动了夷陵之战。这一场战役,孙权部将陆逊“火烧连营”,打得刘备几乎全军覆没——孙权赢了。
有什么严重后果?
孙权与刘备能够结成联盟,合作对抗曹操,是因为无论是孙权还是刘备,其能力都不足以完成独自对抗曹操的目标,合作能让双方获得比单干更高的收益。只要孙权和刘备无法单独对抗曹操这一现实不变,双方合作获得的收益就会大于单干获得的收益。这个博弈的期限是“无限”的——不知道在未来的什么时候会结束。这也就意味着,这个未来可能很长(从实际情况看,这个未来确实很长),未来越长,双方就可以从未来的合作中获得越丰厚的回报。
合作双方的能力越强,大概率来说,合作收益就会越高。如果一方的能力受到削弱,不仅仅影响到这一方的收益,还会让另一方的合作收益也减少。
吕蒙“白衣渡江”之前,刘备定军山之战斩杀夏侯渊,从曹操手中夺取汉中;襄樊之战,关羽水淹七军,斩杀庞德,生擒于禁,围困襄阳、樊城,逼得曹操考虑迁都以避锋芒。这些军事行动给曹操带来了严重的、真实的威胁,曹操必然需要增加力量对来应对刘备一方的行动。对刘备一方增加力量,就意味着没有更多力量应对孙权一方,即使孙权无力发起对曹操的进攻,自身的防御压力总归会减少,这就提高了孙权一方的收益。
夷陵之战中刘备损失惨重,导致蜀汉被削弱。蜀汉的衰弱,使曹操可以减少针对蜀汉的力量,将这些力量投入到针对东吴一方。蜀汉的削弱,不仅仅降低了蜀汉获取收益的能力,同时也降低了东吴获取收益的能力。
每一轮博弈的合作收益都降低了,那么未来博弈的轮次越多,也就是未来越长,损失的收益也就越多。
看似襄樊之战和夷陵之战孙权都是最后的胜利者,但实际上孙权一方为了眼前的收益,放弃了许许多多未来收益。“白衣渡江”之前,孙刘联盟给曹魏的带来了巨大压力,但是在“白衣渡江”之后,这一联盟再也没能对曹魏集团形成实质性的威胁,只是勉强维持不被消灭而已。
那什么时候应该选择背叛呢?很明显,没有未来的时候!越是没有未来,就越要背叛,夺取尽量多的眼前收益。比如说曹魏眼看就要被严重削弱了,对抗他不需要与刘备结盟了,这时候在孙权看来,孙刘联盟的未来大概率就要结束了,没有那么多未来收益可以获得了,眼前收益大于未来收益,就应该准备采取背叛策略。
我们引入贴现率P。明天得到2收益,不如立刻得到2收益值钱,因为明天会出现很多意外导致你无法得到这2收益,贴现率就是明天依旧会得到2收益的概率,也可以理解成明天的2收益比几天的2收益贬值的比率。
若第n轮甲方遭遇乙方背叛,在以后的博弈中,甲就再也不会与乙方合作,则乙方的收益为第n轮背叛的收益3,加以后的无穷个0,最终为3。乙一直与甲合作的收益是第n轮的收益2,加上n+1轮的收益2P,加上n+2轮的收益2P²,加上n+3轮的收益2P³……就是无穷多个2相加。若乙该背叛甲,说明背叛收益高于一直合作的收益,则3>2+2P+2P²+2P³……,求得P小于1/3时,满足不等式。当下一轮博弈依旧会继续的概率不小于1/3时,乙背叛甲的收益就小于一直与甲合作的收益,乙就不该背叛;只有预期博弈继续的概率小于1/3时,乙背叛甲的收益才会大于继续与甲合作,乙应该背叛甲。
背叛或者合作,与贴现率的大小有关!
这就是为什么说孙权趁机夺取南郡是一个愚蠢的短视行为,因为在当时的情况看来,曹魏集团会在很长一段时间里保持最强者地位,这就说明孙刘联盟合作的贴现率是比较大的,而贴现率大时,选择合作才是收益最高的策略。
夷陵之战之后,诸葛亮主持了蜀汉与东吴的重新谈判,再一次让双方回到了合作的策略上,为什么蜀汉会愿意重新与东吴合作呢?理由是——预期的贴现率特别大。
第n轮甲遭遇乙背叛,乙收益3,n+1轮甲报复乙,选择背叛,乙收益0,n+2轮甲乙重新合作,乙收益2P²,n+3轮收益2P³……乙一直与甲合作,第n轮收益2,n+1轮收益2P,n+2轮收益2P²,n+3轮收益2P³……满足背叛收益小于合作,则满足3≤2+2P,求得P≥1/2。
当贴现率足够大时,在一轮背叛与一轮报复后,乙与甲合作的未来收益依旧足够大,乙没有继续背叛的激励,因此甲在报复后,与乙继续合作可以获得更多收益。
因为蜀汉和东吴都承认贴现率确实是比较大的,也就是说,双方合作才能对抗曹魏的现实会延续很长时间,所以双方才愿意重新达成合作关系。
刘备发动夷陵之战是对的,因为报复是必须的;诸葛亮在夷陵之战后重新与东吴结成联盟也是对的,因为需要与东吴合作才能对抗曹魏;但是孙权在关羽北伐曹操的时候偷袭南郡却是错的,在贴现率明显很高的情况下采用了背叛策略,是为了眼前的蝇头小利放弃了巨大的未来收益,是非常不明智的。
这是可以用数理证明的。
孙刘联盟的颓势看起来是从夷陵之战开始的,实际上在吕蒙“白衣渡江”之时,历史的天平已经开始倾斜了。刘备死后,诸葛亮主持了蜀汉与东吴的重新谈判,又达成了合作关系,但是,势已成,不可逆,结局已经写就,回天乏力了。
作者:第五大洋,历史百家争鸣特约作者