从人际关系到国际关系经常会遇到一种利益冲突,合可双赢,争则两败,背叛者占尽寻求合作便宜的局面。这个局面在博弈中叫做“囚徒困境(Prisoner’s dilemma)”。那是Merrill Flood和Melvin Dresher在兰德研究合作与冲突时构造的一个模型,普林斯顿数学家Albert W. Tucker1950年在斯坦福大学给一群心理学家说明选择的难题时举它作为例子,从此成为了二十世纪下半叶在社会科学中影响最大的案例。在“囚徒困境”中,背叛者获益要比合作时大,单方面寻求合作的人受伤害要比相争时深。这诱使局中人在合作与背叛之间往往选择背叛,因为无论对方选择什么,采用“背叛”总比“合作”对自己更有利,这在博弈中叫做“严格优势策略”。双方各自明智的选择排斥了本来可以合作双赢的前景,结果走到了两败俱伤的境地。这是自私人性悲哀的困境。
现代的教育总是让人相信理性的力量和善意的威力。人们不禁想象:在各自决策之前,如果给局中人一个充分交流沟通的机会,是不是有可能让他们携手合作走向双赢?金球赛的最后阶段的游戏(Golden Balls:Split or Steal)提供了许多非常精彩的实例。
2007到2009年风靡英国金球赛(Golden Balls)以参与者们根据各人诚实或者虚假的得球声明,通过公开讨论方式,投票淘汰可能得到差球的队员。到了最后阶段剩下两个人,两人前面各有两个金色的球,其中一个是“平分”,另一个是“骗取”。两人私下中各选一个,如果两个人都选了“平分”,将平分高额的奖金。如果其中一个选择“骗取”,另外一个选择“平分”,前者将获取所有的奖金,后者则空手离开。如果两个人都选择“骗取”,则两败俱伤一无所得。
这最后阶段的游戏是弱化的“囚徒困境”博弈。被背叛的一方受到伤害与相争时一样,这略为减少一点要“平分”者的损失。但这并不改变“骗取”是一个优势策略。因为无论对方选择什么,自己选择“骗取”都比选“平分”不吃亏。如果没有协商,双方不大可能走向合作。但在这最后阶段的游戏中,允许他们在选择前协商沟通。
下面的一个视频显示单纯善意的沟通,可能获得的一种结果。http://www.youtube.com/watch?v=p3Uos2fzIJ0&feature=related
这个视频,一男一女双方都信誓旦旦地承诺选择“平分”这个奖金,女人首先承诺自己会守信,哀婉地祈求对方要平分,两人相握对视眼睛直达心底,那男方诚挚的态度令人动容。但是这个承诺在博弈中只有精神作用并没有实际约束,实际上这个沟通并没有改变未沟通前的状态,寻求合作者浪费了这个机会,单纯的信任往往是受伤害的一方。比赛的现实证明,在几十万英镑的利诱面前,没有约束力的承诺,并不能导致合作。这样的事例在生活中并不少见,人们往往在道德上谴责背信一方的卑劣,但这并不改变竞争中的胜负,也不影响将来世界的面貌。道德的谴责和标榜的作用只不过向人们推介自己是个良好合作的对象,这一点诚实的人和骗子在表现上并没有什么区别。就像在这比赛中无法相信谁的承诺是可信的一样。
另一个视频显示包含着善意和威慑的政治手腕,Nick强迫Ibrahim合作。http://www.youtube.com/watch?v=S0qjK3TWZE8&list=PL134E3457F7D2C2E7&index=30
视频中的Nick表现出掌控局面的能力,他首先强硬地宣布自己要选择“骗取”这个优势策略,附加上盘后平分交易的许诺。即使对方公平地建议双方都选择“平分”,他仍然强势地坚持,他不会改变。并警告说如果对方也选择“骗取”,两人将一无所得。这就把一次博弈分成两个阶段:威胁和利诱。利诱的部分并没有确实的保障,这和另一个视频的承诺一样,只是给人一种希望。但是威胁的部分实实在在地粉碎了也许能占便宜的幻想,让对方只能在事后可能平分和两败俱伤中做选择,把球踢到对方。这是序贯博弈中常见的威胁策略。强势者常常坚持自己掌控命运,而不是寄希望于对方的诚信。国际关系中,例如美国“透明”的国际政策,“清晰”的战略,中国关于在台独时使用武力的立法等等都是使用这个策略。在社会上则是掌控局面政治手腕。
这个视频更精彩的是:在揭晓时Nick并没有坚持他强硬声明的“骗取”策略,而是选了“平分”。这是因为在威胁和利诱面前,理性的对方应该选择“平分”,但不排除对方意气用事。Nick自己选择了“平分”,在对方理性时,只不过将许诺的部分当场对现,在对方不理性时虽然让对方得到好处但并不增加自己的损失,还因为双方前面的许诺存在事后平分的可能。这时“平分”成了他的优势策略。这是一种宽容的表现。Nick的策略包含了善意、威胁、宽容和明朗的特点。
这两个视频说明了:在巨大利诱面前威胁比承诺更有效。有政治手腕能掌控局面的人,可以利用沟通来传递信息,将原来两难的选择转化成两个诱导的选择,来走出困境,这也是政治和商业竞争中已被人使用的技巧。
博弈的结果是由局中的各方来决定的,没有一种策略能够保证对方一定合作。学习博弈是让自己在复杂的局势中做个明白人,选择最为有利的策略。
金球赛引起社会科学研究者的兴趣,有一群经济学者对这些比赛进行分析,发现选择“平分”的人高达53%,这虽然只导致略高于四分之一的合作结果,但这已经大大高于囚徒困境中的预期。
怎么在重复囚徒困境博弈中走向合作,我在“从自私走向合作”的科普博文中已有详细论述。无名氏定理证明了:含有威胁的策略是走出囚徒困境的必要条件。走向合作的最好策略特征是善意的,会报复的,宽容的和明朗的,缺一不可。这也是在人际关系中能够维持合作的最好准则。