输家不但从数量上还是资金量上都要远远超过赢家,才能维持证券和期货市场自身的延续和生存; 市场的主要运动方向,一定是大多数投资人心

博弈论在生活中的应用 点击数: 1 【字体:小 大】 【收藏】 【打印文章】 【查看评论】   【负和博弈简介】
  所谓负和博弈,是指双方冲突和斗争的结果,是所得小于所失,就是我们通常所说的其结果的总和为负数,也是一种两败俱伤的博弈,结果双方都有不同程度的损失。
【负和博弈的例子】
  比如在生活,兄弟姐妹之间相互间的争东西,其结果就很容易形成这种两败俱伤的负和博弈。一对双胞胎姐妹,妈妈给她们俩人卖了两个玩具,一个是金发碧眼、穿着民族服装的捷克娃娃,一个是会自动跑的玩具越野车,看到那个捷克娃娃,姐妹俩人同时都喜欢上了,而都讨厌那个越野车玩具,她们一致认为,越野车这类玩具是男孩子玩的,所以,她们两个人都想独自占有那个可爱的娃娃,于是矛盾便出现了,姐姐想要这个娃娃,妹妹偏不让,妹妹也想独占,姐姐偏不同意,于是,干脆把玩具扔掉,谁都别想要。
  可以说像这种情况,在我们的生活中是经常出现的,在相处过程中,由于交往双方为了各自的利益或占有欲,而不能达成相互间的统一,使交际产生冲突和矛盾,结果是交际的双方都从中受到损失,“博弈论”把这种情况叫“负和博弈”如上面所举的例子,姐妹俩互不让步,最后,干脆仍掉,谁都别想得到,这样造成的后果是:其中一方的心理不能得到满足,另一方的感情也有疙瘩,可以说,对双方而言都受到损失;双方的愿望都没有实现,剩下的也只能是姐妹关系的不和或冷战,从而对姐妹间的感情造成不良的影响。
【“负和博奕”的内在要求】
  市场“负和博奕”的性质在价格波动特征上有充分的体现。以道氏理论为例,道氏理论将价格波动分三个级别:主要(原始)趋势、次级(逆向、反复)趋势、日常(短期)波动。撇开道氏理论的具体实践问题,结合上文论述,可以进一步推断:主要趋势是证券期货市场投资人获利的主要基础,次级趋势和日常波动则是证券期货市场存在及正常运转的基础。次级趋势的主要市场功能是隐蔽主要趋势,使市场走向的真正意图不被大多数人所觉察,并使大多数人在大多数时候被次级趋势所误导,从而作出错误的决策。日常波动的主要市场功能是使操作盈利看起来很容易,以诱使一批又一批的投资人不断为市场注入资金,从而保证市场的延续和长盛不衰。次级移动和日常波动具体来说,就是以大量的市场假象的方式使投资人错误地进场,同时在投资人正确进场后使投资人错误地离场。次级趋势隐蔽主要趋势及日常波动诱资入市的市场功能,从根本上保证了只有少数人成为赢家,最终使以“负和博奕”为特征的投资游戏规则得以维护。
  因而,综合上述各方面,证券期货市场高度波动性、高度随机性的外在价格特征,以及“负和博奕”的市场内在要求这一本质属性,决定了从全局和长期而言,证券期货市场的投资对象价值判断难、获胜概率低,因而操作难度非常高;决定了证券期货市场决不可能是一个简单的投资对象。在价值判断和操作实施这两个对投资收益命运攸关的关键环节上均属高难度,对投资者(尤其是投资家和机构投资者、知名分析师)而言,建立并巩固严肃科学的思维方式和投资模式就显得十分紧迫而重要。
【证券期货市场的“负和博奕”的内在要求】
  证券期货市场的投资交易,是一个连续的“负和博奕”的过程,即投资交易的亏损方不但要输给盈利一方,而且双方都要交纳交易过程的各种费用。所以不但在投资本业中赢家的从业人员是靠投资输家来养活的,同时投资服务业的从业人员,从根本上也要由输家来供养。如果亏损方要养活包括自己在内的所有投资从业人员,那么输家不但从数量上还是资金量上都要远远超过赢家,才能维持证券和期货市场自身的延续和生存。由此可以推论,市场的主要运动方向,一定是大多数投资人心理上最难以承受的方向,也一定是最出乎大多数投资人意料的方向。市场一定会用一切方法来证明大多数投资者和大多数资金投向在大多数时候都是错误的,市场自身生存的前提条件之一就是大多数投资决策的错误。这个“一切方法”就是西方经济理论中所谓的“看不见的手”,就是中国证券市场中所谓的“超级主力”。
  由于任何投资盈利都来源于价格沿投资方向正向的移动,任何投资亏损都产生于价格沿投资方向反向的移动,所以投资人很自然地就会对价格移动方向最为关注,研判价格趋势也就天然地成了投资人进行分析活动的首要功课。目前大多数投资技巧类书籍阐述的主要是以趋势研判为重点的各种分析方法,也在相当程度上强化了投资人的“方向”意识、“趋势”意识。由于参与市场的人数、资金、方法等的大多数代表了错误投向的市场内在要求,以方向或趋势确认为研判重点的大多数人的习惯行为必然是低效的。
  进一步的推论如下:
  推论一:市场会用一切方法证明流行的观点是错误的。
  推论二:市场会用一切方法证明流行的操作方法是错误的。
  推论三:由以供求关系的基本原理为基础的传统经济理论发展起来的基本分析方法的流行运用方式,在证券期货市场中是低效的。
  推论四:传统技术分析方法的流行运用方式在证券期货市场中是低效的。
【负和博弈在股票市场中的应用】
  经国务院批准,财政部决定从2007年5月30日起,调整证券(股票)交易印花税税率,由1‰升为3‰。即对买卖、继承、赠与所书立的A股、B股股权转让书据,由立据双方当事人分别按3‰的税率缴纳证券(股票)交易印花税。
  上一次印花税调整发生在2005年1月,从2‰调整为1‰。当时,中国股市正在低谷徘徊,1‰的证券交易印花税税率也创下新低。此后,在股权分置改革成功、投资者信心恢复等因素的推动下,中国股市步入了一轮前所未有的牛市。
  进入5月,上证指数上攻至4000点,此后在4000点上下有所调整。期间央行加息、上调存款准备金率,证监会加大对违规操作的查处力度,并几次三番警示股市风险,但牛市故我,多重手段都未能收到立竿见影的效果。5月29日,上证综指最高上探4335.96点。
  但印花税一经上调,市场连日大幅下挫。6月4日,沪深两市更分别以单日下跌330.34点和964.23点创下单日下跌点数历史记录。6月5日起,股市重拾升势,四天以来基本保持连日上涨的态势。6月8日,沪综指收于3913.14点,较前一交易日微涨0.57%。
  经济学家谢国忠认为,中国股市现阶段在流通中的股票只有总股本的三分之一左右。因此,流通股票所对应的上市公司盈利只相当于每个交易日5.67亿元。中国股民付出的交易费用比企业盈利还多出67%,这比赌博的赔率更大。按照国际惯例,赌场必须保证玩家48%的胜率,但在中国股市,类似的赢面仅为40%。
  他解释说,投资者购买股票,实际上是购买股权的盈利。交易费用是否过高,应当以盈利为判断标准。A股上市公司的盈利水平大约为每年4000亿元,也就是每个交易日17亿元。在印花税上调之前,中国投资者已经把他们所购买到的盈利的56%都上缴了。在香港和纽约这样的正常市场,这一比率应当低于5%。即使在那些经历过经济泡沫的国家,交易费用占企业盈利的比例也只有20%-30%。
  在一个充满泡沫的市场中,驱动市场的通常不是投资者而是投机者。投机者买入股票不是为了获得上市公司利润,而是为了追求短期价差。今年以来,中国股市的平均股价已经翻番,市场指数则曾上涨了60%。股票每月的平均涨幅都超过10%,流通股票每月平均换手2.5次,交易费用为每月0.9%。这样,投机者的盈利大约相当于交易费用的11倍。如果上涨势头在短期内保持下去,投机就将持续。
  谈到中国政府近日提高印花税的举措,他说,这是一项相当严厉的手段。2007年前四个月,政府每个交易日日均印花税收入达到5.3亿元,再加上券商每日佣金收入4.2亿元,市场平均每天付出的交易费用达9.5亿元。如果成交量还保持在目前水平的话,印花税率上调将使交易费用每天增加10.6亿元,相当于调整前的两倍。在一个正常的市场里,这样的政策足以使市场降温。但是,中国的市场远称不上正常,而投资者付出的交易费用原本就已经高得离谱。
  从投机者角度看,上调印花税的威慑力似乎还不够。交易费用达到此前的两倍多,但他们的预期收益仍然相当于交易费用的5倍,收益可能会逊于以往,但仍然足够可观。如果有足够多的投机者相信这一逻辑,泡沫在短期内就会是自我实现的。
  他尖锐地指出,泡沫顶多是一个零和博弈。在赌场里,每个人都明白这是一场零和游戏,你输即我赢。在股市泡沫中,股票就是筹码,而股票的价格可以持续上涨一段时间。这段时间内,由于所有股票的名义价格都在上涨,每个人都成为赢家。但当泡沫破裂时,股价会回落到以前的水平。因此,长期来看,股市泡沫是零和博弈。而由于浪费资源和盲目投资,它往往会成为负和博弈。
  在相当长时间内,股市泡沫能够给人们带来一种人人都是赢家的幻觉,这会吸引更多的人进入股市。如果人们是完全理性的,泡沫就不会发生。但是,泡沫却不断发生,而且在大多数国家都发生过。当有足够多的人相信自己要交好运,市场又有充足的流动性时,泡沫就应运而生了。


博弈论-博弈论概念


博弈论又被称为对策论(Game Theory),它是现代数学的一个新分支,也是运筹学的一个重要组成内容。在《博弈圣经》中写到:博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。

博弈论(Game Theory),有时也称为对策论,或者赛局理论,应用数学的一个分支, 目前在生物学,经济学,国际关系,计算机科学, 政治学,军事战略和其他很多学科都有广泛的应用。主要研究公式化了的激励结构(游戏或者博弈(Game))间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。 表面上不同的相互作用可能表现出相似的激励结构(incentive structure),所以他们是同一个游戏的特例。其中一个有名有趣的应用例子是囚徒困境悖论(Prisoner's dilemma)。

具有竞争或对抗性质的行为成为博弈行为。在这类行为中,参加斗争或竞争的各方各自具有不同的目标或利益。为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。比如日常生活中的下棋,打牌等。博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案,以及如何找到这个合理的行为方案的数学理论和方法。

生物学家使用博弈理论来理解和预测进化论的某些结果。例如,John Maynard Smith 和George R. Price 在1973年发表于Nature上的论文中提出的“evolutionarily stable strategy”的这个概念就是使用了博弈理论。还可以参见进化博弈理论(evolutionary game theory)和行为生态学(behavioral ecology)。

博弈论也应用于数学的其他分支,如概率,统计和线性规划等。

博弈论-博弈论的发展


对于博弈论的研究,开始于策墨洛(Zermelo,1913),波雷尔(Borel,1921)及冯·诺伊曼(von Neumann, 1928),后来

TRONG>《博弈圣经》TRONG>
由冯·诺伊曼和奥斯卡·摩根斯坦(von Neumann and Morgenstern,1944,1947)首次对其系统化和形式化(参照Myerson, 1991)。随后约翰·福布斯·纳什(John Forbes Nash Jr., 1950, 1951)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。 直至《博弈圣经》的出现, 《博弈圣经》与原有博弈论书籍最大的不同就在于,独创了国正论、国正双赢理论和粒子行为论,书中博弈取胜的文化理论统一了人类的博弈占优行为。更重要的是,它让博弈理论终于可以在现实生活中具体操作,让普通大众通过研习,成为真正的博弈高手。因此,

《博弈圣经》中的博弈理论在政治、经济、文化、生活、娱乐等社会的各个领域具有可应用性,并且对于个人的工作、生活也有具体的指导意义。此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的的学科。
博弈论-分类


博弈的分类根据不同的基准也有不同的分类。一般认为,博弈主要可以分为合作博弈和非合作博弈。它们的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。

从行为的时间序列性,博弈论进一步分为两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。通俗的理解:"囚徒困境"就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈

按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息,在这种情况下进行的博弈就是不完全信息博弈。

目前经济学家们现在所谈的博弈论一般是指非合作博弈,由于合作博弈论比非合作博弈论复杂,在理论上的成熟度远远不如非合作博弈论。非合作博弈又分为:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。与上述四种博弈相对应的均衡概念为:纳什均衡(Nash equilibrium),子博弈精炼纳什均衡(subgame perfect Nash equilibrium),贝叶斯纳什均衡(Bayesian Nash equilibrium),精炼贝叶斯纳什均衡(perfect Bayesian Nash equilibrium)。

博弈论还又很多分类,比如:以博弈进行的次数或者持续长短可以分为有限博弈和无限博弈;以表现形式也可以分为一般型(战略型)或者展开型,等等。

博弈论-意义


博弈论的研究方法和其他许多利用数学工具研究社会经济现象的学科一样,都是从复杂的现象中抽象出基本的元素,对这些元素构成的数学模型进行分析,而后逐步引入对其形势产影响的其他因素,从而分析其结果。

基于不同抽象水平,形成三种博弈表述方式,标准型、扩展型和特征函数型利用这三种表述形式,可以研究形形色色的问题。因此,它被称为“社会科学的数学”从理论上讲,博弈论是研究理性的行动者相互作用的形式理论,而实际上正深入到经济学、政治学、社会学等等,被各门社会科学所应用。

TRONG>博弈论与纳什平衡
TRONG>博弈论(game theory)对人的基本假定是:人是理性的(rational,或者说自私的),理性的人是指他在具体策略选择时的目的是使自己的利益最大化,博弈论研究的是理性的人之间如何进行策略选择的。

纳什(John Nash)编制的博弈论经典故事"囚徒的困境",说明了非合作博弈及其均衡解的成立,故称"纳什平衡"。

所有的博弈问题都会遇到三个要素。在囚徒的故事中,两个囚徒是当事人(players)又称参与者;当事人所做的选择策略 (strategies)是承认了杀人事实,最后两个人均赢得(payoffs)了中间的宣判结果。如果两个囚徒之中有一个承认杀人,另外一个抵赖,不承认杀人,那么承认者将会得到减刑处理,而抵赖者将会得到最严厉的死刑判决,在纳什故事中两个人都承认了犯罪事实,所以两个囚徒得到的是中间的结果。

类似的: 我们也能从“自私的基因”等理论中看到“纳什平衡”的体现。

在互联网这个原始丛林中:最优策略是如何产生的呢?

TRONG>博弈中最优策略的产生
TRONG>艾克斯罗德(Robert Axelrod)在开始研究合作之前,设定了两个前提:一、每个人都是自私的;二、没有权威干预个人决策。也就是说,个人可以完全按照自己利益最大化的企图进行决策。在此前提下,合作要研究的问题是:第一、人为什么要合作;第二、人什么时候是合作的,什么时候又是不合作的;第三、如何使别人与你合作。

社会实践中有很多合作的问题。比如国家之间的关税报复,对他国产品提高关税有利于保护本国的经济,但是国家之间互提关税,产品价格就提高了,丧失了竞争力,损害了国际贸易的互补优势。在对策中,由于双方各自追求自己利益的最大化,导致了群体利益的损害。对策论以著名的囚犯困境来描述这个问题。

A和B各表示一个人,他们的选择是完全无差异的。选择C代表合作,选择D代表不合作。如果AB都选择C合作,则两人各得3分;如果一方选C,一方选D,则选C的得零分,选D的得5分;如果AB都选D,双方各得1分。

显然,对群体来说最好的结果是双方都选C,各得3分,共得6分。如果一方选C,一方选D,总体得5分。如果两人都选D,总体得2分。

对策学界用这个矩阵来描述个体理性与群体理性的冲突:每个人在追求个体利益最大化时,就使群体利益受损,这就是囚徒困境。在矩阵中,对于A来说,当对方选 C,他选D得5分,选C只得3分;当对方选D,他选D得1分,选C得零分。因此,无论对方选C或D,对A来说,选D都得分最多。这是A单方面的优超策略。而当两个优超策略相遇,即A,B都选D时,结果是各得1分。这个结果在矩阵中并非最优。困境就在于,每个人采取各自的优超策略时,得出的解是稳定的,但不是帕累托最优的,这个结果体现了个体理性与群体理性的矛盾。在数学上,这个一次性决策的矩阵没有最优解。

如果博弈进行多次,只要对策者知道博弈次数,他们在最后一次肯定采取互相背叛的策略。既然如此,前面的每一次也就没有合作的必要,因此,在次数已知的多次博弈中,对策者没有一次会合作。

如果博弈在多人间进行,而且次数未知,对策者就会意识到,当持续地采取合作并达成默契时,对策者就能持续地各3分,但如果持续地不合作的话,每个人就永远得1分。这样,合作的动机就显现出来。多次对局下,未来的收益应比现在的收益多一个折现率W,W越大,表示未来的收益越重要。在多人对策持续进行下去,且W比较大,即未来充分重要时,最优的策略是与别人采取的策略有关的。假设某人的策略是,第一次合作,以后只要对方不合作一次,他就永不合作。对这种对策者,当然合作下去是上策。假如有的人不管对方采取什么策略,他总是合作,那么总是对他采取不合作的策略得分最多。对于总是不合作的人,也只能采取不合作的策略。

艾克斯罗德做了一个实验,邀请多人来参加游戏,得分规则与前面的矩阵相同,什么时候结束游戏是未知的。他要求每个参赛者把追求得分最多的策略写成计算机程序,然后用单循环赛的方式将参赛程序两两博弈,以找出什么样的策略得分最高。

第一轮游戏有14个程序参加,再加上艾克斯罗德自己的一个随机程序(即以50%的概率选取合作或不合作),运转了300次。结果得分最高的程序是加拿大学者罗伯布写的"一报还一报"(tit for tat)。这个程序的特点是,第一次对局采用合作的策略,以后每一步都跟随对方上一步的策略,你上一次合作,我这一次就合作,你上一次不合作,我这一次就不合作。艾克斯罗德还发现,得分排在前面的程序有三个特点:第一,从不首先背叛,即"善良的";第二,对于对方的背叛行为一定要报复,不能总是合作,即" 可激怒的";第三,不能人家一次背叛,你就没完没了的报复,以后人家只要改为合作,你也要合作,即"宽容性"。

为了进一步验证上述结论,艾氏决定邀请更多的人再做一次游戏,并把第一次的结果公开发表。第二次征集到了62个程序,加上他自己的随机程序,又进行了一次竞赛。结果,第一名的仍是"一报还一报"。艾氏总结这次游戏的结论是:第一,"一报还一报"仍是最优策略。第二,前面提到的三个特点仍然有效,因为63人中的前15名里,只有第8名的哈灵顿程序是"不善良的",后15名中,只有1个总是合作的是"善良的"。可激怒性和宽容性也得到了证明。此外,好的策略还必须具有的一个特点是"清晰性",能让对方在三、五步对局内辨识出来,太复杂的对策不见得好。"一报还一报"就有很好的清晰性,让对方很快发现规律,从而不得不采取合作的态度。

博弈论-合作的进行过程及规律


"一报还一报"的策略在静态的群体中得到了很好的分数,那么,在一个动态的进化的群体中,这种合作者能否产生、发展、生存下去呢?群体是会向合作的方向进化,还是向不合作的方向进化?如果大家开始都不合作,能否在进化过程中产生合作?为了回答这些疑问,艾氏用生态学的原理来分析合作的进化过程。

假设对策者所组成的策略群体是一代一代进化下去的,进化的规则包括:一,试错。人们在对待周围环境时,起初不知道该怎么做,于是就试试这个,试试那个,哪个结果好就照哪个去做。第二,遗传。一个人如果合作性好,他的后代的合作基因就多。第三,学习。比赛过程就是对策者相互学习的过程,"一报还一报"的策略好,有的人就愿意学。按这样的思路,艾氏设计了一个实验,假设63个对策者中,谁在第一轮中的得分高,他在第二轮的群体中所占比例就越高,而且是他的得分的正函数。这样,群体的结构就会在进化过程中改变,由此可以看出群体是向什么方向进化的。

实验结果很有趣。"一报还一报"原来在群体中占1/63,经过1000代的进化,结构稳定下来时,它占了24%。另外,有一些程序在进化过程中消失了。其中有一个值得研究的程序,即原来前15名中唯一的那个"不善良的"哈灵顿程序,它的对策方案是,首先合作,当发现对方一直在合作,它就突然来个不合作,如果对方立刻报复它,它就恢复合作,如果对方仍然合作,它就继续背叛。这个程序一开始发展很快,但等到除了"一报还一报"之外的其它程序开始消失时,它就开始下降了。因此,以合作系数来测量,群体是越来越合作的。

进化实验揭示了一个哲理:一个策略的成功应该以对方的成功为基础。"一报还一报"在两个人对策时,得分不可能超过对方,最多打个平手,但它的总分最高。它赖以生存的基础是很牢固的,因为它让对方得到了高分。哈灵顿程序就不是这样,它得到高分时,对方必然得到低分。它的成功是建立在别人失败的基础上的,而失败者总是要被淘汰的,当失败者被淘汰之后,这个好占别人便宜的成功者也要被淘汰。

那么,在一个极端自私者所组成的不合作者的群体中,"一报还一报"能否生存呢?艾氏发现,在得分矩阵和未来的折现系数一定的情况下,可以算出,只要群体的 5%或更多成员是"一报还一报"的,这些合作者就能生存,而且,只要他们的得分超过群体的总平均分,这个合作的群体就会越来越大,最后蔓延到整个群体。反之,无论不合作者在一个合作者占多数的群体中有多大比例,不合作者都是不可能自下而上的。这就说明,社会向合作进化的棘轮是不可逆转的,群体的合作性越来越大。艾克斯罗德正是以这样一个鼓舞人心的结论,突破了"囚犯困境"的研究困境。

在研究中发现,合作的必要条件是:第一、关系要持续,一次性的或有限次的博弈中,对策者是没有合作动机的;第二、对对方的行为要做出回报,一个永远合作的对策者是不会有人跟他合作的。

那么,如何提高合作性呢?首先,要建立持久的关系,即使是爱情也需要建立婚姻契约以维持双方的合作。(火车站的小贩为什么要骗人?为什么工作中要形成小组制度?换防的时候一方总是要小小地进攻一下的,在中越前线就是这样)第二、要增强识别对方行动的能力,如果不清楚对方是合作还是不合作,就没法回报他了。第三、要维持声誉,说要报复就一定要做到,人家才知道你是不好欺负的,才不敢不与你合作。第四、能够分步完成的对局不要一次完成,以维持长久关系,比如,贸易、谈判都要分步进行,以促使对方采取合作态度。第五、不要嫉妒人家的成功,"一报还一报"正是这样的典范。第六、不要首先背叛,以免担上罪魁祸首的道德压力。第七、不仅对背叛要回报,对合作也要作出回报。第八、不要耍小聪明,占人家便宜。

艾克斯罗德在《合作的进化》一书结尾提出几个结论。第一、友谊不是合作的必要条件,即使是敌人,只要满足了关系持续,互相回报的条件,也有可能合作。比如,第一次世界大战期间,德英两军在战壕战中遇上了三个月的雨季,双方在这三个月中达成了默契,互相不攻击对方的粮车给养,到大反攻时再你死我活地打。这个例子说明,友谊不是合作的前提。第二、预见性也不是合作的前提,艾氏举出生物界低等动物、植物之间合作的例子来说明这一点。但是,当有预见性的人类了解了合作的规律之后,合作进化的过程就会加快。这时,预见性是有用的,学习也是有用的。

当游戏中考虑到随机干扰,即对策者由于误会而开始互相背叛的情形时,吴坚忠博士经研究发现,以修正的"一报还一报",即以一定的概率不报复对方的背叛,和 "悔过的一报还一报",即以一定的概率主动停止背叛。群体所有成员处理随机环境的能力越强,"悔过的一报还一报"效果越好,"宽大的一报还一报"效果越差。

博弈论-艾克斯罗德的贡献与局限性


艾克斯罗德通过数学化和计算机化的方法研究如何突破囚徒困境,达成合作,将这项研究带到了一个全新境界,他在数学上的证明无疑是十分雄辩和令人信服的,而且,他在计算机模拟中得出的一些结论是非常惊人的发现,比如,总分最高的人在每次博弈中都没有拿到最高分。(刘邦和项羽的战争)

艾氏所发现的"一报还一报"策略,从社会学的角度可以看作是一种"互惠式利他",这种行为的动机是个人私利,但它的结果是双方获利,并通过互惠式利他有可能覆盖了范围最广的社会生活,人们通过送礼及回报,形成了一种社会生活的秩序,这种秩序即使在多年隔绝,语言不通的人群之间也是最易理解的东西。比如,哥伦布登上美洲大陆时,与印地安人最初的交往就开始于互赠礼物。有些看似纯粹的利他行为,比如无偿损赠,也通过某些间接方式,比如社会声誉的获得,得到了回报。研究这种行为,将对我们理解社会生活有很重要的意义。

囚徒困境扩展为多人博弈时,就体现了一个更广泛的问题──"社会悖论",或"资源悖论"。人类共有的资源是有限的,当每个人都试图从有限的资源中多拿一点儿时,就产生了局部利益与整体利益的冲突。人口问题、资源危机、交通阻塞,都可以在社会悖论中得以解释,在这些问题中,关键是通过研究,制定游戏规则来控制每个人的行为。

艾克斯罗德的一些结论在中国古典文化道德传统中可以很容易地找到对应,"投桃报李"、"人不犯我,我不犯人"都体现了"tit for tat"的思想。但这些东西并不是最优的,因为"一报还一报"在充满了随机性的现实社会生活里是有缺陷的。对此,孔子在几千年前就说出了"以德报德,以直报怨"这样精彩的修正策略,所谓"直",就是公正,以公正来回报对方的背叛,是一种修正了的"一报还一报",修正的是报复的程度,本来会让你损失5分,现在只让你损失3分,从而以一种公正审判来结束代代相续的报复,形成文明。

但是,艾氏对博弈者的一些假设和结论使其研究不可避免地与现实脱节。首先,《合作的进化》一书暗含着一个重要的假定,即,个体之间的博弈是完全无差异的。现实的博弈中,对策者之间绝对的平等是不可能达到的。一方面,对策者在实际的实力上有差异,双方互相背叛时,可能不是各得1分,而是强者得5分,弱者得0分,这样,弱者的报复就毫无意义。另一方面,即使对局双方确实旗鼓相当,但某一方可能怀有赌徒心理,认定自己更强大,采取背叛的策略能占便宜。艾氏的得分矩阵忽视了这种情形,而这种赌徒心理恰恰在社会上大量引发了零和博弈。因此,程序还可以在此基础上进一步改进。

其次,艾氏认为合作不需预期和信任。这是他受到质疑颇多之处。对策者根据对方前面的战术来制定自己下面的战术,合作要求个体能够识别那些曾经相遇过的个体并且记得与其相互作用的历史,以便作出反应,这些都暗含着"预期"行为。在应付复杂的对策环境时,信任可能是对局双方达成合作的必不可少的环节。但是,预期与信任如何在计算机的程序中体现出来,仍是需要研究的。

最后,重复博弈在现实中是很难完全实现的。一次性博弈的大量存在,引发了很多不合作的行为,而且,对策的一方在遭到对方背叛之后,往往没有机会也没有还手之力去进行报复。比如,资本积累阶段的违约行为,国家之间的核威慑。在这些情况下,社会要使交易能够进行,并且防止不合作行为,必须通过法制手段,以法律的惩罚代替个人之间的"一报还一报",规范社会行为。这是艾克斯罗德的研究对制度学派的一个重要启发。

博弈论-考考文献

经济学高级学术著作《博弈圣经》http://www.caoab.com
Harold W. K.(editor), 1997, Classics in Game theory, Princeton, NJ:Princeton University Press ISBN 0691011931
Myerson, R., 1991, Game Theory: Analysis of Conflict. Cambridge and London: Harvard University Press.
O*****orne, M. and A. Rubinstein,1994,A Course in Game Theory, Cambridge and London: The MIT Press.
Axelrod, Robert: The Evolution of Cooperation, 1985, ISBN 0465021212
Axelrod, Robert: The Complexity of Cooperation - Agent-Based Models of Competition and Collaboration, 1997, ISBN 0691015678
Dixit, Avinash K./ Skeath, Susan: Games of Strategy, 1999, ISBN 0393974219
Eigen, Manfred / Winkler, Ruthild: Das Spiel, 1976, ISBN 3492021514
Hargreaves Heap, Shaun P. / Varoufakis, Yanis: Game Theory - A Critical Text, 2004, ISBN 0415250951
Kelly, Anthony: Decision Making Using Game Theory - An Introduction for Managers, 2003, ISBN 0521814626
Schlee, Welter: Einführung in die Spieltheorie, 2004, ISBN 3528032146

请您先登陆,再发跟帖!