博弈论经典案例.doc
《博弈论经典案例.doc》由会员分享,可在线阅读,更多相关《博弈论经典案例.doc(11页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、【精品文档】如有侵权,请联系网站删除,仅供学习与交流博弈论经典案例.精品文档.重复博弈囚徒困境,砸了传统经济学的场子。因为个人的自利行为,并不一定导致集体利益的最大化,“看不见的手”拉不住,人类向堕落之城下滑的趋势,难道这真是一个悲哀?索性并非如此,撇去博弈论的理性假设不说。博弈论者很快发现囚徒困境只在单次博弈情形下明显,一旦博弈的开始陷入重复,合作将到来。因为,未来的收益将左右目前的决策。以牙还牙重复的博弈理论上导致了合作的产生,但是谁也不能保证合作的继续,因为之前已经说过,合作的代价是建立在损害个人利益基础之上的。如果个人放弃未来收益或当前背叛收益大于未来收益,背叛的风险仍然存在。那么在重
2、复博弈中怎样的策略才是最优。若干睿智而复杂在经过计算机中PK之后,极其原始的“以牙换牙”策略脱颖而出,固然这个策略简单至极,其威力却无穷,以至于人们在短暂的欣喜之后,发现这把太阿指之剑倒持的可怕,一旦重复链条中出现一次(也许不经意的)背叛,那据此原则行事的博弈将永无止境的背叛下去,个人利益极度膨胀的同时,集体利益无限衰微。幸好,这个世界不是模型,也不是如此简单。很多时候,我们不必以牙还牙,第三方的规范:道德与法律就是我们的假牙,他们更加有利、有理、有节。人质困境一场憋屈的博弈。抢打出头鸟,人质联合固然可以制服歹徒,但是谁愿出头。这一点给了无数处于劫持者地位的一方以机会,类似于秦的远交近攻、各个
3、击破的策略,将最终全盘赢下。人质可有反制的策略,当然有,不过艰难至极。人质可以选择沉默,这样他有一定时间苟延残喘;或者联合劫持者对付人质,结局还是取决于劫持者,万一他过河拆桥怎么办;同时反抗,集体将获得左右策略,但是这需要壮士断腕的勇气,部分人可能因此受伤。这里是实力与勇气的较量,而且实力暂居上风。酒吧博弈如果人人理性,那么每一天到达酒吧的人数将是差不多正好的,但是人非圣贤,往往是有限理性的。第一次到酒吧的人多,那么大多人人认为酒吧人太多,太挤。第二次决定的时候,参考前次而不去酒吧。少数去的人发现酒吧的人第二天很少,感觉很爽,第三次将继续回来,并重新带回许多人循环就此开始。酒吧博弈一方面显示,
4、现实的博弈参与者,是极其有限理性的,其理性只前延后伸一小段。历史数据只对计算机有用,对人,则不一定。 另一个方面,酒吧博弈指出,胜利者永远只是少数。尽管酒吧存在调谐的可能,譬如发短信时时提醒,但成本恐怕太高。而在其他场合,少数派可能更加会设置种种障碍阻止后进者的上升。也就是说,我们的世界仍然是操弄在少数派的手中。不过,总算这个世界不是模型,少数派的道路到底还是有迹可循的。老练的将军仍旧会在八卦迷阵中找到唯一的生门。若你想要,必须做一个更加老练的将军。枪手博弈王者的悲哀。三人对枪自决,甲乙丙枪法优劣递减。最后无奈而神奇的结局,将不取决于同时开枪还是先后开枪,最优良的枪手,倒下的概率将最高;而最蹩
5、脚的枪手,存活的希望却最大。因为没有人会把威胁最小的枪手列为一号清楚目标。在这里,后发制人的弱势者将胜出。以弱胜强,绝不是神话。 难道王者的命运就真如此不堪,呵,道别忘了每个理论模型都是有其前提的,击破之中任何一个,王者仍将归来。这就是先发优势。假设这是一场类似CS的竞技,优秀的枪手击倒二号枪手,立刻获得奖励:盾牌。那么三号枪手将陷入绝境。不过,不管怎样,这个博弈模型,到底给了弱势者一份希望。机会永远存在。猎鹿博弈两个猎人合作猎鹿获得的收益将远大于分别猎兔的收益,战略联盟将开始。这或许是件好事,不过有取决于最后猎获的鹿这一公共资源的分配,如果分配得当,整体的效率将增加。如果一方主导,另一方受损
6、,那么帕累托改善无法进行,合作可能终将破裂。 另外一个问题,更加大局的问题。合作的示范性将使得更多的猎人加入,猎获的鹿将大大增加,人类的利益短期内将呈几何级数增长。但是最后,确是生态失衡,鹿群灭群。短暂的繁华之后,猎人将再一次回归于原始猎兔生活。尽管为了避免这一悲剧,人类还有最后的希望:制度经济学的法宝科斯定理以产权归属来解决外部经济问题。但由于谈判成本以及可行性,人类社会的公共悲剧仍将不断上演。智猪博弈混沌之前最后的博弈。小猪和大猪住在猪圈的一边(食槽在这里),开启食物的开关在另一头,谁去踩,谁丧失先机。结果怎样?是小猪选择“搭便车”,大猪勤跑。因为小猪无论跑还是停,大猪的最优策略都是策略都
7、是去踩机关。不过在实际生活中。这里依旧存在两种策略。 小猪的“搭便车”。大猪有的时候,自觉或不自觉地自封“侠之大者,为国为民”,并因此承受一些不能承受之重。博弈论的诡计指出美国战后的行为极似大猪,战后的美国竭力宣传自己的普世价值观,并深入到海外事务,甚至不惜重金协助小国防务。这样小国不自觉地对大国进行了“剥削”。 大猪在击破模型的一个假设之后,仍然有一个后发制人的机会。因为大猪和小猪的耐饿能力不一样,大猪完全有能力撑得更久,小猪如果不想饿死,那只有一条豪赌的路子:龟兔赛跑式的豪赌,但愿大猪打了个盹儿,他回来的时候,还能吃上一两口,要不然真是赔了夫人又折兵了。据此,再也不难解释为什么很多人切齿的
8、腾讯,毫无顾忌地跟风,做QQ旋风,做拍拍,做滔滔。因为不甘心的小猪早早把新技术研发的前期搞定了,大猪们只需要悄悄跟随,适当的时候踢开挡路的,就可以了。 大猪在这里的后发制人和枪手博弈的后发并不一致,枪手后发是建立在他人恶斗的基础上,大猪后发完全是以自身实力为基础。而且大猪完全不必采取任何激进措施,只要跟随就好。因为小猪获胜的条件不是接近,还是距离。警察与小偷令人沮丧的博弈结局。警察和小偷各只有一个机会去巡查或者偷盗A地或B地。A地的价值大于B地,那么警察应该为了保护价值大而一直保护A地吗。博弈论认为当然不是,警察的合理策略应当是有倾向于A以一定概率的随机巡查。这个概率就是:p=A地价值/AB地
9、总价值。这种情况下才能使小偷最大得手几率降至最低。但是很不幸的是,此时的小偷谋求的是,最小得手几率的最大化。也就是说,警察的最优策略将把小偷的最差策略改良!这个便是冯诺伊曼提出的“最小最大定律”。 我们必须再一次感谢这个不完美的世界,因为现实之中,类似的现象,对于一方仍然可以设法找到对手致命的规律性行动(当然必须考虑到对方是不是一个更加老练的猎手,故意放出的诱饵)。而保持自己的行动的无序性,则有可能成为欺骗策略的武器,这倒似张三丰所言道的:无招胜有招。斗鸡博弈两只斗鸡在决斗的时候,无论选择进或退都是一个难题,因为纳什均衡已经给出了一胜一败的最优策略。在很多较量下,死拼将是得不偿失的,因为很可能
10、给第三者机会。因此,两个已经在战场的强势力很可能自觉的遵循纳什均衡,当一方攻击时,另一方暂退。虽然可能某方暂时受损,但较之于两败俱伤是好得多的。不过,要维持这一状况,必须保证下一次先期受损的一方发动攻势的时候,另一方同样的后退。于是这样的攻击性行为开始变得“仪式化”,没有人真正流血。这只不过是两个巨头玩弄的游戏,目的是警告后来者,想进来,那么也得陪我们一起玩,可是你玩的起么?这正是百事的广告,即使暗含挑衅也最多只到“敢为中国红”这样的地步的原因。协和谬误欧洲政府在大量投资协和飞机后,终于不能自拔。即使前景黯淡,也撑着面子投下去,非要走投无路才放弃。而这时投入的成本已经全打水漂了。如果,发现不能
11、继续的时候,就果敢放手,损失会小得多。可是他们会、能这么做么?壮士断腕,是何等的壮烈,却也是何等的艰难! 沉没成本很可能会延续人们无畏的坚持。已经沉没的本该放弃,可惜大部分有赌徒式的心理,相信阿基米德的杠杆终将启动。可惜他们在爬到足够撬动杠杆的支点之前,已经窒息了。 协和谬误,倒是给了人们半途而废的理由,会不会有人担心它的滥觞会左右一些本该坚持的目标?的确有这个可能,但是应该相信人们足够理智,完全可以比较沉没成本、机会成本与未来收益的关系。看清了的,必定会坦然地走出协和谬误。蜈蚣博弈一场颠前倒后的博弈。蜈蚣博弈的机理是以最终的结果倒退至开始。这是一个睿智的策略,因果相报,把握好因缘,自有好结果
12、。它的另一个好处,就是使得未来的计划明晰化,是你不再徘徊。只可惜,很多时候,碌碌无为的我们并没有看透迷局的眼睛。我们黑色的眼睛只习惯于黑夜。 蜈蚣博弈也有一个致命的悖论,仍旧是个人利益和集体利益的冲突,因为最后一次的背叛收益始终优于合作。可悲的是,这一次背叛将由于人性的理智,穿越时光隧道,回到原始的地点:人们将从开始就拒绝合作。还是感谢我们这个不完美的世界吧,事实上人们很少这样做。当然合作到最后的也很少,这意味着,倒推法只在中间阶段突然发生了作用,只不过谁也不能预测,中间一步在哪里。在那里,我们只有冀望信任、道德、良知等等。分蛋糕博弈两个小孩怎么分蛋糕?经典的故事,经典的解答:一个分,一个选。
13、现实多如此,权利与利益的合理分配将有效促进公平与效率。经营权与所有权的分置的确使得经济更加活力。不过分蛋糕的进阶模型却强调了讨价还价的策略,分蛋糕不是一次性的,而是多回合的,而且出现成本:蛋糕在融化。 时间成本的加入,将使得分配变得复杂化。双方如果不能及时达成交易,不仅集体的收益将减量,而且个体的收益也将减少。在此情况下,利用时间成本以及承诺、威胁将对其中一方极其有利。顾客可能迫于情势,必须尽快结束谈判,这时卖方却不慌不忙,故意拖延,顾客一方将不得不在价格上作出妥协。 顾客一方当然也有策略,它的策略就是货比三家,要求承诺或威胁。这个前提是买方市场的存在。顾客还应当保护自己讨价还价的能力,这就是
14、顾客有权投诉商家。鹰鸽博弈这个博弈很多人等同于斗鸡博弈。不过,斗鸡是两个兼具侵略性的个体,鹰鸽却是两个不同群体的博弈,一个和平,一个侵略。在只有鸽子一个苞谷场里,突然加入的鹰将大大获益,并吸引同伴加入。但结果不是鹰将鸽逐出苞谷场,而是一定比例共存,因为鹰群增加一只鹰的边际收益趋零时(鹰群发生内斗),均衡将到来。 由此产生了ESS进化上的稳定策略,也就是说一旦均衡形成,偏离的运动会受到自然选择的打击。也就是鹰群饱满后,再试图加入的鹰将会被鹰群排挤。 进化上的稳定均衡最大的好处莫过于保持稳定。但问题在于形成强势的路径依赖,也就是胜出的不一定是最好的。因为最好的会被当作出头鸟干掉,这是个体的失败,集
15、团的胜利以及集体的止步不前。脏脸博弈恍然大悟的博弈。三个人在屋子里,不许说话。美女进来说:你们当中至少一个人脸是脏的。三人环看,没有反应。美女又说:你们知道吗?三人再看,顿悟,脸都红了。为什么?因为美女后一句废话点破天机,三个人都知道脏脸的存在,而且推测知道对方也知道了脏脸的存在(因为另两人脸没红,说明他们看到脏脸了),而且知道对方知道自己已经想到上一步循环开始,知识开始共同化,真相大白:三个人都是脏脸,所有人都脸红了。 这就是共同知识的作用,它的作用显得有点可怕的强大。几乎是一招无影腿,杀人不见血。在台面上的博弈之前,私下的算计已经置对手于死地。不过,很可能对方也预料到这一点,早也想到这一点
16、,同时杀来。终于,形成双死局面。 当然,现实虽然存在类似现象,不过共同知识更大的作用在于减少交易成本。因为某些规则人尽皆知,双方只要各自依之行事就可以了。信息均衡很显然,信息的作用在博弈之中非常重要。将博弈论还原到现实,人们不再完全理性,信息存在不对称,博弈就需要在抢占信息高地上作出努力。 信息不对称,是一个很大的障碍。信息的不对称会造成“逆向选择”和“道德风险”,前者事前,后者事后。信息不对称短期内对某一方会有利,但最终会破坏整个市场。于是有两个解决策略。信息传递传达你的正面的信息的策略,也就是说吸引顾客走到你的柜台面前。它的要点是保持有效、减低成本。信息甄别诱导对手暴露其私下拥有的真实信息
17、。就是给顾客一个放大镜,保证顾客不会走到其他柜台去。这种策略显然更加有效,不过风险也更大:万一顾客用放大镜看出了了自己的瑕疵怎么办?价格战博弈现在我们经常会遇到各种各样的家电价格大战,彩电大战、冰箱大战、空调大战、微波炉大战这些大战的受益者首先是消费者。每当看到一种家电产品的价格大战,百姓都会“没事儿偷着乐”。在这里,我们可以解释厂家价格大战的结局也是一个“纳什均衡”,而且价格战的结果是谁都没钱赚。因为博弈双方的利润正好是零。竞争的结果是稳定的,即是一个“纳什均衡”。这个结果可能对消费者是有利的,但对厂商而言是灾难性的。所以,价格战对厂商而言意味着自杀。从这个案例中我们可以引伸出两个问题,一是
18、竞争削价的结果或“纳什均衡”可能导致一个有效率的零利润结局。二是如果不采取价格战,作为一种敌对博弈论(vivalry game)其结果会如何呢?每一个企业,都会考虑采取正常价格策略,还是采取高价格策略形成垄断价格,并尽力获取垄断利润。如果垄断可以形成,则博弈双方的共同利润最大。这种情况就是垄断经营所做的,通常会抬高价格。另一个极端的情况是厂商用正常的价格,双方都可以获得利润。从这一点,我们又引出一条基本准则:“把你自己的战略建立在假定对手会按其最佳利益行动的基础上”。事实上,完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”。在这种状态下,每一个厂商或消费者都是按照所有的别人已定的价格来进行决
19、策。在这种均衡中,每一企业要使利润最大化,消费者要使效用最大化,结果导致了零利润,也就是说价格等于边际成本。在完全竞争的情况下,非合作行为导致了社会所期望的经济效率状态。如果厂商采取合作行动并决定转向垄断价格,那么社会的经济效率就会遭到破坏。这就是为什么WTO和各国政府要加强反垄断的意义所在。污染博弈假如市场经济中存在着污染,但政府并没有管制的环境,企业为了追求利润的最大化,宁愿以牺牲环境为代价,也绝不会主动增加环保设备投资。按照看不见的手的原理,所有企业都会从利己的目的出发,采取不顾环境的策略,从而进入“纳什均衡”状态。如果一个企业从利他的目的出发,投资治理污染,而其他企业仍然不顾环境污染,
20、那么这个企业的生产成本就会增加,价格就要提高,它的产品就没有竞争力,甚至企业还要破产。这是一个“看不见的手的有效的完全竞争机制”失败的例证。直到20世纪90年代中期,中国乡镇企业的盲目发展造成严重污染的情况就是如此。只有在政府加强污染管制时,企业才会采取低污染的策略组合。企业在这种情况下,获得与高污染同样的利润,但环境将更好。贸易自由与壁垒这个问题对于刚刚加入WTO的中国而言尤为重要。任何一个国家在国际贸易中都面临着保持贸易自由与实行贸易保护主义的两难选择。贸易自由与壁垒问题,也是一个“纳什均衡”,这个均衡是贸易双方采取不合作博弈的策略,结果使双方因贸易战受到损害。X国试图对Y国进行进口贸易限
21、制,比如提高关税,则Y国必然会进行反击,也提高关税,结果谁也没有捞到好处。反之,如X和Y能达成合作性均衡,即从互惠互利的原则出发,双方都减少关税限制,结果大家都从贸易自由中获得了最大利益,而且全球贸易的总收益也增加了。博弈论经典案例“囚徒困境”及其实证分析 最近三四十年,经济学经历了一场“博弈论革命”,就是引入博弈论的概念和方法改造经济学的思维,推进经济学的研究。诺贝尔经济学奖授予包括美国普林斯顿大学的纳什博士在内的3位博弈论专家,可以看作是一个标志,这自然也激发了人们了解博弈论的热情。博弈论作为现代经济学的前沿领域,已成为占据主流的基本分析工具。博弈论是研究决策主体的行为发生直接相互作用时的
22、决策以及这种决策的均衡,也就是说,当一个主体的选择受到其他主体选择的影响,而且反过来影响到其他主体选择时的决策问题和均衡问题。一个完整的博弈应当包括五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织;第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失。“囚徒困境”“囚徒困境”是博弈论里最经典的例子之一。讲的是两个嫌疑犯(和)作案后被警察抓住,隔离审讯;警方的政策是坦白从宽,抗拒从严,如果两人都坦白则各判年;
23、如果一人坦白另一人不坦白,坦白的放出去,不坦白的判年;如果都不坦白则因证据不足各判年。在这个例子里,博弈的参加者就是两个嫌疑犯和,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。可能出现的四种情况:和均坦白或均不坦白、坦白不坦白或者坦白不坦白,是博弈的结果。和均坦白是这个博弈的纳什均衡。这是因为,假定选择坦白的话,最好是选择坦白,因为坦白判年而抵赖却要判十年;假定选择抵赖的话,最好还是选择坦白,因为坦白判不被判刑而抵赖确要被判刑年。即是说,不管坦白或抵赖,的最佳选择都是坦白。反过来,同样地,不管是坦白还是抵赖,的最佳选择也是坦白。结果,两个人都选择了坦白,各判刑年。在(坦白、坦
24、白)这个组合中,和都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。囚徒困境反映了个人理性和集体理性的矛盾。如果和都选择抵赖,各判刑年,显然比都选择坦白各判刑年好得多。当然,和可以在被警察抓到之前订立一个攻守同盟,但是这可能不会有用,因为它不构成纳什均衡,没有人有积极性遵守这个协定。实证分析:囚犯困境在经济学上有很多应用,也有力地解释了一些经济现象。一电信价格竞争根据我国电信业的实际情况,我们来构造电信业价格战的博弈模型。假设此博弈的参加者为电信运营商A与B, 他们在电信某一领域展开竞争,一开始的价格都是P0。A(中国电信)是老牌企业,实力雄厚,占
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈论 经典 案例
限制150内