经济与决策方法导论---博弈论.ppt
《经济与决策方法导论---博弈论.ppt》由会员分享,可在线阅读,更多相关《经济与决策方法导论---博弈论.ppt(36页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、经济与管理决策方法经济与管理决策方法导论导论-博弈论博弈论索马里海盗的难题索马里海盗的难题请你按自己的思路来分析并请你按自己的思路来分析并且确定一个决策方案。且确定一个决策方案。全班分几个组讨论这一个案全班分几个组讨论这一个案例,派代表发言,要求有争例,派代表发言,要求有争论。论。决策方法决策方法之一:之一:博弈及其应用博弈及其应用 索马里海盗的难题索马里海盗的难题例题:个海盗抢到了颗宝石,每一颗都一样的大小和价值连城。他例题:个海盗抢到了颗宝石,每一颗都一样的大小和价值连城。他们决定这么分:们决定这么分:第一步,抽签决定自己的号码(、);第一步,抽签决定自己的号码(、);第二步,首先,由号提
2、出分配方案,然后个人进行表决,当且仅当超过第二步,首先,由号提出分配方案,然后个人进行表决,当且仅当超过半数的人同意时,按照他的提案进行分配,否则他将被扔入大海喂鲨鱼;半数的人同意时,按照他的提案进行分配,否则他将被扔入大海喂鲨鱼;第三步,号死后,再由号提出分配方案,然后人进行表决,当且仅当第三步,号死后,再由号提出分配方案,然后人进行表决,当且仅当超过半数的人同意时,按照他的提案进行分配,否则他将被扔入大海喂鲨鱼;超过半数的人同意时,按照他的提案进行分配,否则他将被扔入大海喂鲨鱼;第四步,以此类推。第四步,以此类推。条件:每个海盗都是很聪明的人,都能很理智的判断条件:每个海盗都是很聪明的人,
3、都能很理智的判断得失,从而做出选择。得失,从而做出选择。问题:最后的分配结果如何?问题:最后的分配结果如何?纳什均衡解。纳什均衡解。提示:海盗的判断原则:保命;尽量多得宝石;尽量多杀人。提示:海盗的判断原则:保命;尽量多得宝石;尽量多杀人。海盗分宝石海盗分宝石索马里海盗的难题索马里海盗的难题-猜想猜想一号是危险的一号是危险的二二 5 5号最安全号最安全三三 推理过程:推理过程:从后向前推,如果号强盗都喂了鲨鱼,只剩号和号的话,号一从后向前推,如果号强盗都喂了鲨鱼,只剩号和号的话,号一定投反对票让号喂鲨鱼,以独吞全部金币。所以,号惟有支持号才能定投反对票让号喂鲨鱼,以独吞全部金币。所以,号惟有支
4、持号才能保命。号知道这一点,就会提(,)的分配方案,对号、保命。号知道这一点,就会提(,)的分配方案,对号、号一毛不拔而将全部金币归为已有,因为他知道号一无所获但还是会投号一毛不拔而将全部金币归为已有,因为他知道号一无所获但还是会投赞成票,再加上自己一票,他的方案即可通过。不过,号推知到号的方赞成票,再加上自己一票,他的方案即可通过。不过,号推知到号的方案,就会提出(,)的方案,即放弃号,而给予号和案,就会提出(,)的方案,即放弃号,而给予号和号各一枚金币。由于该方案对于号和号来说比在号分配时更为有利,号各一枚金币。由于该方案对于号和号来说比在号分配时更为有利,他们将支持他而不希望他出局而由号
5、来分配。这样,号将拿走枚金他们将支持他而不希望他出局而由号来分配。这样,号将拿走枚金币。不过,号的方案会被号所洞悉,号并将提出(,币。不过,号的方案会被号所洞悉,号并将提出(,)或(,)的方案,即放弃号,而给号一枚金币,)或(,)的方案,即放弃号,而给号一枚金币,同时给号(或号)枚金币。由于号的这一方案对于号和号(或同时给号(或号)枚金币。由于号的这一方案对于号和号(或号)来说,相比号分配时更优,他们将投号的赞成票,再加上号自号)来说,相比号分配时更优,他们将投号的赞成票,再加上号自己的票,号的方案可获通过,枚金币可轻松落入囊中。这无疑是号己的票,号的方案可获通过,枚金币可轻松落入囊中。这无疑
6、是号能够获取最大收益的方案了!可以看出,这个推理过程就先考虑简化的极端能够获取最大收益的方案了!可以看出,这个推理过程就先考虑简化的极端情况,从而顺藤摸瓜,得出最后的结果。另外,这其实是经济学中的博弈问情况,从而顺藤摸瓜,得出最后的结果。另外,这其实是经济学中的博弈问题,题,号提出的方案就是这种情况下的纳什均衡。号提出的方案就是这种情况下的纳什均衡。海盗分宝石海盗分宝石什么是博弈论:从什么是博弈论:从“囚徒困境囚徒困境”谈起谈起(引例)著名的(引例)著名的“囚徒问题囚徒问题”:一位富翁在家中被杀,财物被盗。警方在一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人甲和乙,并
7、从他们的住处搜出此案的侦破过程中,抓到两个犯罪嫌疑人甲和乙,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯。检察官说,别关在不同的房间进行审讯。检察官说,“由于你们的偷盗罪已有确凿由于你们的偷盗罪已有确凿的证据,所以可以判你们的证据,所以可以判你们1年刑期。但是,我可以和你做个交易。如果年刑期。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,我只判你
8、你单独坦白杀人的罪行,我只判你3个月的监禁,但你的同伙要被判个月的监禁,但你的同伙要被判10年刑。如果你拒不坦白,而被同伙检举,那么你就将被判年刑。如果你拒不坦白,而被同伙检举,那么你就将被判10年刑,他只年刑,他只判判3个月的监禁。但是,如果你们两人都坦白交代,那么,你们都要被个月的监禁。但是,如果你们两人都坦白交代,那么,你们都要被判判5年刑。年刑。”显然最好的策略是双方都抵赖,这样大家都只被判显然最好的策略是双方都抵赖,这样大家都只被判1年。年。但是由于两人处于隔离的情况下无法串供。于是两人都选择坦白的策略但是由于两人处于隔离的情况下无法串供。于是两人都选择坦白的策略以及因此被判以及因此
9、被判5年的结局被称为年的结局被称为“纳什均衡纳什均衡”,也叫非合作均衡。,也叫非合作均衡。因为,每一方在选择策略时都没有因为,每一方在选择策略时都没有“共谋共谋”(串供串供),他们,他们只是选择对自己最有利的策略,而不考虑社会福利只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益。或任何其他对手的利益。甲乙二人合伙盗劫,并且甲乙二人合伙盗劫,并且杀死杀死1人人,警察证据不足,警察证据不足,采用采用隔离隔离各个击破的心理各个击破的心理战术战术囚徒甲不囚徒甲不招招囚徒甲囚徒甲招招囚徒乙不囚徒乙不招招(甲(甲1年,乙年,乙1年)年)(甲判刑甲判刑1年,乙判刑年,乙判刑1年)年)(甲甲0
10、.25年,年,乙乙10年)年)(甲判刑(甲判刑0.25年,乙判刑年,乙判刑10年)年)囚徒乙囚徒乙招招(甲甲10年年,乙乙0.25年年)(甲判刑(甲判刑10年,乙判刑年,乙判刑0.25年)年)(甲甲5年年,乙乙5年年)(甲判刑甲判刑5年乙判刑年乙判刑5年)年)“纳什均衡纳什均衡”对甲来说对甲来说 ,尽管他不知道乙是选择了,尽管他不知道乙是选择了“招招”还是还是“不招不招”,他发现他自,他发现他自己选择己选择“招招”都是比选择都是比选择“不招不招”为好的。因此,为好的。因此,“不招不招”是相对于是相对于“招招”的劣战略,他不会选择劣战略。所以,甲会选择的劣战略,他不会选择劣战略。所以,甲会选择“
11、招招”。博弈的分类及对应的均衡博弈的分类及对应的均衡静静态态动动态态完全完全信息信息完全信息静态博弈;完全信息静态博弈;纳什均衡;纳什均衡;Nash(1950)完全信息动态博弈;完全信息动态博弈;子博弈精炼纳什均衡;子博弈精炼纳什均衡;泽尔腾(泽尔腾(1965)不完全不完全信息信息不完全信息静态博弈;贝不完全信息静态博弈;贝叶斯纳什均衡;叶斯纳什均衡;海萨尼(海萨尼(1967-1968)不完全信息动态博弈,不完全信息动态博弈,精炼贝叶斯纳什均衡;精炼贝叶斯纳什均衡;泽尔腾泽尔腾(1975)Kreps,Wilson(1982),Fudenberg,Tirole(1991)决策方法决策方法之一:之
12、一:博弈及其应用博弈及其应用 对甲来说,尽管他不知道乙是选择了“招”还是“不招”,他发现他自己选择“招”都是比选择“不招”为好的。因此,“不招”是相对于“招”的劣战略,他不会选择劣战略。所以,甲会选择“招”。同样,根据对称性,乙也会选择“招”,结果是甲乙两人都“招”。甲和乙都不会选择劣战略“不招”,称为“剔除劣战略的占优战略均衡”。其中“招”是占优于(优于)“不招”的占优战略。决策方法决策方法之一:之一:博弈及其应用博弈及其应用 囚徒困境博弈虽然简单,但是却体现了非合作博弈的基础,称(招,招)为“纳纳什什均均衡衡”。纳什均衡是局中人策略选择上构成的一种“僵局”,给定其他局中人的选择不变,任何一
13、个局中人的选择是最好的,他也不会改变其策略选择。所以,可以预期(招,招)是甲乙最终完成的稳定的选择。同时囚徒困境也是西方经济学中个个人人理理性性与集集体理性体理性冲突的一个例证。我们可以利用这个道理来分析日常生活中的许多不合作现象决策方法决策方法之一:之一:博弈及其应用博弈及其应用 公共地养羊公共地养羊MAX 养羊数量每只羊产生的效益每只羊产生的效益养羊数量养羊数量类似的例子还有:类似的例子还有:渤海中的鱼愈来愈少了,工业化中的大气及河流渤海中的鱼愈来愈少了,工业化中的大气及河流污染,森林植被的破坏等。解决公共资源过度利用的污染,森林植被的破坏等。解决公共资源过度利用的出路是政府制订相应的规制
14、政策加强管理,如我国政出路是政府制订相应的规制政策加强管理,如我国政府规定海洋捕鱼中,每年有一段时间的府规定海洋捕鱼中,每年有一段时间的“休渔期休渔期”,此时禁止捕鱼,让小鱼苗安安静静地生长,大鱼好好此时禁止捕鱼,让小鱼苗安安静静地生长,大鱼好好地产卵,并对鱼网的网眼大小作出规定,禁用过小网地产卵,并对鱼网的网眼大小作出规定,禁用过小网眼的捕网打鱼,保护幼鱼的生存。又如在三峡库区,眼的捕网打鱼,保护幼鱼的生存。又如在三峡库区,为了保护库区水体环境,关闭了前些年泛滥成灾的许为了保护库区水体环境,关闭了前些年泛滥成灾的许多小造纸厂等。多小造纸厂等。决策方法决策方法之一:之一:博弈及其应用博弈及其应
15、用 决策方法决策方法之一:之一:博弈及其应用博弈及其应用 商店甲高价商店甲高价商店甲降价商店甲降价商店乙高价商店乙高价(甲(甲5万,乙万,乙5万)万)(甲获利甲获利5万,乙获利万,乙获利5万)万)(甲甲8万万,乙乙0.5万万)(甲(甲获利获利8万万,乙,乙获利获利0.5万万)商店乙降价商店乙降价(甲甲0.5万万,乙乙8万万)(甲(甲获利获利0.5万万,乙,乙获利获利8万万)(甲甲1万万,乙乙1万万)(甲获利甲获利1万乙获利万乙获利1万)万)“纳什均衡纳什均衡”囚徒囚徒模型的应用模型的应用:十字路口两个家用电器商店,相同产品,独立定价,双方按高价比:十字路口两个家用电器商店,相同产品,独立定价,
16、双方按高价比双方按低价获利大,但比不上单方降价。本来双方商定按高价,但实际可能单方降价双方按低价获利大,但比不上单方降价。本来双方商定按高价,但实际可能单方降价对甲来说对甲来说 ,尽管他不知道乙是选择了,尽管他不知道乙是选择了“降降”还是还是“不降不降”,他发现他自,他发现他自己选择己选择“降降”都是比选择都是比选择“不降不降”为好的。因此,为好的。因此,“不降不降”是相对于是相对于“降降”的劣战略,他不会选择劣战略。所以,甲会选择的劣战略,他不会选择劣战略。所以,甲会选择“降降”。参与人参与人 playersv一个博弈中的决策主体,他的目的是通过选择行动(或战略)以最大化自己的支付(效用水平
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 经济 决策 方法 导论 博弈论
限制150内