第6章_博弈理论专题.ppt
《第6章_博弈理论专题.ppt》由会员分享,可在线阅读,更多相关《第6章_博弈理论专题.ppt(61页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、第六章博弈理论专题,第一节 零和博弈和非零和博弈第二节 相关均衡第三节 重复博弈第四节 消耗战博弈第五节 抢先博弈,第一节 零和博弈和非零和博弈,在零和博弈(Zero-Sum Game)中,博弈一方获益必然意味着博弈另一方的损失,博弈各方的收益和损失相加总和永远为“零”。赌博是典型的零和博弈。与零和博弈不同,在非零和博弈(Non-Zero-Sum Game)中博弈各方的收益总和不是零。博弈一方的收益并不建立在博弈另一方损失的基础上。博弈双方有可能达到“双赢”的结果。,国际贸易早期的重商主义理论认为:国际贸易是零和博弈。贸易顺差国家的福利水平增长建立在贸易逆差国家福利水平下降的基础上。因此,重商
2、主义者认为一个国家应该尽可能的多出口、少进口。亚当 斯密(Adam Smith)指出:财富来自生产领域而非流通领域,基于两国生产技术绝对差异的国际贸易是双赢的,能提高贸易参与国双方的福利水平。因此,政府没有必要干预国际贸易,应该实行自由贸易政策。不管是逆差国家还是顺差国家,都能从国家贸易中受益。,零和博弈和非零和博弈示意图,第二节 相关均衡,相关均衡(Correlated Equilibrium)的概念首先由经济学家罗伯特 奥曼(Robert Aumann)提出。在他发表于 1974 年的文章中,奥曼指出:在相关均衡中,博弈参与者得到的收益可能高于混合策略纳什均衡。例如:考虑如下完全信息静态博
3、弈,在上表所示的完全信息动态博弈中,存在纯策略纳什均衡和混合策略纳什均衡。根据“划横线法”,博弈的两个纯策略纳什均衡:(L,V)和(R,U)。博弈还存在一个混合策略纳什均衡。可以证明:在混合策略纳什均衡中:参与者 1 选择策略 L 的概率为 p = 2/3;参与者 2 选择策略 U 的概率为 q = 2/3;参与者 1 选择策略 L 或策略 R 均能得到收益 14/3;参与者 2 选择策略 U 或策略 V 均能得到收益 14/3。,相关均衡,设计了这样的机制:考虑一个外生随机变量 X,该随机变量 X 可能的取值为1、2、3,且 P(X = 1) = P(X = 2) = P(X = 3) =
4、1/3当随机变量实现取值后:博弈参与者 1 会得到的信息是:X 是否取值是 1。博弈参与者 2 会得到的信息是:X 是否取值是 2。当随机变量 的取值实现后:如果参与者 1 被告知随机变量 X 的值为 1,那么参与者 1 选择策略 R;如果参与者 1 被告知随机变量 X 的值不为 1,那么参与者 1 选择策略 L。如果参与者 2 被告知随机变量 X 的值为 3,那么参与者 2 选择策略 V;如果参与者 2 被告知随机变量 X 的值不为 3,那么参与者 2 选择策略 U。,在这种机制下,参与者 1 和参与者 2 的策略决策不再完全独立。参与者 1 和参与者 2 的决策均和随机变量 X 的取值相关
5、。也就是说:参与者 1 和参与者 2 的策略选择是“相关”的。这种情况下的均衡称为“相关均衡”。,随机变量 X 不同取值情况下的博弈均衡,由于 P(X = 1) = P(X = 2) = P(X = 3) = 1/3博弈参与者 1 的预期收益 5博弈参与者 2 的预期收益 5在相关均衡下,两名博弈参与者的收益均为 5。在混合策略纳什均衡中,博弈双方的收益均为 14/3。因此,在相关均衡中,两名博弈参与者的收益均高于混合策略纳什均衡的收益。在混合策略纳什均衡中,各博弈参与者按照一定的概率分布随机选择自己的策略。然而在相关博弈中,博弈参与者并不是随机选择自己的策略,而是根据随机变量 X 的取值进行
6、策略选择。,性别博弈与相关均衡,根据“划横线法”,可以博弈的两个纯策略纳什均衡:(看足球,看足球)和(听昆曲,听昆曲)。博弈还存在一个混合策略纳什均衡。,性别博弈的支付矩阵,可以证明:在混合策略纳什均衡中:男方选择“看足球”的概率为 p = 2/3;女方选择“看足球”的概率为 q = 2/3;男方选择策略“看足球”或“听昆曲”均能得到收益 2/3;女方选择策略“看足球”或“听昆曲”均能得到收益 2/3。 考虑这样的机制设计每到周末,这对男女朋友通过扔一个均匀硬币来决定各自的策略。如果硬币正面朝上,男方选择“看足球”,女方选择“看足球”。如果硬币反面朝上,男方选择“听昆曲”,女方选择“听昆曲”。
7、,在相关均衡下,两名博弈参与者的收益均为 3/2。在混合策略纳什均衡中,博弈双方的收益均为 2/3。在相关均衡中,两名博弈参与者的收益均高于混合策略纳什均衡的收益。从直观上说,在性别博弈中,相关均衡的推理过程和思维模式比混合策略纳什均衡的推理过程和思维模式更符合人们的习惯,专栏:罗伯特 奥曼简介,罗伯特 奥曼(Robert Aumann)1930 年出生于德国法兰克福,犹太人。1938 年随家人迁往美国纽约,幸运的躲过了纳粹对犹太人的残酷迫害。奥曼 1950 年获得纽约城市学院数学学士学位,1955 年获得麻省理工学院纯数学博士学位,其博士论文研究的是代数拓扑学中的纽结理论(Knot Theo
8、ry)。1956 年,奥曼进入以色列耶路撒冷希伯莱大学任教至今。,现任耶路撒冷希伯来大学理性分析中心教授、纽约州立大学斯坦尼分校经济系和决策科学院教授、以色列数学俱乐部主席、美国经济联合会荣誉会员等。他还担任国际对策论杂志、数理经济学杂志、经济学理论杂志、运筹学数学等多家专业杂志社的编辑。奥曼第一个提出了博弈论中“相关均衡”的概念。在非合作博弈中,相关均衡比传统的纳什均衡更具灵活性。奥曼在“重复博弈”研究领域也做出了杰出贡献。奥曼第一个系统性定义了博弈中的“共同知识”。,奥曼使用博弈论分析犹太法典中的“塔木德难题”,解决了长期悬而未决的遗产分割问题 。奥曼把这篇文章献给了他在战场上死去的儿子萨
9、蒙 (Shlomo)。由于在博弈论领域的突出贡献,奥曼和美国经济学家托马斯 谢林(Thomas Schelling)分享了 2005 年诺贝尔经济学奖。,专栏:“塔木德难题”及奥曼的解决方案,塔木德是一部犹太教经典著作,地位仅次于圣经,是犹太教口传律法汇编。创作于 2 世纪至 6 世纪。整书反映 7 世纪前犹太教的宗教信仰、口传律法、伦理规范和社团生活的历史发展。在塔木德 妇女部 婚书卷里记载了这样一个财产分配的故事。“犹太教规定:一个人死后,他的妻妾有权继承他的财产。假设一个人有三个伴侣:分别是妻子、妾和婢女 。如果这个人的遗产超过 600 金。那么妻子有权要求继承 300 金,妾有权要求得
10、到 200 金,婢女有权要求得到 100 金。如果这个人的财产不足600金,怎样将有限的财产在妻子、妾和婢女之间分配呢?,犹太教规定的分配方案如上表所示,犹太教遗产分配方案,按照惯常的思维方式:当遗产超过 600 金时,妻子可分得 300 金,妾得到 200 金,婢女得到100 金。说明妻子、妾和婢女在继承遗产上享有的权利比例为:3:2:1。那么当遗产不足 600 金时,妻子应得遗产的 3/6;妾应得遗产的 2/6;婢女应得遗产的 1/6。但是塔木德中的分配方案与此直观逻辑不符。怎样解释塔木德中这个与直觉看似相悖的遗产分配方案,成为几千年来学者们十分疑惑的问题。通常将此问题称为“塔木德难题”。
11、,奥曼通过对塔木德的深入阅读,利用现代博弈理论完美的解决了困扰了学者们多年的“塔木德”难题。奥曼在塔木德 损害部 中门卷中找到了这样一个故事:“甲、乙两个人共同抓着一件大衣来到法官面前。如果甲、乙二人都宣称自己拥有这件大衣的全部所有权,那么甲乙两人分别得到这件大衣的二分之一。如果甲宣称自己拥有这件大衣的全部所有权、乙宣称自己拥有这件大衣的二分之一所有权,那么法官将宣判给甲大衣所有权的四分之三,给乙大衣所有权的四分之一”。,根据这个故事,奥曼仔细思索了古代犹太律法原则后,总结出了古代犹太律法的三个原则:第一:仅分割具有争议的财产。对没有争议的财产不予分割。第二:宣称拥有更多财产权力的一方最终得到
12、的收益不少于宣称拥有较少财产权力的一方。第三:对有争议财产进行分配时,当财产诉求者超过两人时,将所有提出财产诉求者按其诉求金额排序。最小者自成一组,剩下所有诉求者组成另一组,争议财产在两组间公平分配。根据这样的分配原则,可以解释对争执大衣的分配原则。,明确了“大衣分配原则”后,即可将这种思路应用于解决“塔木德难题”。在“塔木德难题”中,如果遗产仅有 100 金,由于妻子、妾和婢女都宣称有权力得到这 100 金。因此,将这 100 金平均分配。妻子、妾和婢女均得到 33.3 金。,如果遗产有 200 金,那么由于婢女宣称自己只拥有 100 金的继承权,因此剩余的 100 金已经可以明确分配给妻子
13、和妾。将妻子和妾看成一个整体,不妨称为“妻妾集团”。“妻妾集团”需要与婢女分割婢女宣称自己有权继承的那 100 金。由于婢女和“妻妾集团”均宣称拥有这100金的继承权。因此婢女和“妻妾集团”各得 50 金。婢女的财产继承结束。“妻妾集团”此时总共拥有 150 金。由于妻子和妾都宣称拥有这 150 金的继承权,因此这 150 金在妻子和妾之间平均分配,每人得到 75 金。因此当遗产为 200 金时,分配结果为:妻子得到 75 金,妾得到 75 金,婢女得到 50 金。,如果遗产有 300 金,那么由于婢女宣称自己只拥有 100 金的继承权,因此剩余的 200 金已经可以明确分配给妻子和妾。“妻妾
14、集团”需要与婢女分割婢女宣称自己有权继承的那 100 金。婢女和“妻妾集团”各得50金。婢女的财产继承结束。“妻妾集团”此时总共拥有 250 金。由于妾宣称自己拥有 200 金的继承权,因此其中 50金可以明确分配给妻子。妻子和妾只需要分割妾宣称自己有权继承的那 200 金。妻子和妾各得100 金。妾的财产继承结束。妻子总计得到 150 金。因此当遗产为 300 金时,分配结果为:妻子得到 150 金,妾得到 100 金,婢女得到 50 金。,根据“大衣分配原则”中的犹太律法思想,通过利用现代博弈的观点,奥曼解决了困扰学者多年的“塔木德难题”。“塔木德”难题的成功破解一方面显示了现代博弈理论的
15、强大解释力和奥曼的高超技巧,另一方面也揭示出古代犹太民族的智慧深度和精湛思维。,第三节 重复博弈,重复博弈(Repeated Game)是一类特殊的完全信息动态博弈。在重复博弈中存在一个重复多次的基础博弈(Base Game)。基础博弈又常被称为阶段博弈(Stage Game)。基础博弈被重复有限次的博弈称为有限次重复博弈。相应的,基础博弈被重复无限次的博弈称为无限次重复博弈或无穷次重复博弈。与重复博弈相对应,非重复博弈也常被称为单一阶段博弈(Single Stage Game)或单次博弈(Single Shot Game)。单次博弈、有限次重复博弈、无限次重复博弈的求解思路和均衡往往存在很大
16、区别。,一、有限次重复博弈,“锤头、剪刀、布”博弈的支付矩阵,“锤头、剪刀、布”博弈没有纯策略纳什均衡,但存在一个混合策略纳什均衡。,如果将“锤头、剪刀、布”博弈从博弈一次转化为博弈多次。即博弈参与者进行多轮相同的博弈。在每次博弈中,博弈参与者的策略是否会发生变化呢?定理:在有限次重复博弈中,如果单次博弈为零和博弈,那么增加博弈次数不会改变博弈均衡。简单重复多次“锤头、剪刀、布”博弈,不会改变两名博弈参与者的策略选择。两名博弈参与者在每次博弈中,都按照单次博弈的混合策略纳什均衡行动。,“囚徒困境”博弈的纯策略纳什均衡:(坦白、坦白)。,“囚徒困境”博弈的支付矩阵,定理:在有限次重复博弈中,如果
17、单次博弈存在唯一的纯策略纳什均衡,则有限次重复博弈的唯一均衡是:各博弈参与者在每阶段都采用该纯策略纳什均衡中的策略 。有限次重复博弈不过是一次性博弈的简单重复。由于(坦白、坦白)是“囚徒困境”博弈唯一的纯策略纳什均衡,因此在任意有限次重复博弈“囚徒困境”中,两名嫌疑人每次博弈都必然选择“坦白”策略。,二、连锁超市悖论,莱茵哈德 泽尔滕(Reinhard Selten)1978 年发表了著名的“连锁超市悖论(The Chain Store Paradox)”。假设市场中有一个连锁超市,不妨称其为博弈参与者 A。连锁超市在 20 个城市中有自己的店面。将这 20 个城市进行编号,分别记为 1,2,
18、20。在每一个城市都有一个潜在的进入者。潜在进入者逐渐积累资本。只有当潜在进入者积累的资本达到一定数量时,潜在进入者才有可能进入市场。,不妨将城市 k 中的潜在进入者称为博弈参与者 k,k = 1,2,20 。因此,博弈共有 21 个参与者:连锁超市(参与者 A)和 20 个潜在进入者。在初始时,假设 20 个潜在进入者都没有足够的资本进入市场。但随着时间的推移,潜在进入者积累的资本逐渐增多。假设城市 1 的潜在进入者将首先积累到足够的资本额进入市场,其次是城市 2 中的潜在进入者,最后是城市20中的潜在进入者。,当城市 k 中的潜在进入者积攒了足以进入市场的资本后,他有两个策略选择:“进入”
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈 理论 专题
限制150内