第五讲博弈论ppt课件.ppt
《第五讲博弈论ppt课件.ppt》由会员分享,可在线阅读,更多相关《第五讲博弈论ppt课件.ppt(123页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、 主 要 内 容1.博弈论概述博弈论概述2.完全信息静态博弈完全信息静态博弈3.完全信息动态博弈完全信息动态博弈一博弈论概述一博弈论概述保罗萨缪尔森说:“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致的了解。”人们在日常生活中进行着博弈,与配偶,朋友,陌生人,老板/员工,教授等。类似的博弈也在商业活动、政治和外交事务、战争中进行着在任何一种情况下,人们相互影响以达成彼此有利的协议或者解决争端。博弈论为众多学科提供了分析的概念和方法:经济学和商学,政治科学,生物学,心理学和哲学。1 1与传统微观经济学的比较与传统微观经济学的比较 传统经济学涉及的个人决策,是在给定价格参数传统经济学涉及
2、的个人决策,是在给定价格参数和收入的条件下,追求效用最大化的决策(消费者均和收入的条件下,追求效用最大化的决策(消费者均衡或生产者均衡);个人效用只依赖于自己的选择,衡或生产者均衡);个人效用只依赖于自己的选择,而外在于他人的选择;个人最优选择只是价格和收入而外在于他人的选择;个人最优选择只是价格和收入的函数而不包含其他人选择的函数。的函数而不包含其他人选择的函数。在博弈论看来,个人效用不仅依赖于自己的选择,在博弈论看来,个人效用不仅依赖于自己的选择,而且依赖于他人的选择;个人的最优选择是其他人选而且依赖于他人的选择;个人的最优选择是其他人选择的函数。择的函数。1.11.1与传统微观经济学的比
3、较与传统微观经济学的比较一致性利益最大化原则均衡原则不一致人与人之间的关系-个人理性导致集体非理性-设计协调性机制-满足个人理性前提下达到集体理性信息不完全-委托-代理理论、信号传递与信息筛选模型1.2 博弈论的发展简史博弈博弈思想最早产生于我国古代。思想最早产生于我国古代。早早在在两两千千多多年年的的春春秋秋时时期期,孙孙武武在在孙孙子子兵兵法法中中论论述述的的军军事事思思想想和和治治国国策策略略,就就蕴蕴育育了了丰丰富富和和深深刻刻的的对对策策论论思思想想。孙孙武武的的后后代代孙孙膑膑,为为田田忌忌谋谋划划,巧巧胜胜齐齐王王,这这个个著著名名的的“田田忌忌赛赛马马”,就就是是典典型型的的对
4、对策思想的成功运用。策思想的成功运用。1.2 博弈论的发展简史一、起源法国经济学家奥古斯丁古诺(Augustin Cournot 1838)古诺模型英国经济学家弗朗西斯埃奇沃斯(Francis Edgeworth 1881)伯川德(Bertrand)和斯坦克伯格(Stackelberg)二、早期突破E策墨罗(EZermelo)于1913年对于象棋游戏的研究。证明了象棋游戏总是有解,即在棋盘的任何一种状态,两个参与者中的一个有赢的策略。开创了求解一类博弈的技巧,即后退归纳法三、近代(1)约翰冯诺依曼(John von Neumann)于1928发表的论文(2)1944年,科学家冯诺伊曼和经济学家
5、奥斯卡摩根斯坦合著博弈与博弈与经济行行为的的理理论(The theory of Games and Economic Behaviour)被公认为是博弈论的开山之作。以往的数学是在物理学的基础上发展起来的,描述的是客观世界行为,而经济学研究的对象更像是一场游戏中的参与者,相互之间预期对方的行动,因此,描述、观察研究对象就需要一系列的数学工具,这一套新的数学工具,被他们命名为博弈论。奥斯卡摩根斯坦(Oskar Morgenstern)19021977,生于西里西亚的戈尔利策。1944年加入美国籍。热心于将数学应用于人类的各种战略问题(不管是商业、战争,还是科学研究),以便获得最大利益和尽可能地减
6、少损失。他认为 这些原理也同样适用于哪怕简单得象抛掷硬币这样的游戏,因而提出了对策论(博弈论)。约翰冯诺依曼(John Von Neumann)19031957,美藉匈牙利人。18岁与老师合作发表第一篇数学论文,22岁获数学博士学位。1927年一1929年冯诺依曼相继在柏林大学和汉堡大学担任数学讲师。1931年成为美国普林斯顿大学的第一批终身教授。1933年转到该校的高级研究所,成为最初六位教授之一,并在那里工作了一生 冯诺依曼是普林斯顿大学、宾夕法尼亚大学、哈佛大学、伊斯坦堡大学、马里兰大学、哥伦比亚大学和慕尼黑高等技术学院等校的荣誉博士是美国国家科学院、秘鲁国立自然科学院和意大利国立林且学
7、院等院的院士 1954年任美国原子能委员会委员;1951年至1953年任美国数学会主席。“计算机之父”“博弈论之父”。冯诺依曼和摩根斯坦的贡献1,提出博弈的概念;2,对效用理论给予公理依据;3,零和博弈(Zero-sum Games)的最优解;4,引进博弈论的一种形式,即合作博弈(cooperative Games)博弈论的发展简史四、发展 1、纳什均衡(Nash-Equilibrium)1950年,约翰 纳什(John Nash)引入均衡(解)的概念,即纳什均衡,将博弈论从零和博弈推进到非零和博弈(即参与人会出现双赢或双输的情况)合作博弈中的讨价还价模型定义非合作博弈及证明均衡解的存在纳什获
8、得1994年诺贝尔经济学奖2、子博弈完美纳什均衡和贝叶斯纳什均衡(Subgame-Perfect Nash-Equilibrium;Bayes-Nash Equilibrium)1965年和1975年兰哈德泽尔藤(Reinhard Selten)把纳什均衡推广到动态博弈,并提出子博弈完美纳什均衡;1967-1968年间,约翰海萨尼(John Harsanyi)把纳什思想推广到不完全信息模型,提出贝叶斯均衡;他们与纳什一起分享1994年诺贝尔经济学奖3、不对称信息条件下交易的对策1996年诺贝尔经济学奖获得者詹姆斯莫里斯教授和威廉姆维克瑞教授在20世纪60、70年代提示不对称信息对交易带来的影响
9、,并提出相应对策。4、信息经济2001年诺贝尔经济学奖授予美国乔治阿克尔洛夫教授、迈克尔斯彭斯教授、约瑟夫斯蒂格利茨教授。20世纪70年代他们提示当代信息经济的核心,信息是有价值的。1970年阿克尔洛夫提出旧车市场模型并提出:市场不能解决所有问题,信息是有价值的1973年斯彭斯通过剖析人才市场盛行的造假行为指出人才市场存在用人单位与应聘者之间的信息不对称,造成“劣币”驱逐“良币”现象斯蒂格利茨将信息不对称理论应用于保险和金融市场5 2005年年,以色列经济学家罗伯特-奥曼和美国经济学家托马斯-谢林,因“通过博弈论分析加强了我们对冲突和合作的理解”所作出的贡献而获奖。三、博弈论与诺贝尔经济学奖获
10、得者1994年诺贝尔经济学奖获得者美国人约翰-海萨尼(John C.Harsanyi)和美国人约翰-纳什(John F.Nash Jr.)以及德国人莱因哈德-泽尔腾(Reinhard Selten)获奖理由:在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响。约翰约翰纳什纳什1928年生于美国年生于美国约翰约翰海萨尼海萨尼19201920年生年生于美国于美国莱因哈德莱因哈德泽尔腾,泽尔腾,19301930年生年生于德国于德国1996年诺贝尔经济学奖获得者英国人詹姆斯莫里斯(James A.Mirrlees)和美国人威廉-维克瑞(William Vickrey)获奖
11、理由:前者在信息经济学理论领域做出了重大贡献,尤其是不对称信息条件下的经济激励理论的论述;后者在信息经济学、激励理论、博弈论等方面都做出了重大贡献。詹姆斯詹姆斯莫里斯莫里斯19361936年生于英国年生于英国威廉维克瑞,1914-1996,生于美国2001年诺贝尔经济学奖获得者三位美国学者乔治-阿克尔洛夫(George A.Akerlof)、迈克尔-斯彭斯(A.Michael Spence)和约瑟夫-斯蒂格利茨(Joseph E.Stiglitz)获奖理由:在“对充满不对称信息市场进行分析”领域做出了重要贡献。约瑟夫斯蒂格利茨,1943年生于美国的印第安纳州,1967年获美国麻省理工学院博士头
12、衔,曾担任世界银行的首席经济学家,现任美国哥伦比亚大学经济学教授乔治阿克尔洛夫1940年生于美国的纽黑文,1966年获美国麻省理工学院博士头衔,现为美国加利福尼亚州大学经济学教授。迈克尔斯彭斯1948年生于美国的新泽西,1972年获美国哈佛大学博士头衔,现兼任美国哈佛和斯坦福两所大学的教授。2005年诺贝尔经济学奖获得者以罗伯特奥曼色列经济学家罗伯特奥曼(Robert J.Aumann)和美国经济学家托马斯谢林(Thomas Thomas C.SchellingC.Schelling)获奖原因:“通过博弈论分析加强了我们对冲突和合作的理解”所作出的贡献而获奖。罗伯特奥曼 托马斯谢林 1博弈论在
13、经济学领域中应用最广泛,最博弈论在经济学领域中应用最广泛,最成功;博弈论的许多成果也是借助于经济学的成功;博弈论的许多成果也是借助于经济学的例子来发展引申的例子来发展引申的;2经济学家对博弈论的贡献也越来越大,经济学家对博弈论的贡献也越来越大,特别是在动态分析和不完全信息引入博弈后,特别是在动态分析和不完全信息引入博弈后,例如克瑞普斯,威尔逊都是经济学家例如克瑞普斯,威尔逊都是经济学家;3最根本性的原因是经济学和博弈论的研最根本性的原因是经济学和博弈论的研究模式是一样的,都强调个人理性,即追求给究模式是一样的,都强调个人理性,即追求给定条件下效用最大化。定条件下效用最大化。博弈专家之所以获经济
14、学奖,原因大致有三点:博弈专家之所以获经济学奖,原因大致有三点:博弈论的基本概念 博弈是指一些个人、团队或组织,面对一博弈是指一些个人、团队或组织,面对一定的环境条件,在一定的规则下,同时或先后,定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自从中取得相应结果进行选择并加以实施,各自从中取得相应结果的过程。的过程。博弈论就是描述在这种形势下各方理性地博弈论就是描述在这种形势下各方理性地选择自己的行动所实现的结果,分析各决策主选择自己的行动所实现的结果,分析各决策主体的行为发生相互作用时的决策以及这
15、种决策体的行为发生相互作用时的决策以及这种决策的均衡问题。的均衡问题。例:房地产开发1、A B两个开发商,投资两个开发商,投资1亿;亿;2、如果市场上有两栋房出售,需求大,、如果市场上有两栋房出售,需求大,每栋:每栋:1.4亿;需求小,每栋:亿;需求小,每栋:7千万;千万;如果市场上有一栋房出售,需求大,每如果市场上有一栋房出售,需求大,每栋:栋:1.8亿;需求小,每栋:亿;需求小,每栋:1.1亿;亿;3、开发与不开发。、开发与不开发。8种可能的结果1、需求大,、需求大,A开发,开发,B不开发,则不开发,则A的的利润利润8千万,千万,B的利润为的利润为0;2、需求大,、需求大,A开发,开发,B
16、开发,则开发,则A的利的利润润4千万,千万,B的利润的利润4千万;千万;3、需求大,、需求大,A不开发,不开发,B开发,则开发,则A的的利润利润0,B的利润为的利润为8千万;千万;4、需求大,、需求大,A不开发,不开发,B不开发,利润不开发,利润各为各为05、需求小,、需求小,A开发,开发,B不开发,则不开发,则A的的利润利润1千万,千万,B的利润为的利润为0;6、需求小,、需求小,A开发,开发,B开发,则开发,则A的利的利润润-3千万,千万,B的利润的利润-3千万;千万;7、需求小,、需求小,A不开发,不开发,B开发,则开发,则A的的利润利润0,B的利润为的利润为1千万;千万;8、需求小,、
17、需求小,A不开发,不开发,B不开发,利润不开发,利润各为各为0博弈三要素、信息及博弈均衡(1)局中人()局中人(player):指参加博弈的各个决策个体,):指参加博弈的各个决策个体,既可以是自然人,也可以是团体。局中人都是既可以是自然人,也可以是团体。局中人都是“理性理性”的,即他清楚地了解自己的目标或利益所在,在决的,即他清楚地了解自己的目标或利益所在,在决策时考虑自己的知识(信息)以及对其他局中人策略策时考虑自己的知识(信息)以及对其他局中人策略的期望,总是采取最佳行动(或策略)以实现其支付的期望,总是采取最佳行动(或策略)以实现其支付的最大化。的最大化。虚拟局中人:自然虚拟局中人:自然
18、,是外部随机变量,对所有利益,是外部随机变量,对所有利益主体都无差异。主体都无差异。一般用一般用i=1,n代表参与人,代表参与人,N代表自然代表自然(2)行动与战略行动与战略(actions or strategies)。行动是局中人在博弈的某个时点的决策变量;每行动是局中人在博弈的某个时点的决策变量;每一个局中人的所有可能选择的行动的集合称这该一个局中人的所有可能选择的行动的集合称这该局中人的行动空间(局中人的行动空间(action space);所有局中);所有局中人的行动的一个有序集合称为该博弈的一个行动人的行动的一个有序集合称为该博弈的一个行动组合(组合(action profile)
19、;);ai 表示第表示第i个参与人的一个特定行动;个参与人的一个特定行动;Ai=ai表示可供表示可供i选择的所有行动的集合;选择的所有行动的集合;在在n人博弈中,人博弈中,n个参与人的行动的有序集个参与人的行动的有序集a=(a1,.,ai,.an)称为行动组合称为行动组合 (2)战略战略(strategies)是局中人在所有给定是局中人在所有给定信息集(信息集是局中人在特定时刻进行决策时信息集(信息集是局中人在特定时刻进行决策时所面对的集合)下的行动规则,他规定局中人在所面对的集合)下的行动规则,他规定局中人在什么时候选择什么行动。什么时候选择什么行动。si 表示第表示第i个参与人的一个特定战
20、略;个参与人的一个特定战略;Si=si表示可供表示可供i选择的所有可选择的战略选择的所有可选择的战略集合;集合;在在n人博弈中,人博弈中,n个参与人每人选择一个战个参与人每人选择一个战略,略,n维向量维向量s=(s1,.,si,.sn)称为一个称为一个战略组合战略组合 (3)信息(信息(information):是局中人有关博弈):是局中人有关博弈的知识,特别是有关其他局中人的特征(如策略的知识,特别是有关其他局中人的特征(如策略空间、支付函数等等)和行动的知识。信息集空间、支付函数等等)和行动的知识。信息集(information sets)是局中人在特定时刻进行)是局中人在特定时刻进行决策
21、时,所面对的信息变量值的集合。共同知识决策时,所面对的信息变量值的集合。共同知识(common knowledge)是指)是指“所有局中人知道,所有局中人知道,所有局中人知道所有局人知道,所有局中人知道所有局人知道,”(或信息)。(或信息)。如果局中人的策略选择、支付函数等都是共同知如果局中人的策略选择、支付函数等都是共同知识,则称之为完全信息(识,则称之为完全信息(complete information),否则就是不完全信息(),否则就是不完全信息(incomplete information)(4)支付(支付(pay off):指在一个特定的策略组合下,:指在一个特定的策略组合下,局中人
22、得到的效用水平或期望效用水平。一个局中人的支局中人得到的效用水平或期望效用水平。一个局中人的支付是所有局中人的策略选择的函数,它不仅取决于自己的付是所有局中人的策略选择的函数,它不仅取决于自己的策略选择,而且还取决于(他所设想的)所有其他局中人策略选择,而且还取决于(他所设想的)所有其他局中人的策略选择,任何一个局中人改变自己的策略都将影响其的策略选择,任何一个局中人改变自己的策略都将影响其他局中人的支付水平,即,局中人之间的利益是相互牵制他局中人的支付水平,即,局中人之间的利益是相互牵制的和制约的。所有局中人的支付的一个有序集合称为博弈的和制约的。所有局中人的支付的一个有序集合称为博弈的一个
23、支付组合(的一个支付组合(payoff profile。Ui=Ui(s1,s2,si sn)参与博弈的多个局中人的收益可用一个矩阵或框图表示,参与博弈的多个局中人的收益可用一个矩阵或框图表示,这种矩阵或框图叫做收益矩阵。这种矩阵或框图叫做收益矩阵。(5)博弈均衡博弈均衡(games equilibrium):):是指所有局中人的最优策略组合。是指所有局中人的最优策略组合。S*=(S1*,Si*,Sn*)其中,其中,Si*是第是第i个参与人在均衡情况下的最个参与人在均衡情况下的最优策略,它是优策略,它是i的所有可能的战略中使的所有可能的战略中使Ui或或Eui最大化的战略。最大化的战略。(5)博弈
24、均衡博弈均衡(games equilibrium):):为了把一个特定的参与人与其他参与人相为了把一个特定的参与人与其他参与人相区别,用区别,用那么,说那么,说博弈的类型 根据博弈者选择的策略,博弈论可划分根据博弈者选择的策略,博弈论可划分为合作博弈与非合作博弈。纳什(为合作博弈与非合作博弈。纳什(Nash)、)、泽尔腾(泽尔腾(Selten)和)和豪尔绍尼豪尔绍尼(Harsanyi)()(19941994诺贝尔经济学奖获得者)诺贝尔经济学奖获得者)的主要贡献在于非合作博弈方面,而且现在大的主要贡献在于非合作博弈方面,而且现在大多数经济学家论及博弈时,也主要是指非合作多数经济学家论及博弈时,也
25、主要是指非合作博弈。博弈。合作博弈和非合作博弈的区别在于人们的行动合作博弈和非合作博弈的区别在于人们的行动为相互作用时,当事人能否达成一个具有约束力为相互作用时,当事人能否达成一个具有约束力(binding agreement)的协议。若有,就是合作博)的协议。若有,就是合作博弈;否则就是非合作博弈。弈;否则就是非合作博弈。合作博弈强调的是团体理性、效率、公正和公平。合作博弈强调的是团体理性、效率、公正和公平。非合作博弈强调的是个人理性、个人最优决策,其非合作博弈强调的是个人理性、个人最优决策,其结果可能是有效率的,也可能是无效率的。结果可能是有效率的,也可能是无效率的。从局中人行动的先后顺序
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第五 博弈论 ppt 课件
限制150内