《经济博弈论课件.pptx》由会员分享,可在线阅读,更多相关《经济博弈论课件.pptx(26页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、1.3 1.3 公理系公理系 第一章第一章 决策论基础知识决策论基础知识1.2 1.2 决策理论的基本概念决策理论的基本概念 1.1 1.1 博弈论、理性和智能性博弈论、理性和智能性 1.4 1.4 期望效用最大化定理期望效用最大化定理 1.5 1.5 贝叶斯条件概率系贝叶斯条件概率系 1.6 1.6 贝叶斯模型的局限性贝叶斯模型的局限性 1.7 1.7 占优占优 1.1 1.1 博弈论、理性和智能性博弈论、理性和智能性 博弈论(博弈论(Game theoryGame theory)可以被定义为是对智能的理性)可以被定义为是对智能的理性 决决策者之间冲突与合作的数学模型的研究。策者之间冲突与合
2、作的数学模型的研究。博弈论为分析那些涉及两个或更多个参与者且其决策会影响博弈论为分析那些涉及两个或更多个参与者且其决策会影响相互间的福利的局势提供了一般的数学方法。相互间的福利的局势提供了一般的数学方法。近代博弈论始于策墨洛(近代博弈论始于策墨洛(Zermelo,1913Zermelo,1913)、波雷尔()、波雷尔(Borel,1921Borel,1921)、冯)、冯.诺依曼(诺依曼(Von Neumann,1928Von Neumann,1928)与摩根斯)与摩根斯特恩(特恩(Morgenstern,1944Morgenstern,1944)合著的伟大的奠基性著作。)合著的伟大的奠基性著作
3、。博弈论方面的许多早期著作都是在第二次世界大战期间在普博弈论方面的许多早期著作都是在第二次世界大战期间在普林斯顿完成的。林斯顿完成的。1.1 1.1 博弈论、理性和智能性博弈论、理性和智能性 在博弈论的语言中,一个博弈(在博弈论的语言中,一个博弈(GameGame)指的是设计到)指的是设计到 两两个或更多个参与人的某个社会局势。个或更多个参与人的某个社会局势。博弈所涉及的参与人被称为局中人(博弈所涉及的参与人被称为局中人(PlayersPlayers)。正如前面博)。正如前面博弈论的定义所述,博弈理论家一般要对局中人做两个基本假弈论的定义所述,博弈理论家一般要对局中人做两个基本假设:他们都是理
4、性的和智能的设:他们都是理性的和智能的如果一个决策者在追逐其目标时能前后一致的做决策,我如果一个决策者在追逐其目标时能前后一致的做决策,我们就称他是理性的(们就称他是理性的(rationalrational)在基于决策理论的基本结论而建立起来的博弈论中,我在基于决策理论的基本结论而建立起来的博弈论中,我 们假设每个局中人的目标是最求其个人期望支付值的最们假设每个局中人的目标是最求其个人期望支付值的最 大化,支付则是用某个效用(大化,支付则是用某个效用(utilityutility)尺度来衡量的。)尺度来衡量的。1.1 1.1 博弈论、理性和智能性博弈论、理性和智能性 借助于理性决策者应该如何行
5、动方面所做的一些非常弱借助于理性决策者应该如何行动方面所做的一些非常弱 的假设,冯的假设,冯.诺依曼和摩根斯特恩(诺依曼和摩根斯特恩(19471947)证明了,对任)证明了,对任 一理性决策者,一定存在某种方式对他所关心的各种可一理性决策者,一定存在某种方式对他所关心的各种可 能结果赋予效用数值,使其总是选择最大化自己的期望能结果赋予效用数值,使其总是选择最大化自己的期望 效用。我们成这一结论为期望效用最大化定理(效用。我们成这一结论为期望效用最大化定理(Expected-utility maximization theoremExpected-utility maximization the
6、orem)。)。在证明效用最大化定理成立的过程中,关键的假设是肯在证明效用最大化定理成立的过程中,关键的假设是肯 定性(定性(sure-thingsure-thing)或替代性()或替代性(substitutionsubstitution)公理:如)公理:如 果偏好选项果偏好选项1 1胜于选项胜于选项2 2,那么就有,他在知道事件,那么就有,他在知道事件A A无无 论发生还是不发生之前都应该偏好选项论发生还是不发生之前都应该偏好选项1 1胜于选项胜于选项2 2。1.1 1.1 博弈论、理性和智能性博弈论、理性和智能性 当我们像博弈论专家或社会科学家那样分析一个博当我们像博弈论专家或社会科学家那
7、样分析一个博弈时,如果局中人知道我们对此博弈所知道的一起,弈时,如果局中人知道我们对此博弈所知道的一起,并能做出我们对此局势所能做出的一切推断,我们并能做出我们对此局势所能做出的一切推断,我们就说此博弈的局中人时智能的(就说此博弈的局中人时智能的(IntelligentIntelligent)。)。博弈论一般都假设局中人在上述意义上是智能的,博弈论一般都假设局中人在上述意义上是智能的,因此如果我们研究出一个能描述某个博弈中智能局因此如果我们研究出一个能描述某个博弈中智能局中人行为的理论,并且我们相信这一理论是正确的,中人行为的理论,并且我们相信这一理论是正确的,那么我们也必须假设该博弈的每个局
8、中人都了解这那么我们也必须假设该博弈的每个局中人都了解这一理论及其预测。一理论及其预测。1.1 1.1 博弈论、理性和智能性博弈论、理性和智能性 对于仅假设理性而不假设智能性的理论,可以考虑对于仅假设理性而不假设智能性的理论,可以考虑经济学中的价格理论这一例。在价格理论的一般均衡经济学中的价格理论这一例。在价格理论的一般均衡模型中,假定每个个体都是追求效用最大化的理性决模型中,假定每个个体都是追求效用最大化的理性决策者,但并不假定他们像价格理论家那样对经济模型策者,但并不假定他们像价格理论家那样对经济模型的全波结构有所了解。在价格理论模型(的全波结构有所了解。在价格理论模型(price-pri
9、ce-theoretic modelstheoretic models)中,个体只观察某些中间价格信)中,个体只观察某些中间价格信号并且对此做出反映,并且假定每个个体都相信,他号并且对此做出反映,并且假定每个个体都相信,他可以在这些价格上交易任意数量而不管这个经济系统可以在这些价格上交易任意数量而不管这个经济系统中是否有人实际上愿意与其做交易。中是否有人实际上愿意与其做交易。1.2 1.2 决策理论的基本概念决策理论的基本概念 贝叶斯理论概述:贝叶斯理论概述:贝叶斯理论概述:贝叶斯理论概述:贝叶斯理论的主要观点时将参数贝叶斯理论的主要观点时将参数u u看作随机变量,并具有看作随机变量,并具有反
10、映实验前关于反映实验前关于u u所有信息的先验分布,而在得到样本所有信息的先验分布,而在得到样本 后,由后,由X X与先验分布得到与先验分布得到u u的后验分布,对的后验分布,对u u所作的任何统计推断必须依据所作的任何统计推断必须依据u u的后验分布,因为后验分布的后验分布,因为后验分布包含了参数包含了参数u u的所有信息。的所有信息。贝叶斯理论可以简单的表示为:贝叶斯理论可以简单的表示为:其中:其中:为后验密度函数;为后验密度函数;为先验密度函数;为先验密度函数;为为样本密度函数,称之为似然函数。样本密度函数,称之为似然函数。1.2 1.2 决策理论的基本概念决策理论的基本概念 博弈论的逻
11、辑根源在于贝叶斯理论(博弈论的逻辑根源在于贝叶斯理论(Bayesian decision Bayesian decision therothero)。事实上,博弈论可以看作是决策理论(对两个或)。事实上,博弈论可以看作是决策理论(对两个或两个以上决策者情形)的一种推广,或者作为决策理论在本两个以上决策者情形)的一种推广,或者作为决策理论在本质上的逻辑完备。因此,要理解博弈论的根本思想,就应该质上的逻辑完备。因此,要理解博弈论的根本思想,就应该从研究决策理论开始。从研究决策理论开始。任何一个理性决策者的行为应该都可以用一个能给出其对任何一个理性决策者的行为应该都可以用一个能给出其对结果或彩金偏好
12、的定量刻划的效用函数(结果或彩金偏好的定量刻划的效用函数(utility functionutility function),),和一个能刻划其对所有相关位置因素的主观概率分布和一个能刻划其对所有相关位置因素的主观概率分布(subjective probability distributionsubjective probability distribution)来描述。)来描述。1.2 1.2 决策理论的基本概念决策理论的基本概念 不确定性下的决策通常是用下述两个模型之一来描述:不确定性下的决策通常是用下述两个模型之一来描述:概率模型(概率模型(probability modelprobab
13、ility model)和状态变量模型()和状态变量模型(state-variable modelstate-variable model)在每一模型中,我们所说的决策者都是在彩票(在每一模型中,我们所说的决策者都是在彩票(lotterieslotteries)中进行选择的人。)中进行选择的人。两者的区别在于其对彩票的定义不同:在概率模型两者的区别在于其对彩票的定义不同:在概率模型 中,彩票是彩金的概率分布;而在状态变量模型中中,彩票是彩金的概率分布;而在状态变量模型中 ,彩票是从可能状态集到彩金集的函数。,彩票是从可能状态集到彩金集的函数。1.2 1.2 决策理论的基本概念决策理论的基本概念
14、 概率模型适用于描述彩金依赖于具有明显客观规律的事概率模型适用于描述彩金依赖于具有明显客观规律的事件这一赌博,我们称这样的事件为客观未知。件这一赌博,我们称这样的事件为客观未知。Eg:Eg:安斯库姆安斯库姆和奥曼(和奥曼(19631963)的)的“轮盘彩票轮盘彩票”(roulette lotteriesroulette lotteries)、奈特)、奈特(knight,1921knight,1921)的)的“风险(风险(risksrisks)”另外,很多事件不具有明显的概率;一个未来运动赛事的另外,很多事件不具有明显的概率;一个未来运动赛事的结果或者股票市场未来的行情都是很好的例子,我们称这类
15、结果或者股票市场未来的行情都是很好的例子,我们称这类事件为主观未知(事件为主观未知(subjective unknownssubjective unknowns)事件。安斯库姆和)事件。安斯库姆和奥曼(奥曼(19631963)的)的“轮盘彩票轮盘彩票”(roulette lotteriesroulette lotteries)或奈特)或奈特(knight,1921knight,1921)的)的“不确定性不确定性”都相当于是依赖主观未知事都相当于是依赖主观未知事件的赌博。件的赌博。1.2 1.2 决策理论的基本概念决策理论的基本概念 这里给出一些基本的符号:对于一个有限集这里给出一些基本的符号:
16、对于一个有限集Z Z,用,用 表表示集上的概率分布集,即示集上的概率分布集,即(按照常规的集合记号,上述大括号中的(按照常规的集合记号,上述大括号中的“”表示表示“使得使得”)令令X X表示决策者最终可能获得的彩金(表示决策者最终可能获得的彩金(prizesprizes)所组成的集;)所组成的集;令令 表示可能的状态(表示可能的状态(statesstates)所组成的集,其中之一将是世)所组成的集,其中之一将是世界真实状态(界真实状态(true state of the worldtrue state of the world)。为了简化数学,我)。为了简化数学,我们假定们假定 和和 两者都是
17、有限集。两者都是有限集。1.2 1.2 决策理论的基本概念决策理论的基本概念 我们将彩票定义为某个函数我们将彩票定义为某个函数 ,对,对 中的每个彩金中的每个彩金 和和 中的每个状态中的每个状态 ,都给出一个非负实数都给出一个非负实数 ,使得对,使得对 中的每个中的每个 都有都有 。令。令L L表示所有这表示所有这样的彩票所组成的集合,就是样的彩票所组成的集合,就是对对 中的任一状态中的任一状态 和和L L中的任一彩票中的任一彩票 ,表示在状态表示在状态 下由下由 确定的确定的X X上的概率分布,即:上的概率分布,即:1.2 1.2 决策理论的基本概念决策理论的基本概念 我们所说的彩金(我们所
18、说的彩金(prizeprize)可以是任何的商品组合或资源配)可以是任何的商品组合或资源配置。我们假定,定义置。我们假定,定义X X中的彩金时已经使得这些彩金是互不中的彩金时已经使得这些彩金是互不相同的,且穷尽了决策者各种决策的可能。相同的,且穷尽了决策者各种决策的可能。决策者关于世界真实状态可能拥有的信息可以用一个事件决策者关于世界真实状态可能拥有的信息可以用一个事件(eventevent)来描述,每个事件都是)来描述,每个事件都是 的一个非空子集。我们用的一个非空子集。我们用 表示所有事件组成的集,则表示所有事件组成的集,则1.2 1.2 决策理论的基本概念决策理论的基本概念 对于对于L
19、L中的任意两个彩票中的任意两个彩票 和和 ,以及,以及 中的任一事件中的任一事件S S,当且仅当,如果决策者知道了世界真实状态在当且仅当,如果决策者知道了世界真实状态在S S中,则对他中,则对他来说,来说,至少是和至少是和 一样的理想选择的时候,我们才写作一样的理想选择的时候,我们才写作 这就是说,当且仅当决策者在只知道事件这就是说,当且仅当决策者在只知道事件S S已经发已经发生而又必须在生而又必须在 和和 之间择一时,选择了彩票之间择一时,选择了彩票 ,才有,才有 给定这个关系给定这个关系 ,我们可以定义关系,我们可以定义关系()()和和 为为1.3 1.3 公理系公理系 1.3 1.3 公
20、理系公理系 1.3 1.3 公理系公理系 1.4 1.4 期望效用最大化定理期望效用最大化定理 上的一个条件概率函数(上的一个条件概率函数(conditional-probability conditional-probability functionfunction)时任何一个这样的函数)时任何一个这样的函数 ,它能对,它能对 中的每个状态中的每个状态t t和事件和事件S S都具体指定非负的条件概率都具体指定非负的条件概率且使得且使得给定任一这样的条件概率函数,我们可以写给定任一这样的条件概率函数,我们可以写 一个效用函数(一个效用函数(utility functionutility fun
21、ction)可以是从)可以是从 到实数到实数集集R R的任一函数。对于效用函数的任一函数。对于效用函数 ,当且仅当它实际,当且仅当它实际上不依赖于状态,于是就存在某个函数上不依赖于状态,于是就存在某个函数 使得对所有使得对所有的的x x和和t t都有都有 时,时,u u才被称为是状态独立的。才被称为是状态独立的。1.4 1.4 期望效用最大化定理期望效用最大化定理 这就是我们所说的期望效用最大化定理这就是我们所说的期望效用最大化定理1.4 1.4 期望效用最大化定理期望效用最大化定理 1.5 1.5 贝叶斯条件概率系贝叶斯条件概率系 我们定义有限集我们定义有限集 上的一个贝叶斯条件概率系上的一
22、个贝叶斯条件概率系(Bayesian conditional-probability systemBayesian conditional-probability system)或简称为条或简称为条件概率系(件概率系(conditional-probability systemconditional-probability system)为为 上满足贝叶上满足贝叶斯公式的任何一个条件概率函数斯公式的任何一个条件概率函数p p。也就是说,如果。也就是说,如果p p是是 上的一个贝叶斯条件概率系,则对上的一个贝叶斯条件概率系,则对 的每一个非空子集的每一个非空子集S S,都是都是 上的一个概率分布
23、,使得上的一个概率分布,使得 ,且,且1.6 1.6 贝叶斯模型的局限性贝叶斯模型的局限性对于从公理系推倒出来的效用最大化定理,对于从公理系推倒出来的效用最大化定理,一个理性偏好的人从直觉上来看似乎是合情合一个理性偏好的人从直觉上来看似乎是合情合理的。但决策方面的实验研究已经揭示了一些理的。但决策方面的实验研究已经揭示了一些系统背离期望效用最大化的行为,例如:系统背离期望效用最大化的行为,例如:效用函数函数不适合:效用函数函数不适合:M.M.阿拉依斯提出的著名悖论阿拉依斯提出的著名悖论 主观概率不适用:主观概率不适用:参看卡尼曼和特弗斯基(参看卡尼曼和特弗斯基(19791979)任何经济模型都
24、不适用:任何经济模型都不适用:参看卡尼曼参看卡尼曼.斯洛维克和特斯洛维克和特弗斯基(弗斯基(19821982)1.6 1.6 贝叶斯模型的局限性贝叶斯模型的局限性期望效用最大化的解释力可以通过凸动扰动期望效用最大化的解释力可以通过凸动扰动(salient perturbationssalient perturbations)分析而扩展到许多貌似矛)分析而扩展到许多貌似矛盾的情形分析。某给定决策问题的一个扰动就是任何盾的情形分析。某给定决策问题的一个扰动就是任何另一个(在某种意义上)与之非常相似的决策问题。另一个(在某种意义上)与之非常相似的决策问题。对任何一个给定的决策问题,如果实际面临这个决
25、策对任何一个给定的决策问题,如果实际面临这个决策问题的人很可能会采取其在某个扰动决策问题中一样问题的人很可能会采取其在某个扰动决策问题中一样的行动,我们就说这个扰动是凸出的。当然们发现决的行动,我们就说这个扰动是凸出的。当然们发现决策问题难以理解而且扰动情形又与他们通常体验的情策问题难以理解而且扰动情形又与他们通常体验的情形很相像时,这个决策问题的特定扰动可能也是凸出形很相像时,这个决策问题的特定扰动可能也是凸出的。如果我们能对个人决策问题的凸出扰动进行预测,的。如果我们能对个人决策问题的凸出扰动进行预测,那么在这个凸出扰动中最大化他期望效用的决策可能那么在这个凸出扰动中最大化他期望效用的决策
26、可能会时对其行为的一个准确预测。会时对其行为的一个准确预测。1.7 1.7 占优占优有时决策者发现主观概率难以确定,无论决策者的信有时决策者发现主观概率难以确定,无论决策者的信念是什么,某些决策选择对他来说都不可能是最优的。念是什么,某些决策选择对他来说都不可能是最优的。在由决策理论转向博弈论之前,我们在这里介绍一些在由决策理论转向博弈论之前,我们在这里介绍一些能说明何时这种与概率无关的论断会成立的基本结论。能说明何时这种与概率无关的论断会成立的基本结论。凸性是许多数理经济学中出现的集合的一个重要特征。凸性是许多数理经济学中出现的集合的一个重要特征。一个向量集是凸的(一个向量集是凸的(conv
27、exconvex),其充要条件:),其充要条件:对于任意两个向量对于任意两个向量p p和和q q以及以及0 0与与1 1之间的任一数字之间的任一数字 ,若若p p和和q q都在这个向量集中,则向量都在这个向量集中,则向量 也一也一定在这个集合中。从几何意义上说,凸性意味着连接定在这个集合中。从几何意义上说,凸性意味着连接集合内任意两点的整个线段也都一定包含于此集之中。集合内任意两点的整个线段也都一定包含于此集之中。定理定理1.5 1.5 若给定若给定 和和X X中的中的y y,则,则 中使得中使得y y为为最优的所有最优的所有p p所组成的集合是个凸集。所组成的集合是个凸集。凸性是许多数理经济
28、学中出现的集合的一个重要特征。一个凸性是许多数理经济学中出现的集合的一个重要特征。一个向量集是凸的(向量集是凸的(convexconvex),其充要条件:),其充要条件:对于任意两个向量对于任意两个向量p p和和q q以及以及0 0与与1 1之间的任一数字之间的任一数字 ,若,若p p和和q q都都在这个向量集中,则向量在这个向量集中,则向量 也一定在这个集合中。也一定在这个集合中。从几何意义上说,凸性意味着连接集合内任意两点的整个线段从几何意义上说,凸性意味着连接集合内任意两点的整个线段也都一定包含于此集之中。也都一定包含于此集之中。1.7 1.7 占优占优一般地,一个随机策略(一般地,一个
29、随机策略(randomized strategyrandomized strategy)就是决策)就是决策选择集选择集X X上地任一概率分布。通常我们用上地任一概率分布。通常我们用 表示这样地表示这样地一个随机策略,其中一个随机策略,其中 表示选取表示选取x x的概率。给定效用函数的概率。给定效用函数 ,我们说,我们说X X中地一个决策选择中地一个决策选择y y因因 中的一个随机中的一个随机策略策略 而成为强劣的,当且仅当而成为强劣的,当且仅当定理定理1.6 1.6 若给定若给定 ,其中,其中X X和和 都是非空有限集,都是非空有限集,且给定且给定X X中任一中任一y y,则在,则在 中存在一个随机策略中存在一个随机策略 使得使得y y在条件在条件(*)的意义上由)的意义上由 为强劣策略的充分必要条件是,在为强劣策略的充分必要条件是,在 中不中不存在任何一个概率分布使得存在任何一个概率分布使得y y在条件在条件 的的意义上是最优的。意义上是最优的。1.7 1.7 占优占优
限制150内