欢迎来到得力文库 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
得力文库 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    不完全信息动态博弈精.ppt

    • 资源ID:59799797       资源大小:233KB        全文页数:20页
    • 资源格式: PPT        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    不完全信息动态博弈精.ppt

    不完全信息动态博弈精不完全信息动态博弈精第七讲 不完全信息动态博弈n n n n 不完全信息动态博弈不完全信息动态博弈不完全信息动态博弈不完全信息动态博弈(或动态贝叶斯博弈或动态贝叶斯博弈或动态贝叶斯博弈或动态贝叶斯博弈)的基本特征是的基本特征是的基本特征是的基本特征是n n参与人的行动是序贯的,有先有后,与完全信息动态博参与人的行动是序贯的,有先有后,与完全信息动态博参与人的行动是序贯的,有先有后,与完全信息动态博参与人的行动是序贯的,有先有后,与完全信息动态博n n弈相比,其中的私人信息可能表现在支付函数上,也可弈相比,其中的私人信息可能表现在支付函数上,也可弈相比,其中的私人信息可能表现在支付函数上,也可弈相比,其中的私人信息可能表现在支付函数上,也可n n能表现在行动的选择上。能表现在行动的选择上。能表现在行动的选择上。能表现在行动的选择上。n n 一、完美贝叶斯一纳什均衡n n(一一一一)、多节点信息集和不完美信息动态博弈的表、多节点信息集和不完美信息动态博弈的表示示n n 用博弈树表示完全且完美信息的动态博弈,其中博弈树上用博弈树表示完全且完美信息的动态博弈,其中博弈树上用博弈树表示完全且完美信息的动态博弈,其中博弈树上用博弈树表示完全且完美信息的动态博弈,其中博弈树上n n的每个节点就是一个独立的决策节,表示参与人在该时点对此前的每个节点就是一个独立的决策节,表示参与人在该时点对此前的每个节点就是一个独立的决策节,表示参与人在该时点对此前的每个节点就是一个独立的决策节,表示参与人在该时点对此前n n的博弈过程有完全的了解。的博弈过程有完全的了解。的博弈过程有完全的了解。的博弈过程有完全的了解。n n 而在不完全信息动态博弈中,而在不完全信息动态博弈中,而在不完全信息动态博弈中,而在不完全信息动态博弈中,“自然自然自然自然”首先选择参与人的类首先选择参与人的类首先选择参与人的类首先选择参与人的类n n型,相应的参与人知道自己的类型,其他参与人不知道;在自然型,相应的参与人知道自己的类型,其他参与人不知道;在自然型,相应的参与人知道自己的类型,其他参与人不知道;在自然型,相应的参与人知道自己的类型,其他参与人不知道;在自然n n的选择之后,参与人开始序贯行动,后行为者能观测到先行为者的选择之后,参与人开始序贯行动,后行为者能观测到先行为者的选择之后,参与人开始序贯行动,后行为者能观测到先行为者的选择之后,参与人开始序贯行动,后行为者能观测到先行为者n n的行动,但无法观测到先行为者的类型,从而产生不完美信息,的行动,但无法观测到先行为者的类型,从而产生不完美信息,的行动,但无法观测到先行为者的类型,从而产生不完美信息,的行动,但无法观测到先行为者的类型,从而产生不完美信息,n n对此,我们在博弈树上用多节点的信息集来反映。对此,我们在博弈树上用多节点的信息集来反映。对此,我们在博弈树上用多节点的信息集来反映。对此,我们在博弈树上用多节点的信息集来反映。二手车交易博弈二手车交易博弈 二手车交易博弈二手车交易博弈n n1 1、二手车交易看成这样一个动态博弈、二手车交易看成这样一个动态博弈、二手车交易看成这样一个动态博弈、二手车交易看成这样一个动态博弈 n n先是自然先是自然先是自然先是自然(N)(N)决定二手车的决定二手车的决定二手车的决定二手车的类型类型类型类型:好车或差车。:好车或差车。:好车或差车。:好车或差车。n n卖主卖主卖主卖主(参与人参与人参与人参与人1)1)知道自己的类型后选择卖或不卖,若卖主选择不知道自己的类型后选择卖或不卖,若卖主选择不知道自己的类型后选择卖或不卖,若卖主选择不知道自己的类型后选择卖或不卖,若卖主选择不n n卖,则博弈结束;若选择卖,则轮到顾客卖,则博弈结束;若选择卖,则轮到顾客卖,则博弈结束;若选择卖,则轮到顾客卖,则博弈结束;若选择卖,则轮到顾客(参与人参与人参与人参与人2)2)决定买还是不决定买还是不决定买还是不决定买还是不n n买。买。买。买。n n顾客在轮到决策的时点上,只能观测到卖主选择了卖的行动而不顾客在轮到决策的时点上,只能观测到卖主选择了卖的行动而不顾客在轮到决策的时点上,只能观测到卖主选择了卖的行动而不顾客在轮到决策的时点上,只能观测到卖主选择了卖的行动而不n n知道卖主的类型是好车还是差车知道卖主的类型是好车还是差车知道卖主的类型是好车还是差车知道卖主的类型是好车还是差车(即顾客不知道自然的选择是好即顾客不知道自然的选择是好即顾客不知道自然的选择是好即顾客不知道自然的选择是好n n车还是差车车还是差车车还是差车车还是差车)。(这是不完美信息)。(这是不完美信息)。(这是不完美信息)。(这是不完美信息)n n这个交易里有两个决策节点就形成这个交易里有两个决策节点就形成这个交易里有两个决策节点就形成这个交易里有两个决策节点就形成 一个多节点的信息集一个多节点的信息集一个多节点的信息集一个多节点的信息集 (用椭(用椭(用椭(用椭圆圈出)。圆圈出)。圆圈出)。圆圈出)。n n2、多节点信息集有如下特征:、多节点信息集有如下特征:n n n n(1 1)在此信息集中的每一个节点都轮到该参与人行动,)在此信息集中的每一个节点都轮到该参与人行动,)在此信息集中的每一个节点都轮到该参与人行动,)在此信息集中的每一个节点都轮到该参与人行动,n n n n(2 2)当博弈的进行达到该信息集中的某个节点时,轮到行动的)当博弈的进行达到该信息集中的某个节点时,轮到行动的)当博弈的进行达到该信息集中的某个节点时,轮到行动的)当博弈的进行达到该信息集中的某个节点时,轮到行动的n n参与人并不知道实际到达了哪一个节点,而只知道到达了其中的参与人并不知道实际到达了哪一个节点,而只知道到达了其中的参与人并不知道实际到达了哪一个节点,而只知道到达了其中的参与人并不知道实际到达了哪一个节点,而只知道到达了其中的n n某个节点的概率某个节点的概率某个节点的概率某个节点的概率(先验概率或后验概率先验概率或后验概率先验概率或后验概率先验概率或后验概率)。(二)完美贝叶斯一纳什均衡n n 对动态博弈进行分析,可信性问题始终是一对动态博弈进行分析,可信性问题始终是一个中心问题,一个理想的均衡必须是排除了所有个中心问题,一个理想的均衡必须是排除了所有不可信的威胁和许诺的。不可信的威胁和许诺的。n n n n在动态博弈中,行动有先后次序,后行动者可以通过观察先行动者的行动获在动态博弈中,行动有先后次序,后行动者可以通过观察先行动者的行动获在动态博弈中,行动有先后次序,后行动者可以通过观察先行动者的行动获在动态博弈中,行动有先后次序,后行动者可以通过观察先行动者的行动获n n得有关后者偏好、战略空间等方面的信息,修正自己的判断得有关后者偏好、战略空间等方面的信息,修正自己的判断得有关后者偏好、战略空间等方面的信息,修正自己的判断得有关后者偏好、战略空间等方面的信息,修正自己的判断 。n n对应于不完全信息动态博弈的均衡概念是对应于不完全信息动态博弈的均衡概念是对应于不完全信息动态博弈的均衡概念是对应于不完全信息动态博弈的均衡概念是“精炼贝叶斯均衡精炼贝叶斯均衡精炼贝叶斯均衡精炼贝叶斯均衡”。这个概念是完。这个概念是完。这个概念是完。这个概念是完n n全信息动态博弈的精炼纳什均衡和不完全信息静态博弈的贝叶斯均衡的结合。全信息动态博弈的精炼纳什均衡和不完全信息静态博弈的贝叶斯均衡的结合。全信息动态博弈的精炼纳什均衡和不完全信息静态博弈的贝叶斯均衡的结合。全信息动态博弈的精炼纳什均衡和不完全信息静态博弈的贝叶斯均衡的结合。n n在完全信息动态博弈中,鉴于纳什均衡本身无法排除不可信的威胁和许诺,在完全信息动态博弈中,鉴于纳什均衡本身无法排除不可信的威胁和许诺,在完全信息动态博弈中,鉴于纳什均衡本身无法排除不可信的威胁和许诺,在完全信息动态博弈中,鉴于纳什均衡本身无法排除不可信的威胁和许诺,n n我们加上了子博弈完美这一要求我们加上了子博弈完美这一要求我们加上了子博弈完美这一要求我们加上了子博弈完美这一要求(即要求策略组合在每一个子博弈中都能构成即要求策略组合在每一个子博弈中都能构成即要求策略组合在每一个子博弈中都能构成即要求策略组合在每一个子博弈中都能构成n n纳什均衡纳什均衡纳什均衡纳什均衡),并称这样的纳什均衡为子博弈完美纳什均衡,并称这样的纳什均衡为子博弈完美纳什均衡,并称这样的纳什均衡为子博弈完美纳什均衡,并称这样的纳什均衡为子博弈完美纳什均衡.n n对于不完全信息动态博弈,由于贝叶斯纳什均衡同样未能排除不可信的威胁对于不完全信息动态博弈,由于贝叶斯纳什均衡同样未能排除不可信的威胁对于不完全信息动态博弈,由于贝叶斯纳什均衡同样未能排除不可信的威胁对于不完全信息动态博弈,由于贝叶斯纳什均衡同样未能排除不可信的威胁n n和许诺,我们需要对贝叶斯纳什均衡进一步强化(即加强对条件的要求),和许诺,我们需要对贝叶斯纳什均衡进一步强化(即加强对条件的要求),和许诺,我们需要对贝叶斯纳什均衡进一步强化(即加强对条件的要求),和许诺,我们需要对贝叶斯纳什均衡进一步强化(即加强对条件的要求),n n并把强化后的贝叶斯纳什均衡称为精练并把强化后的贝叶斯纳什均衡称为精练并把强化后的贝叶斯纳什均衡称为精练并把强化后的贝叶斯纳什均衡称为精练(完美完美完美完美)贝叶斯纳什均衡,简称为精练贝叶斯纳什均衡,简称为精练贝叶斯纳什均衡,简称为精练贝叶斯纳什均衡,简称为精练n n(完美完美完美完美)贝叶斯均衡。贝叶斯均衡。贝叶斯均衡。贝叶斯均衡。n n精炼贝叶斯均衡的要点在于当事人要根据所观察到的他人的行为精炼贝叶斯均衡的要点在于当事人要根据所观察到的他人的行为精炼贝叶斯均衡的要点在于当事人要根据所观察到的他人的行为精炼贝叶斯均衡的要点在于当事人要根据所观察到的他人的行为n n来修正自己有关后者类型的来修正自己有关后者类型的来修正自己有关后者类型的来修正自己有关后者类型的“信念信念信念信念”(”(主观概率主观概率主观概率主观概率)并由此选择自己并由此选择自己并由此选择自己并由此选择自己的行动。的行动。的行动。的行动。n n精炼贝叶斯均衡是所有参与人战略和信念的一种结合,它满足如下条件:精炼贝叶斯均衡是所有参与人战略和信念的一种结合,它满足如下条件:精炼贝叶斯均衡是所有参与人战略和信念的一种结合,它满足如下条件:精炼贝叶斯均衡是所有参与人战略和信念的一种结合,它满足如下条件:n n(1)(1)给定每个人有关其他人类型的信念的情况下,他的战略选择是最优的;给定每个人有关其他人类型的信念的情况下,他的战略选择是最优的;给定每个人有关其他人类型的信念的情况下,他的战略选择是最优的;给定每个人有关其他人类型的信念的情况下,他的战略选择是最优的;n n(2)(2)每个人有关他人类型的信念都是使用贝叶斯法则从所观察到的行为中获得每个人有关他人类型的信念都是使用贝叶斯法则从所观察到的行为中获得每个人有关他人类型的信念都是使用贝叶斯法则从所观察到的行为中获得每个人有关他人类型的信念都是使用贝叶斯法则从所观察到的行为中获得n n的。的。的。的。n n因此,用更为广义的后续博弈的概念来代替子博因此,用更为广义的后续博弈的概念来代替子博n n弈的概念。前面我们已经定义过的子博弈必须开弈的概念。前面我们已经定义过的子博弈必须开n n始于单节点信息集,并且不能分割信息集,与之始于单节点信息集,并且不能分割信息集,与之n n不同的是不同的是“后续博弈后续博弈”是指从任何信息集(不论是是指从任何信息集(不论是n n单节点的还是包含多节点的)开始的动态博弈的单节点的还是包含多节点的)开始的动态博弈的n n后续部分。后续部分。精练贝叶斯纳什均衡的理解n n在不完全信息动态博弈中,在不完全信息动态博弈中,在不完全信息动态博弈中,在不完全信息动态博弈中,“自然自然自然自然”首先选择参与人的类型首先选择参与人的类型首先选择参与人的类型首先选择参与人的类型 ,参与人自,参与人自,参与人自,参与人自n n己知道,其他参与人不知道;己知道,其他参与人不知道;己知道,其他参与人不知道;己知道,其他参与人不知道;n n在在在在“自然自然自然自然”选择之后,参与人开始行动,参与人的行动有先有后,后行选择之后,参与人开始行动,参与人的行动有先有后,后行选择之后,参与人开始行动,参与人的行动有先有后,后行选择之后,参与人开始行动,参与人的行动有先有后,后行n n动者能观测到先行动者的行动,但不能观测到先行动者的类型。动者能观测到先行动者的行动,但不能观测到先行动者的类型。动者能观测到先行动者的行动,但不能观测到先行动者的类型。动者能观测到先行动者的行动,但不能观测到先行动者的类型。n n因为参与人的行动是类型依存的,每个参与人的行动都传递着自己类因为参与人的行动是类型依存的,每个参与人的行动都传递着自己类因为参与人的行动是类型依存的,每个参与人的行动都传递着自己类因为参与人的行动是类型依存的,每个参与人的行动都传递着自己类n n型的某种信息,后行动者可以通过观察先行动者所选择的行动来推断其类型的某种信息,后行动者可以通过观察先行动者所选择的行动来推断其类型的某种信息,后行动者可以通过观察先行动者所选择的行动来推断其类型的某种信息,后行动者可以通过观察先行动者所选择的行动来推断其类n n型或修正对其类型的先验信念(概率分布),然后选择自己的最优行动。型或修正对其类型的先验信念(概率分布),然后选择自己的最优行动。型或修正对其类型的先验信念(概率分布),然后选择自己的最优行动。型或修正对其类型的先验信念(概率分布),然后选择自己的最优行动。n n先行动者理性预测到自己的行动将被后行动者所利用,就会设法选择先行动者理性预测到自己的行动将被后行动者所利用,就会设法选择先行动者理性预测到自己的行动将被后行动者所利用,就会设法选择先行动者理性预测到自己的行动将被后行动者所利用,就会设法选择n n传递对自己有利的信息,避免传递对自己不利的信息。传递对自己有利的信息,避免传递对自己不利的信息。传递对自己有利的信息,避免传递对自己不利的信息。传递对自己有利的信息,避免传递对自己不利的信息。n n因此,该博弈过程的实质不仅是参与人选择行动的过程,而且是参与因此,该博弈过程的实质不仅是参与人选择行动的过程,而且是参与因此,该博弈过程的实质不仅是参与人选择行动的过程,而且是参与因此,该博弈过程的实质不仅是参与人选择行动的过程,而且是参与n n人不断修正信念的过程。精练贝叶斯纳什均衡是完全信息动态子博弈精练人不断修正信念的过程。精练贝叶斯纳什均衡是完全信息动态子博弈精练人不断修正信念的过程。精练贝叶斯纳什均衡是完全信息动态子博弈精练人不断修正信念的过程。精练贝叶斯纳什均衡是完全信息动态子博弈精练n n纳什均衡和不完全信息静态博弈贝叶斯纳什均衡的结合。纳什均衡和不完全信息静态博弈贝叶斯纳什均衡的结合。纳什均衡和不完全信息静态博弈贝叶斯纳什均衡的结合。纳什均衡和不完全信息静态博弈贝叶斯纳什均衡的结合。不完全信息动态博弈的精炼贝叶斯均衡不完全信息动态博弈的精炼贝叶斯均衡应用及分析应用及分析你与张三不完全信息动态博弈你与张三不完全信息动态博弈你与张三不完全信息动态博弈你与张三不完全信息动态博弈黔驴之技不完全信息动态博弈黔驴之技不完全信息动态博弈黔驴之技不完全信息动态博弈黔驴之技不完全信息动态博弈市场进入不完全信息动态博弈市场进入不完全信息动态博弈市场进入不完全信息动态博弈市场进入不完全信息动态博弈二 信号博弈n n1 1、什么是信号博弈、什么是信号博弈、什么是信号博弈、什么是信号博弈n n 信号博弈是一类比较简单但有着广泛应用的不完全信息动态信号博弈是一类比较简单但有着广泛应用的不完全信息动态信号博弈是一类比较简单但有着广泛应用的不完全信息动态信号博弈是一类比较简单但有着广泛应用的不完全信息动态n n博弈。在这种博弈中,有两个参与人,双方各自都只行动一次,博弈。在这种博弈中,有两个参与人,双方各自都只行动一次,博弈。在这种博弈中,有两个参与人,双方各自都只行动一次,博弈。在这种博弈中,有两个参与人,双方各自都只行动一次,n n后行动的参与人具有不完全信息,但他能够从先行动的参与人所后行动的参与人具有不完全信息,但他能够从先行动的参与人所后行动的参与人具有不完全信息,但他能够从先行动的参与人所后行动的参与人具有不完全信息,但他能够从先行动的参与人所n n采取的行动中获得部分信息,因此,先行动的参与人的行动对后采取的行动中获得部分信息,因此,先行动的参与人的行动对后采取的行动中获得部分信息,因此,先行动的参与人的行动对后采取的行动中获得部分信息,因此,先行动的参与人的行动对后n n行动的参与入来讲就好像是某种反应其支付函数的信号,因此,行动的参与入来讲就好像是某种反应其支付函数的信号,因此,行动的参与入来讲就好像是某种反应其支付函数的信号,因此,行动的参与入来讲就好像是某种反应其支付函数的信号,因此,n n这种博弈被称为这种博弈被称为这种博弈被称为这种博弈被称为“信号博弈信号博弈信号博弈信号博弈”,n n 其中,先行动的参与人就被称为信号发送者,后行动的参与其中,先行动的参与人就被称为信号发送者,后行动的参与其中,先行动的参与人就被称为信号发送者,后行动的参与其中,先行动的参与人就被称为信号发送者,后行动的参与n n人被称为信号接收者。人被称为信号接收者。人被称为信号接收者。人被称为信号接收者。n n信号博弈可以划分为三类;混同策略、半分离策略和分离策略。信号博弈可以划分为三类;混同策略、半分离策略和分离策略。信号博弈可以划分为三类;混同策略、半分离策略和分离策略。信号博弈可以划分为三类;混同策略、半分离策略和分离策略。n n各自的意义如下:各自的意义如下:各自的意义如下:各自的意义如下:n n(1 1)混同策略)混同策略)混同策略)混同策略n n混同策略这类策略中,信号发送者在不同类型下部发出相同的信混同策略这类策略中,信号发送者在不同类型下部发出相同的信混同策略这类策略中,信号发送者在不同类型下部发出相同的信混同策略这类策略中,信号发送者在不同类型下部发出相同的信n n号。因而,信号接收者无法从观测到的信号中得到新的信息,也号。因而,信号接收者无法从观测到的信号中得到新的信息,也号。因而,信号接收者无法从观测到的信号中得到新的信息,也号。因而,信号接收者无法从观测到的信号中得到新的信息,也n n就无法对先验概率进行修正。就无法对先验概率进行修正。就无法对先验概率进行修正。就无法对先验概率进行修正。n n(2 2)半分离策略)半分离策略)半分离策略)半分离策略n n指信号发送者对某些类型选择特定的信号,而对另指信号发送者对某些类型选择特定的信号,而对另指信号发送者对某些类型选择特定的信号,而对另指信号发送者对某些类型选择特定的信号,而对另些类型则随些类型则随些类型则随些类型则随n n机地选择信号。这时,信号接收者观测到某些信号能够准确地判机地选择信号。这时,信号接收者观测到某些信号能够准确地判机地选择信号。这时,信号接收者观测到某些信号能够准确地判机地选择信号。这时,信号接收者观测到某些信号能够准确地判n n断出发送者的类型,而观测到另外某些信号时尽管不能完全判断断出发送者的类型,而观测到另外某些信号时尽管不能完全判断断出发送者的类型,而观测到另外某些信号时尽管不能完全判断断出发送者的类型,而观测到另外某些信号时尽管不能完全判断n n出发送者的类型,但是能够据以修正自己的先验概率。出发送者的类型,但是能够据以修正自己的先验概率。出发送者的类型,但是能够据以修正自己的先验概率。出发送者的类型,但是能够据以修正自己的先验概率。n n(3 3)分离策略)分离策略)分离策略)分离策略n n指信号发送者针对不同的类型完全选择不同的信号。这类策略指信号发送者针对不同的类型完全选择不同的信号。这类策略指信号发送者针对不同的类型完全选择不同的信号。这类策略指信号发送者针对不同的类型完全选择不同的信号。这类策略n n中,信号准确地表现类型,接收者可以通过所观测到的信号准确中,信号准确地表现类型,接收者可以通过所观测到的信号准确中,信号准确地表现类型,接收者可以通过所观测到的信号准确中,信号准确地表现类型,接收者可以通过所观测到的信号准确地判断出发送者的类型。地判断出发送者的类型。地判断出发送者的类型。地判断出发送者的类型。三 序贯均衡n n1 1、序贯均衡的概念是由克瑞普斯和威尔逊、序贯均衡的概念是由克瑞普斯和威尔逊、序贯均衡的概念是由克瑞普斯和威尔逊、序贯均衡的概念是由克瑞普斯和威尔逊(1982)(1982)首先提出的。它的原理与完首先提出的。它的原理与完首先提出的。它的原理与完首先提出的。它的原理与完n n美贝叶斯一纳什均衡相似,也应用于动态贝叶斯博弈,但更着重强调非均衡美贝叶斯一纳什均衡相似,也应用于动态贝叶斯博弈,但更着重强调非均衡美贝叶斯一纳什均衡相似,也应用于动态贝叶斯博弈,但更着重强调非均衡美贝叶斯一纳什均衡相似,也应用于动态贝叶斯博弈,但更着重强调非均衡n n路径上后验概率的形成,对局中人随着博弈的进行修正自己信念的方式作了路径上后验概率的形成,对局中人随着博弈的进行修正自己信念的方式作了路径上后验概率的形成,对局中人随着博弈的进行修正自己信念的方式作了路径上后验概率的形成,对局中人随着博弈的进行修正自己信念的方式作了n n更加严格的要求,认为局中人的行动必须由对行动历史的信念合理化决定。更加严格的要求,认为局中人的行动必须由对行动历史的信念合理化决定。更加严格的要求,认为局中人的行动必须由对行动历史的信念合理化决定。更加严格的要求,认为局中人的行动必须由对行动历史的信念合理化决定。n n2 2、序贯均衡对非均衡路径上后验概率的处理是:首先假定在每个信息集上,、序贯均衡对非均衡路径上后验概率的处理是:首先假定在每个信息集上,、序贯均衡对非均衡路径上后验概率的处理是:首先假定在每个信息集上,、序贯均衡对非均衡路径上后验概率的处理是:首先假定在每个信息集上,n n局中人选择严格混合策略局中人选择严格混合策略局中人选择严格混合策略局中人选择严格混合策略(即以严格正的概率选择每一个行动即以严格正的概率选择每一个行动即以严格正的概率选择每一个行动即以严格正的概率选择每一个行动),从而博弈到达,从而博弈到达,从而博弈到达,从而博弈到达n n每一个信息集的概率严格为正,这样贝叶斯公式在每一个信息集上都可以适每一个信息集的概率严格为正,这样贝叶斯公式在每一个信息集上都可以适每一个信息集的概率严格为正,这样贝叶斯公式在每一个信息集上都可以适每一个信息集的概率严格为正,这样贝叶斯公式在每一个信息集上都可以适n n用而不会出现后验概率任意取位的情况;然后,将均衡作为这种严格混合策用而不会出现后验概率任意取位的情况;然后,将均衡作为这种严格混合策用而不会出现后验概率任意取位的情况;然后,将均衡作为这种严格混合策用而不会出现后验概率任意取位的情况;然后,将均衡作为这种严格混合策n n略和相应后验概率的序列的极限,而能够成为这种极限的均衡就是序均衡。略和相应后验概率的序列的极限,而能够成为这种极限的均衡就是序均衡。略和相应后验概率的序列的极限,而能够成为这种极限的均衡就是序均衡。略和相应后验概率的序列的极限,而能够成为这种极限的均衡就是序均衡。四 颤抖手均衡n n1 1、其基本思想是:在任何一个博弈中,每一个局中人均、其基本思想是:在任何一个博弈中,每一个局中人均、其基本思想是:在任何一个博弈中,每一个局中人均、其基本思想是:在任何一个博弈中,每一个局中人均n n有可能犯错误,如同一个人抓东西时因手的颤抖使其发生有可能犯错误,如同一个人抓东西时因手的颤抖使其发生有可能犯错误,如同一个人抓东西时因手的颤抖使其发生有可能犯错误,如同一个人抓东西时因手的颤抖使其发生n n偏差而抓不住一样偏差而抓不住一样偏差而抓不住一样偏差而抓不住一样(这种均衡概念的名称即来源于此这种均衡概念的名称即来源于此这种均衡概念的名称即来源于此这种均衡概念的名称即来源于此),这,这,这,这n n样局中人在选择策略时就需要考虑到其他局中人犯错误的样局中人在选择策略时就需要考虑到其他局中人犯错误的样局中人在选择策略时就需要考虑到其他局中人犯错误的样局中人在选择策略时就需要考虑到其他局中人犯错误的n n可能性,这样的均衡比纳什均衡概念更为合理。可能性,这样的均衡比纳什均衡概念更为合理。可能性,这样的均衡比纳什均衡概念更为合理。可能性,这样的均衡比纳什均衡概念更为合理。n n2 2、泽尔滕将非均衡事件的发生解释为局中人策略选择时的、泽尔滕将非均衡事件的发生解释为局中人策略选择时的、泽尔滕将非均衡事件的发生解释为局中人策略选择时的、泽尔滕将非均衡事件的发生解释为局中人策略选择时的“颤颤颤颤n n抖抖抖抖”,当局中人发现博弈偏离均衡时,他将这一事件归结为某一,当局中人发现博弈偏离均衡时,他将这一事件归结为某一,当局中人发现博弈偏离均衡时,他将这一事件归结为某一,当局中人发现博弈偏离均衡时,他将这一事件归结为某一n n个其他局中人的非蓄意错误。在发生颤抖的博弈中局中人要针个其他局中人的非蓄意错误。在发生颤抖的博弈中局中人要针个其他局中人的非蓄意错误。在发生颤抖的博弈中局中人要针个其他局中人的非蓄意错误。在发生颤抖的博弈中局中人要针n n对这些颤抖作出最佳反应,从而构成了纳什均衡。当颤抖的幅度对这些颤抖作出最佳反应,从而构成了纳什均衡。当颤抖的幅度对这些颤抖作出最佳反应,从而构成了纳什均衡。当颤抖的幅度对这些颤抖作出最佳反应,从而构成了纳什均衡。当颤抖的幅度n n缩小时,被颤抖扰动的博弈中均衡的极限就是颤抖手均衡。颤抖缩小时,被颤抖扰动的博弈中均衡的极限就是颤抖手均衡。颤抖缩小时,被颤抖扰动的博弈中均衡的极限就是颤抖手均衡。颤抖缩小时,被颤抖扰动的博弈中均衡的极限就是颤抖手均衡。颤抖n n手均衡要求均衡策略不仅是对对手策略的最佳反应,而且是当对手均衡要求均衡策略不仅是对对手策略的最佳反应,而且是当对手均衡要求均衡策略不仅是对对手策略的最佳反应,而且是当对手均衡要求均衡策略不仅是对对手策略的最佳反应,而且是当对n n手策略发生微小手策略发生微小手策略发生微小手策略发生微小(或无限小或无限小或无限小或无限小)颤抖时的最佳反应;颤抖时的最佳反应;颤抖时的最佳反应;颤抖时的最佳反应;n n3 3、缺陷:这样定义的颤抖手均衡仍然有缺陷,将它应用到动态、缺陷:这样定义的颤抖手均衡仍然有缺陷,将它应用到动态、缺陷:这样定义的颤抖手均衡仍然有缺陷,将它应用到动态、缺陷:这样定义的颤抖手均衡仍然有缺陷,将它应用到动态n n博弈对应的策略型描述时,就会出现颤抖手均衡不是子博弈完美博弈对应的策略型描述时,就会出现颤抖手均衡不是子博弈完美博弈对应的策略型描述时,就会出现颤抖手均衡不是子博弈完美博弈对应的策略型描述时,就会出现颤抖手均衡不是子博弈完美n n均衡的情况。这是由于动态博弈的策略型描述中,同一局中人在均衡的情况。这是由于动态博弈的策略型描述中,同一局中人在均衡的情况。这是由于动态博弈的策略型描述中,同一局中人在均衡的情况。这是由于动态博弈的策略型描述中,同一局中人在n n动态博弈不同阶段的错误动态博弈不同阶段的错误动态博弈不同阶段的错误动态博弈不同阶段的错误(颤抖颤抖颤抖颤抖)具有相关性,从而不能剔除子博具有相关性,从而不能剔除子博具有相关性,从而不能剔除子博具有相关性,从而不能剔除子博n n奔完美均衡概念所揭示的不合理的均衡。奔完美均衡概念所揭示的不合理的均衡。奔完美均衡概念所揭示的不合理的均衡。奔完美均衡概念所揭示的不合理的均衡。n n 于是,在经济学上,为了排除局中人犯错误时的动态相关于是,在经济学上,为了排除局中人犯错误时的动态相关于是,在经济学上,为了排除局中人犯错误时的动态相关于是,在经济学上,为了排除局中人犯错误时的动态相关n n性,泽尔滕引人了性,泽尔滕引人了性,泽尔滕引人了性,泽尔滕引人了“代理人一策略型表述代理人一策略型表述代理人一策略型表述代理人一策略型表述”,也就是将原来的局中,也就是将原来的局中,也就是将原来的局中,也就是将原来的局中n n人作为委托人、他在不同信息集上雇佣了不同的代理人,授权后人作为委托人、他在不同信息集上雇佣了不同的代理人,授权后人作为委托人、他在不同信息集上雇佣了不同的代理人,授权后人作为委托人、他在不同信息集上雇佣了不同的代理人,授权后n n者进行决策:代理人的支付函数与委托人相同,按委托人的利益者进行决策:代理人的支付函数与委托人相同,按委托人的利益者进行决策:代理人的支付函数与委托人相同,按委托人的利益者进行决策:代理人的支付函数与委托人相同,按委托人的利益n n行动,但是各代理人间彼此独立行动,这样犯错误的可能性就是行动,但是各代理人间彼此独立行动,这样犯错误的可能性就是行动,但是各代理人间彼此独立行动,这样犯错误的可能性就是行动,但是各代理人间彼此独立行动,这样犯错误的可能性就是n n独立的,从们消除了颤抖的动态相关性。通过这种方法就改进了独立的,从们消除了颤抖的动态相关性。通过这种方法就改进了独立的,从们消除了颤抖的动态相关性。通过这种方法就改进了独立的,从们消除了颤抖的动态相关性。通过这种方法就改进了n n颤抖手均衡的概念,与子博弈完美均衡不再矛盾。颤抖手均衡的概念,与子博弈完美均衡不再矛盾。颤抖手均衡的概念,与子博弈完美均衡不再矛盾。颤抖手均衡的概念,与子博弈完美均衡不再矛盾。n n 4、颤抖手均衡与序贯均衡的关系是:颤抖手均衡一定是序贯均衡,而序贯均衡却不一定是颤抖手均衡。

    注意事项

    本文(不完全信息动态博弈精.ppt)为本站会员(豆****)主动上传,得力文库 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知得力文库 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于得利文库 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

    © 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

    黑龙江省互联网违法和不良信息举报
    举报电话:0468-3380021 邮箱:hgswwxb@163.com  

    收起
    展开