《PSM-DID总结.ppt》由会员分享,可在线阅读,更多相关《PSM-DID总结.ppt(25页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、1 1、介绍、介绍PSM-DIDPSM-DID方法方法2 2、分析论文、分析论文 西部大开发是增长驱动还是政策陷阱西部大开发是增长驱动还是政策陷阱3 3、statastata操作过程操作过程双重差分法双重差分法 双重差分(双重差分(difference in differencesdifference in differences,DIDDID)嘛,就是)嘛,就是差分两次。差分两次。 一种专门用于分析政策效果的计量方法。一种专门用于分析政策效果的计量方法。 将制度变迁和新政策视为一次外生于经济系统的将制度变迁和新政策视为一次外生于经济系统的“自然实自然实验验”的研究方法。的研究方法。 将两个虚
2、拟变量及其交乘项增加进回归方程。将两个虚拟变量及其交乘项增加进回归方程。 不是直接对比样本在政策前后的均值变化,而是使用个体不是直接对比样本在政策前后的均值变化,而是使用个体数据进行回归,判断政策的影响是否具有显著的统计意义。数据进行回归,判断政策的影响是否具有显著的统计意义。 基本假设:随机分组、随机事件、对照组不受影响、样本基本假设:随机分组、随机事件、对照组不受影响、样本同质性和实验处理的唯一性。同质性和实验处理的唯一性。倾向得分匹配法倾向得分匹配法 倾向得分匹配法倾向得分匹配法(propensity score matchingpropensity score matching, PS
3、MPSM)是一种研究方法,比如需要研究某个劳动是一种研究方法,比如需要研究某个劳动者接受某种高等教育对其收入的影响,或者研究者接受某种高等教育对其收入的影响,或者研究某个企业运用了某项管理层激励措施以后对企业某个企业运用了某项管理层激励措施以后对企业业绩的影响。业绩的影响。 如果我们简单地将是否执行了某项事件作为虚拟如果我们简单地将是否执行了某项事件作为虚拟变量,而对总体进行回归的话,参数估计就会产变量,而对总体进行回归的话,参数估计就会产生偏误,因为在这样的情况下,我们只观察到了生偏误,因为在这样的情况下,我们只观察到了某一个对象他因为发生了某一事件后产生的表现,某一个对象他因为发生了某一事
4、件后产生的表现,并且拿这种表现去和另一些没有发生这件事情的并且拿这种表现去和另一些没有发生这件事情的其他对象去做比较。这样的比较显然是不科学的,其他对象去做比较。这样的比较显然是不科学的,因为比较的基础并不同。因为比较的基础并不同。修建铁路对沿线城市经济的影响修建铁路对沿线城市经济的影响 现在要修一条铁路,铁路是条线,所以必然会有现在要修一条铁路,铁路是条线,所以必然会有穿过的城市和没有被穿过的城市;穿过的城市和没有被穿过的城市; 如果城市如果城市i i被穿过,记被穿过,记Di=1 Di=1 否则,否则,Di=0 Di=0 ; 现在我们比较好奇铁路修好以后,对铁路穿过的现在我们比较好奇铁路修好
5、以后,对铁路穿过的城市的经济增长有什么影响?我们该怎么做呢?城市的经济增长有什么影响?我们该怎么做呢? 把把Di=1Di=1的城市的的城市的GDPGDP加总,减去加总,减去Di=0Di=0的城市的的城市的GDPGDP加总,加总,然后两者一减,即然后两者一减,即E(Yi|Di=1)-E(Yi|Di=0)E(Yi|Di=1)-E(Yi|Di=0),这样我们就算,这样我们就算出了两类城市的出了两类城市的GDPGDP的平均之差。的平均之差。 万一铁路穿过的城市在建铁路之前万一铁路穿过的城市在建铁路之前GDPGDP就高呢?就高呢? 把铁路穿过的城市分为两个时期,修建铁路前和修建铁路把铁路穿过的城市分为两
6、个时期,修建铁路前和修建铁路后,记为后,记为Ti=0Ti=0和和Ti=1Ti=1,分别求出两个时期的,分别求出两个时期的GDPGDP,然后,然后两者一减,即两者一减,即E(Yi|Ti=1)-E(Yi|Ti=0)E(Yi|Ti=1)-E(Yi|Ti=0),这样我们就算出了,这样我们就算出了铁路沿线城市的铁路沿线城市的GDPGDP增长。增长。问题是就算不修铁路,穿过的这些城市,经济该增问题是就算不修铁路,穿过的这些城市,经济该增长还是会增长的!长还是会增长的! 修建铁路对沿线城市经济的影响修建铁路对沿线城市经济的影响 为了解决以上问题,我们需要观察到至少两期,为了解决以上问题,我们需要观察到至少两
7、期,第一期是建铁路之前,第一期是建铁路之前, T=0T=0;第二期是建铁路之;第二期是建铁路之后,后, T=1 T=1 。 设穿过设穿过Di=1Di=1,否则,否则Di=0Di=0。 两次差分,(两次差分,(1 1)先求出在修建铁路前后每一个)先求出在修建铁路前后每一个城市的城市的GDPGDP增长率,增长率, (2 2)求处理效应:)求处理效应:10iiiYYY1211(1)(0)iiiiYY DY DNN修建铁路对城市经济的促进作用修建铁路对城市经济的促进作用修建铁路对沿线城市经济的影响修建铁路对沿线城市经济的影响 可以换一个写法可以换一个写法 T=1T=1,建铁路之后,建铁路之后 T=0T
8、=0,建铁路之前,建铁路之前 TreatedTreated代表在某一期,某一类城市是不是建了铁路。第零代表在某一期,某一类城市是不是建了铁路。第零期肯定没有建铁路,第一期只有期肯定没有建铁路,第一期只有Di=1Di=1的城市建了铁路。的城市建了铁路。 基基本模型为:本模型为: 对时间差分:对时间差分: 再次差分:再次差分: 所以实际做的时候,可以直接跑这个式子的回归,所以实际做的时候,可以直接跑这个式子的回归,得到的得到的交乘项的系数交乘项的系数就是所要估计的处理效应。就是所要估计的处理效应。 01234()itiiititY D TDT X23iiitY D3itY修建铁路对沿线城市经济的影
9、响修建铁路对沿线城市经济的影响用一个图表示用一个图表示 这里这里DIDDID最关键的最关键的假设是假设是trendtrend,也,也就是两个组别在就是两个组别在不处理的情况下,不处理的情况下,y y的趋势是一样的。的趋势是一样的。一个学生读研对自己工资水平的影响一个学生读研对自己工资水平的影响 如果拿小明来说,小明读了研究生和小明没有读研究生,如果拿小明来说,小明读了研究生和小明没有读研究生,他的收入会差多少?可是小明已经读了研究生,我怎么才他的收入会差多少?可是小明已经读了研究生,我怎么才能估计出他要是不读研究生,他的收入会是多少呢?能估计出他要是不读研究生,他的收入会是多少呢? 于是,我们
10、引入于是,我们引入“倾向得分匹配倾向得分匹配”这样一种研究方法。这这样一种研究方法。这种方法能让我们从一大堆没有读研究生的人群中(总体样种方法能让我们从一大堆没有读研究生的人群中(总体样本的一个子集),对每个人读研究生的概率进行估计,然本的一个子集),对每个人读研究生的概率进行估计,然后选出和小明具有非常相似的去读研究生的概率,可是没后选出和小明具有非常相似的去读研究生的概率,可是没有去读的同学小刚有去读的同学小刚作为小明的对照,然后再来看他们作为小明的对照,然后再来看他们的区别。当样本中的每个研究生的区别。当样本中的每个研究生“小明小明”(赵小明、司马(赵小明、司马小明、石小明小明、石小明)
11、都找到了匹配的非研究生)都找到了匹配的非研究生“小刚小刚”(李(李小刚、王小刚小刚、王小刚 ),我们便能对这两组样本进行比较研),我们便能对这两组样本进行比较研究了。究了。 一个学生读研对自己工资水平的影响一个学生读研对自己工资水平的影响 第一步,我们要对总体样本执行第一步,我们要对总体样本执行probitprobit或者或者logitlogit回归,然回归,然后估计出每一个观测对象读研究生的概率是多少。以后估计出每一个观测对象读研究生的概率是多少。以probitprobit检验为例,在检验为例,在statastata中,执行以下命令:中,执行以下命令: probit dependent va
12、r independent var probit dependent var independent var 其中,其中,dependent vardependent var是一个是一个0 0或或1 1的二进制变量,的二进制变量,1 1代代表该对象读了研究生,否则是表该对象读了研究生,否则是0 0。 对每一个观测值,我们根据估计出来的对每一个观测值,我们根据估计出来的probitprobit模型,算出模型,算出他读研究生的概率是多少。他读研究生的概率是多少。StataStata中,执行如下命令:中,执行如下命令: predict pscore, ppredict pscore, p 其中,其中
13、,pscorepscore是定义的记录每个观测对象概率的变量名是定义的记录每个观测对象概率的变量名称。称。一个学生读研对自己工资水平的影响一个学生读研对自己工资水平的影响 使用使用psmatch2psmatch2命令,让命令,让StataStata帮你对于每个读了研究生帮你对于每个读了研究生的观测对象,找出一个与之具有最接近的概率值的,可是的观测对象,找出一个与之具有最接近的概率值的,可是没有读研究生的观测对象:没有读研究生的观测对象: psmatch2 dependent var, pscore(pscore) psmatch2 dependent var, pscore(pscore) n
14、oreplacementnoreplacement 其中,其中,(pscore)(pscore)是在第二步中生成的那个记录对象概率的是在第二步中生成的那个记录对象概率的变量,变量,noreplacementnoreplacement是一个选项,使得任何读了研究是一个选项,使得任何读了研究生的观察对象的对照对象都具有唯一性,只能生的观察对象的对照对象都具有唯一性,只能1 1对对1 1匹配。匹配。 StataStata会在你的数据中自动添加几个变量,其中会在你的数据中自动添加几个变量,其中_id_id是自动是自动生成的每一个观测对象唯一的生成的每一个观测对象唯一的IDID;_treated_tre
15、ated表示某个对象表示某个对象是否读了研究生,如果读了,是否读了研究生,如果读了,_n_n表示的是他被匹配到的对表示的是他被匹配到的对照对象的照对象的_id_id;_pdif_pdif表示一组匹配了的观察对象他们概率表示一组匹配了的观察对象他们概率值的差。值的差。参考文献:Propensity score matching Help for psmatch2西部大开发:增长驱动还是政策陷阱西部大开发:增长驱动还是政策陷阱 论文内容论文内容1 1、问题提出、问题提出2 2、政策效果理论分析、政策效果理论分析3 3、模型和估计方法、模型和估计方法4 4、数据、变量与描述性统计、数据、变量与描述性
16、统计5 5、评价结果与稳健性检验、评价结果与稳健性检验6 6、结论、结论问题提出问题提出 (1 1)虽然西部地区经济社会发展有所好转,但)虽然西部地区经济社会发展有所好转,但东西部地区经济差距持续扩大。东西部地区经济差距持续扩大。 (2 2)已有文献关于西部大开发对地区经济增长)已有文献关于西部大开发对地区经济增长的作用效果存在争议。的作用效果存在争议。 (3 3)已有研究通过直接对比西部大开发前后的)已有研究通过直接对比西部大开发前后的地区经济绩效来做出判断。地区经济绩效来做出判断。 (4 4)客观地评价西部大开发战略的实施效果,)客观地评价西部大开发战略的实施效果,不仅对于西部大开发战略本
17、身的实施和完善具有不仅对于西部大开发战略本身的实施和完善具有重要意义,而且能够形成对于其他区域发展战略重要意义,而且能够形成对于其他区域发展战略的借鉴作用。的借鉴作用。政策效果的理论分析政策效果的理论分析西部大开发,既带来了增长驱动效应,又带来了政策陷阱效应。西部大开发,既带来了增长驱动效应,又带来了政策陷阱效应。增长驱动效应增长驱动效应 西部地区经济增长率和实际人均西部地区经济增长率和实际人均GDPGDP增长率自增长率自20002000年开年开始逐渐赶上并超过东部地区,地区始逐渐赶上并超过东部地区,地区TFPTFP增长率也明显高于增长率也明显高于东中部地区。东中部地区。 但不能就此认为西部大
18、开发取得了显著绩效。但不能就此认为西部大开发取得了显著绩效。(1 1)基数小,增长快(一张白纸可以画出更美丽的画卷)基数小,增长快(一张白纸可以画出更美丽的画卷)(2 2)税收优惠政策对西部地区的增长具有促进作用,效果)税收优惠政策对西部地区的增长具有促进作用,效果将越来越微弱;将越来越微弱;(3 3)西部地区与发达地区之间的区域差距仍在继续扩大。)西部地区与发达地区之间的区域差距仍在继续扩大。政策陷阱效应政策陷阱效应 优惠政策构成了西部地区经济增长的驱动力,但优惠政策构成了西部地区经济增长的驱动力,但其增长对能源、资源开发的依赖度很高;由于体其增长对能源、资源开发的依赖度很高;由于体制弊端和
19、配套政策缺失,会造成地方政府的短视制弊端和配套政策缺失,会造成地方政府的短视行为,容易忽视人才和技术要素,弱化社会制度行为,容易忽视人才和技术要素,弱化社会制度和软环境构建。和软环境构建。 挤出制度变革、科技创新和人力资本投入等长期挤出制度变革、科技创新和人力资本投入等长期经济增长驱动因素,对西部地区长期经济增长产经济增长驱动因素,对西部地区长期经济增长产生不利影响,最终使得西部大开发的政策优惠演生不利影响,最终使得西部大开发的政策优惠演变为政策陷阱。变为政策陷阱。模型和估计方法模型和估计方法政策评价,所用模型政策评价,所用模型PSM-DIDPSM-DID方法方法四川、重庆、云南、贵州、西藏、
20、陕西、甘肃、宁夏、青海、新疆、四川、重庆、云南、贵州、西藏、陕西、甘肃、宁夏、青海、新疆、内蒙古、广西内蒙古、广西1212个省份为实验组,其余为对照组。个省份为实验组,其余为对照组。进一步将进一步将1994-20121994-2012年中国年中国283283个地级市划分为个地级市划分为4 4组子样本,即西部组子样本,即西部大开发之前的处理组、西部大开发之后的处理组、西部大开发之前的大开发之前的处理组、西部大开发之后的处理组、西部大开发之前的控制组和西部大开发之后的控制组。控制组和西部大开发之后的控制组。dudu1 1代表西部地区的地级市,代表西部地区的地级市,dudu0 0代表其他地区的地级市
21、,代表其他地区的地级市,dtdt0 0代表西部大开发之前的年份,代表西部大开发之前的年份,dtdt1 1代表西部大开发之后的年份。代表西部大开发之后的年份。下标和分别代表第个地级市和第年,代表一系列控制变量,下标和分别代表第个地级市和第年,代表一系列控制变量,为随机扰动项,被解释变量为随机扰动项,被解释变量度量经济增长,具体指标包括人均实度量经济增长,具体指标包括人均实际际GDPGDP和实际和实际GDPGDP的对数值。的对数值。模型和估计方法模型和估计方法 运用运用LogitLogit回归估计倾向得分;回归估计倾向得分; 计算西部大开发每个地级市的结果变量在政策前后的变化,计算西部大开发每个地
22、级市的结果变量在政策前后的变化,对于西部大开发的每个地级市,计算与其匹配的全部非对于西部大开发的每个地级市,计算与其匹配的全部非西部大开发地级市在大开发前后的变化;西部大开发地级市在大开发前后的变化; 将西部大开发地级市在大开发前后的变化减去匹配后非西将西部大开发地级市在大开发前后的变化减去匹配后非西部大开发地级市的变化,得到大开发政策的平均处理效应部大开发地级市的变化,得到大开发政策的平均处理效应(ATTATT),可以有效度量西部大开发对西部省份地级市的),可以有效度量西部大开发对西部省份地级市的实际影响。实际影响。数据、变量与描述性统计数据、变量与描述性统计数据来源:数据来源:中国城市统计
23、年鉴中国城市统计年鉴、各省年鉴各省年鉴被解释变量被解释变量控制变量控制变量数据、变量与描述性统计数据、变量与描述性统计评价结果与稳健性检验评价结果与稳健性检验 作为中国改革开放以来最大的区域经作为中国改革开放以来最大的区域经济发展战略,西部大开发提供了一个济发展战略,西部大开发提供了一个准自然实验,运用准自然实验,运用DIDDID方法来评估西方法来评估西部大开发对西部地区经济增长的净效部大开发对西部地区经济增长的净效应。应。评价结果与稳健性检验评价结果与稳健性检验 考虑到西部大开发对西部地区考虑到西部大开发对西部地区经济增长的推动作用可能随着经济增长的推动作用可能随着时间推移逐渐显现,对西部大
24、时间推移逐渐显现,对西部大开发政策是否存在动态效应进开发政策是否存在动态效应进行了检验。行了检验。评价结果与稳健性检验评价结果与稳健性检验 为了克服西部地区与其他地区经济增长的变动趋势为了克服西部地区与其他地区经济增长的变动趋势存在的系统性差异,降低存在的系统性差异,降低DIDDID估计的偏误,采用估计的偏误,采用PSM-DIDPSM-DID方法进行稳健性检验。方法进行稳健性检验。 运用运用PSM-DIDPSM-DID方法时,通过方法时,通过westdevelopwestdevelop对控制变对控制变量进行量进行LogitLogit回归,获得倾向得分回归,获得倾向得分 WestdevelopW
25、estdevelop是被解释变量,是被解释变量,FDIFDI、FARFAR、sawsaw和和eduedu是解释变量。是解释变量。 运用核匹配运用核匹配(Kernel Matching)(Kernel Matching)进行估计,对西部进行估计,对西部大开发推动地区经济增长的作用进行稳健性检验。大开发推动地区经济增长的作用进行稳健性检验。评价结果与稳健性检验评价结果与稳健性检验 西部大开发并未推动西部地区快速增长。西部大开发并未推动西部地区快速增长。 是什么因素导致了西部大开发的政策效应没有得到应有是什么因素导致了西部大开发的政策效应没有得到应有发挥?发挥? 分别以分别以FDIFDI、FARFAR等六个控制变量为被解释变量,以西部等六个控制变量为被解释变量,以西部大开发为解释变量,进行回归。大开发为解释变量,进行回归。 除了能够扩大地区固定资产投资水平以外,西部大开发除了能够扩大地区固定资产投资水平以外,西部大开发对于其他各类经济增长驱动要素的作用要么不明显,要对于其他各类经济增长驱动要素的作用要么不明显,要么产生了挤出效应。么产生了挤出效应。结束结束
限制150内