《序列相关性(自相关)ppt课件.ppt》由会员分享,可在线阅读,更多相关《序列相关性(自相关)ppt课件.ppt(53页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、一、序列相关的概念n序列相关的含义序列相关的含义n在古典线性回归模型中,我们假定随机误差项序列的各项之间独立,即Cov(i,j)=E(ij)=0。n任一次观测的干扰项都不受任何其他观测的任一次观测的干扰项都不受任何其他观测的干扰项影响干扰项影响n例:上月某个特殊事件对家庭消费支出产生例:上月某个特殊事件对家庭消费支出产生的影响不会波及到本月的消费支出。的影响不会波及到本月的消费支出。n如果上述假定不满足,则称之为序列相关,即: Cov(i,j)=E(ij) 0称为称为一阶序列相关,或,或自相关(autocorrelation)其中:被称为自协方差系数自协方差系数(coefficient of
2、autocovariance)或一阶自相关系数一阶自相关系数(first-order coefficient of autocorrelation) i是满足以下标准的OLS假定的随机干扰项:如果仅存在 E(i i-1)0 i=1,2, ,n 自相关自相关往往可写成如下形式: i=i-1+i -11 0)(iE, 2)var(i, 0),cov(sii 0s 由于序列相关性经常出现在以时间序列为样本的模型中,由于序列相关性经常出现在以时间序列为样本的模型中,因此,本节将用下标因此,本节将用下标t代表代表i。 二、序列相关产生的原因n惯性:如GNP、价格指数、生产、失业等时间序列都呈现商业循环,
3、相继的观测值很可能是相依赖的。n设定偏误:不正确的函数形式或应含而未含变量都会使干扰中观察到序列相关性。从而可能造成自相关。就会出现系统模式:猪肉价格则随机扰动项收入牛肉价格牛肉需求量如果我们用的模型是:猪肉价格收入牛肉价格牛肉需求量ttttttttttttuvvu43214321,会造成自相关。如果我们忽略了滞后项消费收入消费tttt1321序列相关产生的原因(续)n蛛网现象:许多农产品的供给表现出一种所谓的蛛网现象n例如供给对价格的反应要滞后一个时期,即今年例如供给对价格的反应要滞后一个时期,即今年作物的种植量是受去年流行的价格影响的,因此,作物的种植量是受去年流行的价格影响的,因此,相关
4、的函数形式是:相关的函数形式是:121tttSP这种现象就不能期望扰动项是随机的 计量经济学模型一旦出现序列相关性,如果仍采用OLS法估计模型参数,则OLS估计量仍然是现性无偏估计量,但是会产生下列不良后果: 三、序列相关性的后果三、序列相关性的后果 1 1、参数估计量非有效、参数估计量非有效 因为,在有效性证明中利用了 E(NN)=2I 即同方差性和无序列相关假设。 2、变量的显著性检验失去意义、变量的显著性检验失去意义 在变量的显著性检验中,统计量是建立在参在变量的显著性检验中,统计量是建立在参数方差正确估计基础之上的,这只有当随机误差数方差正确估计基础之上的,这只有当随机误差项具有同方差
5、性和无序列相关时才能成立。项具有同方差性和无序列相关时才能成立。如果存在序列相关,参数估计量的方差出现偏误(偏大或偏小),t检验就失去意义。其他检验也是如此。 3、模型的预测失效模型的预测失效 区间预测与参数估计量的方差有关,在方差有偏误的情况下,使得预测估计不准确,预测精度降低。 所以,当模型出现序列相关性时,它的预测功能失效。 然后,通过分析这些,通过分析这些“近似估计量”之间的相之间的相关性,以判断随机误差项是否具有序列相关性。关性,以判断随机误差项是否具有序列相关性。 序列相关性序列相关性检验方法有多种,但基本思路相同:检验方法有多种,但基本思路相同: 基本思路基本思路: : 四、序列
6、相关性的检验四、序列相关性的检验首先首先,采用OLS法估计模型,得到残差作为随机误差项的估计。表示: lsiiiYYe0)(1。图解法:n时间序列图(时间序列图(Time Sequence plot):将残差对时间描点。将残差对时间描点。如图(如图(a)所示,扰动项的估计值呈循环形,并不频繁)所示,扰动项的估计值呈循环形,并不频繁地改变符号,而是相继若干个正的以后跟着几个负的,地改变符号,而是相继若干个正的以后跟着几个负的,表明存在正自相关。表明存在正自相关。n将将et对对et-1描点图,如图(描点图,如图(b)所示。)所示。t(a)etetet-1(b)(c)如(如(c)图所示,扰动项的估计
7、值呈锯齿状,随时间)图所示,扰动项的估计值呈锯齿状,随时间逐次改变符号,表明存在负相关。逐次改变符号,表明存在负相关。tt1tt2 2、杜宾、杜宾- -瓦森(瓦森(Durbin-WatsonDurbin-Watson)检验法)检验法 D-W检验是杜宾(J.Durbin)和瓦森(G.S. Watson)于1951年提出的一种检验序列自相关的方法,该方法的假定条件是:(1)解释变量X非随机;(2)随机误差项t为一阶自回归形式: t=t-1+t(3)回归模型中不应含有滞后应变量作为解释变量,即不应出现下列形式: Yt=0+1X1t+kXkt+Yt-1+t(4)回归含有截距项 该统计量该统计量的分布与
8、出现在给定样本中的X值有复杂的关系,因此其精确的分布很难得到精确的分布很难得到。 但是但是,他们成功地导出了临界值的下限dL和上限dU ,且这些上下限只与样本的容量n和解释变量的个数k有关,而与解释变量X的取值无关。 杜宾和瓦森针对原假设:H0: =0, 即不存在一阶自回归,构如下造统计量: nttnttteeeWD12221)(. D.W. 统计量统计量:dL244-dL0dU4-dU正相关无自相关负相关d不确定不确定 D.W检验步骤检验步骤:(1)计算DW值(2)给定,由n和k的大小查DW分布表,得临界值dL和dU(3)比较、判断 若 0D.W.dL 存在正自相关 dLD.W.dU 不能确
9、定 dU D.W.4dU 无自相关 4dU D.W.4 dL 不能确定 4dL D.W.4 存在负自相关 当D.W.值在2左右时,模型不存在一阶自相关。 证明:证明: 展开D.W.统计量: nttntntnttttteeeeeWD1222212122.(*)1 (2)1 (2.1221nttnttteeeWD如果存在如果存在完全一阶正相关完全一阶正相关,即,即 =1,则,则 D.W. 0 完全一阶负相关完全一阶负相关,即,即 = -1, 则则 D.W. 4 完全不相关完全不相关, 即即 =0,则,则 D.W. 2这里,nttntttnttnttteeeeee22211221为一阶自回归模型 i
10、=i-1+i 的参数估计。)1 (2)1 (2.1221nttnttteeeWD 3 3、回归检验法、回归检验法 tttee1tttteee2211 如果存在某一种函数形式,使得方程显著成立,则说明原模型存在序列相关性。 回归检验法回归检验法的优点优点是:(1)能够确定序列相关的形式,(2)适用于任何类型序列相关性问题的检验。以te为被解释变量, 以各种可能的相关量, 诸如以1te、2te、2te等为解释变量,建立各种方程: 4、高阶自相关的BG检验 拉格朗日乘数检验克服了DW检验的缺陷,适合于高阶序列相关以及模型中存在滞后被解释变量的情形。 它是由布劳殊(Breusch)与戈弗雷(Godfr
11、ey)于1978年提出的,也被称为BG检验检验。 对于模型如果怀疑随机扰动项存在p阶序列相关阶序列相关: tptpttt2211tktktttXXXY22110则可按如下步骤最检验: OLS估计原模型并得到残差et 做et对模型中全部回归元和附加回归元et-1, et-2, et-p的回归, 得到R2。tptp1t1ktk2t21t10teeXXXe原假设H0: 1=2=p =0H0为真时,大样本下)()(22pRpnLM给定,查临界值2(p),与LM值比较,做出判断,实际检验中,可从1阶、2阶、逐次向更高阶检验。 五、序列相关的修正n自相关结构已知时的修正自相关结构已知时的修正广义差分法广义
12、差分法 广义差分法是将原模型变换为满足是将原模型变换为满足OLS法的差法的差分模型,再进行分模型,再进行OLS估计。估计。)2( ) 1 ( ) 1 (1121121121ttttttttttttuXYuXYuuuXYAR为例。以双变量回归模型和t遵循0均值、同方差、无序列相关的各条OLS假定BLUEOLS)()()1 (: )2() 1 (*2*1*11211得到可用满足全部经典假定,tttttttttXYXXYY广义差分方程,失去一次观测ikikiiiXXXY22110更一般地,如果原模型存在tltlttt2211则可以将原模型变换为: )()1 (1111111011ltlttlltlt
13、tXXXYYYtlktlktktkXXX)(11 该模型为广义差分模型广义差分模型,不存在序列相关问题。可进行OLS估计。 未知时序列相关的修正应用广义差分法,必须已知随机误差项的相关系数1, 2, , p 。 实际上,人们并不知道它们的具体数值,所以必须首先对它们进行估计。n(1)用)用DW统计量估计统计量估计 21) 1 (2dd(2)科克伦-奥克特两步法n做原模型的做原模型的OLS估计,得到残差估计,得到残差etn做回归:做回归: 估计估计 n用用 作广义差分方程的回归,求回归系作广义差分方程的回归,求回归系数。数。tttee1(3)德宾两步法n将广义差分方程写为:n将上式看作一复回归模
14、型,求将上式看作一复回归模型,求Yt对对Xt,Xt-1和和Yt-1的回的回归,并把对归,并把对Yt-1的回归系数的估计值(的回归系数的估计值( )看作对)看作对 的的一个估计。虽然这个估计值有偏误,它却是一个估计。虽然这个估计值有偏误,它却是 的一个的一个一致性估计。一致性估计。n求得求得 后,把变量换为后,把变量换为 对转换变量形成的广义差分方程做对转换变量形成的广义差分方程做OLS估计。估计。tttttYXXY11221)1 (1*1*,ttttttXXXYYY虚假序列相关问题虚假序列相关问题 由于随机项的序列相关往往是在模型设定中遗漏了重要的解释变量或对模型的函数形式设定有误,这种情形可
15、称为虚假序列相关(false autocorrelation) ,应在模型设定中排除。 避免产生虚假序列相关性的措施是在开始时建立一个“一般”的模型,然后逐渐剔除确实不显著的变量。例1 美国零工招聘指数与失业率n数据如表。回归模型设为:数据如表。回归模型设为: n其中:其中:HWI:零工招聘指数,零工招聘指数,U:失业率失业率tttUHWIlnln21先验符号?24911. 0)612.21()83.65(:955. 0)0711. 0()111. 0(:ln538. 1308. 7ln2NdtrseUIHWtt查表,N=24,一个解释变量,5%的DW临界值:dL=1.27, dU=1.45,
16、0d=0.911 dL ,正序列相关Unstandardized Residual.10.0-.1-.2LAGS(RES_1,1).10.0-.1-.2ScatterplotDependent Variable: LNHWIRegression Standardized Predicted Value2.01.51.0.50.0-.5-1.0-1.5Regression Standardized Residual1.51.0.50.0-.5-1.0-1.5-2.0)0711. 0()111. 0(:ln538. 1308. 7lnseUIHWtt例1 美国零工招聘指数与失业率n序列相关修正,估
17、计序列相关修正,估计 n用DW统计量估计n科克伦-奥克特两步法n德宾两步法n科科-奥两步法结果:奥两步法结果:5445.02911.0121d546. 0 795. 0 一般对大样本来说,用哪种方法区别不大。但是对小样本则不同。而且没有一种方法总是优于其他方法。科-奥两步法较常用。761. 1858. 0)269.11()96.35(:21. 7546. 01273. 3)131. 0()091. 0(:) 1 (273. 3ln471. 1273. 3n l211*drtseUHWItt)131. 0(:ln471. 121. 7n lseUHWI)0711. 0()111. 0(:ln53
18、8. 1308. 7lnseUIHWttScatterplotDependent Variable: LQRegression Standardized Predicted Value1.51.0.50.0-.5-1.0-1.5-2.0Regression Standardized Residual3210-1-2例2我国1980-2001年发电量与GDP0.488DW 3807.5F 995. 0R (0.008)08). 0( :se488lnGDP. 0911. 3q ln2对数模型lnqi=0+1lnxi+i存在序列相关存在序列相关BG检验:检验:LMtttteee22113 .31F
19、193). 0(182). 0(se879e. 0429e. 1e 2t1tt序列相关修正序列相关修正)879. 0429. 11 (879lnGDP. 0429lnGDP. 1lnGDPlnGDP879lnq. 0429lnq. 1lnqlnqlnGDPlnq0*12t1 - tt*t2t1 - tt*tt*t2*1*t系数均显著,存在序列相关1.797DW2369,F992. 0R010. 0045. 0se487lnGDP. 0767. 1q ln2*t*t0.488DW 3807.5F 995. 0R (0.008)08). 0( :se488lnGDP. 0911. 3q ln201
20、0. 0se487lnGDP. 0927. 3q ln927. 30.879429. 11767. 1tt0ScatterplotDependent Variable: LQ1Regression Standardized Predicted Value1.51.0.50.0-.5-1.0-1.5-2.0Regression Standardized Residual2.01.51.0.50.0-.5-1.0-1.5-2.0六、案例:中国商品进口模型六、案例:中国商品进口模型 经济理论指出,商品进口商品进口主要由进口国的经经济发展水平济发展水平,以及商品进口价格指数商品进口价格指数与国内价格国
21、内价格指数指数对比因素决定的。 由于无法取得中国商品进口价格指数,我们主要研究中国商品进口与国内生产总值的关系。(下表)。 表表 4.2.14.2.1 19782001 年中国商品进口与国内生产总值年中国商品进口与国内生产总值 国内生产总值 GDP (亿元) 商品进口 M (亿美元) 国内生产总值 GDP (亿元) 商品进口 M (亿美元) 1978 3624.1 108.9 1990 18547.9 533.5 1979 4038.2 156.7 1991 21617.8 637.9 1980 4517.8 200.2 1992 26638.1 805.9 1981 4862.4 220.2
22、 1993 34634.4 1039.6 1982 5294.7 192.9 1994 46759.4 1156.1 1983 5934.5 213.9 1995 58478.1 1320.8 1984 7171.0 274.1 1996 67884.6 1388.3 1985 8964.4 422.5 1997 74462.6 1423.7 1986 10202.2 429.1 1998 78345.2 1402.4 1987 11962.5 432.1 1999 82067.46 1657 1988 14928.3 552.7 2000 89442.2 2250.9 1989 16909.
23、2 591.4 2001 95933.3 2436.1 资料来源: 中国统计年鉴 (1995、2000、2002) 。 1. 通过通过OLS法建立如下中国商品进口方程:法建立如下中国商品进口方程: ttGDPM02. 091.152t (3.32) (20.12) ScatterplotDependent Variable: 商品进口(亿美元)Regression Standardized Predicted Value2.01.51.0.50.0-.5-1.0Regression Standardized Residual3210-1-2-3 2. 进行序列相关性检验。 DW检验检验 取=5
24、%,由于n=24,k=2(包含常数项),查表得: dl=1.27, du=1.45由于 DW=0.628 20.05(2) 故: 存在正自相关存在正自相关2 2阶滞后:阶滞后:BG检验检验42.12F318. 3959. 5024. 0011. 0t674. 0R756e. 0112e. 100085GDP. 0389. 0e 22t1ttttptp1t1ktk2t21t10teeXXXe3阶滞后:于是,LM=210.68=14.28取=5%,2分布的临界值20.05(3)=7.815 LM 20.05(3) 表明: 存在正自相关;但存在正自相关;但 t-3t-3的参数不显著,说的参数不显著,
25、说明不存在明不存在3 3阶序列相关性。阶序列相关性。8.5F0.3661.801-4.2240.256-0.231t68. 0R156e. 0963e. 0191e. 101GDP. 0498. 9e 23t2t1tt 3、运用广义差分法进行自相关的处理、运用广义差分法进行自相关的处理 (1)采用杜宾两步法估计)采用杜宾两步法估计 第一步第一步,估计模型 tttttttGDPGDPGDPMMM2*31*2*12211*02121054. 0096. 0055. 0469. 0938. 009.78ttttttGDPGDPGDPMMMt (1.76) (6.64) (-1.76) (5.88)
26、(-5.19) (5.30) 第二步第二步,作差分变换: )469. 0938. 0(21*ttttMMMM)469. 0938. 0(21*ttttGDPGDPGDPGDPD.W.=2.307 R2=0.991则则M*关于关于GDP*的的OLS估计结果为:估计结果为: *020. 018.86ttGDPM (2.76) (16.46)取=5%,DWdu=1.43 (样本容量24-2=22) 表明:已不存在自相关162.300.469)0.938- /(186.18)1/(21*00于是原模型为: ttGDPM020. 030.162与与OLS估计结果的差别只在估计结果的差别只在截距项截距项:
27、 ttGDPM02. 091.152(2)采用科克伦)采用科克伦-奥科特迭代法估计奥科特迭代法估计 2t1tt*t2- t1tt*t751GDP. 011GDP. 1GDPGDP751M. 011M. 1MM7 .382F563.19686. 3t1.882DW95,. 0R0199. 0322.107M2*t取=5% ,DWdu=1.66(样本容量:22)表明:广义差分模型已不存在序列相关性。 可以验证可以验证: : 仅采用1阶广义差分,变换后的模型仍存在1阶自相关性; 采用3阶广义差分,变换后的模型不再有自相关性,但AR3的系数的t值不显著。 2t1tt751e. 011e. 1e 单方程
28、小结 多元回归模型n多元回归模型描述了被解释变量与诸解释多元回归模型描述了被解释变量与诸解释变量的依赖关系变量的依赖关系n偏回归系数偏回归系数 i表示其它解释变量不变的条件表示其它解释变量不变的条件下,第下,第i个解释变量变化对被解释变量的个解释变量变化对被解释变量的 “净净” 影响。影响。n偏回归系数的估计方法:最小二乘估计偏回归系数的估计方法:最小二乘估计n当经典假设满足时,OLS估计量为最优线性无偏估计量111nkknnxy121)()var()(xxyxxx多元回归模型的建模过程n明确所研究的问题,确定因变量明确所研究的问题,确定因变量n通过定性分析,找到导致因变量变化的通过定性分析,
29、找到导致因变量变化的主要影响因素,作为解释变量主要影响因素,作为解释变量n收集数据,整理数据,数据的初步分析收集数据,整理数据,数据的初步分析n分析因变量与各解释变量间关系的性质,确定模型的函数形式n建立计量模型,确定各偏回归系数的先建立计量模型,确定各偏回归系数的先验符号验符号多元回归模型的建模过程(续)n用用OLS估计模型的参数,并作各种检验估计模型的参数,并作各种检验n经济意义检验:各偏回归系数的符号是否与预期一致n经典假设检验:多重共线、异方差、序列相关n如果存在异方差如果存在异方差/序列相关,统计检验无效序列相关,统计检验无效n统计检验:t检验,F检验,判定系数n筛选完善模型:设定偏
30、误问题筛选完善模型:设定偏误问题n模型的应用:预测、结构分析、政策建议模型的应用:预测、结构分析、政策建议n注意:不同形式模型偏回归系数的经济含义回归建模示例1:粮食生产模型n根据理论和经验分析,影响粮食生产(根据理论和经验分析,影响粮食生产(Y)的主要因素有:的主要因素有:n农业化肥施用量(X1), 粮食播种面积(X2),成灾面积(X3),农业机械总动力(X4), 农业劳动力(X5)n已知中国粮食生产的相关数据,建立中国粮食生产函数: Y= 0+ 1 X1 + 2 X2 + 3 X3 + 4 X4 + 4 X5 + 模型估计结果模型估计结果不显著,剔除?辅助回归3 .161121RVIF75
31、. 1,64.16,19. 3,73. 15432VIFVIFVIFVIF差分消除共线差分消除共线1ttt1tt5t54t43t32t21t1tt5t54t43t32t21t10tyyyxxxxxyxxxxxy其中差分方程:35. 1,39. 1,45. 1,96. 2,31. 254321VIFVIFVIFVIFVIF剔除两个不显著变量剔除两个不显著变量)042. 0()126. 0()255. 1 (:se194x. 049x. 0 x182 . 5y 3t2t1tt最终模型:剔除变量法:先剔除哪个变量?先剔除先剔除x5“劳动力劳动力”3 .161VIF75. 1,64.16,19. 3,73. 15432VIFVIFVIFVIF剔除x5“劳动力”和x4“机械总动力”12. 1)618/(56850562/ )56850566744293()/(/ )(,knSSEmSSESSEFURURRknm可检验无序列相关,无异方差去除常数项过原点回归)042. 0()126. 0()255. 1 (:se194x. 049x. 0218x. 5y 3t2t1tt差分模型:)042. 0()007. 0()239. 0(se0.2240.3055.357:成灾面积播种面积化肥用量量粮食产作业:本题作业:本题作每公顷粮作每公顷粮食产量的影食产量的影响因素分析响因素分析模型模型
限制150内