《(6)案例:异方差.doc》由会员分享,可在线阅读,更多相关《(6)案例:异方差.doc(6页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、 案例分析案例分析一、问题的提出和模型设定一、问题的提出和模型设定根据本章引子提出的问题,为了给制定医疗机构的规划提供依据,分析比较医疗机构与人口数量的关系,建立卫生医疗机构数与人口数的回归模型。假定医疗机构数与人口数之间满足线性约束,则理论模型设定为iiiuXY21(5.31)其中iY表示卫生医疗机构数,iX表示人口数。由 2001 年四川统计年鉴得到如下数据。表 5.1 四川省 2000 年各地区医疗机构数与人口数地区人口数(万人)X医疗机构数(个)Y地区人口数(万人)X医疗机构数(个)Y成都1013.36304眉山339.9827自贡315911宜宾508.51530攀枝花103934广
2、安438.61589泸州463.71297达州620.12403德阳379.31085雅安149.8866绵阳518.41616巴中346.71223广元302.61021资阳488.41361遂宁3711375阿坝82.9536内江419.91212甘孜88.9594乐山345.91132凉山402.41471南充 709.2 4064二、参数估计二、参数估计进入 EViews 软件包,确定时间范围;编辑输入数据;选择估计方程菜单,估计样本回归函数如下表 5.2估计结果为56.69,2665.508.,7855. 0)3403. 8()9311. 1(3735. 50548.5632FesR
3、XYii(5.32)括号内为 t 统计量值。三、检验模型的异方差三、检验模型的异方差本例用的是四川省 2000 年各地市州的医疗机构数和人口数,由于地区之间存在的不同人口数,因此,对各种医疗机构的设置数量会存在不同的需求,这种差异使得模型很容易产生异方差,从而影响模型的估计和运用。为此,必须对该模型是否存在异方差进行检验。(一)图形法1、EViews 软件操作。由路径:Quick/Qstimate Equation,进入 Equation Specification 窗口,键入“y c x” ,确认并“ok” ,得样本回归估计结果,见表 5.2。(1)生成残差平方序列。在得到表 5.2 估计结
4、果后,立即用生成命令建立序列2 ie,记为 e2。生成过程如下,先按路径:Procs/Generate Series,进入 Generate Series by Equation 对话框,即图 5.4然后,在 Generate Series by Equation 对话框中(如图 5.4) ,键入“e2=(resid)2” ,则生成序列2 ie。(2)绘制2 te对tX的散点图。选择变量名 X 与 e2(注意选择变量的顺序,先选的变量将在图形中表示横轴,后选的变量表示纵轴) ,进入数据列表,再按路径view/graph/scatter,可得散点图,见图 5.5。图 5.52、判断。由图 5.5
5、 可以看出,残差平方2 ie对解释变量 X 的散点图主要分布在图形中的下三角部分,大致看出残差平方2 ie随iX的变动呈增大的趋势,因此,模型很可能存在异方差。但是否确实存在异方差还应通过更进一步的检验。(二)Goldfeld-Quanadt 检验1、EViews 软件操作。(1)对变量取值排序(按递增或递减) 。在 Procs 菜单里选 Sort Series 命令,出现排序对话框,如果以递增型排序,选 Ascenging,如果以递减型排序,则应选Descending,键入 X,点 ok。本例选递增型排序,这时变量 Y 与 X 将以 X 按递增型排序。(2)构造子样本区间,建立回归模型。在本
6、例中,样本容量 n=21,删除中间 1/4 的观测值,即大约 5 个观测值,余下部分平分得两个样本区间:18 和 1421,它们的样本个数均是 8 个,即821 nn。在 Sample 菜单里,将区间定义为 18,然后用 OLS 方法求得如下结果表 5.3在 Sample 菜单里,将区间定义为 1421,再用 OLS 方法求得如下结果表 5.4(3)求 F 统计量值。基于表 5.3 和表 5.4 中残差平方和的数据,即 Sum squared resid 的值。由表 5.3 计算得到的残差平方和为9 .1449582 1ie,由表 5.4 计算得到的残差平方和为8 .7343552 2ie,根
7、据 Goldfeld-Quanadt 检验,F 统计量为066. 59 .1449588 .7343552 12 2ii eeF(5.33)(4)判断。在05. 0下,式(5.33)中分子、分母的自由度均为 6,查 F 分布表得临界值为28. 4)6 , 6(05. 0F,因为28. 4)6 , 6(066. 505. 0FF,所以拒绝原假设,表明模型确实存在异方差。(三)(三)WhiteWhite 检验检验( (重点介绍重点介绍, ,并掌握并掌握) )由表 5.2 回归方程结果,按路径 view/residual tests/white heteroskedasticity(no cross
8、 terms or cross terms) ,进入 White 检验。根据 White检验中辅助函数的构造,最后一项为变量的交叉乘积项,因为本例为一元函数,故无交叉乘积项,因此应选 no cross terms,则辅助函数为ttttvxx2 2102(5.34)经估计出现 White 检验结果,见表 5.5。从表 5.5 可以看出,0694.182nR,由 White 检验知,在05. 0下,查2分布表,得临界值9915. 5)2(2 05. 0(在(5.34)式中只有两项含有解释变量,故自由度为 2) ,比较计算的2统计量与临界值,因为0694.182nR9915. 5)2(2 05. 0
9、,所以拒绝原假设,不拒绝备择假设,表明模型存在异方差。表 5.5四、异方差性的修正四、异方差性的修正 (一)加权最小二乘法(一)加权最小二乘法(WLSWLS) (重点理解并掌握重点理解并掌握)在运用 WLS 法估计过程中,我们分别选用了权数ti ti ttXwXwXw1,1,1 3221 。权数的生成过程如下,由图 5.4,在对话框中的 Enter Quation 处,按如下格式分别键入:Xw/11;2/12Xw ;)(/13Xsqrw ,经估计检验发现用权数tw2的效果最好。下面仅给出用权数tw2的结果。表 5.7表 5.7 的估计结果如下8838.12,0493.276.,7060. 1.,9387. 0)5894. 3()3794. 4(9530. 26090.3682FesWDRXYii(5.36)括号中数据为 t 统计量值。可以看出运用加权小二乘法消除了异方差性后,参数的 t 检验均显著,可决系数大幅提高,F 检验也显著,并说明人口数量每增加 1 万人,平均说来将增加2.953 个卫生医疗机构,而不是引子中得出的增加 5.3735 个医疗机构。虽然这个模型可能还存在某些其他需要进一步解决的问题,但这一估计结果或许比引子中的结论更为接近真实情况。
限制150内