应用统计学logistic回归模型学习教案.pptx
《应用统计学logistic回归模型学习教案.pptx》由会员分享,可在线阅读,更多相关《应用统计学logistic回归模型学习教案.pptx(54页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、会计学1应用统计学应用统计学logistic回归回归(hugu)模型模型第一页,共54页。对分类变量的分析(fnx),当考察的影响因素较少,且也为分类变量时,常用列联表(Contingency Table)进行整理,并用2检验或分层2检验进行分析(fnx),但存在以下局限性:无法描述其作用大小和方向,更不能考察各因素间是否有交互作用;当控制的分层因素较多时,将导致检验结果不可靠;2检验无法对连续性自变量进行分析(fnx)(致命缺陷)。模型(mxng)简介第1页/共54页第二页,共54页。logistic回归模型适合于应变量为二项分类的资料,在医学研究领域中的应用广泛(gungfn)。如流行病病
2、因学研究(包括队列研究、病例对照研究、横断面研究等)、临床疗效研究(如疗效与治疗方法、患病轻中重等因素关系)、卫生服务研究(如是否就诊与性别、年龄、文化程度的关系)等等。模型(mxng)简介第2页/共54页第三页,共54页。模型(mxng)简介v logistic回归(hugu)模型:第3页/共54页第四页,共54页。反应变量为二分类变量或某事件(shjin)的发生率;自变量与logit(P)之间为线性关系;残差合计为0,且服从二项分布;各观测间相互独立。模型简介适用(shyng)条件v logistic回归模型应该使用最大似然法来解决方程的估计和检验(jinyn)问题,不应当使用以前的最小二
3、乘法进行参数估计。第4页/共54页第五页,共54页。例1 某医师希望(xwng)研究病人的年龄age、性别sex(0为女性、1为男性)、心电图检验是否异常ecg(ST段压低、0为正常、1为轻度异常、2为重度异常)与冠心病ca是否有关,数据见logistic_binary.sav。简单分析(fnx)实例第5页/共54页第六页,共54页。简单分析(fnx)实例第6页/共54页第七页,共54页。选入应变量(binling)选入自变量简单(jindn)分析实例第7页/共54页第八页,共54页。简单(jindn)分析实例结果(ji gu)分析v 此表为应变量取值水平编码,SPSS默认取值水平高的为阳性(
4、yngxng)结果。第8页/共54页第九页,共54页。简单(jindn)分析实例结果(ji gu)分析v 本表输出(shch)当前模型的-2log(似然值)和两个伪决定系数,但对于logistic回归而言,通常看见的伪决定系数不像线性回归模型中的决定系数那么大。第9页/共54页第十页,共54页。简单(jindn)分析实例结果(ji gu)分析v 此表输出模型中的各自(gz)变量的偏回归系数及其标准误、Wald 2、自由度、P 值、OR值(即exp(B)。第10页/共54页第十一页,共54页。哑变量(binling)设置在回归模型中,回归系数b表示其他自变量不变,x每改变一个单位时,所预测(yc
5、)的y的平均变化量,当x为连续性变量时,这样解释没有问题,二分类变量由于只存在两个类别间的比较,也可以对系数得到很好的解释。但是当x为多分类变量时,仅拟合一个回归系数就不太合适了,此时需要使用哑变量(dummy variable)方式对模型进行定义。第11页/共54页第十二页,共54页。例2 Hosmer 和Lemeshow于1989年研究了低出生体重婴儿的影响因素,结果变量(binling)为是否娩出低出生体重儿(变量(binling)名为LOW,1表示低出生体重儿,0表示非低出生体重儿),考虑的自变量(binling)有产妇妊娠前体重、产妇年龄、种族、是否吸烟、早产次数、是否患高血压等。(
6、数据文件见:logistic_step.sav。)哑变量(binling)设置第12页/共54页第十三页,共54页。哑变量(binling)设置第13页/共54页第十四页,共54页。哑变量(binling)设置第14页/共54页第十五页,共54页。选入无序(w x)多分类变量设置参照(cnzho)水平哑变量(binling)设置第15页/共54页第十六页,共54页。哑变量(binling)设置结果(ji gu)分析v 哑变量(种族(zhngz))的设置情况第16页/共54页第十七页,共54页。哑变量(binling)设置v 白人低出生(chshng)体重的风险较低,而黑人风险较高。结果(ji
7、gu)分析第17页/共54页第十八页,共54页。参照水平最好要有实际意义,不推荐使用其他作为参照;参照水平组要有一定的频数作保证,应不少于30或50例;对有序自变量的分析:从专业出发确定;分别(fnbi)以哑变量和连续性变量的方式引入模型进行比较后确定。哑变量(binling)设置v 哑变量(binling)设置应该注意的问题第18页/共54页第十九页,共54页。Forward:Conditional (最可靠(kko))Forward:LR Forward:Wald (应当慎用)Backward:Conditional(最可靠(kko))Backward:LR Backward:Wald(应
8、当慎用)v 6 种筛选(shixun)自变量的方法逐步回归第19页/共54页第二十页,共54页。例3 仍以例2的数据为例,演示(ynsh)如何在SPSS中实现逐步logistic回归分析。逐步回归第20页/共54页第二十一页,共54页。选择其中一种(y zhn)逐步法逐步回归第21页/共54页第二十二页,共54页。逐步回归v 给出了模型拟合过程中每一步(y b)的-2log(L)及两个伪决定系数。结果(ji gu)分析第22页/共54页第二十三页,共54页。逐步回归结果(ji gu)分析第23页/共54页第二十四页,共54页。逐步回归结果(ji gu)分析v 输出了尚不在模型中的自变量是否能被
9、引入的Score检验(jinyn)结果,这里只给出第一步的结果。第24页/共54页第二十五页,共54页。对数似然值与伪决定系数模型(mxng)预测正确率ROC曲线模型(mxng)拟合效果检验v 拟合效果(xiogu)判断指标:第25页/共54页第二十六页,共54页。对数似然值与伪决定系数:对数似然值与伪决定系数:-2-2 倍对数似然值表示模型的拟合效果,其值越小,越接倍对数似然值表示模型的拟合效果,其值越小,越接近于近于0 0,说明模型拟合效果越好。,说明模型拟合效果越好。但是,当自变量中存在缺失值时,因为一般统计软件在但是,当自变量中存在缺失值时,因为一般统计软件在进行计算时会把含有进行计算
10、时会把含有(hn yu)(hn yu)缺失值的记录予以剔除,缺失值的记录予以剔除,不参与统计分析,此时不能用不参与统计分析,此时不能用-2log likelihood-2log likelihood 对不同模对不同模型的拟合效果进行比较。型的拟合效果进行比较。模型拟合效果(xiogu)检验第26页/共54页第二十七页,共54页。模型模型(mxng)(mxng)预测正确率:预测正确率:例3进行逐步回归的第三步(step3)输出以上结果,预测(yc)正确的记录占71.4。模型拟合效果(xiogu)检验第27页/共54页第二十八页,共54页。ROCROC曲线曲线(qxin)(qxin):Save子对
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 统计学 logistic 回归 模型 学习 教案
限制150内