应用统计学logistic回归模型.pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《应用统计学logistic回归模型.pptx》由会员分享,可在线阅读,更多相关《应用统计学logistic回归模型.pptx(54页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、对分类变量的分析,当考察的影响因素较少,且也为分类变量时,常用列联表(Contingency Table)进行整理,并用2检验或分层2检验进行分析,但存在以下局限性:无法描述其作用大小和方向,更不能考察各因素间是否有交互作用;当控制的分层因素较多时,将导致检验结果不可靠;2检验无法对连续性自变量进行分析(致命缺陷)。模型简介第1页/共54页logistic回归模型适合于应变量为二项分类的资料,在医学研究领域中的应用广泛。如流行病病因学研究(包括队列研究、病例对照研究、横断面研究等)、临床疗效研究(如疗效与治疗方法、患病轻中重等因素关系)、卫生服务研究(如是否就诊与性别、年龄、文化程度的关系)等
2、等。模型简介第2页/共54页模型简介v logistic回归模型:第3页/共54页 反应变量为二分类变量或某事件的发生率;自变量与logit(P)之间为线性关系;残差合计为0,且服从二项分布;各观测间相互独立。模型简介适用条件v logistic回归模型应该使用最大似然法来解决方程的估计和检验问题,不应当使用以前的最小二乘法进行参数估计。第4页/共54页例1 某医师希望研究病人的年龄age、性别sex(0为女性、1为男性)、心电图检验是否异常ecg(ST段压低、0为正常、1为轻度异常、2为重度 异 常)与 冠 心 病 ca是 否 有 关,数 据 见logistic_binary.sav。简单分
3、析实例第5页/共54页简单分析实例第6页/共54页选入应变量选入自变量简单分析实例第7页/共54页简单分析实例结果分析v 此表为应变量取值水平编码,SPSS默认取值水平高的为阳性结果。第8页/共54页简单分析实例结果分析v 本表输出当前模型的-2log(似然值)和两个伪决定系数,但对于logistic回归而言,通常看见的伪决定系数不像线性回归模型中的决定系数那么大。第9页/共54页简单分析实例结果分析v 此表输出模型中的各自变量的偏回归系数及其标准误、Wald 2、自由度、P 值、OR值(即exp(B)。第10页/共54页哑变量设置在回归模型中,回归系数b表示其他自变量不变,x每改变一个单位时
4、,所预测的y的平均变化量,当x为连续性变量时,这样解释没有问题,二分类变量由于只存在两个类别间的比较,也可以对系数得到很好的解释。但是当x为多分类变量时,仅拟合一个回归系数就不太合适了,此时需要使用哑变量(dummy variable)方式对模型进行定义。第11页/共54页例2 Hosmer 和Lemeshow于1989年研究了低出生体重婴儿的影响因素,结果变量为是否娩出低出生体重儿(变量名为LOW,1表示低出生体重儿,0表示非低出生体重儿),考虑的自变量有产妇妊娠前体重、产妇年龄、种族、是否吸烟、早产次数、是否患高血压等。(数据文件见:logistic_step.sav。)哑变量设置第12页
5、/共54页哑变量设置第13页/共54页哑变量设置第14页/共54页选入无序多分类变量设置参照水平哑变量设置第15页/共54页哑变量设置结果分析v 哑变量(种族)的设置情况第16页/共54页哑变量设置v 白人低出生体重的风险较低,而黑人风险较高。结果分析第17页/共54页 参照水平最好要有实际意义,不推荐使用其他作为参照;参照水平组要有一定的频数作保证,应不少于30或50例;对有序自变量的分析:从专业出发确定;分别以哑变量和连续性变量的方式引入模型进行比较后确定。哑变量设置v 哑变量设置应该注意的问题第18页/共54页 Forward:Conditional (最可靠)Forward:LR Fo
6、rward:Wald (应当慎用)Backward:Conditional(最可靠)Backward:LR Backward:Wald(应当慎用)v 6 种筛选自变量的方法逐步回归第19页/共54页例3 仍以例2的数据为例,演示如何在SPSS中 实 现 逐 步logistic回归分析。逐步回归第20页/共54页选择其中一种逐步法逐步回归第21页/共54页逐步回归v 给出了模型拟合过程中每一步的-2log(L)及两个伪决定系数。结果分析第22页/共54页逐步回归结果分析第23页/共54页逐步回归结果分析v 输出了尚不在模型中的自变量是否能被引入的Score检验结果,这里只给出第一步的结果。第24
7、页/共54页对数似然值与伪决定系数模型预测正确率ROC曲线模型拟合效果检验v 拟合效果判断指标:第25页/共54页对数似然值与伪决定系数:对数似然值与伪决定系数:-2 倍对数似然值表示模型的拟合效果,其值越小,越接近于0,说明模型拟合效果越好。但是,当自变量中存在缺失值时,因为一般统计软件在进行计算时会把含有缺失值的记录予以剔除,不参与统计分析,此时不能用-2log likelihood 对不同模型的拟合效果进行比较。模型拟合效果检验第26页/共54页模型预测正确率:模型预测正确率:例3进行逐步回归的第三步(step3)输出以上结果,预测正确的记录占71.4。模型拟合效果检验第27页/共54页
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 统计学 logistic 回归 模型
![提示](https://www.deliwenku.com/images/bang_tan.gif)
限制150内