Logistic回归模型 (2).ppt
《Logistic回归模型 (2).ppt》由会员分享,可在线阅读,更多相关《Logistic回归模型 (2).ppt(81页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、Logistic 回归模型回归模型赵耐青赵耐青复旦大学公共卫生学院复旦大学公共卫生学院1数据分析的背景数据分析的背景计量资料单因素统计分析计量资料单因素统计分析对于两组计量资料的比较,一般采用对于两组计量资料的比较,一般采用t检检验或秩和检验。验或秩和检验。对于两个变量的相关分析采用对于两个变量的相关分析采用Pearson相相关分析或关分析或Spearman相关分析相关分析考虑多因素的影响,对于应变量考虑多因素的影响,对于应变量(反应变反应变量量)为计量资料,一般可以考虑应用多重为计量资料,一般可以考虑应用多重线性回归模型进行多因素分析。线性回归模型进行多因素分析。2数据分析的背景数据分析的背
2、景单因素的分类资料统计分析,一般采用单因素的分类资料统计分析,一般采用Pearson 2进行统计检验,用进行统计检验,用Odds Ratio及其及其95%可信区间评价关联程度。可信区间评价关联程度。考虑多因素的影响,对于反应变量为分考虑多因素的影响,对于反应变量为分类变量时,用线性回归模型类变量时,用线性回归模型P=a+bx就不就不合适了,应选用合适了,应选用Logistic回归模型进行统回归模型进行统计分析。计分析。3Logistic回归模型回归模型按研究设计分类按研究设计分类非配对设计:非条件非配对设计:非条件Logistic回归模型回归模型配对的病例对照:条件配对的病例对照:条件Logi
3、stic回归模型回归模型按反应变量分类按反应变量分类二分类二分类Logistic回归模型回归模型(常用常用)多分类无序多分类无序Logistic回归模型回归模型多分类有序多分类有序Logistic回归模型回归模型4基础知识基础知识通过下例引入和复习相关概念通过下例引入和复习相关概念例如:研究患某疾病与饮酒的关联性例如:研究患某疾病与饮酒的关联性患病率患病率 P1=a/m1 P2=b/m25基础知识基础知识Odds(优势)(优势)P越大越大,则则Odds越大;越大;P越小越小,则则Odds越小越小 并且并且 0Odds+6基础知识基础知识 P与与Odds一一对应一一对应对于两个对于两个Odds的
4、比较,一般用它们的的比较,一般用它们的Ratio,并称为并称为Odds Ratio(OR),其定义,其定义如下:如下:其样本估计统计量为其样本估计统计量为7基础知识基础知识 故比较两个率故比较两个率比较比较OR=1?OR1?OR1?8(二分类二分类)Logistic回归模型回归模型因为因为0Odds+所以所以 -ln(Odds)1.96,P0.05,拒绝拒绝H018实例实例1:用用Logistic模型进行统计分析模型进行统计分析实例实例1的回归系数估计为的回归系数估计为se(b)=0.1780719,z=b/se=2.31,P=0.021 则拒绝则拒绝H0。如果对模型中所有的自变量进行检验,如
5、果对模型中所有的自变量进行检验,则称为模型检验。如实例则称为模型检验。如实例2,对两个自变,对两个自变量进行检验,故这是模型检验。量进行检验,故这是模型检验。25实例实例2应用应用Logistic模型模型校正混杂作用校正混杂作用应用应用Stata软件进行最大似然估计,得到软件进行最大似然估计,得到模型拟合的主要结果如下模型拟合的主要结果如下似然函数比为似然函数比为2ln(L)76.32,df=2,P0.001,因此拒绝,因此拒绝H0:1=2=0,可以,可以认为认为 1和和 2不全为不全为0。26实例实例2应用应用Logistic模型模型校正混杂作用校正混杂作用应用应用Stata软件进行最大似然
6、估计,得到软件进行最大似然估计,得到回归系数估计的主要结果如下回归系数估计的主要结果如下饮酒饮酒:27多自变量多自变量Logistic模型的模型的OR解释解释在本例中,对于同为吸烟或不吸烟的对象在本例中,对于同为吸烟或不吸烟的对象而言而言(x2相对固定不变相对固定不变),饮酒饮酒(x1=1)的对数的对数Odds为为不饮酒不饮酒(x1=0)的对数的对数Odds为为28多自变量多自变量Logistic模型的模型的OR解释解释则饮酒的对数则饮酒的对数Odds Ratio为为即:饮酒的即:饮酒的意义:对于同为吸烟的对象或者同意义:对于同为吸烟的对象或者同为不吸烟的对象,其饮酒的为不吸烟的对象,其饮酒的
7、故称校正吸烟后故称校正吸烟后OR,而前者未考虑,而前者未考虑吸烟的单因素吸烟的单因素OR称为称为crude OR29实例实例2应用应用Logistic模型模型校正混杂作用校正混杂作用饮酒饮酒:P=1校正了吸烟因素的情况下,没有足够的校正了吸烟因素的情况下,没有足够的证据推断饮酒与证据推断饮酒与AMI患病有关联性。患病有关联性。吸烟:吸烟:P0.001,校正了饮酒的情况下,可以认,校正了饮酒的情况下,可以认为吸烟与患为吸烟与患AMI的关联性有统计学意义,的关联性有统计学意义,并且可以认为吸烟者患并且可以认为吸烟者患AMI的风险更大。的风险更大。30Logistic模型中的交互作用模型中的交互作用
8、实例实例3:采用病例对照设计研究吸烟和家:采用病例对照设计研究吸烟和家属史与患肺癌的关联性。属史与患肺癌的关联性。用用x1=1,0分别表示吸烟和不吸烟;分别表示吸烟和不吸烟;x2=1,0分别表示有无家属史;用分别表示有无家属史;用y=1,0分别表示分别表示患肺癌和未患肺癌。患肺癌和未患肺癌。31实例实例3:Logistic模型的交互作用模型的交互作用一般而言,吸烟和家属史均是肺癌的重要一般而言,吸烟和家属史均是肺癌的重要相关因素,很有可能这两个因素对患肺癌相关因素,很有可能这两个因素对患肺癌有交互作用,因此采用下列含有交互作用有交互作用,因此采用下列含有交互作用项的项的Logistic模型。模
9、型。其中其中x1和和x2的乘积项的乘积项x1x2称为交互作用项称为交互作用项32应用应用Logistic模型分析实例模型分析实例3用用Stata软件对实例软件对实例3的资料拟合上述模型,得的资料拟合上述模型,得到下列结果:到下列结果:3=0.955825,P0.04,差别有统计学意义,差别有统计学意义,可以认为吸烟和家属史对患肺癌有交互作用。可以认为吸烟和家属史对患肺癌有交互作用。33实例实例3:Logistic模型的交互作用模型的交互作用由于本例模型为由于本例模型为对于无家属史,对于无家属史,x2=0代入模型,得到代入模型,得到由回归系数与由回归系数与OR的关系,得到吸烟的:的关系,得到吸烟
10、的:P =3.84,故拒绝,故拒绝H0,可,可以认为以认为 1+3 0,差别有统计学意义,差别有统计学意义,可以认为吸烟者患肺癌的风险更大。可以认为吸烟者患肺癌的风险更大。36实例实例3:Logistic模型的交互作用模型的交互作用同理,为了评价家属史与肺癌的关联性,同理,为了评价家属史与肺癌的关联性,根据下列根据下列Logistic模型模型对于不吸烟对于不吸烟x1=0,则上述,则上述Logistic模型为模型为家属史的家属史的P=0.认为认为0260.05,两个药的疗效差异无统计学意义。,两个药的疗效差异无统计学意义。模型模型病情重病情重x2=1代入模型,得到代入模型,得到44Logisti
11、c模型中的交互作用模型中的交互作用即:病情重时的药物变量即:病情重时的药物变量x1的回归系数为的回归系数为对于在病情重的情况下,两个药的疗效是否对于在病情重的情况下,两个药的疗效是否有差异需检验有差异需检验 1+3=0,用,用Stata软件计算得:软件计算得:检验统计量检验统计量 242.16,df=1,P0,导致,导致x1越大,患病概率相对越大;越大,患病概率相对越大;若若 10.05,即:对于,即:对于职业为工人与农民而言,其与患病之间的职业为工人与农民而言,其与患病之间的关联性无统计学意义。关联性无统计学意义。52多分类无序自变量的处理多分类无序自变量的处理x13的回归系数P0.0030
12、.05,说明干部与农民的职业与患糖尿病有关联,其干部与工人比较,用Stata软件检验12=13,P=0.0230.05,差异有统计学意义。X2的回归系数P0.001,说明年龄与患病也有关联,其OR=1.04。53引用亚元变量应注意的问题引用亚元变量应注意的问题在在Logistic模型中,二分类变量是不区分有序模型中,二分类变量是不区分有序和无序的,因为回归系数的正负号能处理两和无序的,因为回归系数的正负号能处理两分类变量所对应的概率大小问题。分类变量所对应的概率大小问题。在在Logistic模型中,用亚元处理多分类自变量模型中,用亚元处理多分类自变量时,对同一个因素的一组亚元而言,必须同时,对
13、同一个因素的一组亚元而言,必须同时引入模型或同时不引入模型,不能若干个时引入模型或同时不引入模型,不能若干个亚元在模型中,其它亚元不在模型中,这样亚元在模型中,其它亚元不在模型中,这样会导致模型的参数意义发生改变以致错误解会导致模型的参数意义发生改变以致错误解释参数意义。释参数意义。54多分类有序自变量的处理多分类有序自变量的处理例例6:用横断面调查设计,分析肥胖与患:用横断面调查设计,分析肥胖与患糖尿病的关联性。糖尿病的关联性。职业:用职业:用x1=0,1,2分别表示体重正常,超分别表示体重正常,超重和肥胖。重和肥胖。用用x2表示年龄。表示年龄。x1是有序的分类变量是有序的分类变量(等级变量
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Logistic回归模型 2 Logistic 回归 模型
限制150内