书签分享收藏举报版权申诉 / 15

立即下载

当前位置：首页 > 应用文书 > 工作报告 > Logistic回归模型.pdf

Logistic回归模型.pdf

上传人：hg158****2095

文档编号：73150375

上传时间：2023-02-15

格式：PDF

页数：15

大小：860.81KB

( 4.5 )

《Logistic回归模型.pdf》由会员分享，可在线阅读，更多相关《Logistic回归模型.pdf（15页珍藏版）》请在得力文库 - 分享文档赚钱的网站上搜索。

1、K2MG-EHSWI+04-001K2MG-EHSWI+04-001 环境、健康安全、企业社会责任目标指标环境、健康安全、企业社会责任目标指标LogisticLogistic 回归模型回归模型1 1LogisticLogistic 回归模型的基本知识回归模型的基本知识1.1Logistic 模型简介主要应用在研究某些现象发生的概率，比如股票涨还是跌，公司成功或失败的概率，以及讨论概率与那些因素有关。显然作为概率值，一定有，因此很难用线性模型描述概率与自变量的关系，另外如果接近两个极端值，此时一般方法难以较好地反映p 的微小变化。为此在构建与自变量关系的模型时，变换一下思路，不直接研究，而是研究

2、的一个严格单调函数，并要求在接近两端值时对其微小变化很敏感。于是Logit 变换被提出来：（1）其中当从时，从，这个变化范围在模型数据处理上带来很大的方便，解决了上述面临的难题。另外从函数的变形可得如下等价的公式：（2）模型(2)的基本要求是，因变量（y）是个二元变量，仅取0 或 1 两个值，而因变量取 1 的概率就是模型要研究的对象。而，其中表示影响的第个因素，它可以是定性变量也可以是定量变量，。为此模型(2)可以表述成：（3）显然，故上述模型表明是的线性函数。此时我们称满足上面条件的回归方程为Logistic 线性回归。Logistic 线性回归的主要问题是不能用普通的回归方式来分析模型，

3、一方面离散变量的误差形式服从伯努利分布而非正态分布，即没有正态性假设前提；二是二值变量方差不是常数，有异方差性。不同于多元线性回归的最小二乘估计法则(残差平方和最小)，Logistic 变换的非线性特征采用极大似然估计极大似然估计的方法寻求最佳的回归系数。因此评价模型的拟合度的标准变为似然值评价模型的拟合度的标准变为似然值而非离差平方和。定义定义 1 1称事件发生与不发生的概率比为优势比优势比(比数比比数比 odds ratioodds ratio 简称简称 OR)OR)，形式上表示为，形式上表示为OR=（4）定义定义 2 2Logistic 回归模型是通过极大似然估计法得到的，故模型好坏的评

4、价准则有似然值来表征，称-2 为估计值的拟合似然度拟合似然度，该值越小越好，如果模型完全拟合，则似然值为1，而拟合似然度达到最小，值为 0。其中表示的对数似然函数值。定义定义 3 3记为估计值的方差-协方差矩阵，为的标准差矩阵，则称（5）为的 WaldWald 统计量统计量，在大样本时，近似服从分布，通过它实现对系数的显著性检验。定义定义 4 4假定方程中只有常数项，即各变量的系数均为0，此时称（6）为方程的显著性似然统计量显著性似然统计量，在大样本时，近似服从分布。1.2 Logistic1.2 Logistic 模型的分类及主要问题模型的分类及主要问题根据研究设计的不同，Logistic

5、回归通常分为成组资料的非条件 Logistic 回归和配对资料的条件 Logistic 回归两种大类。还兼具两分类和多分类之分，分组与未分组之分，有序与无序变量之分。具体如下：两分类非条件 Logistic 回归：分组数据的 Logistic 回归，未分组数据的 Logistic 回归；多分类非条件 Logistic 回归：无序变量 Logistic 回归，无序变量 Logistic 回归；1 1K2MG-EHSWI+04-001K2MG-EHSWI+04-001 环境、健康安全、企业社会责任目标指标环境、健康安全、企业社会责任目标指标条件 Logistic 回归：1:1 型、1:M 型和 M

6、:N 型 Logistic 回归。关于 Logistic 回归，主要研究的内容包括：1模型参数的估计及检验2变量模型化及自变量的选择3模型评价和预测问题4模型应用2 2 LogisticLogistic 模型的参数估计及算法实现模型的参数估计及算法实现2.12.1 两分类分组数据非条件两分类分组数据非条件 LogisticLogistic 回归回归因变量(反应变量)分为两类，取值有两种，设事件发生记为 y=1，不发生记为 y=0，设自变量是分组数据，取有限的几个值；研究事件发生的概率与自变量的关系，其Logistic 回归方程为：或例例 2.1.12.1.1 分组数据分组数据11在一次住房展销

7、会上，与房地产商签订初步购房意向书的有n=325 人，在随后的 3 个月时间内，只有一部分顾客购买了房屋。购买房屋的顾客记为1，否则记为0。以顾客的年家庭收入(万元)作为自变量,对数据统计后如表 2.1.1 所示，建立 Logistic 回归模型。表表 2.1.12.1.1购房分组数据购房分组数据序号123456789例例 2.1.22.1.2药物疗效数据药物疗效数据22为考察某药物疗效，随机抽取220 例病人并分配到治疗组和对照组，治疗组采用治疗药物，对照组采用安慰剂。治疗一段时间后观察病人的疗效，得到表 2.1.2 数据。设 y 为疗效指标(y=1 有效，y=0 无效)，为治疗组指标(1

8、为治疗组，0 为对照组)，为年龄组指标(1 为45 岁，0 为其他)。表表 2.1.22.1.2药物疗效数据药物疗效数据序号123治疗分组110年龄分组101有疗效324021无效182031合计506052年家庭收入 X(万元)1.52.53.54.55.56.57.58.59.5签订意向人数253258524339282115实际购买人数813262220221612102 2K2MG-EHSWI+04-001K2MG-EHSWI+04-001 环境、健康安全、企业社会责任目标指标环境、健康安全、企业社会责任目标指标400184058上述两个例子数据都是经过统计加工后的分组数据，对此类数据

9、进行Logistic 回归，首先要明确应变量对应事件的发生概率如何确定和进行Logit 变换，其次才能建立 Logistic 回归。为便于数据处理，为便于数据处理，我们将此类数据的格我们将此类数据的格式作个约定，排列格式为（组序号，自变量，该组事件发生数，该组总例数）式作个约定，排列格式为（组序号，自变量，该组事件发生数，该组总例数）。表表 2.1.32.1.3分组数据的标准格式分组数据的标准格式表表 2.1.12.1.1 改造表改造表序年家庭号收入 X(万元)1234567891.52.53.54.55.56.57.58.59.5实际购买人数81326222022161210签订意向总人数

10、253258524339282115治序疗分号组12341100表表 2.1.22.1.2 改造表改造表年有龄分组效例数101032402118观察例数50605258经过改造后，可得我们关心的事件的发生的频率为。其中为分组数，然后作 Logit 变换，即。变换后的数据，形式上已经可以采用一般的线性回归的处理方式来估计回归参数了。此时方程变为：当然这样处理并没有解决异方差性，当较大时，的近似方差为：（7）所以选择权重，最后采用加权最小二乘法估计参数。注意，分组数据的 Logistic 回归只适用于大样本分组数据，对小样本的为分组数据不适用，并且以组数为回归拟合的样本量，明显降低了拟合精度，在实

11、际应用中必须谨慎。求解算法及步骤：求解算法及步骤：1依据分组数据的标准格式，计算频率、Logit 变换和权重2构建加权最小二乘估计：（8）令，则方程又变成一般的线性回归模型：（9）3构造增广矩阵利用消去法得矩阵，得到估计其中为残差平方和,回归方差各系数检验采用总平方和，回归平方和总平方和求解相当于拟合方程的残差平方和，故得上式ST3 3K2MG-EHSWI+04-001K2MG-EHSWI+04-001 环境、健康安全、企业社会责任目标指标环境、健康安全、企业社会责任目标指标所以方程的检验为例例 2.1.12.1.1 的求解过程如下（由的求解过程如下（由 LLLStatLLLStat 统计软件

12、计算）统计软件计算）：表表2.1.42.1.4数据数据LogitLogit变换及权重变换及权重家庭年收入x1.5000002.500000实际购买mi8签订意向ni250.3200000.40625-0.3794907.718750比例pi逻辑变换Logit-0.7537725.440000权重ni*pi(1-pi)3.5000004.5000005.5000006.5000007.5000008.5000009.500000序号常数项家庭年收入x1332026580.44827-0.207639622520.42307-0.310155720430.46511-0.139762622390.

13、564100.257829316280.571420.287682912210.571420.287682910150.666660.6931477表表2.1.52.1.5回归模型基本信息回归模型基本信息总样本9求解方法加权最小二乘仅常数项beta0-0.095029方程F统计量51.982160F分布自由度1,7方程检验p值0.000176总平方和8.798294回归平方和7.754112残差平方和1.044181表表2.1.62.1.6分组分组LogisticLogistic回归系数检验回归系数检验均值回归系回归系系数标准数数误t统计量2.83781-0.8488-0.8488582820

14、.113578-7.47399414.90110.149320.14932403 30.0207117.209865表表2.1.72.1.70.08647-0.01459174 414.34482812.69230810.6976749.5897446.8571435.1428573.333333自由检验P度df值70.00005670.000056K2MG-EHSWI+04-001K2MG-EHSWI+04-001 环境、健康安全、企业社会责任目标指标环境、健康安全、企业社会责任目标指标-0.01451760.00287本例 Logistic 模型的回归方程：对于多分类无序自变量多分类无序自

15、变量的 Logistic 回归，即某个自变量为m 个水平的名义变量（如治疗方法A,B,C），只需要引入 m-1（2 个）个哑变量，然后采用上述方法进行分析。例例 2.1.32.1.3 研究三种治疗方法对不同性别病人的治疗效果研究三种治疗方法对不同性别病人的治疗效果22，数据如表 2.1.4表表 2.1.42.1.4性别和治疗法对某病治愈情况的影响性别和治疗法对某病治愈情况的影响性别治疗方法A男BCA女BC有效7810168405434无效281146556总例数106112114455940由于治疗方法有三种，没有等级关系，所以属于无序的名义变量，故引入两个哑变量分别代表A 和 B 疗法，其中

16、表示方法 A,表示方法 B,表示方法 C，将上述数据转化成标准格式，得表2.1.5。表表 2.1.52.1.5性别和治疗法对某病治愈情况的影响性别和治疗法对某病治愈情况的影响性别111000100100010010有效7810168405434总例数106112114455940对于分类数据，也可以采用极大似然法进行参数估计，具体见2.22.2 节节最后部分内容。2.22.2两分类未分组两分类未分组(连续连续)非条件非条件 LogisticLogistic 回归回归应变量取值为 0 和 1，设事件发生记为y=1，否则为0，设自变量，n 组观测数据记为,。记，则与的Logistic回归模型是：（

17、10）易知，是均值为的 0-1 型分布，其分布律为，则的似然函数和对数似然函数分别为：5 5K2MG-EHSWI+04-001K2MG-EHSWI+04-001 环境、健康安全、企业社会责任目标指标环境、健康安全、企业社会责任目标指标代入,得（11）记，选取的估计使得达到极大，这就是Logistic 回归模型的极大似然估计，该过程的求解需要采用牛顿迭代法。构造得分函数，共 k+1 个非线性方程组，令其=0 求解，其中(12)构造信息矩阵，即二阶导矩阵的负矩阵，其中(13)很明显，故是一个对称矩阵。求解算法及步骤：求解算法及步骤：1 根据公式(12)计算得分函数，公式（13）计算信息矩阵给定初值

18、,k=1 和精度，可取 0.0000012 采用牛顿迭代式,，通过以下方式求解。构造增广矩阵=，通过对 IF 矩阵作 k+1 次 ij 消去变换求解若或者或者，则转 3否则 k=k+1，继续执行第 2 步3 此时就是回归系数的数值估计，k 就是迭代次数，消去变换后的矩阵的前子阵就是方差-协方差矩阵的估计阵=V，下面给出检验有关计算：计算 Wald 统计量,近似服从分布，检验 p 值标准误,例例 2.2.12.2.1 公共交通调查数据公共交通调查数据11在一次关于公共交通的社会调查中，调查项目为“是乘坐公共汽车上下班，还是骑自行车上下班”。因变量 y=1 表示乘坐公共汽车，y=0 表示骑自行车

19、。自变量是年龄，作为连续变量；是月收入(元)；是性别，=1 表示男性，=0 表示女性。调查对象为工薪族群体，数据如表2.2.1 所示。表表2.2.12.2.1公共交通社会调查公共交通社会调查序号123456789年龄182123232831364246月收入8501200850950120085015001000950性别000000000交通y0011101116 6K2MG-EHSWI+04-001K2MG-EHSWI+04-001 环境、健康安全、企业社会责任目标指标环境、健康安全、企业社会责任目标指标1048120001155180001256210001358180001418850

20、115201000116251200117271300118281500119309501203210001213318001223310001233812001244115001254518001264810001275215001285618001LLLStat 1.0LLLStat 1.0 软件得到：表表 2.2.22.2.2 主要计算结果主要计算结果序序回归系回归系系数标系数标waldwald统统号号均值均值数数准误准误计量计量常数项0.535714-3.6550162.0912233.054766年1273.2140.08210.0521192.4855167 70111000001

21、000001011自由自由检验检验p p度度dfdf值值10.08050110.1148OR=ExpOR=Exp(B)(B)0.0258611.08563以下计算结果采用K2MG-EHSWI+04-001K2MG-EHSWI+04-001 环境、健康安全、企业社会责任目标指标环境、健康安全、企业社会责任目标指标龄月收入性别2860.46428636.107143680.001517-2.5018440.0018651.1578180.6614664.66917511990.4160430.03070991.0015180.081934表表2.2.32.2.3LogisticLogistic模型

22、基本信息模型基本信息总样本求解方法迭代次数(仅beta0)-2LogLikelihood(Beta)仅常数项beta0-2LogLikelihood(beta0)方程Wald值(相减)方程自由度方程检验p值28极大似然法&Newton迭代7(4)25.970652-0.14310138.67326312.70261140.012824对于例例 2.1.32.1.3 分组数据的极大似然估计法极大似然估计法，主要过程如下：代入,得则有；其中,分别表示分组 i中事件发生次数和总观察数，如表表 2.1.42.1.4 和和 2.1.52.1.5 所示所示。然后可采用 Newton-Raphson迭代法进

23、行求解。由 LLLStat 计算得到如下结果。表表 2.2.42.2.4性别和疗法对某病治愈的影响性别和疗法对某病治愈的影响(未分组未分组 LogisticLogistic 似然估计法似然估计法)序号常数项性别治疗A治疗B均值1.0000000.5000000.3333330.333333回归系数1.418399-0.9616180.5847451.560763系数标准误0.2986900.2997970.2641080.315961表表2.2.52.2.5回归系数方差矩阵回归系数方差矩阵V(beta)(V(beta)(信息矩阵信息矩阵I(Beta)I(Beta)的逆矩阵的逆矩阵)0.0892

24、15-0.072957-0.029931-0.030097-0.0729570.089878-0.0000780.000128-0.029931-0.0000780.0697530.029993-0.0300970.0001280.0299930.099831wald统计量22.55051310.2884724.90196624.400993自由度df1111检验P值0.0000020.0013390.0268260.0000018 8K2MG-EHSWI+04-001K2MG-EHSWI+04-001 环境、健康安全、企业社会责任目标指标环境、健康安全、企业社会责任目标指标2.32.3条件条

25、件 LogisticLogistic 回归回归2,32,3条件 Logistic 回归是配对设计(病例-对照)中常用的一种统计分析方法，通过配对方法收集资料：每一配对组可包括一个病例和一个或多个对照，有1：1 型、1：m 型配对。假设收集了如下数据：表表 2.3.12.3.1n n 个个 1:m1:m 配对组配对组,k,k 个协变量的比例资料个协变量的比例资料配对配对组号组号12病例组病例组第第 1 1 对照组对照组第第 mm 个对照组个对照组配对资料用配对的方法来控制影响因素的干扰，并且每个配对组都可以建立一个Logistic 回归方程：为此需要估计的参数有 n 个常数项和 k 个回归系数

26、，配对数越多估计的参数就越多，但是一般的数据量难以支撑这样的估计，故一般的 Logistic 回归不适合配对资料。不过在参数估计时，常数项会被消去，所以方程组减少了 n 个常数项的估计，复杂度大大降低。对于回归参数的估计采用条件似然函数替代一般的似然函数进行。对于第 i 个配对组而言，共有m+1 个观察对象，记为，其中仅有一例发病，且正好是病例组A 发病，而对照组均没有发病的条件概率（类似Bayes 概率）可以表示成：（14）其中=，而，(15)故 n 个配对组的条件似然函数表示为：(16)则对数似然函数为：（17）令，它是一个与第 i 个样本点有关的 k 维向量，表示向量中的第 g 个元素，

27、则有如下得分函数和信息矩阵：=注意此时的，没有常数项。至此(17)式中的参数可采用 Newton-Raphson 迭代法求解了，初值依然取为 0 向量。不过该方程的求解已经相对复杂多了。方程似然度检验和回归系数的wald 检验同非条件 Logistic 回归。例例 2.3.12.3.1 研究肥胖、口服避孕药雌激素与子宫内膜癌的关系，随机抽取 20 名患者，对于每名患者，在随机抽取年龄相近的正常人作为对照。检测患者与正常人的肥胖程度和雌激素服用情况33。表表 2.3.12.3.1 肥胖和雌激素与子宫内膜癌关系病例肥胖和雌激素与子宫内膜癌关系病例-对照研究数据对照研究数据配对组123病例肥胖111

28、病例雌激素111对照 1肥胖010对照 1雌激素011对照 2肥胖001对照 2雌激素0119 9K2MG-EHSWI+04-001K2MG-EHSWI+04-001 环境、健康安全、企业社会责任目标指标环境、健康安全、企业社会责任目标指标4010001500100161100107110111811101191011111001010011010110120101011311001114110010151100011601010117010010181110011910010120110100例例 2.3.12.3.1 求解求解的主要结果，由 LLLStat 软件计算得到：表表2.3.22.

29、3.2条件条件LogisticLogistic回归系数检验回归系数检验序号肥胖雌激素均值(病例)0.6500000.850000回归系数1.8239141.589621系数标准误0.5471920.450544表表2.3.32.3.3条件条件LogisticLogistic回归模型基本信息回归模型基本信息样本量求解方法迭代次数-2LogLikelihood(Beta)-2LogLikelihood(0)方程Wald值(相减)方程自由度方程检验p值20极大似然+牛顿迭代4533.30676343.94449210.63772820.004898wald统计量11.11039012.448367自

30、由度df11检验P值0.0008590.0004192.42.4 多分类有序反应变量多分类有序反应变量 LogisticLogistic 回归回归在实际应用中，经常遇到反应变量为多分类有序变量的情况，例如评价指标分为差、中、良、优等，各等级之间是有序的。这种资料的 Logistic 回归分析通常称为比例比数模型(累积概率模型)44，它需要拟合 m-1(m 为水平或等级个数)个 Logistic 回归模型。有序累积概率 Logistic 模型：或（18）（19）1010K2MG-EHSWI+04-001K2MG-EHSWI+04-001 环境、健康安全、企业社会责任目标指标环境、健康安全、企业社

31、会责任目标指标有序累积概率模型参数的极大似然估计就是寻找参数使得联合概率实现最大化，由于观测之间相互独立，联合概率被分解成边缘概率之积。而观测到的概率就是累积概率之差：第 i 个观测值对应似然值的贡献取决于观测到哪一个j 值，因此对于次序响应的每个j 值，取所有的观测之的乘积，有似然函数：，其中若，则，否则并且对于任一个观测而言，只有一个等级事件发生，即，故有(19)式。其对数似然函数如下（对于分组数据，似然函数变为：，分组中各分类例数）。（20）其中：（21）然后就可以通过极大似然法，就上 Newton-Raphson 方法加以求解参数了，注意的是。下面给出具体推导求解的详细过程。对（20）

32、式进行化简，可得（22）（23）（24）（25）（26）（27）（28）（29）（30）（31）（32）由此构建信息矩阵和，并可迭代求解了。注：若为分组数据，上述每项乘以。例例 2.4.12.4.1研究性别和两种治疗方法对某种疾病疗效的影响33,将疗效分成效果显、有效和无效三个等级，根据试验调查，得到如下资料。表表 2.4.12.4.1 性别和两种治疗方法对某种疾病疗效的影响性别和两种治疗方法对某种疾病疗效的影响性别治疗方法新药女传统新药男传统100显著1665有效572无效6197112141合计273表表2.4.22.4.2多分类有序反应变量数据格式多分类有序反应变量数据格式行号12性性别

33、别11治疗方治疗方法法11频频数数165疗效疗效等级等级121111K2MG-EHSWI+04-001K2MG-EHSWI+04-001 环境、健康安全、企业社会责任目标指标环境、健康安全、企业社会责任目标指标3456789101112111100000010001110006671952710103123123123计算结果，由 LLLStat 统计软件给出：表表2.4.32.4.3回归系数方差矩阵回归系数方差矩阵V(beta)(V(beta)(信息矩阵信息矩阵I(Beta)I(Beta)的逆矩阵的逆矩阵)0.3747330.3248800.2577570.1928230.3248800.3

34、237820.2444570.1696120.2577570.2444570.2894880.0694040.1928230.1696120.0694040.236257表表2.4.42.4.4有序分类因变量有序分类因变量LogisticLogistic回归系数检验回归系数检验序号常数项a1常数项a2性别治疗方法回归系数2.6935761.8120401.0523522.1872720.48606320.24980010.5380410.569018系数标准误0.612155wald统计量19.36137710.1410593.82552811自由度df1检验P值0.0000110.00145

35、00.0504770.000007表表2.4.52.4.5有序分类因变量有序分类因变量LogisticLogistic回归模型基本信息回归模型基本信息样本分组数求解方法迭代次数极大似然+牛顿迭代1712注意：该结果与注意：该结果与 SAS,DPSSAS,DPS 不一致。不一致。1212K2MG-EHSWI+04-001K2MG-EHSWI+04-001 环境、健康安全、企业社会责任目标指标环境、健康安全、企业社会责任目标指标PoissonPoisson 回归模型回归模型1 简介简介一般情况下，单位容积水中的细菌数，单位时间内某些事件发生的次数，单位面积上降落的灰尘的颗粒数等，都可以用 Pois

36、son 分布来描述。一般 Poisson 分布描述成随机变量，概率分布律为：易知，通常可能受到众多因素的影响，不妨假设这些因素为(自变量，协变量），令，对于分组数据，Poisson分布的期望发生数假设为7：（1）其中为回归参数，为第 i组的总观测数。回归模型的似然函数为Poisson 分布条件下各个格子概率函数的乘积，因此 Poisson 分布的极大似然函数和对数似然函数具体形式分别为：代入，得（2）令（3）,（4）则可采用 Newton-Raphson 迭代法求解参数的极大似然估计了。对于仅有常数项的 Poisson 模型，其估计值为，用于计算对数似然比。2 2案例分析案例分析例例 1 13

37、3Doll 和 Hill(1966)研究英国男性医生患冠心病与抽烟、年龄关系。由于死亡与追踪人数和追踪时间有关，故用追踪人数和追踪时间的乘积(人年)作为观察单位数。假定其目标变量(死亡人数)近似服从 Poisson 分布，其调查取样共 74588 调查单位，死亡 598 例。主要研究因素有抽烟（1 为抽烟,0 为不抽烟）；调查对象年龄分成 4 组(35-44 岁,45-54 岁,55-64 岁,65-74 岁)，此为多分类变量，需要设置三个变量加以区分，可将其中一个年龄组作为参照组，不妨取 35-44 岁，计算时不考虑对照组信息。表表 1 1英国男性医生患冠心病与抽烟、年龄关系英国男性医生患冠

38、心病与抽烟、年龄关系分组123456抽烟11110034-44岁10001045-54岁01000155-64岁00100065-74岁000100死亡数32104206186212总例数5230743248286121266318790106731313K2MG-EHSWI+04-001K2MG-EHSWI+04-001 环境、健康安全、企业社会责任目标指标环境、健康安全、企业社会责任目标指标780000001001282857102585由 LLLStat 软件计算的如下结果：表表2 2回归系数方差矩阵回归系数方差矩阵V(beta)(V(beta)(信息矩阵信息矩阵I(Beta)I(Bet

39、a)的逆矩阵的逆矩阵)0.040354-0.013325-0.028763-0.028467-0.0284961551-0.0011690-0.001180.0294617-0.000710.0294670.029491250.01622900.0380780.0337610.03416-0.013363-0.0007510.0294660.02949-0.028767-0.0011150.02946-0.028496-0.0011-0.0284表表3 3分组分组PoissonPoisson回归系数检验回归系数检验序号常数项抽烟45-54岁55-64岁65-74岁均值1.0000000.500

40、0000.2500000.2500000.250000回归系数-8.0360180.5004631.4750122.6150853.3384120.1848280.183758202.526084326.246641110.19511857.14759510.127384系数标准误0.200882wald统计量1600.28946215.4352021自由度df1检验P值0.0000000.0000850.0000000.0000000.000000表表4 4分组分组PoissonPoisson回归模型基本信息回归模型基本信息总组数求解方法迭代次数(仅Beta0)-2LogLikelihood

41、(Beta)仅常数项beta0-2LogLikelihood(beta0)方程Wald值(相减)方程自由度方程检验p值8极大似然+牛顿迭代13(10)7283.685428-5.6765937985.205751701.52032440.000000参考文献：参考文献：1 何晓群.多元统计分析M.北京：中国人民大学出版社,2008.92 金丕焕.医用统计方法M.上海：复旦大学出版社，2004.73 唐启义,冯明光.实用统计分析及其 DPS 数据处理系统M.北京：科学出版社,2002.54 Deniel A.Powers,谢宇著,任强等译.分类数据分析的统计方法M.北京：社会科学文献出版社2009.71414K2MG-EHSWI+04-001K2MG-EHSWI+04-001环境、健康安全、企业社会责任目标指标环境、健康安全、企业社会责任目标指标5 高惠璇.统计计算M.北京：北京大学出版社,1995.76 关冶,陆金甫.数值分析基础M.北京：高等教育出版社,1998.57 沈其君.SAS 统计分析M.北京：高等教育出版社,2005.8每天多一点点的努力，不为别的，只为了日后能够多一些选择，选择云卷云舒的小日子，选择自己喜欢的人。1515

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

11.9 金币

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: Logistic 回归模型

得力文库 - 分享文档赚钱的网站所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

限制150内

关于本文

本文标题：Logistic回归模型.pdf
链接地址：https://www.deliwenku.com/p-73150375.html