spss教程9-4回归分析.ppt
《spss教程9-4回归分析.ppt》由会员分享,可在线阅读,更多相关《spss教程9-4回归分析.ppt(25页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、3 3 自变量中有定性变量的回归自变量中有定性变量的回归例例1.考虑学生体重考虑学生体重(因变量因变量)与身高与身高(自变量、定量自变量、定量变量变量)的关系时,一般需要把男女学生分开来考的关系时,一般需要把男女学生分开来考虑,因为这一关系虑,因为这一关系很可能很可能因为性别的不同而不同。因为性别的不同而不同。这些数据储存在这些数据储存在SPSS数据文件数据文件 height.sav 中。中。o如果如果分别考虑分别考虑男、女生的体重与身高的关系,并假设这一关系为男、女生的体重与身高的关系,并假设这一关系为线线性性的,我们得到的,我们得到(拟合拟合)如下如下两个简单线性回归方程两个简单线性回归方
2、程,括号内为相应,括号内为相应系数估计的系数估计的 p-值。值。o女生:女生:w0=-12.446+0.422 h0,R2=0.214,(.547)(.002)F=11.165(.002)o男生:男生:w1=-37.400+0.645 h1,R2=0.434,(.032)(.000)F=42.128(.000)o拟合结果表明,男、女生的身高和体重的关系是不同的。拟合结果表明,男、女生的身高和体重的关系是不同的。o问题是:问题是:上述身高和体重的关系在不同性别之间的上述身高和体重的关系在不同性别之间的差异显著吗差异显著吗?o在上述结果中在上述结果中似乎没有一个合适的量来回答这一问题。似乎没有一个
3、合适的量来回答这一问题。o在回归模型中引进在回归模型中引进哑变量哑变量(dummy variable),我们就可以来回答上,我们就可以来回答上述问题。述问题。o哑变量的哑变量的取值为取值为 1 和和 0,用来,用来区分定性变量取区分定性变量取某个特定值某个特定值还是还是其其它值它值。例。例1中的变量中的变量 D 就是一个哑变量就是一个哑变量,o哑变量的应用哑变量的应用 例例1的带有哑变量的回归模型为如下的多元线性的带有哑变量的回归模型为如下的多元线性回归模型回归模型:(变量变量 Dh=Dh)w=b b 0+b b 1 D+b b 2 h+b b 3(Dh)+e e(1)o对于女生,对于女生,D
4、=0,模型,模型(1)变为变为 w=b b 0+b b 2 h+e e;而男生的模型则为而男生的模型则为 w=(b b 0+b b 1)+(b b 2+b b 3)h+e e。o拟合得到如下的回归方程:拟合得到如下的回归方程:w=-12.446 24.954 D+0.422 h+0.223 Dh (.534)(.347)(.001)(.166)o由拟合结果可以看出,变量由拟合结果可以看出,变量 D 和和 Dh 的系数均不显著。因此可以说,的系数均不显著。因此可以说,性别对身高和体重关系的性别对身高和体重关系的影响不显著影响不显著。o但是但是,由于,由于 b b 0 不显著,因此我们需对模型作修
5、改:不显著,因此我们需对模型作修改:w=37.4 D+0.346 h+0.299 Dh (.033)(.000)(.004)o此时,变量此时,变量 D 和和 Dh 的系数均为显著的。的系数均为显著的。o因此我们说,性别对身高和体重关系的因此我们说,性别对身高和体重关系的影响是显著的影响是显著的。w=37.4 D+0.346 h+0.299 Dh D=0 w=0.346 hD=1 w=37.4+(0.299+0.346)h男生身高对体重的效应大于女生男生身高对体重的效应大于女生身高对体重的效应身高对体重的效应4 二项二项 Logistic回归回归例子例子在一次住房展销会上在一次住房展销会上,与房
6、地产商签定与房地产商签定购房意向书的顾客中购房意向书的顾客中,在随后在随后3个月中个月中,只有一部分购买了房屋只有一部分购买了房屋.购买房屋的顾客记为购买房屋的顾客记为1,没有购买记为没有购买记为0一、定性因变量的回归方程的意义 设因变量 y只是取0,1两个值的定性变量,考虑简单线性回归模型:由于,是01型贝努利随机变量,则得如下分布根据随机变量的期望值定义,可得二、定性因变量回归的特殊问题 1.离散非正态误差项 2.零均值异方差性 3.回归方程的限制 三 Logistic回归模型 针对01型因变量产生的问题,对回归 模型应该作两个方面的改进。1.回归函数应该改用限制在 区间内的 连续曲线,而
7、不能再沿用直线回归方程。2.因变量本身只取0,1两个离散值,不适于 直接作为回归模型中的因变量,可以用 等于1的比例代替 本身作为因变量。LogitLogit变换变换 发生比发生比Logistic Logistic 回归模型回归模型回归系数的含义回归系数的含义发生比发生比(相对风险相对风险)为当为当x1增加增加1个单位时个单位时,相对风险的比值相对风险的比值基本操作基本操作Analyze=Regression=Binary Logistic pDependent 输入因变量输入因变量pCovariates 输入自变量输入自变量pMethod:输入自变量筛选策略输入自变量筛选策略 Enter:强
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- spss 教程 回归 分析
限制150内