回归分析曲线拟合PPT课件.ppt
《回归分析曲线拟合PPT课件.ppt》由会员分享,可在线阅读,更多相关《回归分析曲线拟合PPT课件.ppt(73页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、关于回归分析曲线拟合第一张,PPT共七十三页,创作于2022年6月什么是回归分析?什么是回归分析?1、重重点点考考察察一一个个特特定定的的变变量量(因因变变量量),而而把把其其他他变变量量(自自变变量量)看看作作是是影影响响这这一一变变量量的的因因素素,并并通通过过适适当当的的数数学学模模型型将将变变量量间间的的关关系表达出来系表达出来2、利用样本数据利用样本数据建立模型建立模型的估计方程的估计方程3、对模型进行、对模型进行显著性检验显著性检验4、进进而而通通过过一一个个或或几几个个自自变变量量的的取取值值来来估估计计或或预测预测因变量的取值因变量的取值回归分析回归分析第二张,PPT共七十三页
2、,创作于2022年6月回归分析的模型回归分析的模型 一、分类一、分类按是否线性分:按是否线性分:线性回归模型线性回归模型和和非线性回归模型非线性回归模型按自变量个数分:按自变量个数分:简单的一元回归简单的一元回归和和多元回归多元回归 二、基本的步骤二、基本的步骤 利用利用SPSSSPSS得到模型关系式,是否是我们所要的?得到模型关系式,是否是我们所要的?要看要看回归方程回归方程的显著性检验的显著性检验(F F检验)检验)回归系数回归系数b的显著性检验的显著性检验(T(T检验检验)拟合程度拟合程度R R2 2 (注:注:相关系数的平方,一元回归用相关系数的平方,一元回归用R SquareR Sq
3、uare,多元回归用,多元回归用Adjusted R SquareAdjusted R Square)第三张,PPT共七十三页,创作于2022年6月回归分析的回归分析的过程过程 在回归过程中包括:在回归过程中包括:nLinerLiner:线性回归:线性回归nCurve EstimationCurve Estimation:曲线估计:曲线估计 Binary LogisticBinary Logistic:二分变量逻辑回归二分变量逻辑回归 Multinomial LogisticMultinomial Logistic:多分变量逻辑回归;:多分变量逻辑回归;Ordinal Ordinal 序回归;
4、序回归;ProbitProbit:概率单位回归;:概率单位回归;NonlinearNonlinear:非线性回归;:非线性回归;Weight EstimationWeight Estimation:加权估计;:加权估计;2-Stage Least squares2-Stage Least squares:二段最小平方法;:二段最小平方法;Optimal Scaling Optimal Scaling 最优编码回归最优编码回归n我们只讲前面我们只讲前面2 2个简单的(一般教科书的讲法)个简单的(一般教科书的讲法)第四张,PPT共七十三页,创作于2022年6月线性回归线性回归 线性回归分为线性回归
5、分为一元线性回归一元线性回归和和多元线性回归多元线性回归。一、一元线性回归:一、一元线性回归:1 1、涉及一个自变量的回归涉及一个自变量的回归2 2、因变量因变量y y与自变量与自变量x x之间为线性关系之间为线性关系被被预预测测或或被被解解释释的的变变量量称称为为因因变变量量(dependent(dependent variable)variable),用用y y表示表示用用来来预预测测或或用用来来解解释释因因变变量量的的一一个个或或多多个个变变量量称称为为自自变变量量(independent variable)(independent variable),用,用x x表示表示 3 3、因因
6、变变量量与与自自变变量量之之间间的的关关系系用用一一个个线线性性方方程程来来表示表示第五张,PPT共七十三页,创作于2022年6月线性回归的过程线性回归的过程 一元线性回归模型确定过程一元线性回归模型确定过程 一、做散点图一、做散点图(Graphs-Scatter-Simple)目的是为了以便进行简单地观测(如:目的是为了以便进行简单地观测(如:Salary与与Salbegin的关系的关系)。二、建立方程二、建立方程 若散点图的趋势大概呈线性关系,可以建立线性方程,若散点图的趋势大概呈线性关系,可以建立线性方程,若不呈线性分布,可建立其它方程模型,并比较若不呈线性分布,可建立其它方程模型,并比
7、较R2(-1)来确定一种最佳方程式(曲线估计)。来确定一种最佳方程式(曲线估计)。多元线性回归一般采用逐步回归方法多元线性回归一般采用逐步回归方法-Stepwise。第六张,PPT共七十三页,创作于2022年6月(一一)一元线性回归模型一元线性回归模型(linear regression model)(linear regression model)1、描描述述因因变变量量 y 如如何何依依赖赖于于自自变变量量 x 和和误误差差项项 的方程称为的方程称为回归模型回归模型2、一元线性一元线性回归模型可表示为回归模型可表示为 y=0 0+1 1 x +注注:线线性性部部分分反反映映了了由由于于x
8、x的的变变化化而而引引起起的的y y的的变变化化;误误差差项项 反反映映了了除除x x和和y y之之间间的的线线性性关关系系之之外外的的随随机机因因素素对对y y的的影影响响,它它是是不不能能由由x x和和y y之之间的线性关系所解释的变异性。间的线性关系所解释的变异性。Y Y是是x x 的线性函数的线性函数(部部分分)加上误差项加上误差项 0 0 和和 1 1 称为模型的称为模型的参数参数误差项误差项 是随机变是随机变量量第七张,PPT共七十三页,创作于2022年6月一元线性回归模型(基本假定)一元线性回归模型(基本假定)1、因变量、因变量x与自变量与自变量y之间具有之间具有线性关线性关系系
9、2、在重复抽样中,自变量、在重复抽样中,自变量x的取值是的取值是固定的,即固定的,即假定假定x是非随机的是非随机的3、误差项、误差项 满足条件满足条件第八张,PPT共七十三页,创作于2022年6月误差项误差项 满足条件满足条件l正态性正态性。是是一个服从正态分布的随机变量,且一个服从正态分布的随机变量,且期望值为期望值为0,即,即 N(0,2)。对于一个给定的。对于一个给定的 x 值,值,y 的期望值为的期望值为E(y)=0+1xl方差齐性方差齐性。对于所有的。对于所有的 x 值,值,的方差一个特定的方差一个特定的值,的方差也都等于的值,的方差也都等于 2 都相同。同样,一个特定都相同。同样,
10、一个特定的的x 值,值,y 的方差也都等于的方差也都等于 2l独立性独立性。独立性意味着对于一个特定的。独立性意味着对于一个特定的 x 值,它值,它所对应的所对应的与其他与其他 x 值所对应的值所对应的不相关;对于一个不相关;对于一个特定的特定的 x 值,它所对应的值,它所对应的 y 值与其他值与其他 x 所对应的所对应的 y 值也不相关值也不相关第九张,PPT共七十三页,创作于2022年6月估计的回归方程估计的回归方程(estimated regression equation)1.总总体体回回归归参参数数0和和1是是未未知知的的,必必须须利利用用样样本本数数据据去去估计估计2.用用样样本本
11、统统计计量量 和和 代代替替回回归归方方程程中中的的未未知知参参数数0和和1,就得到了,就得到了估计的回归方程估计的回归方程3.一元线性回归中估计的回归方程为一元线性回归中估计的回归方程为其其中中:是是估估计计的的回回归归直直线线在在 y 轴轴上上的的截截距距,是是直直线线的的斜斜率率,它它表表示示对对于于一一个个给给定定的的 x 的的值值,是是 y 的的估估计计值值,也也表表示示 x 每变动一个单位时,每变动一个单位时,y 的平均变动值的平均变动值 xy 1b0b+=0by 1b1b0b第十张,PPT共七十三页,创作于2022年6月SPSS 线性回归分析线性回归分析n多元线性回归分析基本结构
12、与一元线性回归相同。而他们多元线性回归分析基本结构与一元线性回归相同。而他们在在SPSS下的功能菜单是集成在一起的。下面通过下的功能菜单是集成在一起的。下面通过SPSS操作操作步骤解释线性回归分析问题。步骤解释线性回归分析问题。第十一张,PPT共七十三页,创作于2022年6月SPSS过程过程n步骤一:录入数据,选择分析菜单中的步骤一:录入数据,选择分析菜单中的Regression=liner 打开线性回归分析对话框;打开线性回归分析对话框;n步骤二:选择被解释变量和解释变量。其中因步骤二:选择被解释变量和解释变量。其中因变量列表框中为被解释变量,自变量为回归分变量列表框中为被解释变量,自变量为
13、回归分析解释变量。析解释变量。n注:要对不同的自变量采用不同引入方法时,注:要对不同的自变量采用不同引入方法时,选选NEXT按钮把自变量归入不同自变量块中。按钮把自变量归入不同自变量块中。第十二张,PPT共七十三页,创作于2022年6月n第三步:选择个案标签。在变量列表中选择变第三步:选择个案标签。在变量列表中选择变量至个案标签中,而被选择的变量的标签用于量至个案标签中,而被选择的变量的标签用于在图形中标注点的值。在图形中标注点的值。n第四步:选择加权二乘法(第四步:选择加权二乘法(WLS)。在变量列)。在变量列表框中选择变量至表框中选择变量至WLS中。但是该选项仅在被中。但是该选项仅在被选变
14、量为权变量时选择。选变量为权变量时选择。n第五步:如果点击第五步:如果点击OK,可以执行线性回归分析,可以执行线性回归分析操作。操作。第十三张,PPT共七十三页,创作于2022年6月Method选项Enter:强迫引入法,默认选项。全部被选变量一次性进入回归模:强迫引入法,默认选项。全部被选变量一次性进入回归模型。型。Stepwise:强迫剔除法。每一次引入变量时,概率:强迫剔除法。每一次引入变量时,概率F最小值最小值的变量将引入回归方程,如果已引入回归方程的变量的的变量将引入回归方程,如果已引入回归方程的变量的F大于设定值,将被剔除回归方程。当无变量被引入或剔除,大于设定值,将被剔除回归方程
15、。当无变量被引入或剔除,时终止回归方程时终止回归方程Remove:剔除变量。不进入方程模型的被选变量剔除。:剔除变量。不进入方程模型的被选变量剔除。Backward:向后消去:向后消去Forward:向前引入:向前引入第十四张,PPT共七十三页,创作于2022年6月Rule选项n选择一个用于指定分析个案的选择规则的变量。选择一个用于指定分析个案的选择规则的变量。选择规则包括:选择规则包括:等于、不等于、大于、小于、大于或等于、小于等于、不等于、大于、小于、大于或等于、小于或等于。或等于。Value中输入相应变量的设定规则的临界值中输入相应变量的设定规则的临界值。第十五张,PPT共七十三页,创作
16、于2022年6月Statistics 选项回归系数框回归系数框估计值:显示回归估计值:显示回归系数的估计值系数的估计值、回归系数的标准差、回归系数的标准差、标准化回归系数、回标准化回归系数、回归系数的归系数的的的t t估计估计值和双尾显著性水平。值和双尾显著性水平。置信区间置信区间协方差矩阵协方差矩阵模型拟合:复相关系数、模型拟合:复相关系数、判定系数、调整判定系数、调整R R2 2、估计估计值的标准误及方差分析值的标准误及方差分析R R2 2改变量:增加或删除一改变量:增加或删除一个自变量产生的改变量个自变量产生的改变量描述性统计量:变量描述性统计量:变量的均数、标准差、相的均数、标准差、相
17、关系数矩阵、单尾检关系数矩阵、单尾检验验部分及偏相关系数:部分及偏相关系数:显示零阶相关、偏相显示零阶相关、偏相关、部分相关系数关、部分相关系数共线性诊断:显示变量共线性诊断:显示变量容差、方差膨胀因子和容差、方差膨胀因子和共线性的诊断表共线性的诊断表残差统计量残差统计量D-WD-W检验统计量:显示残差相关的检验统计量:显示残差相关的D-WD-W检验和残差与预测值的综述统计。检验和残差与预测值的综述统计。个案诊断:个案诊断:1 1、超过、超过n n倍标准差以上的个案为奇异值;倍标准差以上的个案为奇异值;2 2、显示所有变量的标准化残差、观测、显示所有变量的标准化残差、观测值和预测值、残差值和预
18、测值、残差第十六张,PPT共七十三页,创作于2022年6月Plots选项选项该对话框可以分析资料的正态性、线性和方差齐性,还可以检测奇该对话框可以分析资料的正态性、线性和方差齐性,还可以检测奇异值或异常值等。异值或异常值等。1 1、因变量、因变量2 2、标准化预测值、标准化预测值3 3、标准化残差、标准化残差4 4、删除残差、删除残差5 5、调整预测值、调整预测值6 6、StudentStudent残差残差7 7、StudentStudent删除残差删除残差HistogramHistogram:标准化残差的直方图,并给出正态曲线。:标准化残差的直方图,并给出正态曲线。Normal probal
19、ity plotNormal probality plot:标准化残差的正态概率图:标准化残差的正态概率图Produce all partial plotsProduce all partial plots:产生所有偏残差图,生成每个自变量残差与因变量残差的散点图。:产生所有偏残差图,生成每个自变量残差与因变量残差的散点图。第十七张,PPT共七十三页,创作于2022年6月Save对话框预测值预测值包括非标准化的预测值、标准包括非标准化的预测值、标准化的预测值、调整预测值、预化的预测值、调整预测值、预测值均数标准误测值均数标准误距离距离包括自变量个案值与所有包括自变量个案值与所有个案平均值距离、
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归 分析 曲线拟合 PPT 课件
限制150内