数理统计-线性回归ppt课件.ppt
《数理统计-线性回归ppt课件.ppt》由会员分享,可在线阅读,更多相关《数理统计-线性回归ppt课件.ppt(77页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、第第4章章 回归分析回归分析 4.1 4.1 一元线性回归分析一元线性回归分析 4.2 4.2 多元线性回归分析多元线性回归分析变量之间的关系变量之间的关系确定性关系确定性关系相相 关关 关关 系系确定性关系确定性关系身高和体重身高和体重相关关系相关关系相关关系的特征是相关关系的特征是:变量之间的关系很难用一变量之间的关系很难用一种精确的方法表示出来种精确的方法表示出来.回归分析的基本思想回归分析的基本思想变量之间的关系变量之间的关系1.函数关系函数关系:变量之间依一定的函数形成的一:变量之间依一定的函数形成的一一对应关系,若两个变量分别记做一对应关系,若两个变量分别记做Y与与X,则,则当当Y
2、与与X之间存在函数关系时,之间存在函数关系时,X值一旦被指值一旦被指定,定,Y值就是唯一确定的。如圆的面积与其半值就是唯一确定的。如圆的面积与其半径之间的关系径之间的关系.2.统计相关关系统计相关关系:变量之间存在某种关系,:变量之间存在某种关系,但变量但变量Y并不是由变量并不是由变量X唯一确定的,它们唯一确定的,它们之间没有严格的一一对应关系。两个变量之间没有严格的一一对应关系。两个变量间的这种关系就是统计关系,亦称间的这种关系就是统计关系,亦称相关关相关关系系。例如。例如:小麦的产量小麦的产量Y与施肥量与施肥量x1,品种品种x2等存在关系等存在关系,但给定但给定x1,x2的数值后的数值后Y
3、的值还的值还是无法确定的是无法确定的.两个变量之间若存在线性关系称为两个变量之间若存在线性关系称为线性线性相关相关,存在非线性关系称为存在非线性关系称为曲线相关曲线相关,通常,通常通过适当的变量变换,曲线相关可转换为通过适当的变量变换,曲线相关可转换为线性相关。线性相关。一般说来一般说来,在给定在给定X=x条件下条件下Y的条件概的条件概率分布率分布 ,则则Y与与X的关系就清楚的关系就清楚了了.但在实际中要求解往往是非常困难的但在实际中要求解往往是非常困难的.事实上事实上,对对Y而言而言,在实际中只需知道它在实际中只需知道它的某个数字特征的某个数字特征:条件数学期望条件数学期望 就可以了就可以了
4、.把把 称为称为Y关于关于X的回归方程的回归方程.回归分析的作用回归分析的作用:在于通过对变量在于通过对变量X的观的观测值就可预测测值就可预测Y的取值的取值,并且当并且当 时时,为为Y在方差误差意义下的最佳预测值在方差误差意义下的最佳预测值.确定性关系确定性关系和和相关关系相关关系的联系的联系:由于存在测量误差等原因由于存在测量误差等原因,确定性关系在实际确定性关系在实际问题中往往通过相关关系表示出来问题中往往通过相关关系表示出来;另一方面另一方面,当对当对事物内部规律了解得更加深刻时事物内部规律了解得更加深刻时,相关关系也有可相关关系也有可能转化为确定性关系能转化为确定性关系.回归分析回归分
5、析处理变量之间的相关关系的一处理变量之间的相关关系的一种数学方法种数学方法,它是最常用的数理统计方法它是最常用的数理统计方法.线性回归分析线性回归分析非线性回归分析非线性回归分析回回归归分分析析一元线性回归分析一元线性回归分析多元线性回归分析多元线性回归分析问题的分析问题的分析 4.1 4.1 一元线性回归分析一元线性回归分析问题的一般提法问题的一般提法求解步骤求解步骤1.推测回归函数的形式推测回归函数的形式方法一根据专业知识或者经验公式确定方法一根据专业知识或者经验公式确定;方法二作散点图观察方法二作散点图观察.温度温度x(oC)得率得率Y(%)10011012013014015016017
6、018019045 51 54 61 66 70 74 78 85 89用用MATLAB画出散点图画出散点图例例1为研究某一化学反应过程中为研究某一化学反应过程中,温度温度 对产对产品得率品得率Y(%)的影响的影响,测得数据如下测得数据如下.x=100:10:190;y=45,51,54,61,66,70,74,78,85,89;plot(x,y,.r)一元线性回归问题一元线性回归问题2.建立回归模型建立回归模型一元线性回归模型一元线性回归模型3.未知参数未知参数a,b的估计的估计-最小二乘法最小二乘法意义意义:实际测得的:实际测得的点与直线上的理论点与直线上的理论点之间的误差的平点之间的误差
7、的平方和最小方和最小正规方程组正规方程组回归方程回归方程回归直线回归直线参参数数估估计计量量的的性性质质例例2 例例1中的随机变量中的随机变量 Y 符合一元线性回归模型所符合一元线性回归模型所述的条件述的条件,求求 Y 关于关于 x 的线性回归方程的线性回归方程.温度温度x(oC)得率得率Y(%)10011012013014015016017018019045 51 54 61 66 70 74 78 85 89在在MATLAB中求解中求解x=100:10:190;y=45,51,54,61,66,70,74,78,85,89;polytool(x,y,1,0.05)源程序源程序程序运行结果程
8、序运行结果回归图形回归图形参数传送参数传送置信区间置信区间帮助帮助残差平方和残差平方和反应的是在试验中由随机因素反应的是在试验中由随机因素的影响而引起的误差的影响而引起的误差离差平方和离差平方和反应整批数反应整批数据的波动程度据的波动程度回归平方和回归平方和反应回归直反应回归直线引起的偏差线引起的偏差平方和分解式平方和分解式例例3 求例求例2中方差的无偏估计中方差的无偏估计.5.线性相关性的显著性检验线性相关性的显著性检验1).F1).F检验法检验法2).2).相关系数检验法相关系数检验法例例4 检验例检验例 2 中的回归效果是否显著中的回归效果是否显著,取显著性取显著性水平为水平为 0.05
9、.3).t3).t检验法检验法6.预测与控制预测与控制控制控制怎样控制怎样控制x的值才能使的值才能使Y的值在要求的范围内的值在要求的范围内预测预测在自变量在自变量 时,估计时,估计Y的观测值所在范围的观测值所在范围(1).回归函数函数值回归函数函数值 的估计的估计预预测测(2).Y 的观察值的观察值 的估计的估计预预测测例例5(续例续例2)解解(1)已知已知计算计算(2)在在MATLAB中求解中求解输出参数输出参数回归直线回归直线控制控制:怎样控制自变量:怎样控制自变量x的值才能使的值才能使Y的值以的值以1-的置信的置信度落所度落所在要求的区间在要求的区间a,b内内,即即控控制制例例6 对某产
10、品的表面进行腐蚀刻线试验,设腐蚀对某产品的表面进行腐蚀刻线试验,设腐蚀深度深度Y与时间与时间x的结果如下表:的结果如下表:时间时间x(秒秒)深度深度Y(mm)5 6 10 20 30 40 50 60 65 90 4 6813 16 17 19 25 25 29Y=a+bx+12046(1 1)求)求Y与与x的相关关系;(的相关关系;(2 2)当)当 秒时秒时 的置信度为的置信度为95%95%置信区间;(置信区间;(3 3)要深度在)要深度在10102121之间时腐蚀时间应如何控制。之间时腐蚀时间应如何控制。解:)在解:)在xy坐标系上将描出的散点图坐标系上将描出的散点图由图看出点在一条直线附
11、近,因此可假设由图看出点在一条直线附近,因此可假设与与x之间有之间有线性相关关系设为:线性相关关系设为:显著性检验:显著性检验:参数估计:参数估计:预测:预测:控制:控制:方法方法通过适当的变量变换通过适当的变量变换,化成一元线性化成一元线性回归问题进行分析处理回归问题进行分析处理.两边取对数两边取对数可化为一元线性回归的问题可化为一元线性回归的问题两边取对数两边取对数曲线回归方程曲线回归方程例例 表表 9.18 是是 1957 年美国旧轿车价格的调查资料年美国旧轿车价格的调查资料,今以今以 x 表示轿车的使用年数表示轿车的使用年数,Y 表示相应的平均价表示相应的平均价格格(以美元计以美元计)
12、,求求 Y 关于关于 x 的回归方程的回归方程.表表9.18年数年数x价格价格Y123456789102651194314941087765538484290226204在在MATLAB中求解中求解首先作散点图首先作散点图x=1:1:10;y=2651,1943,1494,1087,765,538,484,290,226,204;plot(x,y,.r)选择模型选择模型变量变换变量变换数据变换数据变换 xx=x;yy=log(y);求回归方程求回归方程polytool(xx,yy,1)线性假设的显著性检验线性假设的显著性检验线性回归效果高度显著线性回归效果高度显著.代回原变量代回原变量,得曲线
13、回归方程得曲线回归方程小结小结1.回归分析的任务回归分析的任务2.一元线性回归的步骤一元线性回归的步骤3.可化为一元线性回归的问题可化为一元线性回归的问题研究变量之间的相关关系研究变量之间的相关关系(1)推测回归函数推测回归函数;(2)建立回归模型建立回归模型;(3)估计未知参数估计未知参数;(4)进行假设检验进行假设检验;(5)预测与控制预测与控制.关键关键:选择适当的选择适当的变量代换变量代换.4.2 4.2 多元线性回归分析多元线性回归分析多元线性回归模型多元线性回归模型 多元线性回归的参数估计、线性相关性的多元线性回归的参数估计、线性相关性的检验以及预测控制等问题都可采用一元线性回检验
14、以及预测控制等问题都可采用一元线性回归类似的方法求解。归类似的方法求解。化简可得化简可得参数估计:参数估计:达到最小达到最小.使使误差平方和误差平方和正规方程组正规方程组最大似然估计值最大似然估计值P元经验线性回归方程元经验线性回归方程正规方程组的矩阵形式正规方程组的矩阵形式残差平方和残差平方和估计量的性质:估计量的性质:离差平方和离差平方和回归平方和回归平方和F F检验法检验法:线性相关性的显著性检验线性相关性的显著性检验:多元线性回归多元线性回归1.确定回归系数的点估计值确定回归系数的点估计值,用命令用命令:b=regress(Y,X)2.求回归系数的点估计和区间估计求回归系数的点估计和区
15、间估计,并检验回并检验回归模型归模型,用命令用命令:b,bint,r,rint,stats=regress(Y,X,alpha)3.画出残差及其置信区间画出残差及其置信区间,用命令用命令:rcoplot(r,rint)附:附:MATLAB中回归分析的实现中回归分析的实现符号说明符号说明(1)(2)alpha为显著性水平为显著性水平,默认为默认为 0.05;(3)bint为回归系数的区间估计为回归系数的区间估计;(4)r与与rint分别为残差及其置信区间分别为残差及其置信区间;(5)stats 是用于检验回归模型的统计量是用于检验回归模型的统计量,有三个有三个数值数值,第一个是相关系数第一个是相
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数理统计 线性 回归 ppt 课件
限制150内