回归讲稿年讲稿.ppt
《回归讲稿年讲稿.ppt》由会员分享,可在线阅读,更多相关《回归讲稿年讲稿.ppt(54页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、回归讲稿年回归讲稿年1第一页,讲稿共五十四页哦前言前言1 1 1 1 回回归归分分析析是是数数理理统统计计应应用用最最广广泛泛的的分分支支之之一一,它它不不仅仅是是统统计计专专业业本本科科生生和和研研究究生生的的必必修修课课,而而且且也也是是生生物物、医医学学、经经济济、管管理理、商商业业、金金融融、工工程程技技术术以以及及社社会会科科学学等等学学科科的的本本科科生生和和研研究究生生统统计计课课程程的的重重要内容。要内容。2第二页,讲稿共五十四页哦前言前言2 2 2 2本教材的特点本教材的特点:在不失严谨的前提下,在不失严谨的前提下,突出了实际案例的应用和统计思想的渗透突出了实际案例的应用和统
2、计思想的渗透;结合统计软件较全面地系统介绍了回归分析的实用方法。结合统计软件较全面地系统介绍了回归分析的实用方法。在系统介绍回归分析的基本理论和方法的同时在系统介绍回归分析的基本理论和方法的同时v尽尽力力结结合合中中国国社社会会、经经济济、自自然然科科学学等等领领域域的的研研究究实实例例;在每章后附有思考题与练习题在每章后附有思考题与练习题v把回归分析方法与实际应用结合起来把回归分析方法与实际应用结合起来;v注意定性分析与定量分析的紧密结合注意定性分析与定量分析的紧密结合;v努力把实践中应用回归分析的经验和体会融入教材努力把实践中应用回归分析的经验和体会融入教材v几几乎乎每每种种方方法法都都强
3、强调调它它的的优优缺缺点点和和实实际际应应用用中中应应注注意意的的问问题题对每章的内容给予综述性的评注。对每章的内容给予综述性的评注。在每章后附有思考题与练习题在每章后附有思考题与练习题3第三页,讲稿共五十四页哦前言前言3 3 3 3 回回归归分分析析的的应应用用离离不不开开计计算算机机,本本书书的的案案例例主主要要运运用用在在我我国国已已很很流流行行的的SPSS软软件件实实现现,部部分分内内容容用用Excel和和SAS软软件件完完成成。该该教教材材的的一一个个显显著著特特点点是是在在每每种种方方法法之之后后结结合合实实例介绍例介绍SPSS或或Excel、SAS的实际操作过程。的实际操作过程。
4、我我们们将将在在实实验验中中使使用用相相关关软软件件。并并要要求求掌握相关软件编程和应用软件。掌握相关软件编程和应用软件。4第四页,讲稿共五十四页哦前言前言4 4 4 4 我我们们作作为为数数学学学学院院统统计计专专业业的的学学生生,在在理理论论上上应应比比本本教教材材有有更更深深入入的的了了解,相关内容将在授课时补充。解,相关内容将在授课时补充。参考教材参考教材l 周纪芗,回归分析,华东师范大学出版社,周纪芗,回归分析,华东师范大学出版社,1993l 王王松松桂桂等等人人,线线性性统统计计模模型型,线线性性统统计计模模型型 线线性性回回归归与与方方差差分分析析,高高等等教教育育出出版版社,社
5、,1999l 张启锐,张启锐,应用回归分析,地质出版社,应用回归分析,地质出版社,1988l G.A.F.塞伯塞伯 线性回归分析,科学出版社,线性回归分析,科学出版社,1987l David G.Kleinbaum等等 Applied Regression Analysis and Other Multivariable Method(Third Edition)(应应用用回回归归分分析析和和其其它它多多元元方方法法)机机械械工工业出版社业出版社 2003l S.韦韦斯斯伯伯特特格格(S.Weisberg)应应用用线线性性回回归归(第第2版版)(Applied Linear Regressio
6、n)中国统计出版社中国统计出版社 1998(有第有第3版原文照相版版原文照相版)相关要求相关要求l 每周一交作业每周一交作业,每次上机实验都要交作业每次上机实验都要交作业,计算成绩计算成绩考试形式考试形式l大考大考70%,中考中考20%,平时平时20%(实验实验10%)5第五页,讲稿共五十四页哦第第1章章 回归分析概述回归分析概述1 1 为为了了在在系系统统学学习习回回归归分分析析之之前前对对该该课课程程的的思思想想方方法法、主主要要内内容容、发发展展现现状状等等有有一一个个概概括括的的了了解解,本本章章将将由由变变量量间间的的统统计计关关系系,引引申申出出自自然然科科学学与与社社会会经经济济
7、等等现现象象中中的的相相关关与与回回归归问问题题,并并扼扼要要介介绍绍“回回归归”名名称称的的由由来来及及近近代代回回归归分分析析的的发发展展、回回归归分分析析研研究究的的主主要要内内容容,以以及及建建立立回回归归模模型型的的步步骤骤与与建建模过程中应注意的问题。模过程中应注意的问题。6第六页,讲稿共五十四页哦1.1 变量间的统计关系变量间的统计关系1 1 1 1 自自然然科科学学与与社社会会经经济济等等现现象象之之间间的的相相互互联联系系和和制制约约是是一个普遍规律。一个普遍规律。例例如如,社社会会经经济济的的发发展展总总是是与与一一定定的的经经济济变变量量的的数数量量变变化化紧紧密密联联系
8、系的的。社社会会经经济济现现象象不不仅仅同同和和它它有有关关的的现现象象构构成成一一个个普普遍遍联联系系的的整整体体,而而且且在在它它的的内内部部也也存存在在着着许许多多彼彼此此关关联联的的因因素素,在在一一定定的的社社会会环环境境、地地理理条条件件、政政府府决决策策影影响响下下,一一些些因因素素推推动动或或制制约约另另外外一一些些与与之之联联系系的的因因素素发发生生变变化化。这这种种状状况况表表明明,在在经经济济现现象象的的内内部部和和外外部部联联系系中中存存在在着着一一定定的的相相关关性性,人人们们往往往往利利用用这这种种相相关关关关系系来来制制订订有有关关的的经经济济政政策策,以以指指导
9、导、控控制制社社会会经经济济活活动动的的发发展展。要要认认识识和和掌掌握握客客观观经经济济规规律律就就必必须须探探求求经经济济现现象象间间经经济济变变量量的的变变化化规规律律,变变量量间间的的统统计计关关系系是是经经济济变变量量变变化化规规律律的的重重要特征。要特征。7第七页,讲稿共五十四页哦1.1 变量间的统计关系变量间的统计关系2 2 2 2 互互有有联联系系的的经经济济现现象象及及经经济济变变量量关关系系的的紧紧密密程程度度各各不不一一样样。一一种种极极端端的的情情况况下下是是一一个个变变量量的的变变化化能能完完全全决决定定另另一一个个变量的变化变量的变化。l 例如,一个保险公司承保汽车
10、例如,一个保险公司承保汽车5万辆,每辆保费收入为万辆,每辆保费收入为1000元,则元,则该保险公司汽车承保总收入为该保险公司汽车承保总收入为5000 万元。如果把承保收入记为万元。如果把承保收入记为 y,承,承保汽车辆数记为保汽车辆数记为x,则则 y=1000 xx与与 y 两个变量间完全表现为一种确两个变量间完全表现为一种确定性关系定性关系,即函数关系即函数关系,如图如图1.1所示。所示。l 又如,银行的一年期存款利率是又如,银行的一年期存款利率是年息年息 1.98%,存入本金用,存入本金用 x 表示,表示,到期本息用到期本息用 y表示,则表示,则 y=x+1.98%x这里这里 y 与与 x
11、 仍表现为一种线性函数关系。对于任意两个变量间的函数关系,仍表现为一种线性函数关系。对于任意两个变量间的函数关系,我们可以表述为下面的数学形式我们可以表述为下面的数学形式 y=f(x)y(万万元元)图图1.1 函数关系图函数关系图y=1000 x8第八页,讲稿共五十四页哦1.1 变量间的统计关系变量间的统计关系3 3 3 3 再如,工业企业的原材料消耗总额用再如,工业企业的原材料消耗总额用 y 表示,生产量用表示,生产量用 x1表示,单位产量消耗用表示,单位产量消耗用 x2表示,原材料价格用表示,原材料价格用 x3表示,则表示,则y=x1 x2 x3这里这里 y 与与 x1,x2,x3 仍是一
12、种确定性的函数关系,但它们显然仍是一种确定性的函数关系,但它们显然不是线性函数关系了。我们可以将变量不是线性函数关系了。我们可以将变量 y 与与 p 个变量个变量 x1,x2,xp之间存在着的某种函数关系用下面的形式表示之间存在着的某种函数关系用下面的形式表示 y=f(x1,x2,xp)经济数学中还有很多函数关系的例子。物理中的自由落经济数学中还有很多函数关系的例子。物理中的自由落体距离公式、初等数学中许多计算公式等体距离公式、初等数学中许多计算公式等都是变量间的函数都是变量间的函数关系关系。9第九页,讲稿共五十四页哦1.1 变量间的统计关系变量间的统计关系4 4 4 4 然然而而,现现实实世
13、世界界中中还还有有不不少少情情况况是是两两事事物物之之间间有有着着密密切切的的联联系系,但但它它们们密密切切的的程程度度并并没没有有到到由由一一个个可可以以完完全全确确定定另另一一个个的程度的程度。下面举几个例子。下面举几个例子。1.某种高档消费品的销售量与城镇居民的收入密切相关。居民收入高了,某种高档消费品的销售量与城镇居民的收入密切相关。居民收入高了,这种消费品的销售这种消费品的销售量就大。但是由居民收入量就大。但是由居民收入 x 并不能完全确定某种高并不能完全确定某种高档消费品的销售量档消费品的销售量 y,因,因为这种高档消费品的销售为这种高档消费品的销售量还受着人们的消费习惯、量还受着
14、人们的消费习惯、心理因素、其它商品的吸心理因素、其它商品的吸引程度及价格的高低等诸引程度及价格的高低等诸因素的影响。这样变量因素的影响。这样变量 y 与变量与变量 x 就是一种就是一种非确定非确定的关系的关系,见图,见图1.2。图图1.2 y 与与 x 非确定性关系图非确定性关系图10第十页,讲稿共五十四页哦1.1 变量间的统计关系变量间的统计关系5 5 5 5 2.粮粮食食产产量量 y 与与施施肥肥量量 x 之之间间有有着着密密切切的的关关系系。在在一一定定范范围围内内,施施肥肥量量越越多多,粮粮食食产产量量就就越越高高。但但是是,施施肥肥量量并并不不能能完完全全确确定定粮粮食食产产量量,因
15、因为为粮粮食食产产量量还还与与其其它它因因素素有有关关,如如降降雨雨量量、田田间间管管理理水水平平等等。因因此此粮粮食食产产量量 y 与与施施肥肥量量 x 之之间间不不存在确切的函数关系存在确切的函数关系。3.储储蓄蓄额额与与居居民民的的收收入入密密切切相相关关,但但是是由由居居民民收收入入并并不不能能完完全全确确定定储储蓄蓄额额,因因为为影影响响储储蓄蓄额额的的因因素素很很多多,如如通通货货膨膨胀胀、股股票票价价格格指指数数、利利率率、消消费费观观念念、投投资资意意识识等等。因因此此尽尽管管储储蓄蓄额额与与居居民民的的收收入入有有密密切切的的关关系系,但但它它们们之之间间并并不不存存在在一一
16、种种确定性关系确定性关系。再再如如:广广告告费费支支出出与与商商品品销销售售额额、保保险险利利润润与与保保费费收收入入、工业产值与用电量等。这方面的例子不胜枚举。工业产值与用电量等。这方面的例子不胜枚举。11第十一页,讲稿共五十四页哦1.1 变量间的统计关系变量间的统计关系6 6 6 6 以以上上变变量量关关系系的的一一个个共共同同特特征征是是它它们们之之间间有有密密切切关关系系,但但它它们们是是一一种种非非确确定定性性关关系系。由由于于经经济济问问题题的的复复杂杂性性,有有许许多多因因素素因因为为我我们们的的认认识识以以及及其其它它客客观观原原因因的的局局限限,并并没没有有包包含含在在内内。
17、或或者者由由于于试试验验误误差差、测测量量误误差差以以及及其其它它种种种种偶偶然然因因素素的的影影响响,使使得得另另外外一一个个或或一一些些变变量量的的取取值值带带有有一一定定的的随随机机性性。因因而而当当一一个个或或一一些些变变量量取取定定值值后后,不不能能以以确确定定值值与与之之对对应。应。从从图图1.1看看到到确确定定性性的的函函数数关关系系(线线性性关关系系),各各对对应应点点完完全全落落在在一一条条直直线线上上,而而由由图图1.2看看到到,各各对对应应点点并并不不完完全全落落在在一一条条直直线线上上,即即有有的的点点在在直直线线上上,有有的的点点在在直直线线的的两两侧侧。对对于于这这
18、种种对对应应点点不不能能分分布布在在一一条条直直线线上上的的变变量量间间的的关关系系,也也就就是是变变量量 x 与与 y 之之间间有有一一定定关关系系,但但是是又又没没有有密密切切到到可可以以通通过过 x 惟惟一一确确定定 y 的的程程度度,这这种种关关系系正正是是统统计计学学中中研研究究的的重重要要内容内容。12第十二页,讲稿共五十四页哦1.1 变量间的统计关系变量间的统计关系7 7 7 7 在在统统计计推推断断中中,我我们们把把上上述述变变量量间间具具有有密密切切关关联联而而又又不不能能由由某某一一个个或或某某一一些些变变量量惟惟一一确确定定另另外外一一个个变变量量的的关关系系,称称为为变
19、变量量间间的的统统计计关关系系或或相相关关关关系系。这这种种统统计计关关系系规规律律性性的的研研究究是是统统计计学学中中研研究究的的主主要要对对象象,现现代代统统计计学学中中关关于于统统计计关关系系的的研研究究已已形形成成两个重要的分支两个重要的分支,分别称为,分别称为相关分析相关分析和和回归分析回归分析。回回归归分分析析和和相相关关分分析析都都是是研研究究变变量量间间关关系系的的统统计计学学课课题题。在在应应用用中中,两两种种分分析析方方法法经经常常相相互互结结合合和和渗渗透透,但但它它们们研研究究的的侧侧重重点点和和应应用用面面不不同同。它它们们的的差差别别主主要有以下几点:要有以下几点:
20、l 在在回回归归分分析析中中,变变量量 y 称称为为因因变变量量,处处在在被被解解释释的的特特殊殊地地位位;在在相相关关分分析析中中,变变量量 y 与与变变量量 x 处处 于于 平平 等等 的的 地地 位位,即即 研研 究究 变变 量量 y 与与 变变 量量 x 的的 密密 切切 程程 度度 与与 研研 究究 变变 量量 x 与变量与变量 y 的密切程度是一回事。的密切程度是一回事。l 相相关关分分析析中中所所涉涉及及变变量量 y 与与 x 全全是是随随机机变变量量;而而在在回回归归分分析析中中,因因变变量量y是是随随机机变变量量,自自变变量量x可可以是随机变量,也可以是非随机的确定变量。通常
21、的回归模型中,我们总是假定以是随机变量,也可以是非随机的确定变量。通常的回归模型中,我们总是假定x是非随机的确定变量。是非随机的确定变量。l 相相关关分分析析的的研研究究主主要要是是为为了了刻刻画画两两类类变变量量间间线线性性相相关关的的密密切切程程度度;而而回回归归分分析析不不仅仅可可以以揭示变量揭示变量x对变量对变量y的影响大小,还可以由回归方程进行预测和控制。的影响大小,还可以由回归方程进行预测和控制。13第十三页,讲稿共五十四页哦1.1 变量间的统计关系变量间的统计关系8 8 8 8 由由于于回回归归分分析析与与相相关关分分析析的的研研究究侧侧重重点点不不同同,使使得得它它们们的的研研
22、究究方方法法也也大大不不相相同同。回回归归分分析析已已成成为为现现代代统统计计学学中应用最广泛、研究最活跃的一个独立分支中应用最广泛、研究最活跃的一个独立分支。14第十四页,讲稿共五十四页哦1.2 回归方程与回归名称的由来回归方程与回归名称的由来1 1 1 1 回归分析是处理变量回归分析是处理变量 x 与与 y 之间的关系的一种统计方之间的关系的一种统计方法和技术。这里所研究的变量之间的关系就是上述的统计法和技术。这里所研究的变量之间的关系就是上述的统计关系。即当给定关系。即当给定x的值,的值,y 的值不能确定,只能通过一定的值不能确定,只能通过一定的概率分析来描述。于是,我们称给定的概率分析
23、来描述。于是,我们称给定 x 时时 y 的条件数的条件数学期望学期望 f(x)=E(y|x)(1.1)为随机变量为随机变量 y 对对 x 的的回归函数回归函数,或称为随机变量,或称为随机变量 y 对对 x 的均值回归函数。的均值回归函数。(1.1)式从平均意义上刻画了变量式从平均意义上刻画了变量 x 与与 y 之间的之间的统计规律统计规律。15第十五页,讲稿共五十四页哦1.2 回归方程与回归名称的由来回归方程与回归名称的由来2 2 2 2 在实际问题中,我们把在实际问题中,我们把 x 称为自变量,称为自变量,y 称为因变量。如称为因变量。如果要由果要由 x 预测预测 y,就是要利用,就是要利用
24、 x,y 的观察值,即样本观测值的观察值,即样本观测值 (x1,y1),(x2,y2),(xn,yn)(1.2)来创建一个公式,当给定来创建一个公式,当给定x值后,就代入此公式算出一个值后,就代入此公式算出一个 y值,值,这个值就称为这个值就称为y的预测值。而要建立公式,就要从样本观测值的预测值。而要建立公式,就要从样本观测值(xi,yi)出发,观察出发,观察(xi,yi)在平面直角坐标系上的分布情况,在平面直角坐标系上的分布情况,图图1.2就是居民收入与商品销售额的散点图。由这个图可看出就是居民收入与商品销售额的散点图。由这个图可看出样本点基本上分布在一条直线的周围,因而要确定商品的样本点基
25、本上分布在一条直线的周围,因而要确定商品的销销售额售额 y 与居民收入与居民收入 x 的关系,可考虑用一个线性函数来描述。的关系,可考虑用一个线性函数来描述。图图1.2中的直线即为线性方程中的直线即为线性方程 E(y|x)=+x(1.3)方程方程(1.3)式中的参数式中的参数 ,尚不知道,这就需要由样本数据尚不知道,这就需要由样本数据(1.2)去进行估计。具体如何去估计参数去进行估计。具体如何去估计参数 ,,将在第二章中,将在第二章中详细介绍。详细介绍。16第十六页,讲稿共五十四页哦 当我们由样本数据当我们由样本数据(1.2)式估计出参数式估计出参数 ,的值后,以估计值的值后,以估计值 ,分分
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归 讲稿
限制150内