相关分析和回归分析(1).ppt
《相关分析和回归分析(1).ppt》由会员分享,可在线阅读,更多相关《相关分析和回归分析(1).ppt(61页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、相关分析与回归分析相关分析与回归分析本章要点1、相关关系与非相关关系的区别、相关关系与非相关关系的区别2、相关系数的计算、相关系数的计算3、最小二乘法、最小二乘法4、一元线性回归、一元线性回归5、判定系数与回归系数、判定系数与回归系数6、回归方程的检验、回归方程的检验7、回归估计与预测、回归估计与预测9.1 相关分析概述相关分析概述Outline of Correlation Analysis9.1.1 相关分析的意义相关分析的意义相关和回归分析是研究事物的相互关系、相关和回归分析是研究事物的相互关系、测定它们联系的紧密程度、揭示其变化的测定它们联系的紧密程度、揭示其变化的具体形式和规律性的统
2、计方法,是构造各具体形式和规律性的统计方法,是构造各种经济模型、进行结构分析、政策评价、种经济模型、进行结构分析、政策评价、预测和控制的重要工具。预测和控制的重要工具。比较下面两种现象间的依存关系比较下面两种现象间的依存关系 出租汽车费用与行驶里程:出租汽车费用与行驶里程:总费用总费用=行驶里程行驶里程 每公里单价每公里单价 家庭收入与恩格尔系数:家庭收入与恩格尔系数:家庭收入高,则恩格尔系数低。家庭收入高,则恩格尔系数低。函数关系函数关系(确定性关系)(确定性关系)相关关系相关关系(非确定性关系)(非确定性关系)依存关系有两种类型依存关系有两种类型函数关系函数关系 指现象间所具有的严格的确定
3、性的指现象间所具有的严格的确定性的依存关系依存关系相关关系相关关系指客观现象间确实存在,但数量上指客观现象间确实存在,但数量上不是严格对应的依存关系不是严格对应的依存关系函数关系与相关关系之间并无严格的界限:函数关系与相关关系之间并无严格的界限:有函数关系的变量间,由于有测量误差及各有函数关系的变量间,由于有测量误差及各种随机因素的干扰,可表现为相关关系;对种随机因素的干扰,可表现为相关关系;对具有相关关系的变量有深刻了解之后,相关具有相关关系的变量有深刻了解之后,相关关系有可能转化为或借助函数关系来描述。关系有可能转化为或借助函数关系来描述。现象之间的相互联系,在许多情况现象之间的相互联系,
4、在许多情况下表现为一定的因果关系,将这些下表现为一定的因果关系,将这些现象数量化则成为变量:现象数量化则成为变量:其中一个其中一个或若干个起着影响作用的变量称为或若干个起着影响作用的变量称为自变量自变量,通常用,通常用X表示,它是引起表示,它是引起另一现象变化的原因,是可以控制、另一现象变化的原因,是可以控制、给定的值;而受自变量影响的变量给定的值;而受自变量影响的变量称为称为因变量因变量,通常用,通常用Y表示,它是表示,它是自变量变化的结果,是不确定的值。自变量变化的结果,是不确定的值。按涉及变量的多少分为按涉及变量的多少分为按照表现形式不同分为按照表现形式不同分为按照变化方向不同分为按照变
5、化方向不同分为一元相关一元相关多元相关多元相关直线相关直线相关曲线相关曲线相关负相关负相关正相关正相关相关关系的种类相关关系的种类定性分析定性分析是是依据研究者的理论知识和实践经依据研究者的理论知识和实践经验,对客观现象之间是否存在相关验,对客观现象之间是否存在相关关系,以及何种关系作出判断关系,以及何种关系作出判断定量分析定量分析在在定性分析的基础上,通过编制定性分析的基础上,通过编制相相关表关表、绘制、绘制相关图相关图、计算、计算相关系数相关系数与与判定系数判定系数等方法,来判断现象之等方法,来判断现象之间相关的方向、形态及密切程度间相关的方向、形态及密切程度9.1.2 相关关系的测定相关
6、关系的测定Measurement of Correlation相关表相关表将现象之间的相互关系,用表格的形式来将现象之间的相互关系,用表格的形式来反映反映简单简单相关表相关表适用于所观察的样本单位数适用于所观察的样本单位数较少,不需要分组的情况较少,不需要分组的情况分组分组相关表相关表适用于所观察的样本单位数适用于所观察的样本单位数较多标志变异又较复杂,需较多标志变异又较复杂,需要分组的情况要分组的情况相关图相关图又称又称散点图散点图(Scatter Plot),用直角坐标系,用直角坐标系的的x轴代表自变量,轴代表自变量,y轴代表因变量,将两个轴代表因变量,将两个变量间相对应的变量值用坐标点的
7、形式描绘变量间相对应的变量值用坐标点的形式描绘出来,用以表明相关点分布状况的图形。出来,用以表明相关点分布状况的图形。xyScatter Plot正正 相相 关关Positive Correlation负负 相相 关关Negative Correlation曲线相关曲线相关Other correlation不不 相相 关关Zero Correlationxyxyxy在在直线相关直线相关的条件下,用以反映两变量间的条件下,用以反映两变量间线性相关线性相关密切程度的统计指标,用密切程度的统计指标,用r表示表示相关系数相关系数Coefficient of correlation相关系数相关系数r r
8、的取值的取值范围:范围:-1r1-1r1r0 为为正相关正相关,r 0 为为负相关负相关;|r|=0 表示不存在表示不存在线性线性关系;关系;|r|1 表示表示完全完全线性线性相关相关;0|r|1表示存在表示存在不同程度线性相关不同程度线性相关:|r|0.4 为低度线性相关;为低度线性相关;0.4|r|0.7为显著性线性相关;为显著性线性相关;0.7|r|1.0为为高度高度显著性线性相关。显著性线性相关。判定系数取判定系数取值值范围:范围:r2越接近于越接近于1 1,表明,表明x x与与y y之间的相之间的相关性越强;关性越强;r2越接近于越接近于0 0,表明两,表明两个变量之间几乎没有直线相
9、关关系个变量之间几乎没有直线相关关系.是相关系数的平方,用是相关系数的平方,用r2 表示;用来衡量表示;用来衡量回归方程对回归方程对y的解释程度。的解释程度。判定系数判定系数Coefficient of Determination序号能源消耗量(十万吨)x工业总产值(亿元)yx2y2xy123456789101112131415163538404249525459626465686971727624252428323137404140475049514858122514441600176424012704291634813844409642254624476150415184577657662
10、5576784102496113691600168116002209250024012601230433648409509601176156816121998236025422560305534003381362134564408合计916625550862617537887【例例】计算工业总产值与能源消耗量之间的相计算工业总产值与能源消耗量之间的相关系数及判定系数关系数及判定系数结论:结论:工业总产值与能源消耗量之间存工业总产值与能源消耗量之间存在高度的正相关关系,能源消耗量在高度的正相关关系,能源消耗量x的变的变化能够解释工业总产值化能够解释工业总产值y变化的变化的95.2。9.2一元线性
11、回归分析一元线性回归分析Simple Linear Regression Analysis回归分析回归分析指根据相关关系的数量表达指根据相关关系的数量表达式(回归方程式)与给定的式(回归方程式)与给定的自变量自变量x x(independent(independent variable)variable),揭示揭示因变量因变量y y(dependent variable)(dependent variable)在在数量上的平均变化和求得因数量上的平均变化和求得因变量的预测值的统计分析方变量的预测值的统计分析方法法回归:退回回归:退回regression9.2.1 回归分析概述回归分析概述回归分
12、析与相关分析的联系回归分析与相关分析的联系理论和方法具有一致性;理论和方法具有一致性;无相关就无回归,相关程度越高,回归越无相关就无回归,相关程度越高,回归越好;好;相关系数和回归系数方向一致,可以互相相关系数和回归系数方向一致,可以互相推算。推算。回归分析与相关分析的区别回归分析与相关分析的区别相关分析中相关分析中x与与y对等,回归分析中对等,回归分析中x与与y要要确定自变量和因变量;确定自变量和因变量;相关分析中相关分析中x、y均为随机变量,回归分析均为随机变量,回归分析中只有中只有y为随机变量;为随机变量;相关分析测定相关程度和方向,回归分析相关分析测定相关程度和方向,回归分析用回归模型
13、进行预测和控制。用回归模型进行预测和控制。回归分析的种类回归分析的种类一元回归一元回归(简单回归)(简单回归)多元回归多元回归(复回归复回归)线性回归线性回归非线性回归非线性回归一一 元元线线性性回回归归Simple Linear regression按自变量的按自变量的 个数分个数分按回归曲线按回归曲线的形态分的形态分对于经判断具有线性关系的两个变量对于经判断具有线性关系的两个变量y y与与x x,构造一元线性回归模型为:构造一元线性回归模型为:假定假定E()=0,有,有总体一元线性回归方程总体一元线性回归方程:9.2.2一元线性回归模型一元线性回归模型Simple Linear Regre
14、ssion Model截距截距斜率斜率一元线性回归方程的可能形态一元线性回归方程的可能形态 为正为正 为负为负 为为0一元线性回归方程的几何意义一元线性回归方程的几何意义总体一元线性总体一元线性回归方程回归方程:样本一元线性回归方程:样本一元线性回归方程:以样本统计量估计总体参数以样本统计量估计总体参数斜率(回归系数)斜率(回归系数)截距截距截距截距a 表示在没有自变量表示在没有自变量x的影响时,其它各的影响时,其它各种因素对因变量种因素对因变量y的平均影响;的平均影响;回归系数回归系数b 表表明自变量明自变量x每变动一个单位,因变量每变动一个单位,因变量y平均变平均变动动b个单位。个单位。(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 相关 分析 回归
限制150内