最新Excel应用实例之八——预测分析.doc
《最新Excel应用实例之八——预测分析.doc》由会员分享,可在线阅读,更多相关《最新Excel应用实例之八——预测分析.doc(83页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、Four short words sum up what has lifted most successful individuals above the crowd: a little bit more.-author-dateExcel应用实例之八预测分析第八章 预测分析5.18 预测分析本节提要本节首先讨论了两种时间序列预测法:移动平均法和指数平滑法。然后介绍了回归分析法,其中包括线性回归法和可以转化为线性处理的非线性回归。 预测是指从已知事件测定未知事件。具体地讲,预测就是以准确的调查统计资料和统计数据为依据,从研究现象的历史、现状和规律性出发,运用科学的方法,对研究现象的未来发展前景
2、的测定。预测理论作为通用的方法论,既可以应用于研究自然现象,又可应用于研究社会现象。将预测理论、方法和个别领域现象发展的实际相结合,就产生了预测的各个分支。如社会预测、人口预测、经济预测、政治预测、科技预测、军事预测、气象预测等等。本章主要以经济预测为例来讨论预测技术中最基本、最常用的预测方法及其在Excel 2000中的具体实现。 经济预测的内容十分丰富,常见如某种商品或产品的社会需求预测、市场占有率预测、市场供求预测、库存预测以及企业利润预测、投资效益预测、价格变动预测等等。由于经济系统的复杂性、随机性、动态性、开放性、模糊性以及经济信息的不完善性,使得没有哪种单纯的预测方法能满足一切预测
3、决策工作的需要,所以现在已发展了许多预测方法,不同的预测方法适用于不同的情况。在实际应用中应具体问题具体分析,针对具体问题选择最有效的预测方法来进行预测分析。本节只讨论应用最为广泛的两种时间序列预测法和回归分析预测法。 8.1 时间序列预测法 时间序列是指把历史统计资料按时间顺序排列起来得到的一组数据序列。例如,按月份排列的某种商品的销售量;工农业总产值按年度顺序排列起来的数据序列等等都是时间序列。时间序列一般用 表示,t为时间。 时间序列预测法是将预测目标的历史数据按时间的顺序排列成为时间序列,然后分析它随时间的变化趋势,外推预测目标的未来值。也就是说,时间序列预测法将影响预测目标的一切因素
4、都由“时间”综合起来描述。因此,时间序列预测法主要用于分析影响事物的主要因素比较困难或相关变量资料难以得到的情况。 8.1.1 移动平均法移动平均法是一种简单平滑预测技术,它的基本思想是:根据时间序列资料、逐项推移,依次计算包含一定项数的序时平均值,以反映长期趋势的方法。因此,当时间序列的数值由于受周期变动和随机波动的影响,起伏较大,不易显示出事件的发展趋势时,使用移动平均法可以消除这些因素的影响,显示出事件的发展方向与趋势(即趋势线),然后依趋势线分析预测序列的长期趋势。 1. 移动平均法的基本理论简单移动平均法设有一时间序列 ,则按数据点的顺序逐点推移求出N个数的平均数,即可得到一次移动平
5、均数: 式中 为第t周期的一次移动平均数; 为第t周期的观测值;N为移动平均的项数,即求每一移动平均数使用的观察值的个数。 这个公式表明当t向前移动一个时期,就增加一个新近数据,去掉一个远期数据,得到一个新的平均数。由于它不断地“吐故纳新”,逐期向前移动,所以称为移动平均法。 由于移动平均可以平滑数据,消除周期变动和不规则变动的影响,使得长期趋势显示出来,因而可以用于预测。其预测公式为: 即以第t周期的一次移动平均数作为第t+1周期的预测值。 趋势移动平均法当时间序列没有明显的趋势变动时,使用一次移动平均就能够准确地反映实际情况,直接用第t周期的一次移动平均数就可预测第t+1周期之值。但当时间
6、序列出现线性变动趋势时,用一次移动平均数来预测就会出现滞后偏差。因此,需要进行修正,修正的方法是在一次移动平均的基础上再做二次移动平均,利用移动平均滞后偏差的规律找出曲线的发展方向和发展趋势,然后才建立直线趋势的预测模型。故称为趋势移动平均法。 设一次移动平均数为 ,则二次移动平均数 的计算公式为: 再设时间序列 从某时期开始具有直线趋势,且认为未来时期亦按此直线趋势变化,则可设此直线趋势预测模型为: 式中t为当前时期数;T为由当前时期数t到预测期的时期数,即t以后模型外推的时间; 为第t+T期的预测值; 为截距; 为斜率。 , 又称为平滑系数。 根据移动平均值可得截距 和斜率 的计算公式为:
7、 在实际应用移动平均法时,移动平均项数N的选择十分关键,它取决于预测目标和实际数据的变化规律。 2. 应用举例已知某商场19781998年的年销售额如下表所示,试预测1999年该商场的年销售额。 年份销售额年份销售额19783219897619794119907319804819917919815319928419825119938619835819948719845719959219856419969519866919971011987671998107198869下面使用移动平均工具进行预测,具体操作步骤如下: 选择工具菜单中的数据分析命令,此时弹出数据分析对话框。 在分析工具列表框中,选
8、择移动平均工具。这时将弹出移动平均对话框,如图5.181所示。 图5.181 在输入框中指定输入参数。在输入区域框中指定统计数据所在区域B1:B22;因指定的输入区域包含标志行,所以选中标志位于第一行复选框;在间隔框内键入移动平均的项数5(根据数据的变化规律,本例选取移动平均项数N=5)。 在输出选项框内指定输出选项。可以选择输出到当前工作表的某个单元格区域、新工作表或是新工作簿。本例选定输出区域,并键入输出区域左上角单元格地址C2;选中图表输出复选框。若需要输出实际值与一次移动平均值之差,还可以选中标准误差复选框。 单击确定按钮。这时,Excel给出一次移动平均的计算结果及实际值与一次移动平
9、均值的曲线图,如图5.182所示。 图5.182从图5.182可以看出,该商场的年销售额具有明显的线性增长趋势。因此要进行预测,还必须先作二次移动平均,再建立直线趋势的预测模型。而利用Excel 2000提供的移动平均工具只能作一次移动平均,所以在一次移动平均的基础上再进行移动平均即可。 二次移动平均的方法同上,求出的二次移动平均值及实际值与二次移动平均值的拟合曲线,如图5.183所示。 图5.1834再利用前面所讲的截距 和斜率 计算公式可得: 于是可得t=21时的直线趋势预测模型为: 预测1999年该商场的年销售额为: 8.1.2 指数平滑法移动平均法的预测值实质上是以前观测值的加权和,且
10、对不同时期的数据给予相同的加权。这往往不符合实际情况。指数平滑法则对移动平均法进行了改进和发展,其应用较为广泛。 1. 指数平滑法的基本理论根据平滑次数不同,指数平滑法分为:一次指数平滑法、二次指数平滑法和三次指数平滑法等。但它们的基本思想都是:预测值是以前观测值的加权和,且对不同的数据给予不同的权,新数据给较大的权,旧数据给较小的权。 一次指数平滑法 设时间序列为 ,则一次指数平滑公式为: 式中 为第 t周期的一次指数平滑值; 为加权系数,0 1。 为了弄清指数平滑的实质,将上述公式依次展开,可得: 由于0 1,当 时, 0,于是上述公式变为: 由此可见 实际上是 的加权平均。加权系数分别为
11、 , ,是按几何级数衰减的,愈近的数据,权数愈大,愈远的数据,权数愈小,且权数之和等于1,即 。因为加权系数符合指数规律,且又具有平滑数据的功能,所以称为指数平滑。 用上述平滑值进行预测,就是一次指数平滑法。其预测模型为: 即以第t周期的一次指数平滑值作为第t+1期的预测值。 二次指数平滑法当时间序列没有明显的趋势变动时,使用第t周期一次指数平滑就能直接预测第t+1期之值。但当时间序列的变动出现直线趋势时,用一次指数平滑法来预测仍存在着明显的滞后偏差。因此,也需要进行修正。修正的方法也是在一次指数平滑的基础上再作二次指数平滑,利用滞后偏差的规律找出曲线的发展方向和发展趋势,然后建立直线趋势预测
12、模型。故称为二次指数平滑法。 设一次指数平滑为 ,则二次指数平滑 的计算公式为: 若时间序列 从某时期开始具有直线趋势,且认为未来时期亦按此直线趋势变化,则与趋势移动平均类似,可用如下的直线趋势模型来预测。 式中t为当前时期数;T为由当前时期数t到预测期的时期数; 为第t+T期的预测值; 为截距, 为斜率,其计算公式为: 三次指数平滑法 若时间序列的变动呈现出二次曲线趋势,则需要用三次指数平滑法。三次指数平滑是在二次指数平滑的基础上再进行一次平滑,其计算公式为: 三次指数平滑法的预测模型为: 其中: 加权系数的选择在指数平滑法中,预测成功的关键是 的选择。 的大小规定了在新预测值中新数据和原预
13、测值所占的比例。 值愈大,新数据所占的比重就愈大,原预测值所占比重就愈小,反之亦然。 若把一次指数平滑法的预测公式改写为: 则从上式可以看出,新预测值是根据预测误差对原预测值进行修正得到的。 的大小表明了修正的幅度。 值愈大,修正的幅度愈大, 值愈小,修正的幅度愈小。因此, 值既代表了预测模型对时间序列数据变化的反应速度,又体现了预测模型修匀误差的能力。 在实际应用中, 值是根据时间序列的变化特性来选取的。若时间序列的波动不大,比较平稳,则 应取小一些,如0.10.3;若时间序列具有迅速且明显的变动倾向,则 应取大一些,如0.60.9。实质上, 是一个经验数据,通过多个 值进行试算比较而定,哪
14、个 值引起的预测误差小,就采用哪个。 2. 应用举例已知某厂19781998年的钢产量如下表所示,试预测1999年该厂的钢产量。 年份钢产量年份钢产量1978676198920311979825199022341980774199125661981716199228201982940199330061983115919943093198413841995327719851524199635141986166819973770198716881998410719881958下面利用指数平滑工具进行预测,具体步骤如下: 选择工具菜单中的数据分析命令,此时弹出数据分析对话框。 在分析工具列表框中,选
15、择指数平滑工具。这时将出现指数平滑对话框,如图5.184所示。 图5.184在输入框中指定输入参数。在输入区域指定数据所在的单元格区域B1:B22;因指定的输入区域包含标志行,所以选中标志复选框;在阻尼系数指定加权系数0.3。 在输出选项框中指定输出选项。本例选择输出区域,并指定输出到当前工作表以C2为左上角的单元格区域;选中图表输出复选框。单击确定按钮。这时,Excel给出一次指数平滑值,如图5.185所示。 图5.185 从图5.185可以看出,钢产量具有明显的线性增长趋势。因此需使用二次指数平滑法,即在一次指数平滑的基础上再进行指数平滑。所得结果如图5.186所示。 图5.186 利用前
16、面的截距 和斜率 计算公式可得: 于是,可得钢产量的直线趋势预测模型为: 预测1999年的钢产量为: 8.2 回归分析预测法 在实际经济问题中,某一经济行为常受多因素的影响和制约。例如,商品的销售量与商品的价格、商品的质量以及消费者的收入水平等因素有关;又如果树的产量受施肥量、降雨量、气温等因素的影响。因此,要研究该经济行为就应从事物变化的因果关系出发,寻找它与其他因素之间的的内在联系,这就是因果关系分析法。在因果关系分析法中最常用的方法之一就是回归分析法。 回归分析预测法就是从各种经济现象之间的相互关系出发,通过对与预测对象有联系的现象变动趋势的分析,推算预测对象未来状态数量表现的一种预测方
17、法。 根据回归分析中所考虑因素的多少,可将回归分析分为一元回归分析和多元回归分析。例如,对于耐用消费品销售量与居民收入的相关关系的分析问题就属于一元回归分析;而对于粮食产量与施肥量、降雨量、气温的相关关系的分析问题就属于多元回归分析。一元回归分析实质上多元回归分析的一种特例。 根据回归模型是否是线性的,又可将回归分析分为线性回归分析和非线性回归分析。例如,若耐用消费品销售量与居民收入具有线性关系,则属于线性回归分析问题;若某商店的商品流通费用率与销售额具有曲线关系,则属于非线性回归分析问题。 本节先讨论多元线性回归法,然后再讨论非线性回归问题。 8.2.1 线性回归预测法1. 多元线性回归模型
18、设所研究的对象 受多个因素 的影响,假定各个影响因素与 的关系是线性的,则可建立多元线性回归模型: 式中 代表影响因素,通常是可以控制或预先给定的,故称为解释变量或自变量; 代表各种随机因素对 的影响的总和,称为随机误差项,根据中心极限定理,可以认为它服从正态分布,即 ; 就是所研究的对象,即预测目标,称为被解释变量或因变量。 根据n组观测值 则有 写成矩阵形式 其中 利用最小二乘法可得回归系数向量 的估计值 为 故回归分析模型为 2. 多元线性回归模型的检验 求出的回归模型是否合理,是否符合变量之间的客观规律性,引入所影响因素是否有效,变量之间是否存在线性相关关系,模型能否付诸应用,这要通过
19、检验决定。一般讲,回归模型必须通过三方面的检验:经济意义检验、统计检验和计量经济学检验。只有当所有检验都通过时,所做的回归模型才成立。才能利用连贯性、相关性和类推性原则,根据过去和现在的规律预测未来。当然,还应从经济角度上分析模型的预测值是否合理?是否符合经济规律?是否可行等等? 经济意义检验 首先需要检验模型是否符合经济意义,检验求得的参数估计值的符号与大小是否合理,是否与根据人们的经验和经济理论所拟定的期望值相符合。如果不符,则要查找原因和采取必要的修正措施,重新建立模型。 统计检验统计检验是运用数理统计的方法,对方程进行检验、对模型参数估计值的可靠性进行检验。这主要包括拟合优度检验、方程
20、显著性检验、变量显著性检验,即常用的 检验、F检验和 检验。 拟合优度检验( 检验):检验所有解释变量与被解释变量间的相关程度。拟合优度检验就是检验回归方程对样本观测值的拟合程度。常用的方法是 检验,又称为复相关系数检验法,它是通过对总变差(总离差) 的分解得到。 其中 总变差平方和 是各个观察值与样本均值之差的平方和,反映了全部数据之间的差异;残差平方和 是总变差平方和中未被回归方程解释的部分,由解释变量 中未包含的一切因素对被解释变量 的影响而造成的;回归平方和 是总变差平方和中由回归方程解释的部分。 显然,对于一个好的回归模型,它应该较好地拟合样本观测值, 中 越小越好。于是可以用: 对
21、回归方程的拟合优度进行检验。如果所有样本观测值都位于回归方程上,即: 此时回归方程完全拟合了样本观测值, 等于1。当然,完全拟合的情况是不可能的, 不可能等于1,但毫无疑问, 越接近1,回归方程的拟合优度越高。 通常, 称为复可决系数,取值范围为0 1,其平方根 称为复相关系数(当解释变量的个数为1时, 称为相关系数)。这里, 说明了在被解释变量 的总变差中,由一组解释变量 的变动所引起的百分比; 则描述了一组解释变量 与被解释变量 之间的线性相关程度。例如 =0.93,可以说 值的变化有93%因 的变化而产生。因此,若 的值愈接近1,则表示 与 的关系愈密切。 由于 是一个随解释变量个数的增
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 最新 Excel 应用 实例 预测 分析
限制150内