时间序列分析部分讲义中国科学研究院安鸿志.doc
《时间序列分析部分讲义中国科学研究院安鸿志.doc》由会员分享,可在线阅读,更多相关《时间序列分析部分讲义中国科学研究院安鸿志.doc(23页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、【精品文档】如有侵权,请联系网站删除,仅供学习与交流时间序列分析部分讲义中国科学研究院安鸿志.精品文档.时间序列分析 (J.D.Hamilton)前言: 3.平稳ARMA过程(p49-78),6.谱分析(p180-202),11.向量自回归(p345-409),21.异方差时间序列模型(p799-823).3. 平稳ARMA过程3.0 概述 (认识论,方法论,历史观,发展观)什么是”回归模型”? 什么是”自回归模型”? 它们有什么联系 ?为什么用”回归”一词 ? 它们的推广模型是什么 ?它们的应用背景是什么 ?* 考虑 ”父-子身高的关系”X-父亲的身高,Y-儿子的身高,它们有关系吗? 有什么
2、样的关系呢?不是确定的关系! 又不是没有关系!在同族中抽取n对父-子的身高, 即有n对数据:(X1,Y1), (X2,Y2), , (Xn,Yn).Yk a + bXk , 1kn.Yk = a + bXk + ek , 1kn. (0.1)* 此为一元线性回归模型. ek-个体差异, 其他因素, 等等.* 如果, 如果能记录到一个父系的长子身高序列, 即X1,X2,Xn , 显然, (X1,X2),(X2,X3),(Xn-1,Xn)是(n-1)对父-子身高数据, 与(Xk,Yk)相比, 这里的 Yk = Xk+1 , k=1,2,n-1.依同样论述有Xk +1 = a + bXk + ek
3、, 1kn. (0.2)* 此为一元线性自回归模型(自变元Yk是因变元Xk的延迟)* 回归英文翻译Regression(0.2),具体说来如下:m-男人平均身高. 由(0.2)得 Xk +1-m = a + bXk + ek -m (注意m=(b-1)m+bm) = a +(b-1)m + b(Xk -m)+ ek.Wk = (Xk -m)-第k代长子身高与平均身高之差,c= a +(b-1)m,于是有Wk+1 = c + bWk + ek. (0.3)特别人们发现: 0b1.它表明:平均说来, 当父亲身高超过平均身高时, 其子身高也会超过平均身高, 但是比父亲身高更靠近平均身高.有回归平均身
4、高的趋向! 稳定系统!* 回归模型的推广: (线性模型)* 增加自变元个数: 比如, 儿子身高不仅与父亲还与母亲, 甚至于祖父母有关, 于是(0.1)式应推广为:Yk = a + b1X1k + bpXpk +ek , 1kn. (0.4)* 此为p元线性回归模型.* 向非线性推广:仍以父-子身高的关系为例, 它们的真实关系应是比(0.1)式更一般的形式:Yk = j(Xk )+ ek , 1kn. (0.5)(0.4)式 更一般的形式:Yk = j(X1k,Xpk )+ ek , 1kn. (0.6) 近年来, 又引出了比(0.6)式更广的模型:Yk =j(X1k,Xpk )+s(X1k,X
5、pk )ek ,1kn. (0.7)* 此为异方差回归模型. (0.7)式的更一般的形式:Yk =y(X1k,Xpk ;ek ),1kn. (0.8) 模型越复杂, 越近似真实情况, 也越难统计分析.* 应用背景:非常广泛!主要用于预报,控制,检测,管理.模型的获得方法有两类.3.1 期望,平稳性,遍历性:确切说, 是对(0.1)至(0.8)式中ek的最起码的假定, 根据这些假定就可以引出随机过程和各种模型概念, 用它们近似描述ek(本来是说不清的).而且, 对这些起码的假定, 也只是以最直观的方式, 而非严格的概率论观点, 加以介绍.* 期望和随机过程* 随机过程: X(t);-t,其中X(
6、t)是随机变量.* 随机序列: Xk;k=,-1,0,1,其中Xk是随机变量.特别当Xk=X(kh)时,序列Xk是过程X(t)的等间隔采样序列. 回忆随机变量X和它的样本的定义, 我们有:* 样本序列:,x-1,x0,x1,是序列Xk的一个样本序列,又称为一个实现, 又称为一个观测序列,等等.请注意: 随机变量X的一个样本,就是一个数; 随机向量X的一个样本,就是一个向量数; 随机序列Xk的一个样本, 是一个无穷数列;在实际应用中, 我们无法记录无穷数列,从而在讨论随机序列Xk的样本时, 只能考虑一个样本的有限部分, 比如x1,x2,xn是序列Xk的一段观测值序列.在理论讨论时,为了方便又不得
7、不涉及无穷数列. 这些都是学习和掌握时间序列分析时, 首先要认清的起点.* 序列的分布 :回忆随机变量X的定义便知,它的特征被它的概率分布所确定. 同样, 随机序列也被它的概率分布所确定.不过, 随机序列的分布是无穷个随机变量的概率分布,其复杂性可以想得到. 这里为了避免涉及太深的概率论概念, 我们仅考虑最简单的特疏情况, 即XkN(mk,s2k), 它有密度fk(x)=(2ps2k)-1/2exp(x-mk)2/2s2k而且(Xk+1,Xk+2,Xk+m)有联合正态分布. 于是有:* 期望(均值): EXk=xfk(x)dx=mk,* 方差: Var(Xk)=E(Xk-mk)2=(x-mk)
8、2fk(x)dx=s2k.* 自协方差: gkj=E(Xk-mk)(Xj-mj)=(x-mk)(y-mj)fkj(x,y)dxdy= E(Xj-mj)(Xk-mk)= gjk.回忆二元随机变量X和Y的协方差定义便可理解上式.* 平稳序列:一类重要的特疏随机序列.弱平稳序列: 如果 mk=m; gkj=gk-j=gj-k .严平稳序列: 如果 (Xk+1,Xk+2,Xk+m)的分布与k无关!正态平稳序列: 弱平稳序列 严平稳序列!* 遍历性:一个重要性质-时间序列统计分析的基础.(与大数是律有关)(1/n)k=1nXk EXk=xfk(x)dx=mk, 当n.(1/n)k=1ng(Xk ) Eg
9、(Xk)=g(x)fk(x)dx, 当n.3.2 白噪声序列: 什么是? 为什么叫? 有什么用?它是基楚性的随机序列,具体来说,e-1,e0,是相互独立相同分布的随机变量序列,且均值为零,方差为s2.(常用i.i.d.et表示) Eet=0, Eet2=s2, Eetes=0,(ts)(3.2.1) (3.2.2) (3.2.3)因为, 当ts时gts=E(et-Eet)(es-Ees)=Eetes=EetEes=0=gt-s.为什么叫白噪声序列,在讲谱分析更能看清.它有什么用呢 ? 可以说,很多很多的随机序列都是通过白噪声序列的变化生成的!* 请看几个例子: 例1. Yt=a+bt+et,
10、(确定函数+白噪声) mt=EYt=E(a+bt+et)=a+bt+Eet=a+bt, gkj=E(Yk-EYk)(Yj-EYj)=Eekej=EekEej=0,(jk) gkk=E(Yk-EYk)2=Eek2=s2. 例2. Yt=et+a1et-1+a2et-2, (白噪声延迟的线性和) 例3. Yt=etet-1, (白噪声白噪声延迟) 例4. Yt=et/(1+et-12). (白噪声+白噪声延迟的函数)l 一个有趣的问题: 是否用白噪声序列能生成所有的平稳序列 ? (回答是, 不能!)3.3 移动平均过程(滑动平均序列Moving Average-MA)* 移动平均过程定义的由来-概
11、述:设ek为白噪声序列, 顾名思义, 滑动平均序列是:Yt=(et+et-1+et-m+1)/m, t=,-1,0,1,推而广之Yt=(q0et+q1et-1+qmet-m+1)/(q0+q1+qm), 更广之 Yt=m+q1et-1+qmet-m+1+et, (3.3.8)或Yt=m+i=0yiet-i. (线性序列) (3.3.13)Yt=m+i=-yiet-i. (线性序列,非现实)* 移动平均过程的特征:* 均值函数: EYt=m+i=0yiEet-i=m. (By Eet-i=0) (*)* 自协方差函数:gkj=E(Yk-m)(Yj-m) (用上式)=Ei=0yiek-i i=0y
12、iej-i = Ei=0s=0yiysek-iej-s= i=0s=0yiysEek-iej-s(By Eek-iej-s=0,if k-ij-s) = i=0yiyi+|k-j| Ee12 (By Ee12=s2)= s2i=0yiyi+|k-j| = gk-j. (3.3.18)*可见, (3.3.13)式的Yt是平稳序列. 特别当ek为正态白噪声序列时, Yt也是正态平稳序列.还特别指出: 为保证(3.3.18)式可求和, 要求 i=0yi2. (3.3.14)或者更强的要求i=0|yi|. (3.3.15)由此式可导出 i=0|gi|1时.(3.3.3) (3.3.4) (3.3.5)
13、(3.3.5)式是一阶移动平均过程的基本特征!它表现为自协方差函数序列g0,g1,g2,在1以后是截尾的, 即g0,g1,0,0,0,.易见, 这一特征与g0和g1的具体取值并不密切, 所以,可用序列的自相关函数表述.* 自相关函数: rk=gk/g0, k=0,1, (3.3.6)这是因为rk=gk/g0=gk/g01/2g01/2=E(Yt+k-m)(Yt-m)/E(Yt+k-m)2E(Yt-m)21/2,它是Yt+k和Yt的相关系数, 依平稳性它与t无关, 但与k有关, 所以称函数, 又因是序列自身的关系, 所以称自相关函数.* 对于(3.3.1)的一阶移动平均过程而言, 由(3.3.4
14、)和(3.3.5)知 r0=1, r1=q/(1+q2), 当k1,rk=0. (3.3.7)可见, 自相关函数在1以后全为零(截尾)是一阶移动平均过程的本质性特征!* 以上内容不难推广到* q阶移动平均过程:(MA(q)(见p58-59)模型Yt=m+q1et-1+qqet-q+et, (3.3.8)特征gk=0, rk=0, 当kq. (3.3.12)即,它的自协方差函数在q步以后截尾.关于g0, g1,gq的具体表达式为 g0=(1+q12+q22+qq2)s2, (s2=Eet2) (3.3.10)gj=(qj+qj+1q1+qj+2q2+qqqq-j)s2,j=1,2,q (3.3.
15、12)注意, 以上(3.3.10)和(3.3.10)式, 表达了g0, g1,gq和参数q1,q2,qq2,s2的相互依赖关系! 但是, 除非q=1,一般很难求解. 况且, 它们的解还有不唯一性问题, 此问题方在3.7节中解答.例2(见p59).3.4自回归过程.(自回归序列AutoRegression-AR)* 一阶自回归过程(AR(1) (相当于概述)* 实际背景:* 定义:Yt= c + fYt-1 + et , (3.4.1)其中et是白噪声序列, 而且, et与Yt-1,Yt-2,独立!所以, 在文献中, et又被称为新息序列!* 求解: 由(3.4.1)式反复迭代有: (不妨叫反复
16、迭代法) Yt=c+fYt-1 +et =c+f(c+fYt-2 +et-1)+et=c+fc+f2Yt-2 +fet-1+et=f2Yt-2+(c+fc)+(et+fet-1)=f3Yt-3+(c+fc+f2c)+(et+fet-1+f2et-2)=fnYt-n+(c+fc+fn-1c)+(et+fet-1+fn-1et-n+1)(c+fc+f2c+)+(et+fet-1+f2et-2) (当n)=c/(1-f)+k=0fket-k. (3.4.2)* 平稳性: 显然, 上式成立的充分必要条件是:|f|1. 即 f(-1, 1)于是有名称: 区间(-1,1)为AR(1)模型的平稳域; (3.
17、4.2)式的解为AR(1)模型的平稳解; - AR(1)平稳序列; 它也是MA()序列(见(3.3.13)式).* 均值函数:由(3.4.2)式和Eet=0,有 Yt=c/(1-f)=m. (3.4.3)* 自相关函数: 在(3.3.18)式, 此时yj=fj, j=0,1,于是AR(1)的自协方差函数为 gk=s2fj/(1-f2)=fjg0, j=0,1, (3.4.5)AR(1)的自相关函数为 rk=gk/g0=fj, j=0,1, (3.4.6)* 模型推演方法:(不用(3.3.18)式)回顾模型AR(1)(3.4.1)式Yt=c+fYt-1 +et, 两边同取均值得m=EYt=Ec+
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 时间 序列 分析 部分 讲义 中国 科学研究院 安鸿志
限制150内