统计推断统计推断.pptx
《统计推断统计推断.pptx》由会员分享,可在线阅读,更多相关《统计推断统计推断.pptx(96页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、会计学1统计统计(tngj)推断推断 统计统计(tngj)推断推断第一页,共96页。第六章 统计(tngj)推断 统计推断的特点按照随机原则从总体中抽取样本单位;随机原则是指在抽取样本时,排除主观(zhgun)意识地抽取调查单位,使每个单位都有一定的机会(概率)被抽中,因此也叫概率抽样。其目的是由部分信息来推断总体特征;其理论基础是概率论;其误差事先可以计算并加以控制。第2页/共96页第二页,共96页。第六章 统计(tngj)推断二、统计推断的基本方法二、统计推断的基本方法1 1、参数估计、参数估计研究如何利用样本统计量来推断总体研究如何利用样本统计量来推断总体未知参数的方法。未知参数的方法。
2、2 2、假设检验(参数检验)、假设检验(参数检验)事先对总体参数提出一事先对总体参数提出一个假设,然后个假设,然后(rnhu)(rnhu)再利用样本信息去检验这个再利用样本信息去检验这个假设是否成立的一个过程。假设是否成立的一个过程。第3页/共96页第三页,共96页。第六章 统计(tngj)推断 三、统计推断(tudun)的误差 概念:统计推断(tudun)的误差是指样本数据与总体真实值之间的差距分类:抽样误差与非抽样误差第4页/共96页第四页,共96页。第六章 统计(tngj)推断 1 1、抽样误差、抽样误差概念概念 抽样误差也称随机误差,是指由于抽样的随机性引抽样误差也称随机误差,是指由于
3、抽样的随机性引起起(y(y nqnq)的样本结果与总体真值之间的误差。的样本结果与总体真值之间的误差。抽样误差不是指某个具体的样本观测值与总体真值之间的抽样误差不是指某个具体的样本观测值与总体真值之间的差距,而是指样本的所有可能结果与总体真值之间的平差距,而是指样本的所有可能结果与总体真值之间的平均性差异,因此,也叫抽样平均误差。均性差异,因此,也叫抽样平均误差。第5页/共96页第五页,共96页。第六章 统计(tngj)推断抽样误差的计算抽样误差的计算抽样误差的计算抽样误差的计算(j sun)(j sun)在简单在简单(ji(ji ndn)ndn)随机抽样条件下,样本均值和样本随机抽样条件下,
4、样本均值和样本比例的抽样误差:比例的抽样误差:样本均值的抽样误差样本均值的抽样误差不重复抽样:不重复抽样:重复抽样:重复抽样:当总体方差当总体方差 未知时,可用样本方差未知时,可用样本方差 代替。代替。第6页/共96页第六页,共96页。第六章 统计(tngj)推断 样本样本(yngbn)(yngbn)比例的抽样误差比例的抽样误差重复重复(chngf)抽样:抽样:不重复抽样:不重复抽样:当总体比例当总体比例 未知时,可以用样本比例未知时,可以用样本比例p代替。代替。第7页/共96页第七页,共96页。第六章 统计(tngj)推断 影响抽样误差的因素影响抽样误差的因素 总体各单位标志值的差异程度,即
5、,差异程度越大,总体各单位标志值的差异程度,即,差异程度越大,则抽样误差愈大,反之,则愈小;则抽样误差愈大,反之,则愈小;抽样方法。不同的抽样方法,抽样误差也不同。一抽样方法。不同的抽样方法,抽样误差也不同。一般情况下,重复抽样误差比不重复抽样误差要大一般情况下,重复抽样误差比不重复抽样误差要大一些;些;抽样调查的组织抽样调查的组织(zzh)(zzh)形式。形式。注:注:不同的抽样组织不同的抽样组织(zzh)(zzh)形式有不同的抽样误形式有不同的抽样误差;差;抽样误差是一种随机性误差,只存在于概率抽样误差是一种随机性误差,只存在于概率抽样中抽样中 。第8页/共96页第八页,共96页。第六章
6、统计(tngj)推断 2 2、非抽样误差、非抽样误差 概念概念 非抽样误差是指除抽样误差之外,由于非抽样误差是指除抽样误差之外,由于其他原因引起的样本观测其他原因引起的样本观测(gunc)(gunc)结果与总结果与总体真值之间的差异。体真值之间的差异。非抽样误差存在于各种抽样和调查中。非抽样误差存在于各种抽样和调查中。第9页/共96页第九页,共96页。第六章 统计(tngj)推断 非抽样误差的影响因素非抽样误差的影响因素(yn s)(yn s)(1 1)抽样框因素)抽样框因素(yn s)(yn s);(;(2 2)回答因素)回答因素(yn(yn s)s);(3 3)无回答因素)无回答因素(yn
7、 s)(yn s);(;(4 4)调查员的因素)调查员的因素(yn s)(yn s);(5 5)测量因素)测量因素(yn s)(yn s)。注:非抽样误差从理论上可以避免,但实注:非抽样误差从理论上可以避免,但实际上很难控制。际上很难控制。第10页/共96页第十页,共96页。第六章 统计(tngj)推断第二节第二节 参数估计参数估计一、参数估计概述一、参数估计概述1 1、参数估计、参数估计根据样本统计根据样本统计(t(t ngj)ngj)量来估计总体参数的一种量来估计总体参数的一种方法方法 。2 2、估计量、估计量用于估计总体参数的统计用于估计总体参数的统计(t(t ngj)ngj)量的名称。
8、量的名称。3 3、估计值、估计值根据一组具体样本计算出的估计量的取值。根据一组具体样本计算出的估计量的取值。第11页/共96页第十一页,共96页。第六章 统计(tngj)推断二、参数估计的方法二、参数估计的方法二、参数估计的方法二、参数估计的方法(fngf(fngf)(一)点估计(一)点估计1 1、定义:点估计是指用样本统计量的某个取值直接作为总、定义:点估计是指用样本统计量的某个取值直接作为总体参数的估计值。例如:用样本均值体参数的估计值。例如:用样本均值(jn zh)(jn zh)直接作为直接作为总体均值总体均值(jn zh)(jn zh)的估计;用两个样本均值的估计;用两个样本均值(jn
9、 zh)(jn zh)之差之差直接作为总体均值直接作为总体均值(jn zh)(jn zh)之差的估计之差的估计无法给出估计值接近总体参数程度的信息无法给出估计值接近总体参数程度的信息虽然在重复抽样条件下,点估计的均值虽然在重复抽样条件下,点估计的均值(jn zh)(jn zh)可望等于总体可望等于总体真值,但由于样本是随机的,抽出一个具体的样本得真值,但由于样本是随机的,抽出一个具体的样本得到的估计值很可能不同于总体真值到的估计值很可能不同于总体真值一个点估计量的可靠性是由它的抽样标准误差来衡量的,这一个点估计量的可靠性是由它的抽样标准误差来衡量的,这表明一个具体的点估计值无法给出估计的可靠性
10、的度表明一个具体的点估计值无法给出估计的可靠性的度量量 第12页/共96页第十二页,共96页。第六章 统计(tngj)推断()无无偏偏性性:估估计计量量抽抽样样(chu(chu ynyn)分分布布的数学期望等于被估计的总体参数的数学期望等于被估计的总体参数P P()B B BA A A无偏无偏无偏无偏无偏无偏有偏有偏有偏有偏有偏有偏评价评价(pngji)估计量的标准估计量的标准第13页/共96页第十三页,共96页。第六章 统计(tngj)推断评价(pngji)估计量的标准(2 2)有有有有效效效效性性性性:对对对对同同同同一一一一(tngy)(tngy)总总总总体体体体参参参参数数数数的的的的
11、两两两两个个个个无偏点估计无偏点估计无偏点估计无偏点估计 量,有更小标准差的估计量更有效量,有更小标准差的估计量更有效量,有更小标准差的估计量更有效量,有更小标准差的估计量更有效 A AB B 的抽样分布的抽样分布的抽样分布的抽样分布 的抽样分布的抽样分布的抽样分布的抽样分布P P()第14页/共96页第十四页,共96页。第六章 统计(tngj)推断评价(pngji)估计量的标准(3 3)一一致致性性:随随着着(su(su zhe)zhe)样样本本量量的的增增大大,估计量的值越来越接近被估计的总体参数估计量的值越来越接近被估计的总体参数A AB B较小的样本量较小的样本量较小的样本量较小的样本
12、量较大的样本量较大的样本量较大的样本量较大的样本量P P()第15页/共96页第十五页,共96页。第六章 统计(tngj)推断3 3、点估计的优缺点、点估计的优缺点(qudin)(qudin)(1 1)优点:其一是简洁明了;其二是能提供具体的估计值。)优点:其一是简洁明了;其二是能提供具体的估计值。(2 2)缺点)缺点(qudin)(qudin):其一是无法提供误差情况;其二是估计:其一是无法提供误差情况;其二是估计的可靠程度无从知晓。的可靠程度无从知晓。第16页/共96页第十六页,共96页。第六章 统计(tngj)推断(二)区间估计相关概念1、区间估计给出总体参数的一个区间范围,并在抽样分布
13、(fnb)的基础上给出估计的可靠性度量。置信区间置信区间置信区间置信区间置信下限置信下限置信下限置信下限置信上限置信上限置信上限置信上限样本统计量样本统计量样本统计量样本统计量 (点估计点估计点估计点估计)第17页/共96页第十七页,共96页。第六章 统计(tngj)推断 2 2、置信区间、置信区间 设设 是总体是总体 的一个参数,的一个参数,是参数是参数 的两个统的两个统计量,且计量,且 ,对给定的常数对给定的常数 ,及及任意的任意的 ,有有 ,则称随机区间则称随机区间 是置信度(置信水平)为是置信度(置信水平)为 的置信区间(区间的置信区间(区间估计)。其中估计)。其中 分别为置信下限和置
14、信上限。分别为置信下限和置信上限。反映反映(fnyng)(fnyng)了估计的精度大小。了估计的精度大小。置信区间越窄,置信区间越窄,则估计精度越高。则估计精度越高。第18页/共96页第十八页,共96页。第六章 统计(tngj)推断区间区间(q jin)估计估计的图示的图示 x x95%95%的样本的样本的样本的样本 -1.96-1.96 x x +1.96+1.96 x x99%99%的样本的样本的样本的样本 -2.58-2.58 x x +2.58+2.58 x x90%90%的样本的样本的样本的样本 -1.65-1.65 x x +1.65+1.65 x x第19页/共96页第十九页,共
15、96页。第六章 统计(tngj)推断 3 3、置信度,或者称作置信系数或置信水平,是、置信度,或者称作置信系数或置信水平,是指置信区间中包含总体指置信区间中包含总体(z(z ngtngt)参数真值的可能性参数真值的可能性大小,也就是人们可以信赖的程度,通常用大小,也就是人们可以信赖的程度,通常用 表示。反映的是估计的可靠度,置信水平越大,表示。反映的是估计的可靠度,置信水平越大,则估计的可靠度越高。则估计的可靠度越高。另外,置信度也可以指重复抽样条件下,在构造另外,置信度也可以指重复抽样条件下,在构造的所有置信区间中包含参数真值的区间所占的比的所有置信区间中包含参数真值的区间所占的比例,也就是
16、说构造的所有置信区间中有例,也就是说构造的所有置信区间中有100100()%个区间包含总体个区间包含总体(z(z ngtngt)参数真值。参数真值。第20页/共96页第二十页,共96页。第六章 统计(tngj)推断(95%的置信区间的置信区间)重复重复重复重复(chngf)(chngf)构造出构造出构造出构造出的的的的2020个置信个置信个置信个置信区间区间区间区间 点估计值点估计值点估计值点估计值第21页/共96页第二十一页,共96页。第六章 统计(tngj)推断练习练习(linx)一个一个95%95%的置信区间是指(的置信区间是指()A.A.总体参数落在这一区间内的概率是总体参数落在这一区
17、间内的概率是95%95%B.B.总体参数未落在这一区间内的概率是总体参数未落在这一区间内的概率是5%5%C.C.在用同样方法构造在用同样方法构造(guzo)(guzo)的总体参数的多个区间中,有的总体参数的多个区间中,有95%95%的区的区间包含该总体参数间包含该总体参数D.D.在用同样方法构造在用同样方法构造(guzo)(guzo)的总体参数的多个区间中,有的总体参数的多个区间中,有95%95%的区的区间不包含该总体参数间不包含该总体参数第22页/共96页第二十二页,共96页。第六章 统计(tngj)推断uu 总体均值的区间估计(总体均值的区间估计(已知)已知)uu1 1、假定条件:、假定条
18、件:uu总体服从正态分布且总体方差总体服从正态分布且总体方差(fn(fn ch)ch)已知;已知;uu总体为非正态分布,但为大样本(总体为非正态分布,但为大样本(),),总体方差总体方差(fn(fn ch)ch)已知已知uu2 2、使用正态分布、使用正态分布uu 统计量统计量一个总体参数的区间一个总体参数的区间(q jin)估计估计第23页/共96页第二十三页,共96页。第六章 统计(tngj)推断3、总体(zngt)均值 在置信水平 下的置信区间为:第24页/共96页第二十四页,共96页。第六章 统计(tngj)推断【例例例例6.26.2】解:已知解:已知解:已知解:已知总体均值总体均值 在
19、置信水平在置信水平 下的置信区间为:下的置信区间为:我们可以我们可以(ky)95%(ky)95%的概率保的概率保证该地区企业总经理的年证该地区企业总经理的年收入在收入在 113440 113440至至156560156560元之间。元之间。某地区企业总经理的某地区企业总经理的年收入服从正态分布,年收入服从正态分布,随机抽取随机抽取2525个企业,个企业,得到得到2525个企业总经理个企业总经理的平均收入为的平均收入为135000135000元。元。已知总体的标准差为已知总体的标准差为5500055000元,试求:该元,试求:该地区企业总经理的地区企业总经理的年平均收入年平均收入95%95%的置
20、信的置信(zhxn)(zhxn)区间。区间。第25页/共96页第二十五页,共96页。第六章 统计(tngj)推断uu总体均值的区间估计总体均值的区间估计(gj)(gj)(大样本,(大样本,未知)未知)uu1 1、假定条件:、假定条件:uu总体服从正态分布、大样本(总体服从正态分布、大样本()且总体方)且总体方差(差()未知;)未知;uu总体为非正态分布,大样本(总体为非正态分布,大样本(),且总体),且总体方差(方差()未知。)未知。第26页/共96页第二十六页,共96页。第六章 统计(tngj)推断2 2、使用、使用(shyng)(shyng)正态分布正态分布 统计量统计量3 3、总体均值、
21、总体均值 在置信水平下在置信水平下 的置信区间为:的置信区间为:第27页/共96页第二十七页,共96页。第六章 统计(tngj)推断【例例例例6.36.36.36.3】解:解:解:解:已知:已知:由于总体方差未知,且为大样由于总体方差未知,且为大样本,所以总体均值本,所以总体均值 在置信水在置信水平下平下 的置信区间为:的置信区间为:即,我们有即,我们有90%90%的把握认为,的把握认为,贷贷 款学生款学生(xu sheng)(xu sheng)总体中总体中的平均欠款额在的平均欠款额在 29862.92 29862.92至至30137.0830137.08元之间。元之间。在一项对大学生资助在一
22、项对大学生资助贷款的研究中,从全贷款的研究中,从全国各地随机抽取国各地随机抽取(chu q)3600(chu q)3600名贷过款的大学生作名贷过款的大学生作为样本,得到毕业前为样本,得到毕业前的平均欠款余额为的平均欠款余额为3000030000元,标准差为元,标准差为50005000元。试求贷款元。试求贷款学生总体中平均欠学生总体中平均欠款额的款额的90%90%的置信区的置信区间。间。第28页/共96页第二十八页,共96页。第六章 统计(tngj)推断uu 总体均值总体均值(jn zh)(jn zh)的区间估计(小样本,的区间估计(小样本,未知)未知)uu1 1、假定条件:、假定条件:uu
23、总体服从正态分布、小样本(总体服从正态分布、小样本()且总体方差)且总体方差()未知;)未知;uu2 2、使用、使用t t分布分布uu 统计量统计量第29页/共96页第二十九页,共96页。第六章 统计(tngj)推断3 3、总体、总体(zngt)(zngt)均值均值 在置信水平在置信水平 下的置信下的置信区间为:区间为:第30页/共96页第三十页,共96页。第六章 统计(tngj)推断【例例例例6.46.46.46.4】n n 一家研究机构为估计在某外资企业一家研究机构为估计在某外资企业工作的员工每周加班的平均时间,随机工作的员工每周加班的平均时间,随机抽取了抽取了1616个员工,得到他们每周
24、加班的个员工,得到他们每周加班的时间数据如下时间数据如下(rxi)(rxi)(单位:小时单位:小时):50526258596453555751544560495556第31页/共96页第三十一页,共96页。第六章 统计(tngj)推断 由样本数据可知由样本数据可知(k zh)(k zh):由由 ,查,查t t分布表得:分布表得:,解:已知解:已知第32页/共96页第三十二页,共96页。第六章 统计(tngj)推断 再根据(公式(gngsh)6.5)得员工平均每周加班时间的置信区间为:即,我们有95%的把握认为,该外资企业员工平均每周加班时间为52.3小时至57.7小时之间。第33页/共96页第
25、三十三页,共96页。第六章 统计(tngj)推断 练习练习(linx)一一家家食食品品生生产产企企业业以以生生产产袋袋装装食食品品为为主主,为为对对食食品品质质量量进进行行监监测测,企企业业质质检检部部门门经经常常要要进进行行抽抽检检,以以分分析析每每袋袋重重量量是是否否符符合合要要求求。现现从从某某天天生生产产的的一一批批食食品品中中随随机机抽抽取取了了2525袋袋,测测得得每每袋袋重重量量如如下下表表所所示示。已已知知产产品品重重量量的的分分布布服服从从正正态态分分布布,且且总总体体标标准准差差为为10g10g。试试估估计计(gj)(gj)该该批批产产品品平平均均重量的置信区间,置信水平为
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 推断
限制150内