贾俊平统计参数估计.pptx
《贾俊平统计参数估计.pptx》由会员分享,可在线阅读,更多相关《贾俊平统计参数估计.pptx(74页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、参数估计在统计方法中的地位假设检验假设检验统计方法描述统计描述统计推断统计推断统计参数估计参数估计第1页/共74页统计推断的过程样样本本总体总体样本统计量样本统计量如:样本均值、如:样本均值、比例、方差比例、方差总体均值、比总体均值、比例、方差等例、方差等第2页/共74页参数估计的方法估 计 方 法点 估 计区间估计矩估计法矩估计法最小二乘法最小二乘法最大似然法最大似然法顺序统计量法顺序统计量法贝叶斯法贝叶斯法第3页/共74页7.1 参数估计的基本原理7.1.1 估计量与估计值7.1.2 点估计与区间估计7.1.3 评价估计量的标准第4页/共74页估计量与估计值(estimator&estim
2、ated value)1.估计量:用于估计总体参数的随机变量如样本均值,样本比例,样本方差等例如:样本均值就是总体均值 的一个估计量2.参数用 表示,估计量用 表示3.估计值:估计参数时计算出来的统计量的具体值如果样本均值 x=80,则80就是的估计值第5页/共74页点估计(point estimate)1.用样本的估计量直接作为总体参数的估计值例如:用样本均值直接作为总体均值的估计例如:用两个样本均值之差直接作为总体均值之差的估计2.没有给出估计值接近总体参数程度的信息第6页/共74页点估计(point estimate)虽然在重复抽样条件下,点估计的均值可望等于总体真值,但由于样本是随机的
3、,抽出一个具体的样本得到的估计值很可能不同于总体真值一个点估计量的可靠性是由它的抽样标准误差来衡量的,这表明一个具体的点估计值无法给出估计的可靠性的度量 3.点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法、贝叶斯法等第7页/共74页评价估计量的标准无偏性(unbiasedness)估计量抽样分布的数学期望等于被估计的总体参数,即:P P()B BA A无偏无偏无偏有偏有偏有偏第8页/共74页评价估计量的标准有效性(efficiency)对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效.AB 的抽样分布的抽样分
4、布 的抽样分布的抽样分布P P()第9页/共74页评价估计量的标准一致性(consistency)随着样本容量的增大,估计量的值越来越接近被估计的总体参数AB较小的样本容量较小的样本容量较大的样本容量较大的样本容量P P()第10页/共74页区间估计(interval estimate)1.在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减抽样误差而得到的2.根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量比如,某班级平均分数在7585之间,置信水平是95%置信区间置信区间置信下限置信下限置信上限置信上限样本统计量样本统计量 (点估计点估计)第
5、11页/共74页区间估计的图示 x95%95%的样本的样本 -1.96-1.96 x x +1.96+1.96 x x99%99%的样本的样本 -2.58-2.58 x x +2.58+2.58 x x90%90%的样本的样本 -1.65-1.65 x x +1.65+1.65 x x由所有样本容量为n的样本均值构成第12页/共74页区间估计的图示 95.5%95.5%的样本的样本 -2-2 x x +2+2 x xx第13页/共74页置信区间(95%的置信区间)重复构造出重复构造出 的的2020个个置信区间置信区间 点估计值点估计值第14页/共74页置信水平1.将构造置信区间的步骤重复很多次
6、,置信区间包含总体参数真值的次数所占的比例称为置信水平 2.表示为 100(1-为总体参数未在区间内的比例3.常用的置信水平值有 99%,95%,90%相应的为0.01,0.05,0.10第15页/共74页置信区间(confidence interval)1.由样本统计量所构造的总体参数的估计区间称为置信区间2.统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间 3.用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的
7、一个第16页/共74页置信区间与置信水平均值的抽样分布均值的抽样分布(1-(1-)%)%区间包含了区间包含了%的区间未包含的区间未包含 1 1 /2 2 /2 2第17页/共74页7.2 一个总体参数的区间估计7.2.1 总体均值的区间估计7.2.2 总体比例的区间估计7.2.3 总体方差的区间估计第18页/共74页一个总体参数的区间估计总体参数符号表示样本统计量均值比例方差第19页/共74页总体均值的区间估计正态总体、已知,或非正态总体、大样本假定条件总体服从正态分布,且方差()已知如果不是正态分布,可由正态分布来近似(n 30)使用正态分布统计量 z总体均值总体均值 在在1-1-1-1-置
8、信水平下的置信水平下的置信区间为置信区间为第20页/共74页总体均值的区间估计(例题分析)【例例 】一一家家食食品品生生产产企企业业以以生生产产袋袋装装食食品品为为主主,为为对对产产品品质质量量进进行行监监测测,企企业业质质检检部部门门经经常常要要进进行行抽抽检检,以以分分析析每每袋袋重重量量是是否否符符合合要要求求。现现从从某某天天生生产产的的一一批批食食品品中中随随机机抽抽取取了了2525袋袋,测测得得每每袋袋重重量量如如下下表表所所示示。已已知知产产品品重重量量的的分分布布服服从从正正态态分分布布,且且总总体体标标准准差差为为10g10g。试试估估计计该该批批产产品品平平均均重重量量的的
9、置置信信区区间间,置置信信水水平平为为95%95%25袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3第21页/共74页总体均值的区间估计(例题分析)解解:已已知知 N N(,101010102 2 2 2),n n=25,=25,=25,=25,1-1-1-1-=95%95%95%95%,z z z z /2/2/2/2=1.96=1.96=1.96=1.96。根根据
10、据样样本本数数据据计计算算得:得:总体均值总体均值 在在1-1-1-1-置信水平下的置信区间为置信水平下的置信区间为该食品平均重量的置信区间为该食品平均重量的置信区间为101.44g109.28g101.44g109.28g第22页/共74页总体均值的区间估计(例题分析)【例例】一一家家保保险险公公司司收收集集到到由由36363636投投保保个个人人组组成成的的随随机机样样本本,得得到到每每个个投投保保人人的的年年龄龄(周周岁岁)数数据据如如下下表表。试建立投保人年龄试建立投保人年龄90%90%90%90%的置信区间。的置信区间。36个投保人年龄的数据 23353927364436424643
11、3133425345544724342839364440394938344850343945484532第23页/共74页总体均值的区间估计(例题分析)解解:已已知知n=36,n=36,1-1-=90%90%,z z /2/2=1.645=1.645。根根据据样样本本数数据计算得:据计算得:,总体均值总体均值 在在1-1-置信水平下的置信区间为置信水平下的置信区间为投保人平均年龄的置信区间为投保人平均年龄的置信区间为37.3737.37岁岁41.6341.63岁岁第24页/共74页总体均值的区间估计有限总体,无退还抽样 总体均值总体均值 在在1-1-置信水平下的置信水平下的置信区间为置信区间为
12、【例例】某职业介绍所的职员从申请某一职业的某职业介绍所的职员从申请某一职业的10001000名名申请者中采用不重复抽样方式随机抽取了申请者中采用不重复抽样方式随机抽取了200200名申请名申请者,借此来估计者,借此来估计10001000名申请者考试的平均成绩。已知名申请者考试的平均成绩。已知由由200200名申请者构成的样本平均分名申请者构成的样本平均分7878分,由已往的经分,由已往的经验已知总体方差为验已知总体方差为9090,但该职员不知道总体服从何种,但该职员不知道总体服从何种分布。试求总体均值分布。试求总体均值 的的9090的置信区间。的置信区间。第25页/共74页总体均值的区间估计(
13、例题分析)解:根据中心极限定理,解:根据中心极限定理,n n200200为大样本,因此,可看做总体近似服从为大样本,因此,可看做总体近似服从正态分布、又因为是有限总体的不重复抽样,所以在计算标准差时需乘正态分布、又因为是有限总体的不重复抽样,所以在计算标准差时需乘以有限总体修正系数,即:以有限总体修正系数,即:z z/2/2=1.645=1.645所以,我们有90的把握说,总体平均值处在7779之间。第26页/共74页总体均值的区间估计(例题分析)【例】某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间(单位:小时),得到的数据如下表
14、:求该校大学生平均上网时间的置信区间,置信概率分别为90%、95%和99%。第27页/共74页例题分析 第28页/共74页总体均值的区间估计(小样本)假定条件总体服从正态分布,且方差()未知小样本(n 30)使用 t 分布统计量总体均值 在1-置信水平下的置信区间为第29页/共74页总体均值的区间估计(例题分析)【例例】已已知知某某种种灯灯泡泡的的寿寿命命服服从从正正态态分分布布,现现从从一一批批灯灯泡泡中中随随机机抽抽取取1616只只,测测得得其其使使用用寿寿命命(小小时时)如如下。建立该批灯泡平均使用寿命下。建立该批灯泡平均使用寿命95%95%的置信区间的置信区间16灯泡使用寿命的数据 1
15、510152014801500145014801510152014801490153015101460146014701470第30页/共74页总体均值的区间估计(例题分析)解解:已已 知知 N N(,2 2),n n=16,=16,1-1-=95%95%,t t /2,15/2,15=2.131=2.131 根据样本数据计算得:根据样本数据计算得:,总体均值总体均值 在在1-1-置信水平下的置信区间为置信水平下的置信区间为该该种种灯灯泡泡平平均均使使用用寿寿命命的的置置信信区区间间为为1476.81476.8小小时时1503.21503.2小时小时第31页/共74页总体均值的区间估计总结总体
16、分布总体分布样本容量样本容量 已知已知 未知未知正态分布正态分布大样本大样本(n 30)小样本小样本(n30)非正态分布非正态分布大样本大样本(n 30)第32页/共74页总体比率的区间估计假定条件总体服从二项分布可以由正态分布来近似使用正态分布统计量 z 总体比例总体比例 在在1-1-置信水平下置信水平下的置信区间为的置信区间为第33页/共74页总体比率的区间估计(例题分析)【例例】某某城城市市想想要要估估计计下下岗岗职职工工中中女女性性所所占占的的比比例例,随随机机地地抽抽取取了了100100名名下下岗岗职职工工,其其中中6565人人为为女女性性职职工工。试试以以95%95%的的置置信信水
17、水平平估估计计该该城城市市下下岗岗职职工工中中女女性性比比例例的的置置信信区区间间该该城城市市下下岗岗职职工工中中女女性性比比例例的的置置信信区区间间为为55.65%74.35%55.65%74.35%解:解:已知已知 n n=100=100,p p65%65%,1,1-=95%=95%,z z /2/2=1.96=1.96第34页/共74页总体比率的区间估计(例题分析)【例例】某一大公司的人事处长某一大公司的人事处长希望知道本公司内专业不对口希望知道本公司内专业不对口的职员究竟占多大比率。于是,的职员究竟占多大比率。于是,他从他从20002000名具有大专以上学历名具有大专以上学历的职员中随
18、机抽取了一个由的职员中随机抽取了一个由150150人组成的样本进行研究,结果人组成的样本进行研究,结果表明,其中有表明,其中有4545人说他们从事人说他们从事的工作与所从学专业不对口。的工作与所从学专业不对口。试在试在95.5%95.5%的置信程度下构造出的置信程度下构造出不对口人员所占真正比率的置不对口人员所占真正比率的置信区间。信区间。解:由于样本容量很大故可用正态分布逼近,且故需用有限总体校正系数计算s我们有95.5的把握说,该公司具有大专以上学历的人员中,有22.8%37.2%的人专业不对口第35页/共74页总体方差的区间估计1.估计一个总体的方差或标准差2.假设总体服从正态分布3.总
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 贾俊平 统计 参数估计
限制150内