抽样与参数估计18451.pptx
《抽样与参数估计18451.pptx》由会员分享,可在线阅读,更多相关《抽样与参数估计18451.pptx(80页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、第5章 抽样与参数估计 k不像其他科学,统计从来不打算使自己不像其他科学,统计从来不打算使自己完美无缺,统计意味着你永远不需要确完美无缺,统计意味着你永远不需要确定无疑。定无疑。古德蒙古德蒙R艾弗森艾弗森 重点掌握计算内容重点掌握计算内容重点掌握计算内容重点掌握计算内容淡化公式推导淡化公式推导淡化公式推导淡化公式推导侧重于统计应用侧重于统计应用侧重于统计应用侧重于统计应用教学、学习方式教学、学习方式以理解统计思想为主以理解统计思想为主课程设计思路课程设计思路第 5 章 知识点知识点1、概率、概率及分布及分布3、抽样分布、抽样分布 及中心极限定理及中心极限定理4、参数估计、参数估计2、统计量、统
2、计量 与参数与参数预备预备知识知识 推断推断指标指标 推断推断依据依据理论理论知识知识计算计算方法方法5.1 5.1 参数与统计量参数与统计量 平均数平均数标准差标准差比比 例例参数参数:统计量统计量 x s p 总体总体总体总体 样本样本样本样本未知参数未知参数已知统计量已知统计量5.2 抽样分布抽样分布概念抽样分布概念中心极限定理中心极限定理几种常用统计量几种常用统计量的分布的分布5.2.15.2.25.2.3作出推断的依据是什么作出推断的依据是什么?怎样才能让别人信服你的推断结怎样才能让别人信服你的推断结果呢果呢?1、从一个总体中随机从一个总体中随机抽出抽出容量相同容量相同的各种样本,则
3、从的各种样本,则从这些样本计算出的某这些样本计算出的某统计量的所有可能值统计量的所有可能值形成的概形成的概率分布,被称为这一个统计量的抽样分布率分布,被称为这一个统计量的抽样分布。2 2、统计量的概率分布、统计量的概率分布,是一种,是一种理论分布理论分布。3 3、提供了样本统计量提供了样本统计量长远而稳定的信息长远而稳定的信息,是是进行推断的进行推断的理论基础,也是抽样推断科学性的重要依据理论基础,也是抽样推断科学性的重要依据。5.2.1 5.2.1 抽样分布抽样分布统计量的分布具有某种统计量的分布具有某种确定的性质确定的性质,而这些性质是,而这些性质是已知的已知的,而且反映在它的抽样分布之中
4、。,而且反映在它的抽样分布之中。k5.2.1 5.2.1 抽样分布抽样分布(一)一)样本均值的抽样分布样本均值的抽样分布【例例】设设一一个个总总体体,含含有有4 4个个元元素素(个个体体),即即总总体体单单位位数数N N=4 4。4 4 个个体分别为个个体分别为x x1 1=1=1,x x2 2=2=2,x x3 3=3=3,x x4 4=4=4 。总体的均值、方差及分布如下总体的均值、方差及分布如下总体分布总体分布1 14 42 23 30 00.20.20.50.5均值和方差均值和方差总体的分布总体的分布 XN(2.5,1.25)重复抽样重复抽样 n=2X1X2X3X41234样本元素组合
5、样本均值1X1,X112X1,X21.53X1,X324X1,X42.55X2,X12.56X2,X227X2,X32.58X2,X439X3,X1210X3,X22.511X3,X3312X3,X43.513X4,X12.514X4,X231516X4,X3X4,X43.54l现从现从4个中重复个中重复抽抽2个构成个构成16个个可能样本。可能样本。统计量统计量次数次数f频率频率111/161.511/16233/162.555/16333/163.522/16411/16合计合计162/16抽样的概率分布表抽样的概率分布表样本元素组合样本均值1X1,X112X1,X21.53X1,X324X
6、1,X42.55X2,X12.56X2,X227X2,X32.58X2,X439X3,X1210X3,X22.511X3,X3312X3,X43.513X4,X12.514X4,X231516X4,X3X4,X43.54样本均值的分布与总体分布的比较样本均值的分布与总体分布的比较 =2.52=1.25 总体分布总体分布总体分布总体分布1 14 42 23 3.1 1抽样分布抽样分布抽样分布抽样分布P P(x x)1 10 0.06.06.3.31.51.53 34 43.53.52 22.52.5x x.1.1.2.2样本均值样本均值 x 的抽样分布与总体分布的关系的抽样分布与总体分布的关系:
7、=2.5=2.5=2.5 =1.25=1.25=1.25X X X总体分布总体分布总体分布总体分布总体分布总体分布N N=4=4抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布xn n=2=21.样本均值的数学期望样本均值的数学期望2.样本均值的方差样本均值的方差l重复抽样重复抽样结论:样本均值的抽样分布结论:样本均值的抽样分布 (数学期望与方差数学期望与方差)比较及结论:比较及结论:比较及结论:比较及结论:1.1.样本均值的均值样本均值的均值样本均值的均值样本均值的均值(数学期望数学期望数学期望数学期望)等于总体均值等于总体均值等于总体均值等于总体均值2.2.样本均值的方差等于总体方差的样本
8、均值的方差等于总体方差的样本均值的方差等于总体方差的样本均值的方差等于总体方差的1/1/n n。1.总体总体(或样本或样本)中具有某种属性的单位与全部单位总数中具有某种属性的单位与全部单位总数之比之比l不同性别的人与全部人数之比不同性别的人与全部人数之比l合格品合格品(或不合格品或不合格品)与全部产品总数之比与全部产品总数之比2.总体比例可表示为总体比例可表示为3.样本比例可表示为样本比例可表示为 5.2.1 5.2.1 抽样分布抽样分布(二)二)样本比例的抽样分布样本比例的抽样分布 当样本容量很大时,样本比例的抽样分布可用当样本容量很大时,样本比例的抽样分布可用当样本容量很大时,样本比例的抽
9、样分布可用当样本容量很大时,样本比例的抽样分布可用正态分布近似推断总体比例正态分布近似推断总体比例正态分布近似推断总体比例正态分布近似推断总体比例 的理论基础的理论基础的理论基础的理论基础1.样本比例的数学期望样本比例的数学期望2.样本比例的方差样本比例的方差样本比例的抽样分布样本比例的抽样分布 (数学期望与方差数学期望与方差)l虽然比率虽然比率p p随着样本容量随着样本容量n n的增大而近似服从正态分的增大而近似服从正态分布,但究竟多大才能使布,但究竟多大才能使p p近似正态分布呢近似正态分布呢?这与这与p p的取的取值大小有关。值大小有关。l当当p p接近于接近于0 05 5时,用较小的样
10、本就可使时,用较小的样本就可使p p的分布趋的分布趋于正态分布;于正态分布;l但当但当p p接近于接近于0 0和和1 1时,就要很大的样本才能使时,就要很大的样本才能使p p的分的分布趋于正态分布。布趋于正态分布。l统计学家统计学家W GW GCocbanCocban提出一个标准可供参考,如表提出一个标准可供参考,如表5 57 7所示。所示。5.2.2 5.2.2 中心极限定理中心极限定理 从总体中抽取样本容量为从总体中抽取样本容量为n的简单随机样本,的简单随机样本,当样本容量当样本容量 n 30时,样本均值时,样本均值 的抽样分布可的抽样分布可用正态概率分布近似。用正态概率分布近似。5.2.
11、2 5.2.2 中心极限定理中心极限定理 x x 的的的的分分分分布布布布 趋趋趋趋 于于于于正正正正 态态态态 分分分分布布布布 的的的的 过过过过程程程程、中心极限定理中心极限定理当样本容量足当样本容量足当样本容量足当样本容量足够大时够大时够大时够大时(n n 30)30),样本均值的,样本均值的,样本均值的,样本均值的抽样分布逐渐抽样分布逐渐抽样分布逐渐抽样分布逐渐趋于正态分布趋于正态分布趋于正态分布趋于正态分布从从从从均均均均值值值值为为为为 ,方方方方差差差差为为为为 2 2的的的的一一一一个个个个任任任任意意意意总总总总体体体体中中中中抽抽抽抽取取取取容容容容量量量量为为为为n n
12、的的的的样样样样本本本本,当当当当n n充充充充分分分分大大大大时时时时,样样样样本本本本均均均均值值值值的的的的抽抽抽抽样样样样分分分分布布布布近近近近似似似似服服服服从从从从均值为均值为均值为均值为、方差为、方差为、方差为、方差为 2 2/n n的正态分布的正态分布的正态分布的正态分布 一个任意分一个任意分布的总体布的总体x x总结:推断时样本统计量的抽样分布形式概括总结:推断时样本统计量的抽样分布形式概括几几种种概概率率分分布布正态分布正态分布 分布分布 F分布分布 t分布分布5.2.3 5.2.3 几种常用的统计量及其分布几种常用的统计量及其分布正态分布正态分布(normal dist
13、ribution)l1.描述连续型随机变量的最重要的分布l2.可用于近似离散型随机变量的分布l例如例如:二项分布二项分布l3.经典统计推断的基础x xf f(x x)正态分布最常用、最重要正态分布最常用、最重要(1)(1)客观世界中有许多随机现象都服从或近似服从正态分客观世界中有许多随机现象都服从或近似服从正态分布布。例如:测量误差,同龄人的身高、体重,一批棉纱例如:测量误差,同龄人的身高、体重,一批棉纱的抗拉强度,一种设备的使用寿命,一定条件下某种农的抗拉强度,一种设备的使用寿命,一定条件下某种农作物的产量,等等。作物的产量,等等。l 它们的共同特点是,它们的共同特点是,中间多两端少,即离均
14、值越近中间多两端少,即离均值越近的数值越常见;反之,离均值越远的数值越少见。的数值越常见;反之,离均值越远的数值越少见。(2)(2)正态分布具有很好的数学性质。正态分布具有很好的数学性质。l 正态分布是许多概率分布的极限分布,其他一些分正态分布是许多概率分布的极限分布,其他一些分布的概率布的概率(如二项分布如二项分布)可由正态分布来近似计算,统计可由正态分布来近似计算,统计推断中许多重要的分布推断中许多重要的分布(如如2 2分布、分布、t t分布、分布、F F分布分布)都都是在正态分布的基础上推导出来的。是在正态分布的基础上推导出来的。(3)(3)尽管经济管理活动中的有些变量尽管经济管理活动中
15、的有些变量是正偏斜的,是正偏斜的,但是正但是正态分布仍然是与之十分贴近的,这丝毫不影响正态分布态分布仍然是与之十分贴近的,这丝毫不影响正态分布在抽样应用中的地位在抽样应用中的地位。概率密度函数概率密度函数lf(x)=随机变量 X 的频数 l=总体方差 l=3.14159;e=2.71828lx=随机变量的取值(-x +)l=总体均值正态分布的概率正态分布的概率概率是曲线下的概率是曲线下的面积面积!a ab bx xf f(x x)例题分析例题分析l l计算下列概率:(1)(1)ZN(0,1),求P(Z25)和 P(-15Z2)。解:利用Excel中的【NORMSDIST函数得l lP(Z25)
16、=0993 79l lP(-15Z2)=P(Z2)-P(Z-15)=0.910 l l(2)X-N(50,102),l l 求P(X 40)和P(30X 40)。l l(3)正态分布概率为005时,求标准正态累积分布函数的反函数值Z。l l解:l l(2)利用Excel中的NORMDIST 函数可得l l P(X40)=0158 655l l P(30X40)=P(X40)-P(X30)=0.1 35 l l(3)利用Excel中的【NORMSINV 函数得l l NORMSINV(005)=-1644 854 标准正态分布标准正态分布1.一般的正态分布取决于均值和标准差 2.计算概率时,每一
17、个正态分布都需要有自己的正态概率分布表,这种表格是无穷多的l例:l l、50和25l 280和25l 3、50和2103、若能将一般的正态分布转化为标准正态分布,计算概率时只需要查一张表标准正态分布函数标准正态分布函数2.标准正态分布标准正态分布标准正态分布标准正态分布的概率密度函数的概率密度函数的概率密度函数的概率密度函数1.任任何何一一个个一一般般的的正正态态分分布布,可可通通过过下下面面的的线线性性变变换换转转化化为为标标准正态分布准正态分布 z分数是一个值分数是一个值z大于或小于均值的标准差个数。大于或小于均值的标准差个数。3.标准正态分布标准正态分布标准正态分布标准正态分布的分布函数
18、的分布函数的分布函数的分布函数标准化的例子标准化的例子、P(5 X 6.2)x 55 1010一般正态分布一般正态分布一般正态分布一般正态分布一般正态分布一般正态分布6.2 11Z标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布 0 0 0.12.4478.4478.44785和和210标准正态分布表的使用标准正态分布表的使用1.将一个一般的转换为标准正态分布2.计算概率时,查标准正态概率分布表3.对于负的 x,可由(-x)x得到4.对于标准正态分布,即XN(0,1),有lP(a X b)b a lP(|X|a)2 a 15.对于一般正态分布,即XN(,),有正态分布正
19、态分布(例题分析例题分析)【例例例例】设设设设X X N N(0(0,1)1),求以下概率:,求以下概率:,求以下概率:,求以下概率:(1)(1)P P(X X 1.5)2)2);(3)(3)P P(-1(-1X X 3)3);(4)(4)P P(|(|X X|2)2)解解解解:(1)(1)P P(X X 1.5)=2)=1-2)=1-P P(X X 2)=1-0.9773=0.0332 2)=1-0.9773=0.0332 (3)(3)P P(-1(-1X X 3)=3)=P P(X X 3)-3)-P P(X X-1)-1)=(3)-(3)-(-1)=(-1)=(3)1-(3)1-(1)(
20、1)=0.9987-(1-0.8413)=0.84 =0.9987-(1-0.8413)=0.84 (4)(4)P P(|(|X X|2)=2)=P P(-2(-2 X X 2)=2)=(2)-(2)-(-2)(-2)=(2)-1-(2)-1-(2)=2(2)=2 (2)-1=0.9545(2)-1=0.9545正态分布正态分布(例题分析例题分析)【例例例例】设设X X N N(5(5,3 32 2),求以下概率,求以下概率、(1)(1)P P(X X 10)10);(2)(2)P P(2(2X X 1010)解解解解:(1)(1)(2)(2)正态分布的正态分布的重要特征重要特征是是它有很好的
21、数学性质,它有很好的数学性质,而且对所有的正态分布这些性质都相同。而且对所有的正态分布这些性质都相同。更特别地,这些性质是,对于任何正态分布,落入更特别地,这些性质是,对于任何正态分布,落入均值两边均值两边n个标准差范围之内的正态分布变量的观测值的个标准差范围之内的正态分布变量的观测值的比例是相同的。比例是相同的。因此,正如图所示因此,正如图所示落入均值两边落入均值两边1个标准差范围内的观测值接近个标准差范围内的观测值接近68.27.落入均值两边落入均值两边2个标准差范围内的观测值接近个标准差范围内的观测值接近95.45%落入均值两边落入均值两边3个标准差范围内的观测值接近个标准差范围内的观测
22、值接近99.73.k正态分布中六西格玛原理正态分布中六西格玛原理 摩托罗拉公司于摩托罗拉公司于1987年创立的年创立的6管理理念就是把质量水准的度管理理念就是把质量水准的度量从量从“百分之几百分之几”精确到精确到“百万分之几百万分之几”甚至甚至“十亿分之几十亿分之几”。当上下公差不变时,当上下公差不变时,6的质量水准就意味着产品合格率达到的质量水准就意味着产品合格率达到99999 999 8,即其特性值落在区间即其特性值落在区间(一一6,十十6)外的概率仅为十亿分之二。外的概率仅为十亿分之二。l6表明:现代技术的复杂程度使得过去的关于“可接受质量水平”的观念已经不再适用!l现代市场竞争的激烈程
23、度要求企业在多种运作流程中达到几乎完美的质量水平。l在生产管理尤其是在产品质量管理中使用六西格玛原理,就意味着产品质量的全面提高,几乎每一件产品都要达到合格的水平,这是对过去粗放式企业管理的一个巨大挑战。l首先可以从产品质量的直接管理人手。l其次,可以从全面质量管理、企业整体管理等方面进行尝试。l再次,可以在企业生产的过程控制与六西格玛原理的应用方面相结合。l从而使企业在技术进步和品牌创建等方面做出较大的贡献。由正态分布导出由正态分布导出的几个重要分布的几个重要分布一、2分布分布二、二、t 分布分布三、三、F 分布分布导出背景导出背景l在小样本中,当总体分布为正态分布,而总体方差已在小样本中,
24、当总体分布为正态分布,而总体方差已知,则样本分布应采用正态分布,即用正态分布进行知,则样本分布应采用正态分布,即用正态分布进行统计推断。统计推断。l当总体分布为正态分布,总体方差未知,则样本相应当总体分布为正态分布,总体方差未知,则样本相应地可采用地可采用t t分布,分布,2分布和分布和F分布进行统计推断。分布进行统计推断。l当总体分布为二项分布,因样本容量小,则二项分布当总体分布为二项分布,因样本容量小,则二项分布的概率不能用泊松分布或正态分布来近似地计算,需的概率不能用泊松分布或正态分布来近似地计算,需要直接用二项分布来计算,故在这种情况下,样本分要直接用二项分布来计算,故在这种情况下,样
25、本分布需要二项分布进行统计推断。布需要二项分布进行统计推断。一、一、c c2分布分布(图示图示)不同容量样本的抽样分布不同容量样本的抽样分布不同容量样本的抽样分布不同容量样本的抽样分布 2 2 2 2n n=1=1n n=4=4n n=10=10n n=20=201.由由阿阿贝贝(Abbe)于于1863年年首首先先给给出出,后后来来由由海海尔尔墨墨特特(Hermert)和和卡卡皮皮尔尔逊逊(KPearson)分分别别于于1875年年和和1900年推导出来年推导出来2.设设 ,则,则3.令令 ,则,则 Y 服从自由度为服从自由度为1的的 2分布,即分布,即4.5.当总体当总体 ,从中抽取容量为,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样 参数估计 18451
限制150内