抽样与参数估计.pptx
《抽样与参数估计.pptx》由会员分享,可在线阅读,更多相关《抽样与参数估计.pptx(79页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、第5章 抽样与参数估计 k不像其他科学,统计从来不打算使自己不像其他科学,统计从来不打算使自己完美无缺,统计意味着你永远不需要确完美无缺,统计意味着你永远不需要确定无疑。定无疑。 古德蒙古德蒙R艾弗森艾弗森 重点掌握计算内容重点掌握计算内容淡化公式推导淡化公式推导侧重于统计应用侧重于统计应用教学、学习方式教学、学习方式以理解统计思想为主以理解统计思想为主课程设计思课程设计思路路第 5 章 知识点知识点1、概率、概率及分布及分布3、抽样分布、抽样分布 及中心极限定理及中心极限定理4、参数估计、参数估计2、统计量、统计量 与参数与参数预备预备知识知识 推断推断指标指标 推断推断依据依据理论理论知识
2、知识计算计算方法方法5.1 5.1 参数与统计量参数与统计量 平均数平均数标准差标准差比比 例例参数参数: 统计量统计量 x s p未知参数未知参数已知统计量已知统计量5.2 抽样分布抽样分布概念抽样分布概念中心极限定理中心极限定理几种常用统计量几种常用统计量的分布的分布5.2.15.2.25.2.3作出推断的依据是什么作出推断的依据是什么? ?怎样才能让别人信服你的推断结怎样才能让别人信服你的推断结果呢果呢? ?1、从一个总体中随机从一个总体中随机抽出抽出容量相同容量相同的各种样本,则从的各种样本,则从这些样本计算出的某这些样本计算出的某统计量的所有可能值统计量的所有可能值形成的概形成的概率
3、分布,被称为这一个统计量的抽样分布率分布,被称为这一个统计量的抽样分布。2 2、统计量的概率分布、统计量的概率分布,是一种,是一种理论分布理论分布。3 3、提供了样本统计量提供了样本统计量长远而稳定的信息长远而稳定的信息,是是进行推断的进行推断的理论基础,也是抽样推断科学性的重要依据理论基础,也是抽样推断科学性的重要依据。 5.2.1 5.2.1 抽样分布抽样分布统计量的分布具有某种统计量的分布具有某种确定的性质确定的性质,而这些性质,而这些性质是是已知的已知的,而且反映在它的抽样分布之中。,而且反映在它的抽样分布之中。k5.2.1 5.2.1 抽样分布抽样分布( (一)一)样本均值的抽样分布
4、样本均值的抽样分布5 . 21NxNii25. 1)(122NxNii总体的分布总体的分布 XN(2.5, 1.25)X1X2X3X41234样本元素组合样本均值1X1,X112X1,X21.53X1,X324X1,X42.55X2,X12.56X2,X227X2,X32.58X2,X439X3,X1210X3,X22.511X3,X3312X3,X43.513X4,X12.514X4,X231516X4,X3X4,X43.54xl现从现从4个中重复个中重复抽抽2个构成个构成16个个可能样本。可能样本。x统计量统计量次数次数f频率频率111/161.511/16233/162.555/1633
5、3/163.522/16411/16合计合计162/16x 5 . 21640NxxExnnxxix222225. 11610抽样的概率分布表抽样的概率分布表样本元素组合样本均值1X1,X112X1,X21.53X1,X324X1,X42.55X2,X12.56X2,X227X2,X32.58X2,X439X3,X1210X3,X22.511X3,X3312X3,X43.513X4,X12.514X4,X231516X4,X3X4,X43.54x样本均值的分布与总体分布的比较样本均值的分布与总体分布的比较5 . 2)(xEx625. 025. 122nnx样本均值样本均值的抽样分布与总体分布的
6、关系的抽样分布与总体分布的关系:x25. 125 . 2)(xE626. 02x)(xE625. 025. 122nnx1.样本均值的数学期望样本均值的数学期望2.样本均值的方差样本均值的方差l重复抽样重复抽样结论:样本均值的抽样分布结论:样本均值的抽样分布 (数学期望与方差数学期望与方差)(xEnx221.总体总体(或样本或样本)中具有某种属性的单位与全部单位总数中具有某种属性的单位与全部单位总数之比之比l不同性别的人与全部人数之比不同性别的人与全部人数之比l合格品合格品( (或不合格品或不合格品) ) 与全部产品总数之比与全部产品总数之比2.总体比例可表示为总体比例可表示为3.样本比例可表
7、示为样本比例可表示为 5.2.1 5.2.1 抽样分布抽样分布( (二)二)样本比例的抽样分布样本比例的抽样分布NNNN011或nnpnnp011或1.样本比例的数学期望样本比例的数学期望2.样本比例的方差样本比例的方差样本比例的抽样分布样本比例的抽样分布 (数学期望与方差数学期望与方差)(pEnp)1(2l虽然比率虽然比率p p随着样本容量随着样本容量n n的增大而近似服从正态分的增大而近似服从正态分布,但究竟多大才能使布,但究竟多大才能使p p近似正态分布呢近似正态分布呢? ?这与这与p p的取的取值大小有关。值大小有关。l当当p p接近于接近于0 05 5时,用较小的样本就可使时,用较小
8、的样本就可使p p的分布趋的分布趋于正态分布;于正态分布;l但当但当p p接近于接近于0 0和和1 1时,就要很大的样本才能使时,就要很大的样本才能使p p的分的分布趋于正态分布。布趋于正态分布。l统计学家统计学家W GW GCocbanCocban提出一个标准可供参考,如提出一个标准可供参考,如表表5 57 7所示。所示。 5.2.2 5.2.2 中心极限定理中心极限定理 从总体中抽取样本容量为从总体中抽取样本容量为n的简单随机样本,的简单随机样本,当样本容量当样本容量 n 30时,样本均值时,样本均值 的抽样分布可的抽样分布可用正态概率分布近似。用正态概率分布近似。 5.2.2 5.2.2
9、 中心极限定理中心极限定理中心极限定理中心极限定理nxx总结:推断时样本统计量的抽样分布形式概括总结:推断时样本统计量的抽样分布形式概括几几种种概概率率分分布布正态分布正态分布 分布分布 F分布分布 t分布分布25.2.3 5.2.3 几种常用的统计量及其分布几种常用的统计量及其分布正态分布正态分布(normal distribution)l1. 描述连续型随机变量的最重要的分布l2. 可用于近似离散型随机变量的分布l例如例如: : 二项分布二项分布l3. 经典统计推断的基础正态分布最常用、最重要正态分布最常用、最重要(1)(1)客观世界中有许多随机现象都服从或近似服从正态分客观世界中有许多随
10、机现象都服从或近似服从正态分布布。例如:测量误差,同龄人的身高、体重,一批棉纱例如:测量误差,同龄人的身高、体重,一批棉纱的抗拉强度,一种设备的使用寿命,一定条件下某种农的抗拉强度,一种设备的使用寿命,一定条件下某种农作物的产量,等等。作物的产量,等等。l 它们的共同特点是,它们的共同特点是,中间多两端少,即离均值越近中间多两端少,即离均值越近的数值越常见;反之,离均值越远的数值越少见。的数值越常见;反之,离均值越远的数值越少见。(2)(2)正态分布具有很好的数学性质。正态分布具有很好的数学性质。l 正态分布是许多概率分布的极限分布,其他一些分正态分布是许多概率分布的极限分布,其他一些分布的概
11、率布的概率( (如二项分布如二项分布) )可由正态分布来近似计算,统计可由正态分布来近似计算,统计推断中许多重要的分布推断中许多重要的分布( (如如2 2分布、分布、t t分布、分布、F F分布分布) )都都是在正态分布的基础上推导出来的。是在正态分布的基础上推导出来的。(3)(3)尽管经济管理活动中的有些变量尽管经济管理活动中的有些变量是正偏斜的,是正偏斜的,但是正但是正态分布仍然是与之十分贴近的,这丝毫不影响正态分布态分布仍然是与之十分贴近的,这丝毫不影响正态分布在抽样应用中的地位在抽样应用中的地位。概率密度函数概率密度函数xxfx,e21)(2221lf(x) = 随机变量 X 的频数
12、l = 总体方差 l =3.14159; e = 2.71828lx = 随机变量的取值 (- x +)l = 总体均值正态分布的概率正态分布的概率?d)()(baxxfbxaP例题分析例题分析2 标准正态分布标准正态分布1.一般的正态分布取决于均值和标准差 2.计算概率时 ,每一个正态分布都需要有自己的正态概率分布表,这种表格是无穷多的l例:l l、50和25l 280和25l 3、50和2103、若能将一般的正态分布转化为标准正态分布,计算概率时只需要查一张表标准正态分布函数标准正态分布函数xxx,e21)(221.任何一个任何一个一般的正态分布,可通过下面的线性变换转化为标一般的正态分布
13、,可通过下面的线性变换转化为标准正态分布准正态分布 z分数是一个值分数是一个值z大于或小于均值的标准差个数。大于或小于均值的标准差个数。 )1 ,0( NXZxtxtttxde21d)()(2-2标准化的例子标准化的例子、P(5 X 6.2) 12. 01052 . 6XZ5和和210标准正态分布表的使用标准正态分布表的使用1.将一个一般的转换为标准正态分布2.计算概率时 ,查标准正态概率分布表3.对于负的 x ,可由 (-x) x得到4.对于标准正态分布,即XN(0,1),有lP (a X b) b a lP (|X| a) 2 a 15.对于一般正态分布,即XN( , ),有abbXaP)
14、(正态分布正态分布(例题分析例题分析)正态分布正态分布(例题分析例题分析)9525. 0)67. 1 (67. 135351035)10(XPXPXP7938. 0) 1()67. 1 (67. 1351351035352)102(XPXPXP正态分布的正态分布的重要特征重要特征是是它有很好的数学性质,它有很好的数学性质,而且对所有的正态分布这些性质都相同。而且对所有的正态分布这些性质都相同。更特别地,这些性质是,对于任何正态分布,落入更特别地,这些性质是,对于任何正态分布,落入均值两边均值两边n个标准差范围之内的正态分布变量的观测值的个标准差范围之内的正态分布变量的观测值的比例是相同的。比例
15、是相同的。因此,正如图所示因此,正如图所示落入均值两边落入均值两边1个标准差范围内的观测值接近个标准差范围内的观测值接近68.27.落入均值两边落入均值两边2个标准差范围内的观测值接近个标准差范围内的观测值接近95.45%落入均值两边落入均值两边3个标准差范围内的观测值接近个标准差范围内的观测值接近99.73.k正态分布中六西格玛原理正态分布中六西格玛原理 摩托罗拉公司于摩托罗拉公司于1987年创立的年创立的6管理理念就是把质量水准的度管理理念就是把质量水准的度量从量从“百分之几百分之几”精确到精确到“百万分之几百万分之几”甚至甚至“十亿分之几十亿分之几”。 当上下公差不变时,当上下公差不变时
16、,6的质量水准就意味着产品合格率达到的质量水准就意味着产品合格率达到99999 999 8,即其特性值落在区间即其特性值落在区间(一一6,十十6)外的概率仅为十亿分之二。外的概率仅为十亿分之二。l6表明:现代技术的复杂程度使得过去的关于“可接受质量水平”的观念已经不再适用!l现代市场竞争的激烈程度要求企业在多种运作流程中达到几乎完美的质量水平。l在生产管理尤其是在产品质量管理中使用六西格玛原理,就意味着产品质量的全面提高,几乎每一件产品都要达到合格的水平,这是对过去粗放式企业管理的一个巨大挑战。l首先可以从产品质量的直接管理人手。l其次,可以从全面质量管理、企业整体管理等方面进行尝试。l再次,
17、可以在企业生产的过程控制与六西格玛原理的应用方面相结合。l从而使企业在技术进步和品牌创建等方面做出较大的贡献。 由正态分布导出由正态分布导出的几个重要分布的几个重要分布一、2分布分布二、二、 t 分布分布三、三、 F 分布分布导出背景导出背景l在小样本中,当总体分布为正态分布,而总体方差已在小样本中,当总体分布为正态分布,而总体方差已知,则样本分布应采用正态分布,即用正态分布进行知,则样本分布应采用正态分布,即用正态分布进行统计推断。统计推断。l当总体分布为正态分布,总体方差未知,则样本相应当总体分布为正态分布,总体方差未知,则样本相应地可采用地可采用t t分布,分布, 2分布和分布和F分布进
18、行统计推断。分布进行统计推断。l当总体分布为二项分布,因样本容量小,则二项分布当总体分布为二项分布,因样本容量小,则二项分布的概率不能用泊松分布或正态分布来近似地计算,需的概率不能用泊松分布或正态分布来近似地计算,需要直接用二项分布来计算,故在这种情况下,样本分要直接用二项分布来计算,故在这种情况下,样本分布需要二项分布进行统计推断。布需要二项分布进行统计推断。一、一、 2分布分布(图示图示)1.由阿贝由阿贝(Abbe) 于于1863年首先给出,后来由海尔墨特年首先给出,后来由海尔墨特(Hermert)和卡和卡皮尔逊皮尔逊(KPearson) 分别于分别于1875年和年和1900年推导出来年推
19、导出来2.设设 ,则,则3.令令 ,则,则 Y 服从自由度为服从自由度为1的的 2分布,即分布,即4. 5.当总体当总体 ,从中抽取容量为,从中抽取容量为n的样本,则的样本,则一、一、 2分布分布( 2 distribution),(2NX)1 ,0( NXz2zY ) 1 (2Y),(2NX) 1()(2212nxxnii1.1.在总体方差的估计和非参数检验中会用到在总体方差的估计和非参数检验中会用到 2 2分布分布. .2.2.分布的变量值始终为正分布的变量值始终为正 3.3.分布的形状取决于其自由度分布的形状取决于其自由度n n的大小,通常为不对称的大小,通常为不对称的正偏分布,但随着自
20、由度的增大逐渐趋于对称的正偏分布,但随着自由度的增大逐渐趋于对称 4.4.期望为:期望为:E E( ( 2 2)=)=n n,方差为:,方差为:D D( ( 2 2)=2)=2n n( (n n为自由度为自由度) ) 5.5.可加性:若可加性:若U U和和V V为两个独立的为两个独立的 2 2分布随机变量,分布随机变量,U U 2 2(n(n1 1) ),V V 2 2( (n n2 2),),则则U U+ +V V这一随机变量服从自由度这一随机变量服从自由度为为n n1 1+ +n n2 2的的 2 2分布分布 一、一、 2分布分布 (性质和特点性质和特点)l 2 2分布的概率即为曲线下面积
21、。分布的概率即为曲线下面积。l利用Excel中的(CHIDIST)统计函数,可以计算给定 2 2值和自由度的 2 2分布右尾的概率,l而利用(CHIINV)函数则可以计算给定右尾概率和自由度时相应的反函数值( 2 2值)。l 例例: 计算:计算:l(1)自由度为自由度为8, 2 2值大于值大于10的概率;的概率;l(2)自由度为自由度为10, 2 2分布右尾概率为分布右尾概率为005时的反函数值时的反函数值(在估计和检验中称为临界值在估计和检验中称为临界值).l在在Excel工作表的计算单元格工作表的计算单元格l输入函数输入函数“=CHIDIST(10,8)”,得到,得到 2 2分布的右尾概率
22、分布的右尾概率为为0265 026。l输入函数输入函数“CHIINV(005,10)”,得到,得到 2 2 18307。 2分布分布(图示图示) 选择容量为选择容量为n 的的简单随机样本简单随机样本计算样本方差计算样本方差s2计算卡方值计算卡方值 2 = (n-1)s2/2计算出所有的计算出所有的 2值值总体总体 2分布分布(例题的图示例题的图示)16个样本方差的分布个样本方差的分布样本方差s2s2取值的概率0.04/160.56/1624/164.52/16二、 t 分布分布 当正态总体标准差未知时,在小样本条件下对总当正态总体标准差未知时,在小样本条件下对总体均值的估计和检验要用到体均值的
23、估计和检验要用到t t分布分布二、 t 分布图示分布图示lt分布的概率即为曲线下面积。分布的概率即为曲线下面积。l利用利用Excel中的中的(TDIST)统计函数,可以计算给定统计函数,可以计算给定t值值和自由度时和自由度时t分布的概率值,而利用分布的概率值,而利用(TINV)函数则可函数则可以计算给定概率和自由度时的相应以计算给定概率和自由度时的相应t值。值。l例例 :计算:计算:l(1)自由度为自由度为10,t值大于值大于2的概率;的概率;l(2)自由度为自由度为10, t分布右尾概率为分布右尾概率为005时的时的t值。值。l在在Excel工作表的计算单元格工作表的计算单元格l输入函数输入
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样 参数估计
限制150内