总体均数和总体率讲稿.ppt
《总体均数和总体率讲稿.ppt》由会员分享,可在线阅读,更多相关《总体均数和总体率讲稿.ppt(62页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、关于总体均数和总体率第一页,讲稿共六十二页哦第一节 均数抽样误差与t分布 欲了解总体的特征,最直接的方法是对总体中的每个观察单位进行测量,通过整理分析得到总体参数,但这在医学研究实际中往往是不可能实现的。通常应用抽样研究,通过样本指标来了解总体特征。第二页,讲稿共六十二页哦 抽样研究所得样本均数会不会恰好等于未知的总体均数呢?如果固定样本含量n从同一总体中进行多次抽样,所得样本均数又会如何呢?第三页,讲稿共六十二页哦 假设已知某地30岁-40岁正常男性血清总胆固醇的均值为5.0mmol/L,标准差为0.6mmol/L。现从该总体中进行随机抽样,每次抽取30名正常男子,并测得他们的血清总胆固醇水
2、平,最终共抽取100份样本,并计算出每份样本的均数。第四页,讲稿共六十二页哦第五页,讲稿共六十二页哦 由个体变异产生的,随机抽样引起的样本统计量与总体参数之间的差异称为抽样误差(sampling error)。抽样造成的样本均数与总体均数间的差异就称为均数的抽样误差。在抽样研究中,抽样误差是不可避免的,但抽样误差分布具有一定的规律性。第六页,讲稿共六十二页哦图图3-1 从正态分布总体从正态分布总体N(5.0,0.62)中随机抽样所得样本均数的分布)中随机抽样所得样本均数的分布第七页,讲稿共六十二页哦 样本均数大部分分布在总体均数5.0的左右,中间多、两边少,左右基本对称,服从正态分布,并且样本
3、均数的变异范围比原变量的变异范围要小很多。第八页,讲稿共六十二页哦 样本均数的标准差称为均数的标准误,简称标准误,用符号 表示。均数的标准误说明各样本均数 围绕总体均数 的离散程度,可用来反映样本均数的抽样误差大小。XX第九页,讲稿共六十二页哦中心极限定理从正态总体 N(,2)中,随机抽取例数为 n 的样本,样本均数也服从正态分布;即使从偏态总体随机抽样,当 n 足够大时(n 50),样本均数近似正态分布。第十页,讲稿共六十二页哦从均数为,标准差为 的正态或偏态总体中,抽取例数为 n 的样本,样本均数的总体均数也为 ,标准差与原标准差成正比,与样本例数的平方根成反比。第十一页,讲稿共六十二页哦
4、22,nXXNXN Xn第十二页,讲稿共六十二页哦 越大,样本均数的分布越分散,样本均数与总体均数的差别越大,抽样误差越大,由样本均数估计总体均数的可靠性越小。反之,越小,样本均数的分布越集中,样本均数与总体均数的差别越小,抽样误差越小,由样本均数估计总体均数的可靠性越大。XX第十三页,讲稿共六十二页哦 的大小与 成正比,与 成反比。当固定不变时,样本含量n增大,减小。因此,在实际工作中,可通过适当增加样本含量来减小抽样误差。XnX第十四页,讲稿共六十二页哦 常未知,用 S 估计,因此均数标准误的估计值为XSSn第十五页,讲稿共六十二页哦t 分布的演化2,0,1XXNN 2,0,1XXXXNN
5、 第十六页,讲稿共六十二页哦 常未知,若用 ,这时对样本均数进行的不是 Z变换而是 t 变换 XXXSXXXtSSn 统计量 t 不再服从N(0,1)标准正态分布第十七页,讲稿共六十二页哦 英国统计学家 W.S.Gosset 于1908年以“Student”笔名发表论文,证明统计量 t 服从v=n-1的t分布第十八页,讲稿共六十二页哦 又称为Student t分布(Students t-distribution),1XXXttnSSn分布第十九页,讲稿共六十二页哦t 分布的图形及特征第二十页,讲稿共六十二页哦t 分布的特征为:以0为中心,左右对称的单峰分布 越小,t值越分散,峰越矮,尾越高 增
6、大,t分布逐渐逼近Z分布,时,t分布即为Z分布第二十一页,讲稿共六十二页哦t 界值表 横标目:自由度 纵标目:概率 P(曲线下面积)表中数字:自由度为,概率P 为时,所对应的 t 界值,记为t,第二十二页,讲稿共六十二页哦,t 2,t222,t单侧:或双侧:即,P tt,P tt 22,P ttP tt 221,Pttt 第二十三页,讲稿共六十二页哦在相同自由度时,t 的绝对值越大,P 越小在相同 P 值时,自由度越大所对应的 t 界值越小在相同 t 值时,双侧概率 P 为单侧概率 P 的两倍 时,t界值即为Z界值第二十四页,讲稿共六十二页哦第二节 总体均数的点估计与区间估计 点估计(poin
7、t estimation):将样本统计量直接作为总体参数的估计值 区间估计(interval estimation):按事先给定的概率,估计包含未知总体参数的一个可能范围第二十五页,讲稿共六十二页哦 区间估计的实质假设某个总体的均数为,需要找到两个量A和B,使得在一个比较高的可信度下(如95%),区间(A,B)能包含。即P(A 50)22,XXXZSXZS2XXZS1.96XXS第三十页,讲稿共六十二页哦 例6-3中,因n=120,试求该地正常成年男性 血清胆固醇平均水平的95可信区间。1.73/smmol L3.86/xmmol L即(3.55,4.17)mmol/L 1.731.963.8
8、6 1.963.860.31120 xxs第三十一页,讲稿共六十二页哦 例6-1 从某地随机抽取120名30岁-40岁正常男性,得其血清总胆固醇水平的均数为4.95mmol/L,标准差为0.64mmol/L,试估计该地30岁-40岁正常男性血清总胆固醇平均水平的95%可信区间。第三十二页,讲稿共六十二页哦 因n=120,属于未知但n足够大,又均数为4.95mmol/L,标准差为0.64mmol/L,故该地30岁-40岁正常男性血清总胆固醇平均水平的95%可信区间为 即(4.84,5.06)mmol/L0.641.964.95 1.964.950.11120XXS第三十三页,讲稿共六十二页哦当未
9、知n 较小2,2,XXXtSXtS/2,/2,/2,/2,/2,/2,()1()1()1XXXPtttXPttSP XtSXtS -t/2,v 0 t/2,v 第三十四页,讲稿共六十二页哦可信区间的涵义 从总体中作随机抽样,每个样本可以算得一个可信区间。如95%可信区间意味着做100次抽样,算得100个可信区间,平均有95个估计正确。在实际研究中,一般只进行一次抽样,算得一个可信区间,对于这个可信区间来说,我们就认为该区间包含了总体均数,把握度为95%。第三十五页,讲稿共六十二页哦图6-5 从N(0,1)中随机抽样算得的100个95可信区间(n=10)第三十六页,讲稿共六十二页哦可信区间的两个
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 总体 讲稿
限制150内