第3章 有限数据统计处理.ppt
《第3章 有限数据统计处理.ppt》由会员分享,可在线阅读,更多相关《第3章 有限数据统计处理.ppt(44页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、第三章第三章 有限数据的统计处理有限数据的统计处理 3.1 总体的参数估计总体的参数估计 期望值和方差、参数估计期望值和方差、参数估计 3.2 一般的统计检验一般的统计检验 平均值检验、平均值检验、F检验、离群值检验检验、离群值检验1/31/20231浙江科技学院本科课程浙江科技学院本科课程化工数据处理化工数据处理总体、个体和样本总体、个体和样本:o总体总体(Population):调查研究的事物或现象的全体o个体个体(Item unit):组成总体的每个元素o样本样本(Sample):从总体中所抽取的部分个体o样本容量样本容量(Sample size):样本中所含个体的数量1/31/2023
2、2浙江科技学院本科课程浙江科技学院本科课程化工数据处理化工数据处理示例:示例:有限数据的统计处理有限数据的统计处理总体总体样本样本甲甲样本容量样本容量平均值平均值500g500g乙乙平行测定平行测定 3 3 次次平行测定平行测定 4 4 次次丙丙平行测定平行测定 4 4 次次有限数据的处理:有限数据的处理:计算计算估计估计 显著性检验显著性检验没有系统误差,没有系统误差,=T有系统误差,有系统误差,T1/31/20233浙江科技学院本科课程浙江科技学院本科课程化工数据处理化工数据处理3.1.1 期望值和方差期望值和方差数据集中趋势的表示:对一B物质客观存在量为T 的分析对象进行分析,得到n 个
3、个别测定值 x1、x2、x3、xn,平均值平均值 Average 中位数中位数Median有限次测量:测量值向有限次测量:测量值向平均值平均值 集中集中无限次测量:测量值向无限次测量:测量值向总体平均值总体平均值 集中集中数据集中趋势和分散程度的表示数据集中趋势和分散程度的表示数据集中趋势和分散程度的表示数据集中趋势和分散程度的表示1/31/20234浙江科技学院本科课程浙江科技学院本科课程化工数据处理化工数据处理数据分散程度的表示:数据分散程度的表示:极差R Range相对极差相对极差相对极差相对极差R R R R偏差偏差偏差偏差 DeviationDeviation平均偏差平均偏差平均偏差
4、平均偏差 Mean deviationMean deviation相对平均偏差相对平均偏差相对平均偏差相对平均偏差 relative mean relative mean deviationdeviation标准偏差标准偏差标准偏差标准偏差 standard standard deviationdeviation相对标准偏差相对标准偏差相对标准偏差相对标准偏差(变异系数变异系数变异系数变异系数)Relative standard deviation Relative standard deviation(Coefficient of variation,(Coefficient of vari
5、ation,CV CV)1/31/20235浙江科技学院本科课程浙江科技学院本科课程化工数据处理化工数据处理总体标准偏差与标准偏差的比较:总体标准偏差与标准偏差的比较:总体标准偏差标准偏差标准偏差无限次测量,无限次测量,对总体平均值的离散对总体平均值的离散有限次测量有限次测量对平均值的离散对平均值的离散自由度自由度计算一组数据分散计算一组数据分散度的独立偏差数度的独立偏差数自由度的理解:例如,有三个测量值,求得平均值,也知自由度的理解:例如,有三个测量值,求得平均值,也知道道x1和和x2与平均值的差值,那么,与平均值的差值,那么,x3与平均值的差值就是与平均值的差值就是确定的了,不是一个独立的
6、变数。确定的了,不是一个独立的变数。1/31/20236浙江科技学院本科课程浙江科技学院本科课程化工数据处理化工数据处理平均值的标准偏差:平均值的标准偏差:平均值的总平均值的总平均值的总平均值的总体标准偏差体标准偏差体标准偏差体标准偏差对对对对有限有限有限有限次测量次测量次测量次测量S(x)的物理意义:的物理意义:在有限次测量中,每个测量值平均所具有的标准偏差。在有限次测量中,每个测量值平均所具有的标准偏差。1/31/20237浙江科技学院本科课程浙江科技学院本科课程化工数据处理化工数据处理对对有限次测量:有限次测量:1、增加测量次数、增加测量次数可以提高精密度。可以提高精密度。2、增加(过多
7、)、增加(过多)测量次数的代价不测量次数的代价不一定能从减小误差一定能从减小误差得到补偿。得到补偿。结论:结论:测量次数测量次数1/31/20238浙江科技学院本科课程浙江科技学院本科课程化工数据处理化工数据处理3.1.2 参数估计参数估计矩估计法矩估计法矩估计法矩估计法最小二乘法最小二乘法最小二乘法最小二乘法最大似然法最大似然法最大似然法最大似然法顺序统计量法顺序统计量法顺序统计量法顺序统计量法估估 计计 方方 法法点点 估估 计计区间估计区间估计1/31/20239浙江科技学院本科课程浙江科技学院本科课程化工数据处理化工数据处理一、点估计一、点估计1.从总体中抽取一个样本,根据该样本的统计
8、量对总体的未知参数作出一个数值点的估计例如:用样本均值作为总体未知均值的估计值就是一个点估计2.点估计没有给出估计值接近总体未知参数程度的信息3.点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等概念要点:概念要点:1/31/202310浙江科技学院本科课程浙江科技学院本科课程化工数据处理化工数据处理被估计的总体参数被估计的总体参数总体参数总体参数符号表示符号表示用于估计的样用于估计的样本统计量本统计量一个一个总总体体均值方差两个总体两个总体均值之差方差比1/31/202311浙江科技学院本科课程浙江科技学院本科课程化工数据处理化工数据处理估计量的优良性准则o无偏性:无偏性:估计量
9、的数学期望等于被估计的总体参数P P(X X)X XC CA A 无偏无偏无偏无偏无偏无偏有偏有偏有偏有偏有偏有偏1/31/202312浙江科技学院本科课程浙江科技学院本科课程化工数据处理化工数据处理AB 中位数的抽样分布中位数的抽样分布中位数的抽样分布中位数的抽样分布均值的抽样分布均值的抽样分布均值的抽样分布均值的抽样分布X XP P(X X)p 有有效效性性:一个方差较小的无偏估计量称为一个更有效的估计量。如,与其他估计量,样本相比均值是一个更有效的估计量。1/31/202313浙江科技学院本科课程浙江科技学院本科课程化工数据处理化工数据处理o一致性:一致性:随着样本容量的增大,估计量越来
10、越 接近被估计的总体参数AB较小的样本容量较小的样本容量较小的样本容量较小的样本容量较大的样本容量较大的样本容量较大的样本容量较大的样本容量 P P(X X)X X1/31/202314浙江科技学院本科课程浙江科技学院本科课程化工数据处理化工数据处理二、区间估计二、区间估计1.根据一个样本的观察值给出总体参数的估计范围2.给出总体参数落在这一区间的概率3.例如:总体均值落在5070之间,置信度为 95%样本统计量样本统计量样本统计量样本统计量 (点估计点估计点估计点估计)置信区间置信区间置信区间置信区间置信下限置信下限置信下限置信下限置信上限置信上限置信上限置信上限概念要点:概念要点:1/31
11、/202315浙江科技学院本科课程浙江科技学院本科课程化工数据处理化工数据处理置信区间估计内容:置信区间估计内容:2 2 已知已知 2 2未知未知 均均 值值方方 差差置置 信信 区区 间间1/31/202316浙江科技学院本科课程浙江科技学院本科课程化工数据处理化工数据处理问题:问题:在在 的的某个范围某个范围某个范围某个范围 内包含内包含 的的概率概率概率概率 有多大?有多大?对有限次测量对有限次测量1 1、概率、概率2 2、区间界限,多大区间、区间界限,多大区间置信水平置信水平 Confidence level置信度置信度 Degree of confidence Probability
12、 level置信区间置信区间 Confidence interval 置信界限置信界限 Confidence limit 必然的联系必然的联系这个问题涉及两个方面:这个问题涉及两个方面:1/31/202317浙江科技学院本科课程浙江科技学院本科课程化工数据处理化工数据处理总体平均值的置信区间总体平均值的置信区间概率概率区间大小区间大小例:例:包含在包含在 区间区间 几率相对大几率相对大几率几率 相对小相对小几率为几率为100%无意义无意义平均值的置信区间的问题平均值的置信区间的问题1/31/202318浙江科技学院本科课程浙江科技学院本科课程化工数据处理化工数据处理1.总体未知参数落在区间内的
13、概率2.表示为(1-n 为显著性水平,是总体参数未在区间内的概率3.常用的置性水平值有 99%,95%,90%n相应的相应的 为0.01,0.05,0.10置信水平:置信水平:1/31/202319浙江科技学院本科课程浙江科技学院本科课程化工数据处理化工数据处理区间与置信水平:区间与置信水平:均值的抽样分布均值的抽样分布均值的抽样分布均值的抽样分布(1-(1-)%)%区间包含了区间包含了区间包含了区间包含了%的区间未包含的区间未包含的区间未包含的区间未包含 1-1-/2 2 /2 21/31/202320浙江科技学院本科课程浙江科技学院本科课程化工数据处理化工数据处理影响区间宽度的因素:影响区
14、间宽度的因素:1.数据的离散程度,用来测度2.样本容量,3.置信水平(1-),影响 Z 的大小1/31/202321浙江科技学院本科课程浙江科技学院本科课程化工数据处理化工数据处理落在总体均值某一区间内的样本落在总体均值某一区间内的样本 x_XX=Z x95%95%的样本的样本的样本的样本 -1.96-1.96 x x +1.96+1.96 x x99%99%的样本的样本的样本的样本 -2.58-2.58 x x +2.58+2.58x x90%90%的样本的样本的样本的样本 -1.65-1.65 x x +1.65+1.65 x x1/31/202322浙江科技学院本科课程浙江科技学院本科课
15、程化工数据处理化工数据处理总体均值的置信区间(已知)1.假定条件n总体服从正态分布,且总体方差()已知n如果不是正态分布,可以由正态分布来近似(n 30)2.使用正态分布统计量3.总体均值 在1-置信水平下的置信区间为1/31/202323浙江科技学院本科课程浙江科技学院本科课程化工数据处理化工数据处理正态总体实例正态总体实例:总体均值的区间估计总体均值的区间估计解解解解:已已 知知 N N(,0.150.152 2),x x 21.4,21.4,n n=9,1-=9,1-=0.95=0.95,/2/2=1.96=1.96 总体均值总体均值 的置信区间为的置信区间为我我们们可可以以9595的的
16、概概率率保保证证该该种种零零件件的的平平均长度在均长度在21.321.321.5 mm21.5 mm之间之间【例例例例】某某种种零零件件长长度度服服从从正正态态分分布布,从从该该批批产产品品中中随随机机抽抽取取件件,测测得得其其平平均均长长度度为为 21.4mm21.4mm。已已知知总总体体标标准准差差 =0.15mm=0.15mm,试试建建立立该该种种零零件件平平均均长长度度的的置置信信区区间间,给给定定置置信信水水平平为为0.950.95。1/31/202324浙江科技学院本科课程浙江科技学院本科课程化工数据处理化工数据处理非正态总体实例:非正态总体实例:总体均值的区间估计总体均值的区间估
17、计解解解解:已已知知 x x26.0,26.0,=6=6,n n=100,=100,1-1-=0.950.95,/2/2=1.96=1.96我我们们可可以以9595的的概概率率保保证证平平均均每每天天参参加加锻锻炼炼的的时时间间在在24.824.827.2 27.2 分分钟钟之间之间【例例例例】某某大大学学从从该该校校学学生生中中随随机机抽抽取取100100人人,调调 查查 到到 他他们们平平均均每每天天参参加加体体育育 锻锻 炼炼 的的 时时 间间 为为26.026.0分分钟钟。试试以以9595的的置置信信水水平平估估计计该该大大学学全全体体学学生生平平均均每每天天参参加加体体育育锻锻炼炼的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第3章 有限数据统计处理 有限 数据 统计 处理
限制150内