欢迎来到得力文库 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
得力文库 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    第七 抽样与抽样估计.pptx

    • 资源ID:73445480       资源大小:665.37KB        全文页数:59页
    • 资源格式: PPTX        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第七 抽样与抽样估计.pptx

    第 一 节 抽样及抽样估计中的基本概念第1页/共59页(一)抽样及抽样估计的概念(一)抽样及抽样估计的概念 1.抽抽样样即抽抽样样调调查查,是指在总体中选取部分单位组成样本并收集样本单位的数据资料的过程。2.抽抽样样估估计计是在抽样调查的基础上,利利用用样本的数据资料计算样样本本指指标标,以样本特征值对对总总体体特特征征值值做出具有一定可靠程度的估计和判断估计和判断。一、抽样估计的概念和特征第2页/共59页(二)抽样估计的特点 1.1.抽样估计是由部分推断总体由部分推断总体的一种认识方法 2.2.抽样估计建立在随机取样随机取样的基础上3.3.抽样估计运用的是不确定的概率估计方法不确定的概率估计方法4.4.抽样估计的误差可误差可以事先计算计算并加以控制控制第3页/共59页二、抽样及抽样估计中的相关概念(一)全及总体和样本(一)全及总体和样本1.1.全全及及总总体体:是由被被调调查查对对象象的的全全部部单单位位所构成的集合体,简称总体。总体容量总体容量:总体中的单位数,用N表示2.2.样样本本:样本是从总体中抽抽取取的的进进行行调调查查的的部部分分单单位位的集合体,又称抽样总体样本容量样本容量:样本中的单位数,用n表示大样本和小样本:大样本和小样本:n30时称大样本,n30称小样本*应应用用:在班级40名学生中随机选取15人进行健康状况调查,说明其中的总体、样本及容量第4页/共59页二、抽样及抽样估计中的相关概念(二)概率抽样与非概率抽样 1.概概率率抽抽样样:又称随机抽样,是按随机原则抽取样本单位。本章所指本章所指的均为概率抽样。2.非非概概率率抽抽样样:又称非随机抽样,是指从研究的目的和需要出发,根据调查者的经验或判断,从总体中有意识地抽取有意识地抽取部分单位构成样本。*应用举例应用举例:重点调查、典型调查应为非概率抽样第5页/共59页二、抽样及抽样估计中的相关概念(三)重复抽样和不重复抽样 1.1.重复抽样:又称有放回的抽样,从总体中抽取样本时,每次被抽中的单位都再被放回总体中参与下一次抽样。2.2.不重复抽样:又称无放回的抽样,总体中随机抽选的单位经观察后不放回到总体中,即不再参加下次抽样。*思考与讨论:从容量为N的总体中随机抽取容量为n的样本,根据概率论与数理统计知识,讨论重复抽样和不重复抽样中各单位依次被抽中的概率,并比较在同等条件下,哪种抽样的代表性好?第6页/共59页二、抽样及抽样估计中的相关概念(四)抽样框 1.1.概念:抽样框是包括全部抽样单位的名单框架包括全部抽样单位的名单框架。2.2.形式 名单抽样框:如学生名单、职工名单、企业名单等 区域抽样框:如将一个城市按行政区划分为若干区、街道、居委会等 时间抽样框:如对流水线上的产品每隔一定时间抽取一定单位第7页/共59页(五)总体参数和样本统计量 1.1.总体参数:是反映总体数量特征的数值反映总体数量特征的数值。在抽样推断 中,参数是未知的、待估计的确定值参数是未知的、待估计的确定值。2.2.样本统计量:是根据样本资料计算的反反映映样样本本数数量量特特征征的的变变量量,它的值随着样本的不同而变化,因此是是一个随机变量随机变量。二、抽样及抽样估计中的相关概念第8页/共59页表表7-1 7-1 总体参数和样本统计量符号总体参数和样本统计量符号第9页/共59页(六)抽样误差 1.1.统计误差及分类 偏差/系统误差:由于破坏随机原则而产生随机性误差/抽样误差*:即使遵循随机原则以样本指标代表总体指标时的偏差统计误差登记性误差:统计调查中,由于观察、测量、登记、计算等原因或被调查者提供 虚假信息所造成代表性误差:以样本指标推断总体指标时产 生的代表 性程度的差异。第10页/共59页(六)抽样误差2.2.抽样误差 与抽样误差有关的三个概念 (1)抽样实际误差:指某一次具体抽样中,样本指标值与总体参数真实值之间的偏差。(2)抽样平均误差:是指所有可能的样本指标与总体指标之间的平均差异程度,即样本估计值的标准差。(3)抽样极限/允许误差:又称置信区间,是指一定概率下抽样误差的可能范围,说明样本估计量在总体参数周围变动的范围,记作。抽样误差是指不包括登记性误差和系统性误差在内的随机误差,它衡量了抽样估计的精确度。第11页/共59页抽样平均误差 抽样平均数的平均误差 概念:就是抽样平均数的标准差,反映抽样平均数的所有可能值对总体平均数的平均离散程度,记作 。定义公式:其中:各个可能样本的平均数 :总体平均数 :重复抽样条件下所有可能的样本数 第12页/共59页抽样平均误差实际抽样推断中采用的公式 重复简单随机抽样 不重复简单随机抽样 其中,为总体方差 为不重复抽样的修正因子 第13页/共59页抽样平均误差样本成数(比例)的抽样平均误差 重复抽样条件下:不重复抽样条件下:总体中具有某种特征的单位占全部总体单位数的比例称为总体比例,记作 ,样本中具有此种特征的单位占全部样本单位数的比例称为样本比例,记作 。第14页/共59页抽样极限误差样本平均数的抽样极限误差:以绝对值形式表示的样本平均数的抽样误差的可能范围,用符号表示为:即:说明样本均值以确定的总体均值为中心,在 之间变动。在实际抽样估计中是以样本均值推断总体均值的区间范围,因此,可将上述不等式做如下变换:第15页/共59页抽样极限/允许误差样本比例的抽样极限误差:以绝对值形式表示的样本比例的抽样误差的可能范围,用符号表示为:即:同理,也可将上述不等式转换为:第16页/共59页第二节 抽样分布第17页/共59页一、抽样分布的概念和种类(一)概念 精确分布小样本分布:大多数是在正态分布总体条件下得到的,但应用不广(二)种类渐进分布大样本分布:样本容量无限增 大时统计量的极限分布,可看作是抽 样分布的一种近似。抽抽样样分分布布是是样样本本统统计计量量的的概概率率分分布布。从一个总体中随机抽取容量相等的样本,根据样本资料计算某一统计量所有可能的概率分布,称为这个统计量的抽样分布。第18页/共59页常见的抽样分布(一)正态分布.正态分布:正态分布:如果随机变量的概率密度函数为:-+其中,为常数且0,则称服从参数为、的正态分布,记作,。正态分布是最常见的抽样分布正态分布是最常见的抽样分布第19页/共59页常见的抽样分布2.标准正态分布:在正态分布中,当参数=0,=1时,则称服从标准正态分布,记作,1)。标准正态分布的分布密度和分布函数的性质如下:(1)是偶函数,即=(2)=1-(3)如果,则的分布函数为上述公式称为正态分布函数的标准化公式。第20页/共59页常见的抽样分布(二)分布 设 是独立同分布的随机变量,且每个随机变量都服从标准正态分布,即 (0,1),则随机变量 =的分布称为自由度为 的 分布,记作 ()。当 时,分布趋近于正态分布,即 ()(,2 )。第21页/共59页常见的抽样分布(三)分布 设随机变量 与 相互独立,(0,1),(),则称随机变量 服从自由度为 的 分布,记作 ()。当 时,分布趋近于标准正态分布。实际应用中,当 30时,分布可用标准正态分布近似。第22页/共59页常见的抽样分布(四)分布 1.设随机变量 与 相互独立,且分别服从自由度为 、的 分布,则称随机变量 服从第一自由度为 、第二自由度 为 的 分布,记作 (,)。2.分布对于两个总体的方差比的统计推断问题十分重要,是方差分析等统计推断方法的基础。与前两种分布不同的是 分布不以正态分布为其极限分布,它总是一个正偏分布。第23页/共59页二、样本平均数的抽样分布(一)总体方差 已知时,样本平均数 的抽样分布 定理7-1 设总体 ,()是一个简单随机样本,则有:(,)将样本平均数标准化,即有:(0,1)上述定理说明:样本平均数的数学期望值等于总体平均数,样本平均数的方差等于总体方差除以样本容量,同时也说明了样本平均数抽样分布具有的基本性质。第24页/共59页二、样本平均数的抽样分布(一)总体方差 已知时,样本平均数 的抽样分布 定理7-2中心极限定理:设 是具有期望值 ,方差 的任意总体,则样本平均数的抽样分布将随 的增大而趋于总 体平均数为 ,标准差为 的正态分布,即 渐近服 从 (,)。将这一正态随机变量进行标准化,则有:0,1)*说明:样本无论抽自正态或非正态总体,只要样本容量足够大,在总体平均数 和方差 已知和有限的条件下,样本平均数 的抽样分布就会趋于正态分布。一般认为样本容量 30时,即可用定理7-2作为推断的依据。第25页/共59页二、样本平均数的抽样分布(二)总体方差 未知时,样本平均数 的抽样分布 当总体方差 未知时,可以用样本方差 代替总体方差 ,或用样本标准差 代替总体标准差 ,则有:定理7-3 设总体 ,),()是 其一个简单随机样本,样本平均数为 ,样本标准差 ,则统计量 ()*即当总体方差未知时,样本平均数服从自由度为 的 分布 第26页/共59页三、样本比例(成数)的抽样分布 当从总体中抽取一个容量为 的样本时,样本中具有某种特征的单位数 服从二项分布,即有 ,),且有 ,因此样本比例 也服从二项分布,且有:根据中心极限定理,当 时,二项分布趋近于正态分布。所以,在大样本下,若 和 均大于5,样本 比例近似服从正态分布:第27页/共59页第 三 节 抽样估计的基本方法第28页/共59页一、点估计(一)概念 1.1.点估计 2.2.矩估计 设总体随机变量的分布函数已知,但它的一个或多个参数未知,若从总体中抽取一组样本观察值,以该组数据来估计总体参数,就称为参数的点估计。矩矩估估计计法法是是用用样样本本的的矩矩去去估估计计总总体体的的矩矩,从而获得总体有关参数的估计量的方法。矩是指以期望值为基础定义的数字特征,如数学期望、方差、协方差等。第29页/共59页一、点估计(二)矩估计法的评价 优点:一,计算简便直观,一般不考虑抽样误差和可靠程度 二,适用于对估计准确与可靠程度要求不高的情况 局限性:一,它要求总体矩存在 二,不能充分利用估计时已掌握的有关总体分布的信息第30页/共59页一、点估计(三)应用例题 例例7-17-1 某厂对所生产的电子元件抽取5%进行抽样调查,计算出样本的平均耐用时间=4340小时,样本合格率=98%。根据矩估计法原理,估计该厂所生产的电子元件的平均耐用时间和合格率。解:解:点估计法是用样本指标直接作为总体指标的代表值,所以,全部电子元件的平均耐用时间即为4340小时;总体合格率为98%。第31页/共59页二、区间估计(一)区间估计的概念 根据样本统计量以一定的可靠程度去估计总体参数值所在的范围或区间,是抽样估计的主要方法。(二)抽样估计的置信度与精确度 1.1.置信度:表示区间估计的可靠程度或把握程度,也即所估计的区间包含总体参数真实值的可能性大小,一般以1-表示。其中 表示显著性水平,即某一小概率事件发生的临界水平。置信度通常采用三个标准:(1)显著性水平=0.05,即1-=0.95 (2)显著性水平=0.01,即1-=0.99 (3)显著性水平=0.001,即1-=0.999第32页/共59页(二)抽样估计的置信度与精确度*2.2.抽样估计的精确度:用置信区间的大小即抽样极限/允许误差来表示 3.3.抽样估计的置信度与精确度的矛盾关系 在样本容量和其他条件一定的情况下,若希望抽样估计有较高的可靠度,则必须扩大置信区间,即必须降低估计的精确度;若希望抽样估计有较高的精确度,即置信区间范围缩小,则必须降低估计的把握度。即:抽样估计要求的把握度越高,则抽样允许误差越大,精确度越低;反之则相反。*思考:思考:在抽样调查中,如何同时提高抽样估计的精确度和把握度?第33页/共59页区间估计的应用(一)总体均值的区间估计 1.总体方差已知时 当 ,)时,来自该总体的简单随机样本 的样本均值服从数学期望为 、方差 为的正态分布,将样本均值统计量 标准化,得到 统计量 根据区间估计的定义,在给定的显著性水平 下,总体均值 在 1-的置信度下的置信区间为:(,),即 其中,即抽样平均误差,即抽样允许误差 第34页/共59页1.1.总体方差已知时总体均值的区间估计 例题应用 例例7-3 7-3 某厂生产的零件长度服从正态分布,从该厂生产的零件中随机抽取25件,测得它们的平均长度为30.2厘米。已知总体标准差 =0.45厘米。要求:要求:(1)计算抽样平均误差和抽样允许误差 (2)估计零件平均长度的可能范围(=0.05)已知已知:,),=30.2,=25,1-=0.95,第35页/共59页解题过程 (1)抽样平均误差 查标准正态分布表可知在 =0.05时,=1.96,所以,抽样允许误差 (2)总体均值的置信区间为:(,)=(,)=(30.02,30.38)即我们可以以95%的概率保证该厂零件平均长度在30.02厘米到30.38厘米之间。第36页/共59页2.2.总体方差未知时总体均值的区间估计*总体方差 未知,可以以样本方差 代替,但新的统计量不服从标准正态分布,而是服从自由度为 -1的 分布*给定置信度1-,可查 分布表确定临界值 从而总体均值的置信区间为:(,)其中,即为抽样平均误差 即为抽样允许误差上式也可表示为:第37页/共59页例题应用 例例7-4 7-4 从某市高中生中按不重复抽样方法随机抽取25名调查每周收看电视的时间,分组资料见表7-3。要求:要求:(1)计算抽样平均误差和抽样允许误差 (2)估计该市全体高中生每周平均看电视时间的置信区间(给定的显著性水平为0.05)。第38页/共59页解题过程(一)已知:=25,=0.05样本均值 样本方差 =4.16(1)查 分布表知 =0.05时,临界值 =2.0639,因此,抽样平均误差 抽样允许误差第39页/共59页解题过程(二)(2)总体均值置信度为95%的置信区间为:(,)=(5-0.842,5+0.842)=(4.16,5.84)即我们可以以95%的把握保证该市高中生每周平均看电视时间在4.16到5.84小时之间。第40页/共59页(二)总体比例的区间估计 *在大样本下,样本比例的分布趋近于均值为 、方差为 的正态分布。因此,给定置信度1-,查正态分布 表得 ,则样本比例的抽样极限误差为:所以,总体比例的置信度为1-的置信区间为:第41页/共59页例题分析 例例7-57-5 某厂对一批产成品按不重复抽样方法随机抽选200件进行质量检测,其中一等品160件,试以90%的概率估计一等品率的范围。已知已知:,1-=90%,=200 查表知:=1.645 计算得样本比例的抽样平均误差为:抽样极限误差为:所以,该批产品的一等品比例的置信区间为:即这批产品的一等品率在75.35%到84.66%之间。第42页/共59页(三)总体方差的区间估计*1.大样本情况下,样本标准差 的分布近似服从正态分布 ,所以,总体标准差 的置信度为1-的置信区间近似为:()2.小样本情况下,若总体呈正态分布且其均值和方差未知,则总体方差 的置信区间可由如下统计量的分布来确定:总体方差的置信度为1-的置信区间为:(,)第43页/共59页例题应用 例例7-67-6 从某班学生中随机抽取16人,计算得语文平均成绩为75分,方差为25分。假定学生成绩服从正态分布,试求总体方差及标准差的置信区间(给定的显著性水平为0.05)。解解:已知 =25,=0.05,查 分布表确定两个临界值:=将临界值数字带入上述公式中,总体方差 和标准差的置信度为1-的置信区间分别为:(,),即为(13.64,59.89)(,),即为(3.69,7.74)第44页/共59页(四)两个总体均值之差的区间估计 *设两个正态总体为 ,)、,),方差 、已知,从两个总体中分别抽取容量为 和 的大样本,则样本均值之差服从正态分布,均值为 ,方差为 即 从而可以构造 在置信度为1-水平下的置信区间:第45页/共59页例题应用 例例7-7 7-7 两家公司员工的月平均工资都服从正态分布,现从两公司随机各抽取16名员工组成样本,计算得样本均值分别为3000元和2400元,已知两公司全体职工平均工资的标准差分别为3600元和2800元。要求要求 分别以95%和99%的置信度估计两公司员工平均工资之差的置信区间。解:已知解:已知:,=16 根据上述公式,-的置信区间为 第46页/共59页例题应用(1)当1-=95%时,查表知,置信区间为:即我们以95%的概率保证两公司员工平均工资之差在560.8元到639.2元之间。(2)当1-=99%时,查表知 ,此时的置信区间为:即我们以99%的概率保证两公司员工平均工资之差在548.4元到651.6元之间。第47页/共59页(五)两个总体比例之差的区间估计 *设两个总体的比例分别为 和 ,分别从两个总体中随机抽取容量为 和 的大样本,并计算样本比例 和 ,可以证明,当 和 都很大,从而 5和 5时,-的分布近似服从正态分布,且:因此 -的置信度为1-的置信区间为:由于总体比例未知,以样本比例来代替,上述置信区间为:第48页/共59页例题应用 例例7-87-8对两个高校的在校生参加社会实践的情况进行调查,分别随机抽取了200名学生,其中参加过社会实践的学生比例分别为80%和60%。要求要求 计算两个高校参加过社会实践的学生比例之差的置信区间(=0.05)。解解:由于 =200属于大样本,符合 5和 5的条件,又知:=80%,=60%,1-=95%,查表知 ,故置信区间为:即我们有95%的把握保证两个高校的学生参加过社会实践的比例之差在16.08%到23.92%之间。第49页/共59页第 四 节 抽样调查的组织方式第50页/共59页一、简单随机抽样 (一)概念 (二)评价:简单易行,最符合随机原则,是抽样调查的基本形式 (三)适用情况:当总体单位数不多且分布比较均匀,或总体单位之间数量特征值差异较小,或总体单位有现成的编号时,采用这种方式比较适宜。又称纯随机抽样,是对总体单位不做任何分类或排队,直接从总体中按随机原则抽取样本单位的调查方式第51页/共59页二、类型抽样(一)概念(二)适用情况:总体单位在被研究标志上有明显差异时。(三)遵循原则:分组时应使组内差异尽可能小,组间差异尽可能大。等比例类型抽样(四)种类:不等比例类型抽样 又称分层抽样或分类抽样,是将统计分组和抽样调查结合起来的组织方式。先将总体单位按某一标志分成若干组,然后在各组中采用简单随机抽样或其他方式抽取样本单位。第52页/共59页三、等距抽样(一)概念 无关标志排序抽样:排序的标志与被研究的标志无 关,实质是简单随机抽样。(二)分类 有关标志排序抽样:排序的标志与被研究的标志有 关,有利于提高样本的代表性。(三)评价:抽样误差一般较简单随机抽样小,当被研究现象标志变异程度较大时,更能显示出其优越性。但有可能产生系统性误差。又称机械抽样或系统抽样,它是先将总体各单位按某一标志顺序排列,然后按照固定的顺序和相同的间隔抽取样本单位的抽样组织方式。第53页/共59页四、整群抽样(一)概念(二)整群抽样与类型抽样的区别 类型抽样划分的组称为“类”,作用是缩小总体,使总体的变异减少,而抽取的基本单位仍是总体单位;整群抽样划分的组称为“群”,作用是扩大单位,抽取的基本单位不是总体单位而是群,从而简化抽样工作程序。(三)评价 样本单位集中于群内,显著地影响了总体单位分配的均匀性。与其他方式相比,在相同的条件下,抽样误差较大,代表性较低。又称分群抽样或集团抽样,是将总体划分为若干群,然后以群为单位按简单随机抽样或等距抽样方式抽取部分群,对中选群中的所有单位一一调查的抽样组织方式。第54页/共59页五、多阶段抽样(一)概念(二)优点 1.便于组织抽样 2.可以获得各阶段单元的调查资料 3.方式灵活 4.抽样单位的分布较广,降低抽样误差 (三)适用情况 当总体单位很多且分布广泛,几乎不可能从总体中直接抽取总体单位时,常采用多阶段抽样。多阶段抽样又称为多级抽样,它是将抽取样本单位的过程划分为几个阶段,然后逐阶段抽取样本单位的抽样组织方式。第55页/共59页本章小结(一)抽抽样样和和抽抽样样估估计计:是在抽样调查的基础上,利用样本资料计算样本指标,据以对总体特征值做出有一定可靠程度的估计和判断。抽样估计涉及的概念抽样估计涉及的概念:总体和样本 概率抽样和非概率抽样 重复抽样和不重复抽样 抽样框 总体参数和样本统计量 抽样误差(抽样平均误差、抽样极限误差等概念需深入领会和重点掌握)第56页/共59页本章小结(二)抽样估计方法抽样估计方法 点估计和区间估计。其中区间估计是主要方法。应理解置信区间、置信度、显著性水平的含义,领会区间估计精确度和可靠度之间的关系,重点掌握总体均值和总体比例的区间估计方法。抽样调查的组织方式抽样调查的组织方式 简单随机抽样、类型抽样、等距抽样、整群抽样和多阶段抽样等,应根据研究目的和研究对象的特点,选择合适的抽样组织方式。第57页/共59页 END第58页/共59页感谢您的观看!第59页/共59页

    注意事项

    本文(第七 抽样与抽样估计.pptx)为本站会员(莉***)主动上传,得力文库 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知得力文库 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于得利文库 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

    © 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

    黑龙江省互联网违法和不良信息举报
    举报电话:0468-3380021 邮箱:hgswwxb@163.com  

    收起
    展开