抽样与抽样估计 (2)讲稿.ppt
《抽样与抽样估计 (2)讲稿.ppt》由会员分享,可在线阅读,更多相关《抽样与抽样估计 (2)讲稿.ppt(78页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、关于抽样与抽样估计(2)第一页,讲稿共七十八页哦一、抽样调查一、抽样调查的概念和特点的概念和特点1 1、概念、概念:抽样调查抽样调查是按是按随机原则随机原则从全部研究对象中从全部研究对象中抽取部分单位进行观察,并根据样本的实抽取部分单位进行观察,并根据样本的实际数据对总体的际数据对总体的数量特征数量特征作出具有一定作出具有一定可可靠程度靠程度的估计和判断的估计和判断。只抽取部分单位进行调查只抽取部分单位进行调查。1 1 抽样调查抽样调查的一般问题的一般问题第二页,讲稿共七十八页哦2 2、特点、特点(1)抽样调查抽样调查建立在随机取样的基础上建立在随机取样的基础上。(2)(2)它是由部分推断整体
2、的一种认识方法它是由部分推断整体的一种认识方法。(3)抽样调查抽样调查的误差可以事先计算并加以控的误差可以事先计算并加以控制。制。第三页,讲稿共七十八页哦3 3、抽样调查的适用范围、抽样调查的适用范围抽抽样调查方法是市场经济国家在调查样调查方法是市场经济国家在调查方法上的必然选择,和普查相比,它具有方法上的必然选择,和普查相比,它具有准确度高、成本低、速度快、应用面广等准确度高、成本低、速度快、应用面广等优点。优点。第四页,讲稿共七十八页哦1.1.实实际工作不可能进行全面调查观察,而又需际工作不可能进行全面调查观察,而又需要了解其全面资料的事物;要了解其全面资料的事物;2.2.虽虽可进行全面调
3、查观察,但比较困难或并不必可进行全面调查观察,但比较困难或并不必要;要;3.3.对对普查或全面调查统计资料的质量进行检查和修普查或全面调查统计资料的质量进行检查和修正;正;4.4.抽抽样方法适用于对大量现象的观察,即组成样方法适用于对大量现象的观察,即组成事物总体的单位数量较多的情况;事物总体的单位数量较多的情况;5.5.利利用抽样推断的方法,可以对于某种总体的假用抽样推断的方法,可以对于某种总体的假设进行检验,判断这种假设的真伪,以决定取舍设进行检验,判断这种假设的真伪,以决定取舍。一般适用于以下范围:一般适用于以下范围:第五页,讲稿共七十八页哦三、有关抽样的基本概念三、有关抽样的基本概念(
4、一)总体和样本(一)总体和样本总体:总体:也称全及总体。指所要认识的研究对也称全及总体。指所要认识的研究对象全体。总体单位总数用象全体。总体单位总数用“N N”表示。表示。样本:样本:也称抽样总体,是抽出的单位组成的也称抽样总体,是抽出的单位组成的整体。样本单位总数用整体。样本单位总数用“n n”表示。表示。二、抽样推断的内容二、抽样推断的内容参数估计参数估计假设检验假设检验第六页,讲稿共七十八页哦(二)参数和统计量(二)参数和统计量1 1、针对总体计算的指标叫总体参数,也叫全及指、针对总体计算的指标叫总体参数,也叫全及指标。标。2 2、针对样本计算的指标为统计量,也叫估计量、针对样本计算的指
5、标为统计量,也叫估计量,也也叫抽样指标。叫抽样指标。参数的值是定值参数的值是定值常用的参数有:总体平均数、总体成数常用的参数有:总体平均数、总体成数P P、总体标准、总体标准差差其值随样本的不同而不同,是个随机变量。其值随样本的不同而不同,是个随机变量。抽样估计就是通过统计量的值去估计参数的值。抽样估计就是通过统计量的值去估计参数的值。常用的统计量有:样本平均数、样本成数常用的统计量有:样本平均数、样本成数p p、样本、样本标准差标准差S S第七页,讲稿共七十八页哦 1N0NNNP1第八页,讲稿共七十八页哦 。n1nnnp1%1P%3p第九页,讲稿共七十八页哦XnxxPnnp12 xp2ss第
6、十页,讲稿共七十八页哦nxnxxxxn21fxfffffxfxfxxnnn212211ffxffxffxffxinnii2211或第十一页,讲稿共七十八页哦NXXNii122)(KiiKiiiFFXX1122)(NXXNii12)(KiiKiiiFFXX112)(第十二页,讲稿共七十八页哦nxxs22)(ffxxs22)(nxxs2)(ffxxs2)(ffxxs22)(ffxxs2)(第十三页,讲稿共七十八页哦利用样本统计量对总体某些性利用样本统计量对总体某些性质或数量特征进行推断。质或数量特征进行推断。随机原则随机原则总体参数总体参数统计量统计量推断估计推断估计参数估计参数估计检验检验假设检
7、验假设检验抽样分布抽样分布第十四页,讲稿共七十八页哦(三)样本容量和样本个数(三)样本容量和样本个数1 1、样本容量:、样本容量:一个样本包含的单位数。用一个样本包含的单位数。用 “n n”表示。一般要求表示。一般要求 n n 30302 2、样本个数:、样本个数:从一个全及总体中可能抽取从一个全及总体中可能抽取的样本数目。的样本数目。第十五页,讲稿共七十八页哦(四)重复抽样和不重复抽样(四)重复抽样和不重复抽样1 1、重复抽样:也叫放回抽样。、重复抽样:也叫放回抽样。2 2、不重复抽样:也叫无放回抽样。、不重复抽样:也叫无放回抽样。一个单位可能中选多次一个单位可能中选多次每次抽单位,概率固定
8、,都为每次抽单位,概率固定,都为1/N1/N。一个单位最多中选一次一个单位最多中选一次每次抽单位,概率不同,逐渐增加每次抽单位,概率不同,逐渐增加第十六页,讲稿共七十八页哦(五五)、概率抽样与非概率抽样、概率抽样与非概率抽样1、概率抽样:也叫随机抽样,是指按照随机原、概率抽样:也叫随机抽样,是指按照随机原则抽取样本。概率抽样最基本的组织方式有:则抽取样本。概率抽样最基本的组织方式有:简单随机抽样、分层抽样、等距抽样和整群抽简单随机抽样、分层抽样、等距抽样和整群抽样。样。2、非概率抽样:也叫非随机抽样,是指从研、非概率抽样:也叫非随机抽样,是指从研究目的出发,根据调查者的经验或判断,从究目的出发
9、,根据调查者的经验或判断,从总体中有意识地抽取若干单位构成样本。重总体中有意识地抽取若干单位构成样本。重点调查、典型调查、配额调查等属于非随机点调查、典型调查、配额调查等属于非随机抽样。抽样。第十七页,讲稿共七十八页哦(六)、抽样框(六)、抽样框 1 1、抽样框是包括全部抽样单位的名单框架。编制抽、抽样框是包括全部抽样单位的名单框架。编制抽样框是实施抽样的基础。抽样框的好坏通常会直接样框是实施抽样的基础。抽样框的好坏通常会直接影响到抽样调查的随机性和调查的效果。影响到抽样调查的随机性和调查的效果。2 2、抽样框主要有三种形式:、抽样框主要有三种形式:名单抽样框,即列出全部总体单位的名录一览表名
10、单抽样框,即列出全部总体单位的名录一览表,如职工名单、企业名单等。,如职工名单、企业名单等。区域抽样框,即按地理位置将总体范围划分为若区域抽样框,即按地理位置将总体范围划分为若干小区域,以小区域为抽样单位。如对某市居民住房干小区域,以小区域为抽样单位。如对某市居民住房情况进行调查,将全市居民户划分为若干街道或片区情况进行调查,将全市居民户划分为若干街道或片区。第十八页,讲稿共七十八页哦3 3、一个理想的抽样框应该与目标总体一致,即应包括、一个理想的抽样框应该与目标总体一致,即应包括全部总体单位,既不重复,也不遗漏(穷尽与互斥)。全部总体单位,既不重复,也不遗漏(穷尽与互斥)。若有遗漏,易造成系
11、统性误差。若有遗漏,易造成系统性误差。在实践中,要取得与目标总体完全一致的抽样框往往在实践中,要取得与目标总体完全一致的抽样框往往很困难,甚至不可能,常常只能采用与目标总体近似很困难,甚至不可能,常常只能采用与目标总体近似的抽样框。的抽样框。时间表抽样框,即将总体全部单位按时间顺序排列时间表抽样框,即将总体全部单位按时间顺序排列,把总体的时间过程分为若干个小的时间单位,以此时,把总体的时间过程分为若干个小的时间单位,以此时间单位为抽样单位。如对流水线上间单位为抽样单位。如对流水线上2424小时内生产的产品小时内生产的产品进行质量抽查时,以进行质量抽查时,以5 5分钟为一个抽样单位,可将全部分钟
12、为一个抽样单位,可将全部产品分为产品分为288288个抽样单位并按时间顺序排列。个抽样单位并按时间顺序排列。第十九页,讲稿共七十八页哦(七)、抽样误差(七)、抽样误差统计调查的误差,是指调查所得结果与总体真实统计调查的误差,是指调查所得结果与总体真实值之间的差异。在抽样调查中,误差的来源有登值之间的差异。在抽样调查中,误差的来源有登记性误差和代表性误差两大类。记性误差和代表性误差两大类。登登记记误误差差系系统统性性误误差差统统计计误误差差代代表表性性误误差差实实际际误误差差随随机机误误差差抽抽样样平平均均误误差差第二十页,讲稿共七十八页哦(1 1)登记性误差,指在调查和汇总过程中)登记性误差,
13、指在调查和汇总过程中由于测量、登记、计算等方面的差错或被调由于测量、登记、计算等方面的差错或被调查者提供虚假资料而造成的误差。它在任何查者提供虚假资料而造成的误差。它在任何调查中均存在。而且调查范围越大,调查单调查中均存在。而且调查范围越大,调查单位越多,产生登记性误差的可能性也越大。位越多,产生登记性误差的可能性也越大。(2 2)代表性误差,指样本推断总体时,由于)代表性误差,指样本推断总体时,由于样本结构与总体结构不一致而产生的误差。又样本结构与总体结构不一致而产生的误差。又分系统误差与随机误差两种。分系统误差与随机误差两种。第二十一页,讲稿共七十八页哦随机误差也叫偶然误差。它是由偶然随机
14、误差也叫偶然误差。它是由偶然性因素引起的代表性误差。它不可避免性因素引起的代表性误差。它不可避免,但可计算与控制。抽样估计中的抽样,但可计算与控制。抽样估计中的抽样误差,就是指这种随机误差。误差,就是指这种随机误差。在计算抽样误差时,常常假设不存在登记性在计算抽样误差时,常常假设不存在登记性误差和系统误差误差和系统误差系统误差是非随机因素引起的误差,它系统系统误差是非随机因素引起的误差,它系统性偏高或偏低,也称偏差。性偏高或偏低,也称偏差。第二十二页,讲稿共七十八页哦2 2 抽样平均误差抽样平均误差一、抽样误差的概念一、抽样误差的概念1 1、抽样误差是指由于抽样的随机性而产生的、抽样误差是指由
15、于抽样的随机性而产生的那一部分代表性误差(随机性误差),不包括那一部分代表性误差(随机性误差),不包括 登记性误差,也不包括可能发生的偏差。登记性误差,也不包括可能发生的偏差。主要有两主要有两种种:实际抽样误差实际抽样误差,抽样平均误差。抽样平均误差。(1 1)实际抽样误差:指某一样本指标与总体参数)实际抽样误差:指某一样本指标与总体参数之间的离差之间的离差例例8 8-2-1-2-1:从从1 1、2 2、3 3中抽中抽2 2个(重复),参个(重复),参数取总体平均数数取总体平均数 (等于(等于2 2),则实际抽),则实际抽样误差如下:样误差如下:X第二十三页,讲稿共七十八页哦样本样本 样本统计
16、量样本统计量实际抽样误差实际抽样误差(-)(1 1、1 1)1 1-1-1(1(1、2 2)1.51.5-0.5-0.5(1 1、3 3)2 20 0(2 2、1 1)1.51.5-0.5-0.5(2 2、2 2)2 20 0(2 2、3 3)2.52.50.50.5(3 3、1 1)2 20 0(3 3、2 2)2.52.50.50.5(3 3、3 3)3 31 1xxxX第二十四页,讲稿共七十八页哦(2)(2)抽样平均误差:指样本指标的标准差。抽样平均误差:指样本指标的标准差。抽样实际误差是无法知道的,而抽样平均误差抽样实际误差是无法知道的,而抽样平均误差可以计算。可以计算。在讨论抽样误差
17、时,通常指抽样平均误差在讨论抽样误差时,通常指抽样平均误差要计算抽样平均误差,得从抽样分布谈起要计算抽样平均误差,得从抽样分布谈起二、抽样分布及抽样平均误差的计算二、抽样分布及抽样平均误差的计算 抽样分布是指样本指标的概率分布,由样抽样分布是指样本指标的概率分布,由样本指标的可能取值与之相应的频数或频率组成本指标的可能取值与之相应的频数或频率组成。第二十五页,讲稿共七十八页哦 对于抽样分布,可计算其均值和方差等来反对于抽样分布,可计算其均值和方差等来反映该分布的中心和离散趋势。映该分布的中心和离散趋势。(一)抽样分布的集中趋势与离中趋势的测定(一)抽样分布的集中趋势与离中趋势的测定 A A、样
18、本平均数的抽样分布的集中趋势与离、样本平均数的抽样分布的集中趋势与离中趋势的测定中趋势的测定 1 1、把所有可能样本的平均数及其相应的频数或、把所有可能样本的平均数及其相应的频数或频率排列起来,就是样本平均数的抽样分布。频率排列起来,就是样本平均数的抽样分布。通常计算这一分布的均值和标准差,分别反映样通常计算这一分布的均值和标准差,分别反映样本平均数分布的集中趋势与离中趋势。本平均数分布的集中趋势与离中趋势。第二十六页,讲稿共七十八页哦2 2、例、例8 8-2-2-2-2:从从4 4、6 6、8 8三个数中按重复抽样抽三个数中按重复抽样抽2 2个,个,调查其平均数,形成的抽样分布如下:调查其平
19、均数,形成的抽样分布如下:样本样本样本平均数样本平均数频数频数(4、4)41(4、6)(6、4)52(4、8)(6、6)(8、4)63(6、8)(8、6)72(8、8)81x第二十七页,讲稿共七十八页哦平均数平均数:xE32118273625146954计算该分布的平均数和标准差,得计算该分布的平均数和标准差,得 标准差标准差:x912212112222234而总体平均数和标准差分别为:而总体平均数和标准差分别为:X638643222238第二十八页,讲稿共七十八页哦所以,可得以下两点结论:(重复)所以,可得以下两点结论:(重复)样本平均数的平均数等于总体平均数。样本平均数的平均数等于总体平均
20、数。抽样平均数的标准差仅为总体标准差的抽样平均数的标准差仅为总体标准差的n13 3、样本平均数的标准差即是平均数的抽样样本平均数的标准差即是平均数的抽样平均误差平均误差)(x第二十九页,讲稿共七十八页哦在实际中,不可能一一列举所有可能的样本,从而不在实际中,不可能一一列举所有可能的样本,从而不能按上述方法计算。可利用上述第个结论计算,即能按上述方法计算。可利用上述第个结论计算,即:重复抽样重复抽样时:时:xnn2不重复抽样不重复抽样时:时:x)1(21NnnNnn第三十页,讲稿共七十八页哦 2S第三十一页,讲稿共七十八页哦4 4、例、例8 8-2-3-2-3:用简单重复抽样的方法,从用简单重复
21、抽样的方法,从660660个工厂中个工厂中抽取抽取3333个工厂调查月产值情况,得资料如下,试求月产个工厂调查月产值情况,得资料如下,试求月产值的抽样平均误差。值的抽样平均误差。月产值(万元)月产值(万元)工厂数工厂数 0-10 0-10 20 20 10-20 10-20 9 9 20-30 20-30 2 2 30-40 30-40 2 2第三十二页,讲稿共七十八页哦解解xfxf33235225915205=10.76 ffxx2332292024.2424.1424.476.5222291.72xn)(49.13391.72万元(万元)(万元)第三十三页,讲稿共七十八页哦B B、样本成数
22、的抽样分布的集中趋势与离中趋势、样本成数的抽样分布的集中趋势与离中趋势的测定的测定1 1、把所有可能样本的成数及其相应的频、把所有可能样本的成数及其相应的频数或频率排列起来,就是样本成数的抽样数或频率排列起来,就是样本成数的抽样分布。分布。通常计算这一分布的均值和标准差,分别反映通常计算这一分布的均值和标准差,分别反映样本成数分布的集中趋势与离中趋势。样本成数分布的集中趋势与离中趋势。第三十四页,讲稿共七十八页哦2 2、例、例8 8-2-4-2-4:从张(男)、王(男)、田(女):从张(男)、王(男)、田(女)三个人中按重复抽样抽三个人中按重复抽样抽2 2个,调查其男性比重,形个,调查其男性比
23、重,形成的抽样分布如下成的抽样分布如下 样本样本样本成数样本成数(p p)频数频数(张、张)(张、王)(张、张)(张、王)(王、张)(王、王)(王、张)(王、王)1 14 4(张、田)(张、田)(王、田)(王、田)(田、张)(田、王)(田、张)(田、王)1/21/24 4(田、田)(田、田)0 01 1第三十五页,讲稿共七十八页哦平均数:平均数:pE14410421413296计算该分布的平均数和标准差,得计算该分布的平均数和标准差,得 标准差:标准差:p914432613122291而总体成数和标准差分别为:而总体成数和标准差分别为:P32)(PP192第三十六页,讲稿共七十八页哦所以,可得
24、以下两点结论:(重复)所以,可得以下两点结论:(重复)样本成数的平均数等于总体成数。样本成数的平均数等于总体成数。抽样成数的标准差仅为总体成数标准差的抽样成数的标准差仅为总体成数标准差的n13 3、样本成数的标准差即是成数的抽样平均误样本成数的标准差即是成数的抽样平均误差差在实际中,不可能一一列举所有可能的样本在实际中,不可能一一列举所有可能的样本,从而不能按上述方法计算。可利用上述第,从而不能按上述方法计算。可利用上述第个结论计算,即:个结论计算,即:)(p第三十七页,讲稿共七十八页哦重复抽样重复抽样时:时:不重复抽样不重复抽样时:时:nppp1Nnnppp11当总体成数未知时,可用当总体成
25、数未知时,可用4 4种方法取得:种方法取得:样本资料、历史资料、小规模调查资料、估计样本资料、历史资料、小规模调查资料、估计资料资料4 4、例、例6-2-56-2-5:一批:一批8 8瓦的日光灯管瓦的日光灯管8000080000只,从中抽只,从中抽取取400400只检验,发现有只检验,发现有1212只不合格,试求合格率的抽只不合格,试求合格率的抽样平均误差。样平均误差。第三十八页,讲稿共七十八页哦解:解:样本合格样本合格率率 p40012400%97重复抽样重复抽样时:时:不重复抽样不重复抽样时:时:nppp1Nnnppp1140003.097.0=0.853%=0.853%)(8000040
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样与抽样估计 2讲稿 抽样 估计 讲稿
限制150内