抽样调查的基本概念与理论依据.pptx
《抽样调查的基本概念与理论依据.pptx》由会员分享,可在线阅读,更多相关《抽样调查的基本概念与理论依据.pptx(57页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、1抽样调查的意义2抽样调查的基本概念和理论依据3抽样平均误差4抽样推断5必要抽样单位数的确定一、抽样调查的概念、特点(一)、概念: 抽样调查是按照随机原则随机原则从全部研究对象中抽取一部分单位进行观察,并依据所获得的数据对全部研究对象的数量特征数量特征做出具有一定可靠性可靠性的估计判断,从而达到对全部研究对象的认识的一种统计方法。根据部分实际资料对全部总体的数量特征做出估计。按随机的原则从全部总体中抽取样本单位。抽样推断的抽样误差可以事先计算并且加以控制。对某些不可能进行全面调查而又要了解其全面情况的社会经济现象,必须应用抽样调查。对某些社会经济现象虽然可以进行全面调查,但抽样调查可以节约时间
2、、费用,提高调查的时效性。抽样调查和全面调查同时进行,可以发挥相互补充和检查质量的作用。抽样调查可以用于工业生产过程的质量控制。利用抽样调查原理,还可以对某种总体的假设进行检验,来判断这种假设的真伪,以决定行动的取舍。一、总体与样本(一)、总体与总体指标总体:总体:是根据研究目的确定的所要研究的同类事物的全体。总体单位数称为总体容量,一般用N 表示。总体指标:总体指标:用来反映总体数量特征的指标。(二)、样本与样本指标样本:样本:从总体中抽取的部分总体单位所构成的整体。样本所包含的总体单位个数称为样本容量,一般用n表示。在实际工作中,人们通常把n30的样本称为大样本,而把 n30的样本称为小样
3、本。样本指标:样本指标:是根据样本资料计算的、用于估计和推断相应总体指标的综合指标。211iPPXFFXXFFXX FFNXPNPP 总体指标:或211ippxffxxffxxfsfnxpnspp 样本指标:或() 概率抽样:也叫随机抽样,是指按照随机原则抽取样本。概率抽样最基本的组织方式有:简单随机抽样、分层抽样、等距抽样和整群抽样。 非概率抽样:也叫非随机抽样,是指从研究目的出发,根据调查者的经验或判断,从总体中有意识地抽取若干单位构成样本。重点调查、典型调查、配额调查等属于非随机抽样。(但由于非随机抽样的效果取决于调查者的经验、主观判断和专业知识,故难免掺杂调查者的主观偏见,出现因人而异
4、的结果,且容易产生倾向性误差;此外,非随机抽样不能计算和控制其抽样误差,无法说明调查结果的可靠程度。)随机原则:就是排除主观意愿的干扰,使总体的每个单位都有一定随机原则:就是排除主观意愿的干扰,使总体的每个单位都有一定的概率被抽选为样本单位,每个总体单位能否选入样本是随机的。的概率被抽选为样本单位,每个总体单位能否选入样本是随机的。抽样框的主要形式有三种:1、名单抽样框:即列出全部总体单位的名录一览表,如职工名单、企业名单等。2、区域抽样框:即按地理位置将总体范围划分为若干小区域,以小区域为抽样单位。3、时间表抽样框:即将总体全部单位按时间顺序排列,把总体的时间过程分为若干个小的时间单位,以此
5、时间单位为抽样单位。 误 差登记性误差代表性误差系统性误差随机性误差登记性误差是指在调查和汇总过程中由于观察、测量、登记、计算等方法的差错或被调查者提供虚假资料而造成的误差。任何一种统计调查都可能产生登记性误差。代表性误差是指用样本指标推断总体指标时,由于样本结构与总体结构不一致、样本不能完全代表总体而产生的误差。系统性误差是指由于非随机因素引起的样本代表性不足而产生的误差,表现为样本估计量的值系统偏低或偏高。随机性误差又称偶然性误差,是指遵循随机原则抽样,由于随机因素(偶然性因素)引起的误差。抽样估计中的所谓抽样误差,就是指的这种随机误差。 样本的可能数目既和样本的容量有关,也和抽样的方法有
6、关。根据取样方式的不同,抽样方法有重复抽样和不重复抽样两种。1、重复抽样:是指从总体的N个单位中抽取一个容量为n的样本,每次抽出一个单位后,再将其放回总体中参加下一次抽取,这样连续抽n次即得到一个样本。2、不重复抽样:是指抽中单位不再放回总体中,下一个样本单位只能从余下的总体单位中抽取。重复抽样:同一总体单位有可能被重复抽中;每个总体单位在每次抽样中被抽中的概率都是相同的。抽样误差较大。不重复抽样:同一总体单位不可能被重复抽中;由于每次抽取是在不同数目的总体单位中进行,每个总体单位在各次抽样中被抽中的概率不相等。抽样误差较小。1、考虑顺序的抽样:即从总体N 中抽取n个单位构成样本,不但要考虑样
7、本各单位的不同性质,而且还考虑不同性质各单位的中选顺序。相同构成成分的单位,由于顺序不同,也作为不同样本。2、不考虑顺序的抽样:即从总体N个单位抽取n个单位构成样本。只考虑样本各单位的组成成分如何,而不考虑单位的抽样顺序。如果样本的成分相同,不论顺序有多大不同,都作为一种样本。考虑顺序的不重复抽样数目考虑顺序的重复抽样数目不考虑顺序的不重复抽样数目不考虑顺序的重复抽样数目!nNNANnnnNBN!nNNCnNn1nnNN nDC 考虑顺序的重复抽样数目不考虑顺序的不重复抽样数目2416()nnNBN个!4!4 3 2 16()!2! 42 !2 2nNNCnNn 个 考虑顺序的重复组合:AA
8、BA CA DAAB BB CB DBAC BC CC DCAD BD CD DD 不考虑顺序的不重复抽样数目AB BC CDAC BDAD大数法则:大数法则:关于大量的随机现象具有稳定性质的法则。中心极限定理:中心极限定理:如果总体变量存在有限的平均数和方差,那么不论这个总体变量的分布如何,随着抽样单位数n的增加,抽样平均数的分布便趋近于正态分布。 现象的某种总体规律只有当具有这些现象足够多数的单位汇总综合在一起的时候,才能显示出来。因此只有从大量现象的总体中,才能研究这些现象的规律性。 现象的总体性规律,通常是以平均数的形式表现出来。 所研究的现象总体包含的单位愈多,平均数也就越能够正确地
9、反映出这些现象的规律性。 各单位的共同倾向(这些表现为主要的、基本的因素)决定着平均数的水平;而单位对平均数的离差(这些表现为次要的、偶然的因素)则由于足够多数单位的汇总综合的结果,而相互抵消,趋于消失。 随着抽样单位数n的增加,抽样平均数x有接近总体平均数X的趋势。lim1inPxX 抽样平均数与总体平均数的离差究竟有多大?离差不超过一定范围的概率究竟有多少?这个离差的分布怎样? 要解决这些问题,就要依靠中心极限定理要解决这些问题,就要依靠中心极限定理。 在现实生活中,一个随机变量服从于正态分布未必很多,但多个随机变量和的分布趋近于正态分布则普遍存在的。 抽样平均数也是一种随机变量和的分布,
10、因此在抽样单位数 n充分大的条件下,抽样平均数也趋近于正态分布,这为抽样误差的概率估计提供了一个极为有效而且方便的条件。一、抽样实际误差:二、抽样平均误差:是抽样平均数(或抽样成数)的标准差。它反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的平均误差程度。xX2ixxX样本可能数目(一)、抽样估计的特点:抽样估计是在逻辑上运用归纳推理而不是运用演绎推理。抽样估计是在方法上运用不确定的概率估计法而不是确定的数学分析法。抽样估计的估计结论存在着一定的抽样误差。无偏性:用抽样指标估计总体指标要求抽样指标的平均数等于被估计的总体指标。一致性:随着样本的单位数n的无限增大,抽样指标和未知的总体指
11、标之间的绝对离差为任意小的可能性也趋于必然性。有效性:用抽样指标估计总体要求作为优良估计量的方差应该比其它估计量的方差小。 E xX lim1lim1nnP xE xP xX序号样本变量(x)样本平均数平均数离差离差平方1(A、A)40、4040-204002 (A、B)40、5045-152253 (A、C)40、7055-5254 (A、D)40、8060005 (B、A)50、4045-152256 (B、B)50、5050-101007 (B、C)50、7060008 (B、D)50、80655259 (C、A)70、4055-52510 (C、B)70、50600011 (C、C)7
12、0、70701010012 (C、D)70、80751522513 (D、A)80、40600014 (D、B)80、506552515 (D、C)80、70751522516 (D、D)80、808020400合计9602000ix元)(604)80705040(X 22:9606016:20001611.18:240604:100015.81()4ixE xxXXXNXXN样本平均数的平均数样本可能数目(元)抽样平均误差样本可能数目(元)总体平均数(元)总体标准差元 举例说明抽样平均误差的意义:设有4个工人,各人的工资水平分别是40、50、70、80元,现采用不重复抽样方法随机从中抽取2人
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样调查 基本概念 理论依据
限制150内