抽样技术-第7章.pptx
《抽样技术-第7章.pptx》由会员分享,可在线阅读,更多相关《抽样技术-第7章.pptx(61页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、第七章第七章 其他抽样方法其他抽样方法第一节 二重抽样第二节 捕获再捕获抽样第三节 电话调查抽样2022-4-2417.1二重抽样二重抽样n一、概述一、概述 二重抽样(double sampling),也称二相抽样或两相抽样(two-phase sampling),是指在抽样时分两步抽取样本,每一步抽取一个样本。 一般情况下,先从总体N中抽取一个较大的样本n,称为第一重(相)样本,对之进行调查以获取总体的某些辅助信息,为下一步的抽样估计提供条件。然后进行第二重(相)抽样,第二重抽样所抽的样本n相对较小,但是第二重抽样调查才是主调查。一般地,第二重样本是从第一重样本中抽取的,即第一重样本的子样本
2、,但有时也可以从总体中独立抽取。由于样本是分两次抽取的,因此称为二重抽样。二重抽样与两阶段抽样二重抽样与两阶段抽样n二者都可被视为分阶段抽样方法;n差异差异:n两阶段抽样两阶段抽样是先从总体N个单元(初级单元)中抽出n个样本单元,却并不对这n个样本单元中的所有小单元(二级单元)都进行调查;二重抽样二重抽样则不同,要对第一重(相)样本进行调查以获取总体的某些辅助信息。n两阶段抽样两阶段抽样的第一阶段抽样单位和第二阶段抽样单位往往是不同的;而二重抽样二重抽样的第二重样本则往往是第一重样本的子样本。二、为分层的二重抽样二、为分层的二重抽样1、符号说明、符号说明用下标h表示层数,h=1,2,LNh:总
3、体第 h层的单元数;总体单元数 N= Nhnh:第一重样本第 h层的单元数;第一重样本单元数 n= nhnh:第二重样本第 h层的单元数;第二重样本单元数 n= nhWh= :总体单元第 h层的权重wh= :第一重样本第 h层的权重fhD= :第二重样本第 h层的抽样比, 0fhD1yhj:第二重样本第 h层 j单元的观测值,j=1,2,nh;h=1,2,L 2.抽样方法抽样方法 3.估计量及其性质估计量及其性质定理定理7.1证明证明定理定理7.2定理定理7.2 证明证明【例例7.1】 某银行要调查其客户的资产情况。已知该银行的客户数为8000,针对客户规模差异较大的特点,拟采用分层抽样。但由
4、于缺乏现有的分层资料,决定采用二重分层抽样方法,第一重样本量 n=1 000,根据其自报的资产情况可分为4层:第一层为300万元以下;第二层为300万元1 000万元;第三层为1 000万元2 000万元;第四层为2 000万元以上。然后在第一重样本分层的基础上,在各层分别抽取第二重样本。第二重样本量 n=nh=200。通过对这200位客户进行详细的调查,取得有关数据整理如表71,试估计该银行所有客户的资产总额及其抽样标准误差。n表71某银行客户的样本数据 4.二重分层抽样样本量的最优分配二重分层抽样样本量的最优分配n二重分层抽样中有两次抽样,这两次抽样的样本量,即 n和 n,直接影响估计的精
5、度。n第一重抽样 n越大,对分层信息的了解和估计就越精确,从而可以减少估计量的方差;同样,第二重抽样 n越大,估计量的方差越小。n调查经费是有限的,因此需要在给定的费用条件下,选择 n和 n,使得估计量的方差 V( )最小。 5.在无回答中的应用在无回答中的应用n该偏差取决于无回答层占总体的比例以及回答层和无回答层的差异。n使用二重抽样方法对无回答样本进行二次抽样调查,其估计量优于仅根据回答数据的估计量,如果对无回答层的二重抽样中能得到完全回答,甚至可以消除无回答偏差。n关于二重抽样对无回答数据的调整估计量参见第10章的相关内容。三、为比率的二重抽样三、为比率的二重抽样1.二重抽样比估计的抽样
6、方法二重抽样比估计的抽样方法2.二重抽样的比估计及其性质二重抽样的比估计及其性质【例7.2】n某住宅小区共有200个住户,现欲估计小区住户家庭月平均收入的平均水平。家庭收入的数据不易调查,而家庭支出的资料相对容易获取,而且家庭月平均收入与家庭月平均支出之间强相关,因此拟采用二重抽样比估计方法。先从住户中随机抽取100个住户作为第一重样本,调查家庭月平均支出,结果家庭月平均支出的样本均值为1 500元;然后从这100个住户中随机抽选10户作为第二重样本,调查家庭月平均收入和家庭月平均支出,资料见表72。试估计该小区家庭月平均收入,并计算估计量标准误差。 3.二重抽样比估计时样本量的最优分配二重抽
7、样比估计时样本量的最优分配7.2 捕获再捕获抽样捕获再捕获抽样n一、捕获再捕获估计一、捕获再捕获估计 捕获再捕获抽样的基本思想捕获再捕获抽样的基本思想是从总体中抽取一个样本,将样本的每个个体标识(作标记或加标签) 后释放回总体中,经过一段时间的充分混合后,再从总体中抽取一个样本,此时,该样本将包括已标识的和未标识的个体,利用这两个样本的信息对总体数量做估计。 该方法实际上是两阶段抽样方法两阶段抽样方法。n彼德森(Peterson,1896)首先提出了捕获再捕获抽样方法,并将该方法用于野生动物的数量研究中。n施纳贝尔(Schnabel,1938)将此方法扩展到多样本情形,即对第二次捕获的个体标识
8、后再释放回总体中,进行第三次抽样。这种方法计算比较简单,精确度也较高,因而得到广泛的应用。以捕鱼的例子进行说明以捕鱼的例子进行说明n假如我们想估计湖中鱼的数量N。一个方法是从湖中捕获200条鱼做上标记后放回湖中,让它们与湖中未作标记的鱼混合。然后,从湖中再捕获100条鱼,这次与第一次捕获是相互独立的。假设第二次捕获的鱼中有20条是已经做了标记的,同时假定两次捕获中间湖中鱼的总体没有发生变化,且每次从湖中捕鱼都是简单随机抽样,那么就可以得到这样的估计:湖中的鱼有20%做了标记,这就相当于那200条作了标记的鱼近似代表了湖中鱼总体的20%。因此N的估计值就近似等于1000。n这种方法依赖于以下假定
9、这种方法依赖于以下假定:n(1)总体是封闭的两次抽样间没有鱼进入或离开该湖。即对每次抽样而言,N是相同的。n(2)每个样本都是来自总体的简单随机抽样,即湖中每条鱼都有同样的机会被捕获。n(3)两个样本是独立的。即第一次捕获并被作了标记的鱼被放回湖中后跟总体再次混合,标记与否跟第二次被捕获的概率没有关系。n(4)鱼不会丢失其标记,从而有标记的鱼可以被识别。二、应用二、应用:美国人口普查局的美国人口普查局的PES方法方法n美国人口普查局在10年一次的人口普查中希望能调查到尽可能多的人,但不可避免有些人会被遗漏掉从而导致普查的人口估计要少于实际的人口总量。nHogan(1993)介绍了美国人口普查局
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样 技术
限制150内