数学抽样方法和总体分布估计.pptx
《数学抽样方法和总体分布估计.pptx》由会员分享,可在线阅读,更多相关《数学抽样方法和总体分布估计.pptx(40页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、随机抽样考纲要求:理解随机抽样的必要性和重要性;会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法.第1页/共40页简单随机抽样1.1.定义定义:设一个总体的个数为设一个总体的个数为N,N,如果如果_从中抽取一个样本,且每次抽取时各个个体从中抽取一个样本,且每次抽取时各个个体_,称这样,称这样的抽取为简单随机抽样的抽取为简单随机抽样.通过逐个被抽到的概率相等抽签法随机数表法(1 1).(2).2.2.简单随机抽样的常用方法简单随机抽样的常用方法:抽取的方法第2页/共40页随机数表法的步骤(1 1)编号;(如)编号;(如0000,0101,0202,6060)(2 2)在随机数表中
2、任选一个数作为开始)在随机数表中任选一个数作为开始.(如从第(如从第8 8行第行第8 8列开始)列开始)(3 3)从选定的数开始按一个方向(如向右)读下去,读到()从选定的数开始按一个方向(如向右)读下去,读到(1 1)中的编号则取出,)中的编号则取出,直到取够样本为止直到取够样本为止.第3页/共40页系统抽样1.1.定义定义:当当总体的个体数总体的个体数N N较大较大时,可将总体分成均衡的几个部分,然后按照预先定出的时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取规则,从每一部分抽取1 1个个体,得到所需要的样本这种抽样叫做个个体,得到所需要的样本这种抽样叫做系统抽样系
3、统抽样。2.2.系统抽样的步骤系统抽样的步骤:(1 1)将总体中的个体随机编号;)将总体中的个体随机编号;(2 2)将编号分段;)将编号分段;(分段数等于样本容量分段数等于样本容量)(3 3)在第一段中用简单随机抽样确定起始的个体编号;)在第一段中用简单随机抽样确定起始的个体编号;(4 4)抽取样本)抽取样本.第4页/共40页分层抽样1.1.定定义义:当当已已知知总总体体由由差差异异明明显显的的几几部部分分组组成成时时,为为了了使使样样本本更更充充分分地地反反映映总总体体的的情情况况,常常将将总总体体分分成成几几部部分分,然然后后按按照照各各部部分分所所占占的的比比例例进进行行抽抽样样,这这种
4、种抽抽样样叫叫做做分分层层抽抽样样,所所分分成的部分叫做成的部分叫做层层.2.2.分层抽样的步骤分层抽样的步骤:(1 1)分层;)分层;(2 2)按比例确定每层抽取个体的个数;)按比例确定每层抽取个体的个数;(3 3)各层抽样)各层抽样.第5页/共40页例题分析1.(091.(09湖南湖南)一个总体分为一个总体分为A,BA,B两层两层,其个体数之比为其个体数之比为4 4:1 1,用分层抽样方法从总体中抽取,用分层抽样方法从总体中抽取一个容量为一个容量为1010的样本,已知的样本,已知B B层中甲、乙都被抽到的概率为层中甲、乙都被抽到的概率为 则总体中的个体数为则总体中的个体数为_._.4040
5、第6页/共40页2.(092.(09广东文广东文)某单位某单位200200名职工的年龄分布情况如图名职工的年龄分布情况如图,现要从中抽取现要从中抽取4040名职工作样本名职工作样本,用系统用系统抽样法抽样法,将全体职工随机按将全体职工随机按1 1200200编号编号,并按编号顺序平均分为并按编号顺序平均分为4040组组(1(15 5号号,6,61010号号,196,196200200号号).).若第若第5 5组抽出的号码为组抽出的号码为2222,则第,则第8 8组抽出的号码应是组抽出的号码应是_._.若用分层抽样若用分层抽样方法,则方法,则4040岁以下年龄段应抽取岁以下年龄段应抽取_人人.第
6、7页/共40页3.3.(0505湖北)某初级中学有学生湖北)某初级中学有学生270270人,其中一年级人,其中一年级108108人,二、三年级各人,二、三年级各8181人,现要利用抽样方法抽取人,现要利用抽样方法抽取1010人参人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为一、二、三年级依次统一编号为1 1,2 2,270270;使用系;使用系统抽样时,将学生统一随机编号统抽样时,将学生统一随机编号1 1,2
7、2,270270,并将整,并将整个编号依次分为个编号依次分为1010段段.如果抽得号码有下列四种情况:如果抽得号码有下列四种情况:7 7,3434,6161,8888,115115,142142,169169,196196,223223,250250;5 5,9 9,100100,107107,111111,121121,180180,195195,200200,265265;1111,3838,6565,9292,119119,146146,173173,200200,227227,254254;3030,5757,8484,111111,138138,165165,192192,21921
8、9,246246,27270.0.系统、分层系统、分层分层分层A A都不能为系统抽样都不能为系统抽样B B都不能为分层抽样都不能为分层抽样C C都可能为系统抽样都可能为系统抽样D D都可能为分层抽样都可能为分层抽样系统、分层系统、分层不是系统、不是系统、不是分层不是分层第8页/共40页4.(20104.(2010湖北湖北)将参加夏令营的将参加夏令营的600600名学生编号为:名学生编号为:001001,002002,600600,采用系统抽样方,采用系统抽样方法抽取一个容量为法抽取一个容量为5050的样本,且随机抽得的号码为的样本,且随机抽得的号码为003003这这600600名学生分住在三个
9、营区,名学生分住在三个营区,从从001001到到300300在第在第营区,从营区,从301301到到495495住在第住在第营区,从营区,从496496到到600600在第在第营区,三个营区营区,三个营区被抽中的人数依次为(被抽中的人数依次为()A A26,16,8,B26,16,8,B2525,1717,88C C2525,1616,9D9D2424,1717,99第9页/共40页5.(20105.(2010安徽安徽)某地有居民某地有居民100000100000户,其中普通家庭户,其中普通家庭9900099000户户,高收入家庭高收入家庭10001000户从普通户从普通家庭中以简单随机抽样方
10、式抽取家庭中以简单随机抽样方式抽取990990户,从高收入家庭中以简单随机抽样方式抽取户,从高收入家庭中以简单随机抽样方式抽取l00l00户进户进行调查,发现共有行调查,发现共有120120户家庭拥有户家庭拥有3 3套或套或3 3套以上住房,其中普通家庭套以上住房,其中普通家庭5050户,高收人家庭户,高收人家庭7070户依据这些数据并结合所掌握的统计知识,你认为该地拥有户依据这些数据并结合所掌握的统计知识,你认为该地拥有3 3套或套或3 3套以上住房的家庭所套以上住房的家庭所占比例的合理估计是占比例的合理估计是_.(_.(百分比)百分比)第10页/共40页三种抽样方法的比较类别类别共同点共同
11、点各自特点各自特点相互联系相互联系适用范围适用范围简单随简单随机抽样机抽样系统抽系统抽样样分层抽分层抽样样从总体中逐个抽取将总体均分成几部分,按事先确定的规则在各部分抽取抽样过程中每个个体被抽取的概率相等将主体分成几层,分层进行抽取在起始部分抽样时采用简单随机抽样各层抽样时采用简单随机抽样或系统抽样总体中的个体数较少总体中的个体数较多总体由差异明显的几部分组成第11页/共40页总体估计(1)了解分布的意义和作用了解分布的意义和作用,会列频率分布表会列频率分布表,会画频率分布会画频率分布直方图直方图,频率折线图频率折线图,茎叶图茎叶图,理解它们各自的特点理解它们各自的特点.会用样本的频率分布估计
12、总体分布会用样本的频率分布估计总体分布,会用样本的基本数会用样本的基本数字特征估计总体的基本数字特征字特征估计总体的基本数字特征,理解用样本估计总体的理解用样本估计总体的思想思想.会用随机抽样的基本方法和样本估计总体的思想解决一会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题些简单的实际问题.利用实际问题的直方图利用实际问题的直方图,了解正态分布曲线的特点及曲了解正态分布曲线的特点及曲线所表示的意义线所表示的意义.第12页/共40页用样本的频率分布估计总体分布列样本的频率分布表绘制频率直方图.第13页/共40页列频率分布表的步骤1 1、计算数据中最大值与最小值的差计算数据中最大
13、值与最小值的差(称极差)(称极差).(即这组数据变动的范围有多大)(即这组数据变动的范围有多大)2 2、决定组数与组距决定组数与组距.(数据越多,分的组数越多)(数据越多,分的组数越多)3 3、决定分点决定分点.4 4、列频率分布表列频率分布表.(.(分组、频数、频率、累积频率分组、频数、频率、累积频率)绘制频率分布直方图的步骤1 1、以横轴表示总体分组,以纵轴表示、以横轴表示总体分组,以纵轴表示频率与组距的比值频率与组距的比值;2 2、以每个组距为底,以各频率与组距的比为高,分别画成矩形、以每个组距为底,以各频率与组距的比为高,分别画成矩形.第14页/共40页例题分析例、为了了解中学生的身高
14、情况,对某中学同龄的例、为了了解中学生的身高情况,对某中学同龄的5050名男学生的身体进行了测量,结果如名男学生的身体进行了测量,结果如下(单位:下(单位:cmcm)1751681701761671811621731711771711711741731741751751681701761671811621731711771711711741731741751771661631601661661631691741651751651701581671741771661631601661661631691741651751651701581671741721661721761721751611731
15、67170172165157172173166172166172176172175161173167170172165157172173166177169177169列样本的频率分布表,画频率分布直方图列样本的频率分布表,画频率分布直方图.第15页/共40页解:在这个样本中,最大值为181,最小值为157,它们的差是24,可以取组距为4,分成6组.根据题意列出样本的频率分布表频率分布表如下:分组分组频数频数频率频率累积频率累积频率合计341213144500.06 0.080.240.260.280.081.000.060.140.380.640.921.00157157,161161)161
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 抽样 方法 总体 分布 估计
限制150内