BP第四十讲 抽样方法与总体分布的估计.doc
《BP第四十讲 抽样方法与总体分布的估计.doc》由会员分享,可在线阅读,更多相关《BP第四十讲 抽样方法与总体分布的估计.doc(11页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、 高考数学一轮第四十讲 第 1 页共 11 页 第四十讲 抽样方法与总体分布的估计考点解读【基础性考点知识突破基础性考点知识突破】一、随机抽样1简单随机抽样:设一个总体的个数为如果通过逐个抽取的方法从中抽取一个N样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样实现简单随机抽样,常用抽签法和随机数法2抽签法:一般地,抽签法就是把总体中的个个体编号,把号码写在号签上,将N号签放在一个不透明的容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取次,就n得到一个容量为的样本,这种抽样方法称为抽签法n3随机数法:利用随机数表、随机数骰子或计算机产生随机数进行抽样的方法,叫做随机数法
2、【提示】简单随机抽样必须具备下列特点:(l)简单随机抽样要求被抽取的样本的总体个数是有限的N(2)简单随机抽样的样本数小于或等于样本总体个数nN(3)简单随机抽样的样本是从总体中逐个抽取的(4)简单随机抽样是一种不放回抽样(5)简单随机抽样的每个个体入样的可能性均为N二、系统抽样1定义:当总体中的个体数较多时,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取 1 个体,得到所需要的样本,这种抽样叫做系统抽样2由系统抽样的定义可知系统抽样有以下特征:(1)当总体容量较大时,采用系统抽样N(2)将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等因此,系统抽样又称等距抽样
3、,分段的间隔一般为Nkn(3)预先制定的规则指的是在第一段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整数倍即为抽样编号(4)系统抽样是把一个问题划分成若干部分来分块解决,从而把复杂问题简单化,体现高考数学一轮第四十讲 第 2 页共 11 页 了数学中的转化思想三、分层抽样1定义:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样2分层抽样又称类型抽样,应用分层抽榫时应遵循以下要求:(1)分层:将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则(2)分层抽样为保证每个个体等
4、可能入样,需遵循在各层中进行简单随机抽样或系统抽样,每层样本数量与每层个体数量的比与这层个体数量与总体容量的比相等二、用样本估计总体1用样本的频率分布估计总体的频率分布频率分布直方图的理解a纵轴表示,即小长方形的高=;频率 组距频率 组距b小长方形的面积=组距=频率;频率 组距c数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于1频率分布折线图和总体密度曲线a频率分布折线图:连接频率分布直方图中各小长方形上端的中点,即得频率分布折线图b总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率分布折线图会越来越接近于一条光滑曲线,即总体密度曲线茎叶图茎是指中
5、间的一列数,叶是从茎的旁边生长出来的数2用样本的数字特征估计总体的数字特征平均数、中位数、众数数字特征样本数据平均数样本数据的算术平均数高考数学一轮第四十讲 第 3 页共 11 页 中位数将数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)众数出现次数最多的数据样本方差与标准差设样本的元素为,样本的平均数为,则1x2xnxxa样本方差:;2222 121()()() nsxxxxxxnb样本标准差:222 121()()() nsxxxxxxn平均数、方差的有关性质a若,的平均数为,则,的平均数为1x2xnxx1mxa2mxanmxamxab若,的方差为,则,的方差为1x
6、2xnx2s1mxa2mxanmxa22m s【培优性方法技巧综合培优性方法技巧综合】一、抽样问题的求解1三种抽样方法的选择方法如果总体中个体之间的差异明显(如年龄、学段、性别、工种) ,并能据此将总体分为几层(几类、几部分) ,那么一般选择分层抽样方法;如果总体中个体数很多,无明显层次差异,希望被抽到的个体之间的间隔均等,那么选择系统抽样方法;如果总体中个体数不多,且希望被抽取的个体带有随机性、无固定间隔,那么可以考虑简单随机抽样2抽样方法中的计算问题的求法系统抽样中的计算问题,系统抽样中被抽取的两个样本编号的间距相等,据此,若有个总体,希望抽取个nm个体,确定抽样间距时,若为整数,则抽样间
7、距为;否则,一般先剔除几个个体,n mn m使得为整数,抽样间距一般为不大于的最大整数n mn m高考数学一轮第四十讲 第 4 页共 11 页 分层抽样中的计算问题分层抽样满足“” ,即“,或=每层中抽取的个体数量样本容量 本层的总个体数量总体数量11n N22n Nn N=” ,据此在已知每层间的个体数量或数量比、样本容量、总12:nnn12:NNN体数量中的两个时,就可以求出第三个3分层抽样在高考中的考查体现在计算上,解决此类问题的关键是:明白分层抽样是等概率抽样;每层中抽取的个体数与每层的总个体数之比都相等,都等于样本容量与总体数量的比值4分层抽样的一般步骤:第一,分层;第二,按比例确定
8、每层抽取个体的数量;第三,各层抽样(抽样的方法可以是简单随机抽样,也可以是系统抽样,且各层之间的抽样方法可以不一样) ;第四,汇合成样本5系统抽样在高考中的考查体现了对抽取后的样本编号的特征,解决此类问题的关键是:a.明白系统抽样也是等概率抽样;b.明白在系统抽样中,被抽取的样本是按照一定的规律抽取的,相邻的两个样本编号的间距相等6系统抽样的步骤:第一步,将总体中的个体随机编号;第二步,将编号分段;第三步,在第 1 段中用简单随机抽样确定起始的个体编号;第四步,按照事先确定的规则抽取样本7系统抽样最基本的特征是“等距性” ,每组内所抽取的号码需要依据第一组抽取的号码和组距来确定,每组抽取样本的
9、号码依次构成一个以第一组抽取的号码为首项,组m距为公差的等差数列,第组抽取的样本号码为dnak(1)kamkd二、利用样本频率分布估计总体分布1从频率分布直方图中得出有关数据的方法频率:频率分布直方图中横轴表示组别,纵轴表示,频率=组距;频率 组距频率 组距频率比:频率分布直方图中各小长方形的面积之和为 1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比,从而根据已知的几组数据个数比求有关值;众数:最高小长方形底边中点的横坐标;中位数:平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标;高考数学一轮第四十讲 第 5 页共 11 页 平均数:频率分布直方图中每个
10、小长方形的面积乘小长方形底边中点的横坐标之和;性质应用:若纵轴上存在参数值,则根据所有小长方形的高之和组距=1 列方程即可求得参数值,2茎叶图中数据得出的方法:茎叶图是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数,对于样本数据较少,但较为集中的一组数据:若数据是两位整数,则将十位数字作茎,个位数字作叶;若数据是三位整数,则将百位、十位数字作茎,个位数字作叶样本数据为小数时做类似处理对于样本数据较少,但较为集中的两组数据,关键是找到两组数据共有的茎,用茎叶图刻画数据的优点是:a所有的信息都可以从茎叶图中得到b茎叶图便于记录和读取,能够展示数据的分布情况缺点是:当样
11、本数据较多或数据位数较多时,茎叶图就显得不太方便茎叶图通常用来记录两值数的数据,它可以用来分析单组数据,也可以对两组数据进行比较通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,是否关于该茎对称,是否分布均匀等3组距的选择应力求“取整” ,如果极差不利于分组(如不能被组数整除) ,可适当增大极差,如在左、右两端各增加适当范围(尽量使两端增加的量相同) 4频率分布表的优点是能够反映具体数据在各个不同区间的取值频率;缺点是不够直观、形象,对分析数据分布的总体态势不太方便5频率分布直方图的优点是能够直观地表明数据分布的形状,一般呈中间高、两端低、左右对称的“峰”状结构;缺点是从直方图本身得不到具
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- BP 第四十 抽样 方法 总体 分布 估计
限制150内