高三寒假讲义第15讲 统计与统计案例.docx
《高三寒假讲义第15讲 统计与统计案例.docx》由会员分享,可在线阅读,更多相关《高三寒假讲义第15讲 统计与统计案例.docx(34页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、第十五讲概率与统计第一讲统计与统计案例高考考点考点解读抽样方法1.分层抽样中利用抽样比确定样本容量、各层抽样的个体数等2考查系统抽样的有关计算样本频率分布、数字特征1.频率分布直方图、茎叶图的绘制及识图,并利用图解决实际问题2茎叶图与数字特征相结合考查3平均数和方差的计算线性回归分析与独立性检验在实际问题中的应用1.线性回归方程的求解及应用2独立性检验的应用以及独立性检验与统计、概率的综合问题备考策略本部分内容在备考时应注意以下几个方面:(1)掌握三种抽样的特点及相互联系,特别是系统抽样和分层抽样的应用(2)会用样本的频率分布估计总体分布,会用样本的数字特征估计总体的数字特征(3)了解回归分析
2、及独立性检验的基本思想,认识其统计方法在决策中的应用预测2020年命题热点为:(1)频率分布直方图、茎叶图的绘制及应用(2)数字特征的求解及应用(3)线性回归方程的求解及应用Z 1抽样方法三种抽样方法包括:简单随机抽样、系统抽样、分层抽样.2统计图表(1)在频率分布直方图中:各小矩形的面积表示相应各组的频率,各小矩形的高;各小矩形面积之和等于1;中位数左右两侧的直方图面积相等,因此可以估计其近似值(2)茎叶图3样本的数字特征(1)众数:在样本数据中,出现次数最多的那个数据中位数:样本数据中,将数据按大小排列,位于最中间的数据如果数据的个数为偶数,就取中间两个数据的平均数作为中位数;(2)样本平
3、均数(x1x2xn)i;(3)样本方差s2(x1)2(x2)2(xn)2(xi)2;(4)样本标准差s.注意:(1)现实中总体所包含的个体数往往较多,总体的平均数与标准差、方差是不知道(或不可求)的,所以我们通常用样本的平均数与标准差、方差来估计总体的平均数与标准差、方差(2)平均数反映了数据取值的平均水平,标准差、方差描述了一组数据围绕平均数波动的大小标准差、方差越大,数据的离散程度越大,越不稳定4变量间的相关关系(1)利用散点图可以初步判断两个变量之间是否线性相关如果散点图中的点从整体上看大致分布在一条直线的附近,我们说变量x和y具有线性相关关系(2)用最小二乘法求回归直线的方程设线性回归
4、方程为x,则.注意:回归直线一定经过样本的中心点(,),据此性质可以解决有关的计算问题5回归分析r,叫做相关系数相关系数用来衡量变量x与y之间的线性相关程度;|r|1,且|r|越接近于1,相关程度越高,|r|越接近于0,相关程度越低6独立性检验假设有两个分类变量X和Y,它们的取值分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为y1y2总计x1ababx2cdcd总计acbdabcd则K2,若K23.841,则有95%的把握说两个事件有关;若K26.635,则有99%的把握说两个事件有关;若K250%,所以超过了经济收入的一半,所以D项符合题意,故选A2(2017全国卷,3)某
5、城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图根据该折线图,下列结论错误的是( A )A月接待游客量逐月增加B年接待游客量逐年增加C各年的月接待游客量高峰期大致在7,8月D各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳解析对于选项A,由图易知月接待游客量每年7,8月份明显高于12月份,故A错;对于选项B,观察折线图的变化趋势可知年接待游客逐年增加,故B正确;对于选项C,D,由图可知显然正确故选A3(2018全国卷,14)某公司有大量客户,且不同年龄段客户对其服务的评价
6、有较大差异为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是分层抽样.解析根据题干中有大量客户,且不同年龄段客户对其服务的评价有较大差异,可知最合适的抽样方法是分层抽样4(2018江苏卷,3)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为90. 解析90.5(2018全国卷,19)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量0,01)0.1,02)0.2,03)0.3,0
7、4)0.4,05)0.5,06)0.6,07)频数13249265使用了节水龙头50天的日用水量频数分布表日用水量0,01)0.1,02)0.2,03)0.3,04)0.4,05)0.5,06)频数151310165(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)解析(1)(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35 m3的频率为0.20.110.12.60.120.050.48
8、,因此该家庭使用节水龙头后日用水量小于0.35 m3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天的日用水量的平均数为1(0.0510.1530.2520.3540.4590.55260.655)0.48.该家庭使用了节水龙头后50天的日用水量的平均数为2(0.0510.1550.25130.35100.45160.555)0.35.估计使用节水龙头后,一年可节省水(0.480.35)36547.45(m3)6(2018全国卷,18)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20
9、人,第一组工人用第一种生产方式,第二组工人用第二种生产方式根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:超过m不超过m第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:K2,P0.0500.0100.001k03.8416.63510.828解析(1)第二种生产方式的效率更高理由如下:方法一:由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生
10、产任务所需时间至少80 min,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79 min.因此第二种生产方式的效率更高方法二:由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5 min,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5 min.因此第二种生产方式的效率更高方法三:由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80 min;用第二种生产方式的工人完成生产任务平均所需时间低于80 min,因此第二种生产方式的效率更高方法四:由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大
11、致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高(2)由茎叶图知m80.列联表如下:超过m不超过m第一种生产方式155第二种生产方式515(3)由于K2的观测值k106.635,所以有99%的把握认为两种生产方式的效率有差异 例1 (1)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力
12、情况有较大差异,而男女生视力情况差异不大在下面的抽样方法中,最合理的抽样方法是( C )A简单随机抽样B按性别分层抽样C按学段分层抽样 D系统抽样解析因为男女生视力情况差异不大,而学段的视力情况有鹿大差异,所以应按学段分层抽样故选C(2)已知某地区中小学生人数和近视情况分布如图1和图2所示为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( A )A200,20 B100,20C200,10 D100,10 解析由题图可知,样本容量等于(3 5004 5002 000)2%200;抽取的高中生近视人数为2 0002%50%20,故
13、选A(3)(2018贵阳一模)从编号为01,02,49,50的50个个体中利用下面的随机数表选取5个个体,选取方法从随机数表第1行第5列的数开始由左到右依次抽取,则选出来的第5个个体的编号为( D )7816657208121463078243699728019832049234493582003623486969387481A14 B07C32 D43解析由题意知选定的第一个数为65(第1行的第5列和第6列),按由左到右选取两位数(大于50的跳过、重复的不选取),前5个个体编号为08,12,14,07,43.故选出来的第5个个体的编号为43.选D规律总结系统抽样与分层抽样的求解方法(1)系统
14、抽样的最基本特征是“等距性”,每组内所抽取的号码需要依据第一组抽取的号码和组距唯一确定每组抽取样本的号码依次构成一个以第一组抽取的号码m为首项,组距d为公差的等差数列an,第k组抽取样本的号码akm(k1)d.(2)分层抽样的关键是根据样本特征差异进行分层,实质是等比例抽样,求解此类问题需先求出抽样比样本容量与总体容量的比,则各层所抽取的样本容量等于该层个体总数与抽样比的乘积在每层抽样时,应采用简单随机抽样或系统抽样进行G 1某校150名教职工中,有老年人20名,中年人50名,青年人80名,从中抽取30名作为样本采用随机抽样法:抽签取出30个样本;采用系统抽样法:将教职工编号为00,01,14
15、9,然后平均分组抽取30个样本;采用分层抽样法:从老年人、中年人、青年人中抽取30个样本下列说法中正确的是( A )A无论采用哪种方法,这150名教职工中每个人被抽到的概率都相等B两种抽样方法,这150名教职工中每个人被抽到的概率都相等;并非如此C两种抽样方法,这150名教职工中每个人被抽到的概率都相等;并非如此D采用不同的抽样方法,这150名教职工中每个人被抽的概率是各不相同的解析三种抽样方法中,每个人被抽到的概率都等于.故选A2(2018昆明一模)某班有学生60人,将这60名学生随机编号为160号,用系统抽样的方法从中抽出4名学生,已知3号、33号、48号学生在样本中,则样本中另一个学生的
16、编号为( C )A28B23C18D13解析抽样间隔为15,故另一个学生的编号为31518.(一)用样本数字特征估计总体 例2 (1)(2018湘潭一模)某中学奥数培训班共有14人,分为两个小组,在一次阶段测试中两个小组成绩的茎叶图如图所示,其中甲组学生成绩的平均数是88,乙组学生成绩的中位数是89,则nm的值为( B )A5B6C7D8解析甲组学生成绩的平均数是88,788684889590m92887m3.又乙组学生的成绩的中位数是89.n9.nm936.故选B(2)为迎接即将举行的集体跳绳比赛,高一年级对甲、乙两个代表队各进行了6轮测试,测试成绩(单位:次/分钟)如下表:轮次一二三四五六
17、甲736682726376乙837562697568补全茎叶图,并指出乙队测试成绩的中位数和众数;试用统计学中的平均数、方差知识对甲、乙两个代表队的测试成绩进行分析解析(1)补全茎叶图如下:乙队测试成绩的中位数为72,众数为75.(2)甲72,s(6372)2(6672)2(7272)2(7372)2(7672)2(8272)239;乙72,s(6272)2(6872)2(6972)2(7572)2(7572)2(8372)244.因为甲乙,ss,所以甲、乙两队水平相当,但甲队发挥较稳定(二)用频率分布直方图估计总体 例3 某城市100户居民的月平均用电量(单位:度),以160,180),18
18、0,200),200,220),220,240),240,260),260,280),280,300分组的频率分布直方图如图(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为220,240),240,260),260,280),280,300的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在220,240)的用户中应抽取多少户?解析(1)由已知得,20(0.0020.00950.0110.0125x0.0050.0025)1,解得x0.0075.(2)由题图可知,面积最大的矩形对应的月平均用电量区间为220,240),所以月平均用电量的众数的估计值为
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高中数学 高考数学 新高考数学 数学专题 数学学案 数学设计 数学课件 数学培优 高三数学
限制150内