样本估计总体.doc
《样本估计总体.doc》由会员分享,可在线阅读,更多相关《样本估计总体.doc(26页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、2.2.1 用样本的频率分布估计总体分布(第一课时 频率分布表)【课标定向】学习目标频率分布及频率分布表提示与建议1.了解频率分布的意义2.了解什么是频率分布表,掌握编制频率分布表的方法【互动探究】自主探究用样本频率分布(表)估计总体频率分布,其制作步骤是:第一步,按确定的组距对一批数据分组后,数出落在各组内数据的(即频数),填入表中;第二步,各小组的频数与数据总数的叫做这一小组的频率,算出各小组的频率,填入表中;第三步,小于某一数值的频率为,算出后填入累积频率表中剖例探法讲解点一制作频率分布表当总体很大或不便获得总体的频率时,可以用样本的频率分布估计总体的频率分布,我们把反映总体频率分布的表
2、格称为频率分布表下面我们通过一个具体的实例来阐述这一处理样本数据的方法为了估计全市居民用水量的分布情况,假设通过抽样,我们获得了100位居民某年的月均用水量3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.13.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.43.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.33.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.83.0 2.9 2.4 2.4 1.9 1.3 1.
3、4 1.8 0.7 2.02.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.32.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.42.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2 100位居民的月均用水量(单位:t)1.编制频率分布表的方法步骤:求极差(也称全距,即一组数据中最大值与最小值的差)计算极差时,需要找出这组数据的最大值和最小值,当数据很多时,可借助如下算法(最大值):第一步,把这100个数据命名为;第二步,设变量;第三步,把
4、逐个与比较,如果则运用上面的算法得出这组样本数据的最大值是4.3,用类似的方法可以得出最小值0.2,它们的差为4.3-0.2=4.1,说明样本数据的变化范围是4.1t决定组距与组数样本数据有100个,由上面算得极差为4.1,取组距为0.5,那么组数=极差/组距=4.1/0.5=8.2,于是应将样本数据分成9组注意:为方便起见,组距的选择应力求“取整”,如果极差不利于分组(如不能被组数整除),可适当增大极差,如在左、右两端各增加适当范围(尽量使两端增加的量相同)决定分点,将数据分组以组距为0.5,将数据分组时,可以分成以下9组:分组时,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间,当然
5、也可以采用其他分组方法登记频数,计算频率,列出频率分布表如表:频率=频数/样本容量,如第一小组的频率为4/100=0.04100位居民的月均用水量的频率分布表2.小结组距和组数的确定没有固定的标准,将数据分组时,组数应力求合适,以使数据的分布规律能清楚地呈现出来,组数太多或太少,都会影响我们了解数据的分布情况,数据分组的组数与样本容量有关一般样本容量越大,所分组数越多,当样本容量不超过100 时,按照数据的多少,常分成5至12组频率分布表排除了抽样造成的误差,精确地反映了总体取值的概率分布规律!总体分布例题为了估计某人的射击技术状况,在他的训练记录中抽取了50次进行检验,他命中环数如下:7 8
6、 6 8 6 5 9 10 7 95 6 5 6 7 8 7 9 10 98 5 7 8 7 6 8 6 7 79 6 5 8 6 9 6 8 10 78 7 8 6 9 8 7 10 8 9作出频率分布表【解析】频率分布表如下:环数频数频率550.106100.207110.228120.24980.161040.08【规律技巧总结】作频率分布表时要注意给出的数据,怎样分组,以及频数与频率之间的关系精彩反思1.一般地,编制频率分布表的步骤如下:求全距,决定组数和组距,组距=全距/组数如果取全距时不利于分组(如不能被组数整除),可适当增大全距,如在左、右两端各增加适当范围,(尽量使两端增加的量
7、相同),同时还要注意,分的组数过少或过多都不好,过少或过多,都不能反映数据的分布规律分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间登记频数,计算频率,列出频率分布表2.当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布,反映总体频率分布的表格叫频率分布表3.频率分布表各组中的频数之和为样本容量,各组中的频率之和等于1【自我测评】1.一个容量为20的样本,已知某组的频率为0.25,则该组的频数为( )5 15 2 802.从某一总体中抽出一个体数为200的样本后,得到组距与频数如下:,则样本在上的频率是( )0.69 0.46 1 不存在3.一个容量为20的数据样本,
8、分组与频数为,则样本数据在区间上的可能性为( )5% 25% 50% 70%【拓展迁移】思维提升4.下面是不同厂家生产的手提式电脑的重量(单位:),试列出其频率分布表:1.9 2.0 2.1 2.4 2.4 2.8 3.2 2.3 1.5 2.6 2.6 1.9 2.4 2.2 1.6 1.7 1.7 1.8 1.8 3.0视野拓展“国际数学界”的最高奖项数学领域中有一种世界性的奖励,这就是每四年颁发一次的菲尔兹奖在各国数学家的眼里,菲尔兹奖所带来的荣誉可与诺贝尔奖相媲美菲尔兹奖是由国际数学联盟(简称IMU) 主持评定的,并且只在每四年召开一次的国际数学家大会(简称ICM)上颁发,菲尔兹奖的权
9、威性,部分地来自于此第一次国际数学家大会在苏黎世召开,紧接着,1900年又在巴黎召开了第二次会议,自1900年以后,大会一般每四年召开一次菲尔兹奖是以已故的加拿大数学家约翰查尔斯菲尔兹命名的2.2.1 用样本的频率分布估计总体分布(第二课时 频率分布直方图)【课标定向】学习目标频率分布直方图;频率分布折线图;总体密度曲线提示与建议1.了解频率分布直方图的意义;2.了解折线图和密度曲线的意义;3.掌握作频率分布直方图的方法【互动探究】自主探究1.在频率分布直方图中,纵轴表示,数据落在各小组内的频率用表示,各小长方形的面积总和2.下列关于频率分布直方图的说法正确的是( )直方图的高表示取某数的频率
10、直方图的高表示该组上的个体在样本中出现的频率直方图的高表示取某组上的个体在样本中出现的频数与组距的比值直方图的高表示取该组上的个体在样本中出现的频率与组距的比值3.在频率分布直方图中,各个长方形的面积表示( )落在相应各组的数据的频数 相应各组的频率该样本所分成的组数该样本的样本容量4.连结频率分布直方图中各小长方形上端的中点,就得到频率分布折线图,随着的增加,作图时所分的的增加,相应的频率分布折线图就会越来越接近于一条光滑曲线,统计中称之为总体密度曲线,它能够更加精细的反映出剖例探法讲解点一制作频率分布图1.频率分布直方图的绘制方法与步骤:(下面用上节居民用水量中的数据加以说明)先制作频率分
11、布表,然后作直角坐标系,以横轴表示月均用水量,纵轴表示频率/组距;把横轴分成若干段,每一线段对应一个组的组距,即在横轴上标上0.5,1,1.5 ,4.5表示的点;在上面标出的各点中,分别以相邻两点为端点的线段为底作矩形,它的高等于该组的频率/组距,每个矩形的面积恰好是该组上的频率这些矩形就构成了频率分布直方图2.有关问题的理解因为小矩形的面积=组距频率/组距=频率,所以各小矩形的面积表示相应各组的频率,这样,频率分布直方图就以面积的形式反映了数据落在各个小组的频率的大小在频率分布直方图中,各小矩形的面积的总和等于1同样一组数据,如果组距不同,横轴、纵轴单位不同,得到的图的形状也会不同,不同的形
12、状给人的印象也不同,这种印象有时会影响我们对总体的判断,下面分别以0.1和1为组矩重新作图,观察图的特点可见,分组越细越接近样本的原始数据,更能真实反映样本数据的原始状态,但如果样本容量不增加,只一味减小组距,有时反而影响频率分布观察讲解点一制作频率折线图1.频率分布折线图如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起来,就得到一条折线,我们称这条折线为本组数据的频率分布折线图,简称频率分布折线图如上例中,可得如下频率折线图注意:取值区间两端点须分别向外延伸半个组距,并取此组距上在轴上的点与折线的首尾分别相连2. 总体密度曲线一般地,当总体中的个体数较多时,抽样时样本容量就不能太小
13、例如,如果要抽样调查一个省乃至全国的居民的月均用水量,那么样本容量就应比调查一个城市的时候要大如果将样本容量取得足够大,分组的组距取得足够小,那么相应的频率折线图会趋于一条光滑曲线,统计中称这条光滑的曲线为总体密度曲线3.频率分布与总体分布总体密度曲线反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息,总体在某一区间取值的百分比就是该区间与该曲线所夹的曲边梯形的面积,例如上图中阴影部分的面积就是总体在区间内取值的百分比总体密度曲线通常都是利用样本的频率分布估计出来的,这是因为:并非所有的总体都存在密度曲线,如一些离散型总体;尽管有些总体密度曲线是客观存在的,但一般很难像函数图象那
14、样被准确地画出来,我们只能用样本的频率分布对它进行估计,一般说来,样本容量越大,这种估计就越精确例题在一小时内统计一传呼台接收到用户的呼唤次数,按每分钟统计如下:0 0 1 2 1 2 2 3 4 10 1 2 5 3 1 2 2 2 42 4 3 1 1 3 2 3 4 61 2 0 2 3 1 3 1 4 11 2 0 2 3 4 2 5 0 21 1 0 3 2 1 3 1 2 0写出一分钟内传呼呼唤次数的频率分布表,并画出频率分布图【解析】 一分钟传呼呼唤次数的频率分布表及频率分布直方图如下图所示:一分钟内呼唤次数频数频率080.1331160.2672170.2833100.1674
15、60.100520.033610.017总计601.000【规律技巧总结】在画频率分布直方图的过程中,一定要合理分组,确定恰当的组距严格按步骤画出频率分布直方图精彩反思1.频率分布直方图和折线图的优缺点:优点:直方图直观,能以面积的形式反映数据落在各小组的频率的大小;折线图能直观地反映数据的变化趋势缺点:不精确,没有保留原始数据2.在频率分布直方图中,各小长方形的面积表示相应各组的频率,所有小矩形的面积和为1【自我测评】1.对于样本频率分布直方图与总体密度曲线的关系,下列说法中正确的是( )频率分布直方图与总体密度曲线无关频率分布直方图就是总体密度曲线样本容量很大的频率直方图就是总体密度曲线如
16、果样本容量无限增大,分组的组距无限减小,那么相应的频率折线图会越来越接近一条光滑曲线,则这条光滑曲线为总体密度密线2.在频率分布直方图中,中位数两侧的面积的比为( )13 21 11 不确定3.下列是容量为100的样本的频率分布直方图,试根据图形中的数据填空:样本数据落在范围内的频率为;样本数据落在范围内的频率为;总体在范围内的概率为【拓展迁移】思维提升4.某班50名学生在一次百米测试中,成绩介于13秒与19秒之间,将测试结果按下列方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;第六组,成绩大于等于18秒且小于19秒右图是按上述方法分组得到的频率分
17、布直方图设成绩小于17秒的学生人数占全班总人数的百分比为,成绩大于等于15秒且小于17秒的学生人数为,则从右图的频率分布直方图中可分析出和分别为( )0.9,35 0.9,45 0.1,35 0.1,455.从某小学随机抽取100名同学,将他们的身高(单位:厘米),数据绘制成频率分布直方图(如图)由图中数据可知若要从身高在三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在内的学生中选取的人数为6.从高三学生中抽取50名同学参加数学竞赛,成绩的分组及各组的频率如下(单位:分):列出样本的频率分布表(含累积频率);画出频率分布直方图;估计成绩在的学生比例;估计成绩在85分以下的学生
18、比例视野拓展纪塔娜女神的智慧在非洲流传一个古老的神话:一个酋长要分给纪塔娜女神一块土地,这块土地可以用一张灰鼠皮围起来,酋长十分得意,他认为一张灰鼠皮本来就很小,用它能围出多大一块土地?纪塔娜女神接过鼠皮后,把它剪成很细的皮条连成一条长皮绳,她用皮绳靠海岸线围成一块很大的半圆形土地,结果分得一块很大的土地,酋长连呼吃亏2.2.1 用样本的频率分布估计总体分布(第三课时 茎叶图)1 2 52 4 53 1 1 6 7 94 4 95 0茎:表示十位数叶:表示个位数分界线【课标定向】学习目标茎叶图提示与建议了解茎叶图的意义,掌握制作茎叶图的方法【互动探究】自主探究1 .下列命题正确的是( )频率分
19、布直方图中每个小矩形的面积等于相应组的频数频率分布直方图的面积为对应数据的频数频率分布直方图中各小矩形高(平行于纵轴的边)表示频率与组距的比用茎叶图统计某运动员得分:13,51,23,8,26,38,16,33,14,28,39时,茎是指中位数262.当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以;而且,给数据的和都带来了方便3. 茎叶图表示数据时,茎表示的数据在叶表示的数据,并且叶分布在剖例探法讲解点一茎叶图及其应用除了上面几种图表能帮助我们理解样本数据外,统计中还有一种用来表示数据的图叫做茎叶图,它是一种将样本数据有条理地列出来,从而观察样本分布情况的图下面以具体的实例阐述茎叶图
20、的制作方法及其特点:上班时间 下班时间8 1 6 7 98 7 6 1 0 2 2 5 7 9 95 3 2 0 3 0 0 2 60 4例如:某篮球运动员在2002赛季各场比赛的得分情况如下:12,15,24,31,31,36,37,39,44,49,50制作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共同一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从小到大(或从大到小的顺序同行列出)上述运动员得分茎叶图如图:图中第一行分界线的左边的“1”表示十位数,,右边的“2” 和“5”表示个位数字,这一行说明该运动员的得分为12分和15分,同理可说明其它各行
21、的意思从这张图中可以看出,茎叶图不仅能够保留原始数据,而且能够展示数据的分布情况,如上图中该运动员平均得分及中位数、众数都在20到40之间,且分布较对称,集中程度高,说明其发挥比较稳定例题某市对上、下班交通情况做抽样调查,上、下班时间各抽取了12辆机动车行驶时速如下:(单位:km/h)上班时间:30 33 18 27 32 40 26 28 21 28 35 20下班时间:27 19 32 29 36 29 30 22 25 16 17 30用茎叶图表示上面的样本数据,并求出样本数据的中位数写出一分钟内传呼呼唤次数的频率分布表,并画出频率分布图【思维切入】以十位数为茎,个位数为叶,可以作出相应
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 样本 估计 总体
限制150内