用样本估计总体一改.pptx
《用样本估计总体一改.pptx》由会员分享,可在线阅读,更多相关《用样本估计总体一改.pptx(85页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、会计学1用样本估计总体一改用样本估计总体一改复习回顾复习回顾1.抽样方法有哪些?第1页/共85页类别类别共同点共同点各自特点各自特点相互联系相互联系适用范围适用范围 简单随机简单随机 抽样抽样 系统系统 抽样抽样 分层抽样分层抽样2.三种抽样方式比较三种抽样方式比较1.不放不放回抽样回抽样2.抽样抽样过程中过程中,每个个每个个体被抽体被抽取的机取的机会均等会均等从总体中从总体中逐个抽取逐个抽取将总体均分为将总体均分为几部分几部分,按简单按简单随机抽样抽取随机抽样抽取第一个样本,第一个样本,然后按相同的然后按相同的间隔抽取其他间隔抽取其他样本样本将总体分成将总体分成几层,分层几层,分层进行抽取进
2、行抽取 抽取第一抽取第一个样本时个样本时采用简单采用简单随机抽样随机抽样 各层抽样时,各层抽样时,采用简单随采用简单随机抽样或系机抽样或系统抽样统抽样总体中的个总体中的个体数较少体数较少总体中的个总体中的个体数较多体数较多 (间隔相同的间隔相同的时间或距离时间或距离)总体由差异总体由差异明显的几部明显的几部分组成分组成第2页/共85页练习:在下列问题中,各采用什么抽样练习:在下列问题中,各采用什么抽样方法抽取样本较合适?方法抽取样本较合适?1、从、从20台电脑中抽取台电脑中抽取4台进行质量检测;台进行质量检测;2、从、从2004名同学中,抽取一个容量为名同学中,抽取一个容量为20的样本的样本3
3、、某中学有、某中学有180名教工,其中业务人员名教工,其中业务人员136名,管理人员名,管理人员20名,后勤人员名,后勤人员24名,从中抽取一个容量为名,从中抽取一个容量为15的样本。的样本。简单随机抽样简单随机抽样系统抽样系统抽样分层抽样分层抽样第3页/共85页 如何从样本数据中提取基本信如何从样本数据中提取基本信息来估计总体的情况呢?息来估计总体的情况呢?抽样是统计的第一步,抽样是统计的第一步,接下来就要对样本进行分析。接下来就要对样本进行分析。第4页/共85页2.2 2.2 用样本估计总体用样本估计总体一、用样本的频率分布估计总体的分布一、用样本的频率分布估计总体的分布二、用样本的数字特
4、征估计总体的特二、用样本的数字特征估计总体的特征征平均数、中位数、众数、平均数、中位数、众数、极差、方差、标准差极差、方差、标准差频率分布表、频率分布直方图、频率分布表、频率分布直方图、频率折线图、茎叶图频率折线图、茎叶图第5页/共85页采用抽样调查的方采用抽样调查的方式获得样本数据式获得样本数据分析样本数据来估分析样本数据来估计全市居民用水量的计全市居民用水量的分布情况分布情况我国是世界上严重缺水我国是世界上严重缺水的国家之一,城市缺水的国家之一,城市缺水问题较为突出,某市政问题较为突出,某市政府为了节约生活用水,府为了节约生活用水,计划在本市试行居民生计划在本市试行居民生活用水定额管理,即
5、确活用水定额管理,即确定一个居民月用水量标定一个居民月用水量标准准a a,用水量不超过,用水量不超过a a的的部分按平价收费,超出部分按平价收费,超出a a的部分按议价收费。的部分按议价收费。如果希望大部分居民的如果希望大部分居民的日常生活不受影响,那日常生活不受影响,那么标准么标准a a定为多少比较定为多少比较合理呢合理呢?探究探究:你认为,为了较你认为,为了较为合理地确定出为合理地确定出这个标准,需要这个标准,需要做哪些工作?做哪些工作?第6页/共85页下表给出下表给出100100位居民的月均用水量表位居民的月均用水量表 分析数据的一种分析数据的一种基本方法基本方法是用图将它们画出来,或者
6、是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递个目的,一是从数据中提取信息,二是利用图形传递信息。表格则是通过改变数据的构成形式,为我们提信息。表格则是通过改变数据的构成形式,为我们提供解释数据的新方式供解释数据的新方式讨论:如何分讨论:如何分析数据?析数据?根据这些数根据这些数据你能得出据你能得出用水量其他用水量其他信息吗信息吗?为此我们要对这些数据进行整理与分析为此我们要对这些数据进行整理与分析第7页/共85页初中我们曾经学过频数分布图和频数分布表,这使我们能够清楚地知道数据
7、分布在各个小组的个数。下面将要学习的频率分布图和频率分布表,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律。它可以使我们看到整个样本数据的频率分布情况。初中我们曾经学过频数分布图和频数分布表,这使我们能够清楚地知道数据分布在各个小组的个数。下面将要学习的频率分布图和频率分布表,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律。它可以使我们看到整个样本数据的频率分布情况。第8页/共85页一一频率分布的概念:频率分布的概念:频率分布频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布是指一个样本数据在各个小范围内
8、所占比例的大小。一般用频率分布直方图反映样本的频率分布 一、频率分布直方图一、频率分布直方图第9页/共85页第一步第一步:求极差求极差:(数据组中最大值与最小值的差距数据组中最大值与最小值的差距)最大值最大值=4.3 =4.3 最小值最小值=0.2 =0.2 所以极差所以极差=4.3-0.2=4.1=4.3-0.2=4.1第二步第二步:决定组距与组数决定组距与组数:(注意取整)(注意取整)当样本容量不超过当样本容量不超过100100时时,按照数据的多少按照数据的多少,常常分成分成512512组组.为方便组距的选择应力求为方便组距的选择应力求“取整取整”.本题如果组距为本题如果组距为0.5(t)
9、.0.5(t).则则 第三步第三步:将数据分组:将数据分组:(给出组的界限给出组的界限)所以将数据分成所以将数据分成9 9组较合适组较合适.0,0.5),0.5,1),1,1.5),4,4.5)共共9组组.第10页/共85页第四步第四步:列频率分布表列频率分布表.分组分组频数频数频率频率频率频率/组距组距0-0.5)40.5-1)8 1-1.5)15 1.5-2)22 2-2.5)25 2.5-3)15 3-3.5)5 3.5-4)4 4-4.5)2合计合计100组距组距=0.5=0.5 0.040.080.080.160.30.150.440.220.250.512.000.020.040.
10、040.080.10.30.150.05第11页/共85页 为了直观反映样本数据在各组中的为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:关信息用下面的图形表示:月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O第12页/共85页 为了直观反映样本数据在各组中的为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:关信息用下面的图形表示:月均用水量月均用水量/t频率频率
11、组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O第13页/共85页 为了直观反映样本数据在各组中的为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:关信息用下面的图形表示:月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O第14页/共85页 为了直观反映样本数据在各组中的为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:
12、关信息用下面的图形表示:月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O第15页/共85页 为了直观反映样本数据在各组中的为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:关信息用下面的图形表示:月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O第16页/共85页 为了直观反映样本数据在各组中的为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有分布
13、情况,我们将上述频率分布表中的有关信息用下面的图形表示:关信息用下面的图形表示:月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O第17页/共85页 为了直观反映样本数据在各组中的为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:关信息用下面的图形表示:月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O第18页/共85页 为了直观反映样本数据在各组中的为了直观反映样
14、本数据在各组中的分布情况,我们将上述频率分布表中的有分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:关信息用下面的图形表示:月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O第19页/共85页 为了直观反映样本数据在各组中的为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:关信息用下面的图形表示:月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O第20页
15、/共85页 为了直观反映样本数据在各组中的为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:关信息用下面的图形表示:月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O第21页/共85页00.10.20.30.40.50.6 0.5 1 1.5 2 2.5 3 3.5 4 4.5频率频率/组距组距 月均用水量月均用水量/t/t (组距组距=0.5)=0.5)0.080.160.30.440.50.30.10.080.04小长方形的面小长方形的面
16、积积=?=?小长方形的面小长方形的面积总和积总和=?=?月均用水量居月均用水量居民人数最多的民人数最多的在哪个区间在哪个区间?请大家阅读第请大家阅读第6868页页,直方图有直方图有哪些优点和缺哪些优点和缺点点?第五步第五步:画出频率分布直方图画出频率分布直方图.第22页/共85页 同样一组数据同样一组数据,如果组距不同如果组距不同,横轴、纵轴的单位横轴、纵轴的单位不同不同,得到的图的形状也会不同得到的图的形状也会不同.不同的形状给人以不不同的形状给人以不同的印象同的印象,这种印象有时会影响我们对总体的判断这种印象有时会影响我们对总体的判断.分分别以别以1 1和和0.10.1为组距重新作图为组距
17、重新作图,然后谈谈你对图的印象然后谈谈你对图的印象.第23页/共85页频率分布直方图的特征:频率分布直方图的特征:1.频率分布直方图频率分布表更直频率分布直方图频率分布表更直观地观地反映了样本的分布规律反映了样本的分布规律.2.从频率分布直方图得不出原始的从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。原有的具体数据信息就被抹掉了。第24页/共85页 如果当地政府希望使如果当地政府希望使85%85%以上的居民每月的用水量不超出标准,根据频率分布表以上的居民每月的用水量不超出标准,根据频率分布表2-22-2和频率分布直方图
18、和频率分布直方图2.2-12.2-1,你能对制定月用水量标准提出建议吗你能对制定月用水量标准提出建议吗?88%88%的居民月用水量在的居民月用水量在3t 3t以下,以下,可建议取可建议取a=3.a=3.第25页/共85页小结小结:画频率分布直方图的步骤画频率分布直方图的步骤:第一步第一步:求极差求极差:(数据组中最大值与最小值的差距数据组中最大值与最小值的差距)第二步第二步:决定组距与组数决定组距与组数:(强调取整)(强调取整)第三步第三步:将数据分组将数据分组 (给出组的界限给出组的界限)第四步第四步:列频率分布表列频率分布表.(包括分组、频数、频率(包括分组、频数、频率、频、频率率/组距组
19、距)第五步第五步:画频率分布直方图画频率分布直方图(在频率分布表的基础上(在频率分布表的基础上绘制,横坐标为样本数据尺寸,纵坐标为频率绘制,横坐标为样本数据尺寸,纵坐标为频率/组距组距.)组距组距:指每个小组的两个端点的距离指每个小组的两个端点的距离组数组数:将数据分组,当数据在将数据分组,当数据在100个以内时,个以内时,按数据多少常分按数据多少常分5-12组。组。第26页/共85页注意注意(2)纵坐标为纵坐标为:第27页/共85页练习:练习:例例 某地区为了了解知识分子的年龄结构,某地区为了了解知识分子的年龄结构,随机抽样随机抽样5050名,其年龄分别如下:名,其年龄分别如下:4242,3
20、838,2929,3636,4141,4343,5454,4343,3434,4444,4040,5959,3939,4242,4444,5050,3737,4444,4545,2929,4848,4545,5353,4848,3737,2828,4646,5050,3737,4444,4242,3939,5151,5252,6262,4747,5959,4646,4545,6767,5353,4949,6565,4747,5454,6363,5757,4343,4646,58.58.(1)(1)列出样本频率分布表;列出样本频率分布表;(2)(2)画出频率分布直方图;画出频率分布直方图;(3)
21、(3)估计年龄在估计年龄在32325252岁的知识分子所占的比例约是多少岁的知识分子所占的比例约是多少.第28页/共85页(1)(1)极差为极差为67-28=3967-28=39,取组距为,取组距为5 5,分为,分为8 8组组.分分 组组 频数频数 频率频率 2727,3232)3 0.063 0.06 32 32,3737)3 0.063 0.06 37 37,4242)9 0.189 0.18 42 42,4747)16 0.3216 0.32 47 47,5252)7 0.147 0.14 52 52,5757)5 0.105 0.10 57 57,6262)4 0.084 0.08 6
22、2 62,6767)3 0.063 0.06 合合 计计 50 1.0050 1.00样本频率分布表:样本频率分布表:第29页/共85页(2 2)样本频率分布直方图:)样本频率分布直方图:年龄年龄0.060.060.050.050.040.040.030.030.020.020.010.0127 32 37 42 47 52 57 62 6727 32 37 42 47 52 57 62 67频率频率组距组距O(3 3)因为)因为0.06+0.18+0.32+0.14=0.70.06+0.18+0.32+0.14=0.7,故年龄在故年龄在32325252岁的知识分子约占岁的知识分子约占70%.
23、70%.第30页/共85页课堂练习课堂练习2(2006年全国卷年全国卷II)一个社会调查机构就某地居民一个社会调查机构就某地居民的月收入调查了的月收入调查了10 000人,并根据所得数据画了样人,并根据所得数据画了样本的频率分布直方图本的频率分布直方图(如下图如下图).为了分析居民的收入为了分析居民的收入与年龄、学历、职业等方面的关系,要从这与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出人中再用分层抽样方法抽出100人作进一步调查,人作进一步调查,则在则在2500,3000(元元)月收入段应抽出月收入段应抽出_人人.0.00010.00020.00030.00040
24、.0005月收入月收入(元元)频率频率/组距组距251000 1500 2000 2500 3000 3500 4000第31页/共85页课堂练习课堂练习0.30.14.34.54.74.95.1视力视力频率频率/组距组距A.0.27,78B.0.27,83C.2.7,78D.2.7,83A第32页/共85页第33页/共85页频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5连接频率分布直方图连接频率分布直方图中各小长方形上端的中各小长方形上端的中点中点,得到得到频率分布折频率分布折线图
25、线图第34页/共85页频率分布折线图频率分布折线图 由于样本是随机的,不同的样本的得到的频率分布折线图不同,即使对于同一样本,不同的分组情况得到的频率分布折线图也不同,频率分布折线图是随着由于样本是随机的,不同的样本的得到的频率分布折线图不同,即使对于同一样本,不同的分组情况得到的频率分布折线图也不同,频率分布折线图是随着样本的容量样本的容量和和分组情况分组情况的变化而变化的。的变化而变化的。第35页/共85页利用样本频分布对总体分布进行相应估计利用样本频分布对总体分布进行相应估计(3)当样本容量无限增大,组距无限缩小,)当样本容量无限增大,组距无限缩小,那么频率折线图就会无限接近于一条光滑曲
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 样本 估计 总体 一改
限制150内