统计学原理 第三章 统计整理.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《统计学原理 第三章 统计整理.ppt》由会员分享,可在线阅读,更多相关《统计学原理 第三章 统计整理.ppt(60页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、第三章第三章 统计整理统计整理本章的教学目的:统计数据的整理由统计分组、统计汇总和统计表构成。这三部分相互联系构成整个统计资料整理的全过程。本章要求掌握统计分组的方法和汇总技术;学会编制变量数列和统计表;认识统计资料整理在统计研究中承先启后的地位。第一节 统计整理的意义和内容 一统计整理 根据根据统计研究任务的统计研究任务的要求要求,对调查所搜索的原始资料进行,对调查所搜索的原始资料进行分分组、汇总组、汇总,使使其其条理化、系统化条理化、系统化的工作过程。的工作过程。统计整理包括对原始资料和次级资料(二手资料)的整理。二。统计整理的意义 统计整理实现了从个别单位的统计整理实现了从个别单位的标志
2、值标志值向说明总体数量特征的向说明总体数量特征的指指标值标值过渡,是人们对社会经济现象从感性认识上升到理性认识过渡,是人们对社会经济现象从感性认识上升到理性认识的过渡阶段,为统计分析提供基础。的过渡阶段,为统计分析提供基础。在整个统计工作中发挥着承上启下的作用。例如:通过调查取得例如:通过调查取得100100个商业企业某月销售额资料:个商业企业某月销售额资料:(单位:万元)(单位:万元)2020,6060,4545,9090,105105,5656,250250,8989,130130,3030,9898,300300。将这些数据资料按将这些数据资料按“销售额销售额”的多少进行整理,得到下的多
3、少进行整理,得到下列整理结果:列整理结果:销售额(万元)企业数(个)0 50 12 50 100 25 100 150 30 150 200 23 250 300 10 合 计 100审核分组汇总编制统计图表三三、统计整理的内容、统计整理的内容1.统计分组 选择应整理的指标和确定应分的组;是基础2.统计汇总 对各项指标进行汇总,确定 各组和总体的单位数和标志总量;是中心内容 汇总技术:汇总技术:手工汇总:划记法、过录法、折叠法、卡手工汇总:划记法、过录法、折叠法、卡片法。片法。电子计算机汇总:电子计算机汇总:3编制统计表 用统计表体现分组、汇总的结果。是最有效的形式四、数据的审核四、数据的审核
4、1.及时性:及时性:是否按时报送了有关资料。对不报、漏报或迟报的现象都要及时查清。2.完整性:完整性:调查单位或填报单位是否齐全;项目是否有答案,资料是否符合规定。3.准确性准确性:资料是否准确可靠。常用审核准确性方法有两种:(1)计算检查 各项指标的计算口径、计量单位是否符合规定,并通过各种计算方法来检查各指标间的数值的计算结果。(2)逻辑检查 首先,从理论上或常识上检查资料是否有悖常理、有无不切实际或不符合逻辑的地方。第二节 统计分组一统计分组的意义 根据统计研究任务的要求和研究现象总体的内在特点,把现象总体按某一标志某一标志划分为若干性质不同但又有联系的几个部分称为统计分组统计分组。总体
5、的变异性是统计分组的客观依据。统计分组是在总体内进行的一种定性分类,它把总体划分为一个个性质不同的范围更小的总体。总体经过分组以后,各组内部的差异缩小趋于同质,组与组之间的差异拉大以表明现象间质的差别或量的不同。分组前分组前分组前分组前分组后分组后分组后分组后253342统计分组前后对照图统计分组前后对照图 统计分组的作用:(1)划分社会经济现象的类型;(2)说明总体内部结构以及整个结构的类型和特征;(3)分析现象的依存关系。母项二、统计分组的要求1、统计分组三要素2、统计分组在技术上的要求子项分组标志标志同一性互斥性周延性三、统三、统 计计 分分 组组 的的 种种 类类统计分组的分类统计分组
6、的分类统计分组的分类统计分组的分类按按分组标志的多少分组标志的多少按按分组标志的性质分组标志的性质按其按其任务和作用任务和作用类型分组类型分组分析分组分析分组结构分组结构分组简单分组简单分组复合分组复合分组变量分组变量分组品质分组品质分组按其任务和作用不同按其任务和作用不同:类型分组 结构分组 依存关系分组 (1)类型分组 例:按所有制性质划分,我国现有以下经济类例:按所有制性质划分,我国现有以下经济类型:型:国有经济;集体经济;私营经济;个体经国有经济;集体经济;私营经济;个体经济、联营经济;股份制经济;外商投资经济、联营经济;股份制经济;外商投资经济;港、澳、台投资经济。济;港、澳、台投资
7、经济。(2)结构分组)结构分组例:上海市按例:上海市按GDP计算的三次产业结构(计算的三次产业结构(%)1980年年 1990年年 1996年年 1997年年 GDP 100 100 100 100 第一产业第一产业 3.2 4.3 2.5 2.3 第二产业第二产业 75.7 63.8 54.5 52.2 第三产业第三产业 21.1 31.9 43.0 45.5 (3)依存关系分组)依存关系分组 例:中国农民家庭按收入分组的恩格尔系数例:中国农民家庭按收入分组的恩格尔系数按收入分组(元)按收入分组(元)200 300 400 500 600 800 1000恩格尔系数(恩格尔系数(%)64.9
8、 60.2 56.7 54.4 50.5 49.9 43.6 按分组标志的多少按分组标志的多少:简单分组 复合分组 举例举例:理科学生组理科学生组 文科学生组文科学生组 本科学生组本科学生组 本科学生组本科学生组 男学生组男学生组 男学生组男学生组 女学生组女学生组 女学生组女学生组 专科学生组专科学生组 专科学生组专科学生组 男学生组男学生组 男学生组男学生组 女学生组女学生组 女学生组女学生组 按按分组标志的性质:分组标志的性质:品质分组分组:如人口按性别、民族、职业、文化程度;工业企业按经济类型、部门、轻重工业。变量分组变量分组 如人口按年龄;工业企业按职工人数、生产能力分组。四 分组体
9、系与分组标志的选择(一)分组体系统计分组后所形成的一系列互相联系、互相补充的多种分组的整体称分组体系分组体系。分组体系有平行分组体系和复合分组体系两种。对同一总体选择两个或两个以上的标志分别进行简单分组,就形成平行分组体系,如对我国工业企业总体构成,可以分别按经济类型,企业规模进行简单分组,就形成平行分组体系;对同一总体选择两个或两个以上的标志层叠起来进行分组,就形成复合分组体系,如为了认识我国高等院校在校学生状况,可以同时选择学科、本科、性别等三个标志进行复合分组。(二)、分组标志的选择 分组标志的选择是统计分组的关键。1 根据研究的目的选择分组标志;2 选择能够反映现象本质或主要特征的标志
10、;3 应考虑现象所处的具体历史条件和经济条件第三节 变量数列一分配数列的概念 将总体按某一标志分组,计算出总体单位在各组的分布次数或称频数频数,就形成了分配数列,也叫频数分布或次数分布。分配数列由两部分组成:分组与分配次数。二分配数列的类型1品质数列。按品质标志分组 2变量数列。按数量标志分组 变量数列的种类。单项式数列 每一组只有一个值进行分组形成的数列。组距式数列 按组距式分组形成的分配数列。n 某厂职工人数统计表某厂职工人数统计表按性别分组按性别分组男男 职职 工工女女 职职 工工合合 计计人数(人)人数(人)(频数)频数)比率()比率()(频率)(频率)25311536868.7531
11、.25100.00某厂职工家庭人口分组统计某厂职工家庭人口分组统计按家庭人口分组按家庭人口分组1合合 计计职工户数职工户数(频数)频数)比率()比率()(频率)(频率)723456381055431202.915.241.320.512.18.0255100某班学生按考试成绩分组某班学生按考试成绩分组 按成绩分组按成绩分组(分)(分)人数(人)人数(人)比率比率(%)6060以下以下 7 7 8.88.8 60706070 2121 26.226.2 70807080 2525 31.231.2 80908090 1919 23.823.8 9090以上以上 8 8 10.010.0 合合 计
12、计 8080 100.0100.03 3、组距数列的有关问题、组距数列的有关问题(1 1)组数)组数(2 2)组限)组限(3 3)开口组和闭口组)开口组和闭口组()组距()组距 (5 5)组中值)组中值 (缺上限的开口组)(缺上限的开口组)(缺下限的开口组)(缺下限的开口组)2003年某地区年龄和性别分人口数及组中值三、变量数列编制的步骤1、组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,可以按 Sturges(斯特奇斯)提出的经验公式来确定组数k2.2.确确定定各各组组的的组组距距:组组距距(Class(Class Width)Width)是是一一个个组组的的上上限限与
13、与下下限限之之差差,可可根根据据全全部部数数据据的的最最大大值值和和最最小小值值及及所分的组数来确定,即所分的组数来确定,即 组距组距组距组距(最大值最大值最大值最大值 -最小值)最小值)最小值)最小值)组数组数组数组数 等距分组和不等距分组 等距分组是各组保持相等的组距,也就是说各组标志值的变动都限于相同的范围。各组组距均相等。如:1020,2030,3040,等。组距为10。这种分组适用于均匀分布的总体。不等距分组即各组组距不相等的分组。如:1020,2050,5060,6070等。其中第二 组与其它各组组距不同。这种分组适用于资料分布离差较大或特殊的研究目的。统计分组时采用等距分组还是不
14、等距分组,取决于研究对象的性质特点。在标志值变动比较均匀的情况下宜采用等距分组。等距分组便于各组单位数和标志值直接比较,也便于计算各项综合指标。等距分组表(上下组限重叠)某车间某车间50名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)频率(频率(%)105110110115115120120125125130130135135140358141064610162820128合计合计50100 在标志值变动很不均匀的情况下宜采用不等距分组。在变量分布比较密集的区间,采用较短的组距;在变量分布比较稀少的区间,采用较长的组距。不等距分组有时更能说明现象的本
15、质特征。在不等距分组中,由于各组组距的大小对各组的分布次数有影响,这时的次数分布不能反映总体的分布特征,因此需要消除组距不等的影响,方法是用各组组距去除相应的分布次数,即用次数密度或称频数密度反映现象的分布状况。组限和组中值组距两端的数值称组限。其中,每组的起点数值称为下限,每组的终点数值称为上限。组限的表示方法常见的有两种,一是上下限重叠式(连续组距式);二是上下限不重叠式(间断组距式)。对于连续型变量,只能采用上下限重叠式的组限表示法;对于离散型变量,二者都可以采用。若采用上下限重叠式的表示法,应遵循“上组限不包括在内”的统计原则。3.3.根据分组整理成频数分布表根据分组整理成频数分布表
16、四频数和频率统计分组后各组对应的单位数称为频数,也叫次数;各组单位数占总体单位总数的比重称为频率。各组的频率大于,所有组的频率总和等于。在变量分布数列中,频数(频率)表明对应组标志值的作用程度。频数(频率)数值越大表明该组标志值对于总体水平所起的作用也越大,反之,频数(频率)数值越小,表明该组标志值对于总体水平所起的作用越小。工资分组工资分组 职工人数(人)职工人数(人)各组人数所占比重各组人数所占比重 (元)(元)(次数或频数)(次数或频数)(%)(频率)(频率)500600 100 25600700 200 50700800 100 25 合合 计计 400 100频率:各组的频率大于频率
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学原理 第三章 统计整理 统计学 原理 第三 统计 整理
![提示](https://www.deliwenku.com/images/bang_tan.gif)
限制150内