欢迎来到得力文库 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
得力文库 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    (精品)第二章 统计数据的收集、整理与显示.ppt

    • 资源ID:85522347       资源大小:533.01KB        全文页数:79页
    • 资源格式: PPT        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    (精品)第二章 统计数据的收集、整理与显示.ppt

    统计学导论周国富 主讲1第二章第二章 统计数据的收集、统计数据的收集、整理与显示整理与显示 第一节 统计数据的收集 第二节 统计数据的整理 第三节 统计数据的显示2第一节第一节 统计数据的收集统计数据的收集 (参见袁卫等(参见袁卫等统计学统计学P8-9P8-9,交代得很简单),交代得很简单)统计数据收集:统计数据收集:是指根据统计研究预定的目是指根据统计研究预定的目的和任务,运用科学的调查方法与手段,有的和任务,运用科学的调查方法与手段,有计划、有组织地收集反映客观现实的统计资计划、有组织地收集反映客观现实的统计资料的过程。料的过程。统计数据的收集是统计工作的统计数据的收集是统计工作的基础环节基础环节。3一、统计数据的收集方法按所收集数据是否经过加工来划分,统计数据按所收集数据是否经过加工来划分,统计数据有两种表现形式:有两种表现形式:(见袁卫等(见袁卫等统计学统计学P8P8)原始资料:原始资料:是直接向调查对象收集的反映是直接向调查对象收集的反映调查单位的统计数据;调查单位的统计数据;二手资料:二手资料:是已经加工、整理过的、说明是已经加工、整理过的、说明总体现象的数据。总体现象的数据。4一、统计数据的收集方法按被调查单位是否处于人为控制之下来划分,按被调查单位是否处于人为控制之下来划分,原始资料原始资料又有两种类型:又有两种类型:试验数据:试验数据:是在既定的控制条件下进行试是在既定的控制条件下进行试验,反映试验过程和结果的数据验,反映试验过程和结果的数据(适用于自(适用于自然科学)然科学);调查数据:调查数据:是按照既定的调查方案,通过是按照既定的调查方案,通过统计调查所取得的数据统计调查所取得的数据(适用于社会经济现(适用于社会经济现象)象)。5一、统计数据的收集方法收集被调查单位的原始资料(即调查数据)收集被调查单位的原始资料(即调查数据),常用的方法有:直接观察法、报告法常用的方法有:直接观察法、报告法(通讯法)、采访法、登记法等。(通讯法)、采访法、登记法等。此外,此外,计算机辅助电话调查计算机辅助电话调查、网络调查网络调查、卫星遥感技术卫星遥感技术等,正被广泛地用于统计数等,正被广泛地用于统计数据的收集。据的收集。6二、二、统计调查方式统计调查方式统计调查方式:统计调查方式:是指从调查对象中选取调查单位的方式。全面调查:对调查对象中的所有单位一一进行调查。非全面调查:仅对调查对象中的一部分单位进行调查。常用的统计调查方式:普查 抽样调查 重点调查统计报表制度71.1.普查普查(见袁卫等(见袁卫等统计学统计学P8P8)普普查查:是是专专门门组组织织的的一一种种全全面面调调查查,它它主主要要是是用用以以收收集集某某些些不不能能或或不不宜宜用用定定期期报报表表收收集集的的统统计计资资料料。对对国国情情国国力力的的调调查查一一般般采采用用普普查。查。普查的特点普查的特点:(1 1)普查是一种非经常性的全面调查;)普查是一种非经常性的全面调查;(2 2)普普查查比比任任何何一一种种调调查查形形式式更更能能掌掌握握大大量、详细、全面的统计资料。量、详细、全面的统计资料。8第二次全国经济普查第二次全国经济普查普查时点普查时点为2008年12月31日24时,普查时期普查时期为2008年1月1日12月31日。普查对象普查对象:在境内从事第二、第三产业的法人单位、产业活动单位和个体经营户。普查范围普查范围:采矿业,制造业,电力,建筑业,交通运输、仓储和邮政业,批发和零售业,住宿和餐饮业,金融业,房地产业,租赁和商务服务业等。普查内容普查内容:单位基本属性、财务状况、生产经营情况、生产能力、能源消耗等。9第二次全国农业普查第二次全国农业普查 普查时点普查时点为2006年12月31日,普查时期普查时期为2006年1月1日12月31日。普查对象普查对象:为我国境内的农村住户、城镇农业生产经营户、农业生产经营单位、村民委员会和乡镇人民政府。普查内容普查内容:主要包括农业生产条件、农业生产经营活动、农业土地利用、农村劳动力及就业、农村基础设施、农村社会服务、农村居民生活,以及乡镇、村民委员会和社区环境等方面情况。农业普查采用全面调查全面调查的方法,对所有普查对象由普查员进行逐个查点和填报。通过普查,掌握了我国有关农业、农村、农民的基本情况。102抽样调查抽样调查(见袁卫等(见袁卫等统计学统计学P8P8)抽样调查:抽样调查:是一种非全面调查,抽样调是一种非全面调查,抽样调查可以分为概率抽样和非概率抽样。查可以分为概率抽样和非概率抽样。概率抽样概率抽样是按随机原则从调查对象中抽取是按随机原则从调查对象中抽取一部分单位作为样本进行观察,然后根据一部分单位作为样本进行观察,然后根据样本数据去推算调查对象的总体特征。样本数据去推算调查对象的总体特征。非概率抽样非概率抽样是随便地或有意识地抽取单位是随便地或有意识地抽取单位进行调查,一般不用样本数据推断总体的进行调查,一般不用样本数据推断总体的数量特征。数量特征。(袁卫等(袁卫等统计学统计学P8P8没有提及)没有提及)通常讨论的是概率抽样。通常讨论的是概率抽样。11概率抽样概率抽样概率抽样的特点:概率抽样的特点:样本单位按随机原则抽取,排除了主观样本单位按随机原则抽取,排除了主观因素对选样的影响。因素对选样的影响。根据部分调查的实际资料对调查对象总根据部分调查的实际资料对调查对象总体的数量特征作出估计。体的数量特征作出估计。抽样误差可以事先计算并加以控制。抽样误差可以事先计算并加以控制。抽样调查的适用场合:抽样调查的适用场合:不可能或不必要进行全面调查的社会经不可能或不必要进行全面调查的社会经济现象,采用抽样调查;济现象,采用抽样调查;对普查资料进行必要的修正。对普查资料进行必要的修正。123重点调查重点调查(袁卫等(袁卫等统计学统计学没讲)没讲)重重点点调调查查:在在调调查查对对象象中中,只只选选择择一一部部分分重重点单位进行的非全面调查。点单位进行的非全面调查。重重点点单单位位:它它们们的的数数量量虽虽少少,但但在在所所研研究究现现象象的的标标志志总总量量中中占占有有绝绝大大比比重重,在在总总体体中中具具有有举举足足轻轻重重的的作作用用。对对这这些些单单位位进进行行调调查查,能能够够从从数数量量上上反映整个总体在该标志总量方面的基本情况。反映整个总体在该标志总量方面的基本情况。重点调查的特点:重点调查的特点:可可以以了了解解较较详详细细的的情情况况,但但无无法法对对现现象象总总体体的的数数量特征作出准确的推算,也无法测算调查误差。量特征作出准确的推算,也无法测算调查误差。重点调查的适用场合:重点调查的适用场合:当当调调查查任任务务只只要要求求掌掌握握基基本本情情况况,而而部部分分单单位位又又能比较集中地反映研究的项目,宜采用重点调查。能比较集中地反映研究的项目,宜采用重点调查。134统计报表制度统计报表制度(袁卫等(袁卫等统计学统计学没讲)没讲)统计报表制度:统计报表制度:依照国家有关法规,自上而依照国家有关法规,自上而下地统一布置,以一定的原始记录为依据,下地统一布置,以一定的原始记录为依据,按照统一的表式、统一的指标项目、统一的按照统一的表式、统一的指标项目、统一的报送时间和报送程序,自下而上地逐级地定报送时间和报送程序,自下而上地逐级地定期提供统计资料的一种调查方式。期提供统计资料的一种调查方式。统计报表制度的主要特点:统计报表制度的主要特点:报表资料的来源建立在报表资料的来源建立在各个基层单位的原始记录各个基层单位的原始记录的基础上;的基础上;由于统计报表是逐级上报和汇总的,各级领导部由于统计报表是逐级上报和汇总的,各级领导部门都能获得管辖范围内的报表资料;门都能获得管辖范围内的报表资料;是一种经常性的(连续性)调查,调查项目相对是一种经常性的(连续性)调查,调查项目相对稳定,有利于积累资料,并进行动态对比分析。稳定,有利于积累资料,并进行动态对比分析。14三、统计调查体系三、统计调查体系(袁卫等(袁卫等统计学统计学没讲)没讲)统计调查体系:统计调查体系:一个国家开展统计调一个国家开展统计调查的方法和制度的总称。查的方法和制度的总称。我国现行的统计调查体系:我国现行的统计调查体系:以必要的周期性的普查为基础,经常性以必要的周期性的普查为基础,经常性的抽样调查为主体,同时辅之以重点调的抽样调查为主体,同时辅之以重点调查、科学推算和部分全面报表综合运用查、科学推算和部分全面报表综合运用的统计调查方法体系。的统计调查方法体系。15四、统计调查方案的设计四、统计调查方案的设计 (袁卫等(袁卫等统计学统计学没讲)没讲)统计调查方案的设计,是指在背景分析的前提下,制定出一个周密的方案,用以指导调查工作的全过程。16四、统计调查方案的设计四、统计调查方案的设计统计调查方案一般包括以下内容:统计调查方案一般包括以下内容:一一明确调查目的。明确调查目的。就是明确统计调查要解决什么问题。二二确定调查对象和调查单位。确定调查对象和调查单位。调查对象:调查对象:是指需要调查的现象总体。调调查查单单位位:是指所要调查的具体单位,它是所要调查登记的标志的承担者。17四、统计调查方案的设计四、统计调查方案的设计报告单位:报告单位:亦称填报单位,它是负责向上报告调查内容、提交统计资料的单位。报告单位一般是在行政上、经济上具有一定独立性的单位;而调查单位可以是人、企事业单位,也可以是物。二者有时一致,有时不一致。例:全国人口普查,属于报告单位和调查单位不一致的情形。18三三设计调查项目。设计调查项目。调查项目调查项目:是调查中所要登记的调查单位的特征,也就是调查单位的标志。四四设计调查表格和问卷。设计调查表格和问卷。将各个调查项目按照一定的顺序排列在一定的表格上,就构成了调查表调查表。调查表的种类:一览表和单一表调查问卷调查问卷:一种特殊形式的调查表格四、统计调查方案的设计四、统计调查方案的设计19五五确定调查时间和调查期限。确定调查时间和调查期限。调查时间:调查时间:是指调查资料所属的时间。在统计调查中,如果所调查的是时期现象,就要明确规定调查资料所反映的起止日期;如果所要调查的是时点现象,调查时间就是规定的统一标准时点。调查期限:调查期限:是进行调查工作的时限。包括收集资料和报送资料的工作所需的时间。六六拟定实施调查的进度计划。拟定实施调查的进度计划。包括培训调查人员、落实调查经费、调查数据的报送方式等。七七调查报告的撰写。调查报告的撰写。四、统计调查方案的设计四、统计调查方案的设计20五、五、二手资料二手资料的主要来源渠道的主要来源渠道(参见袁卫等(参见袁卫等统计学统计学P9P9)1统计年鉴中国统计年鉴、国际统计年鉴、地方统计年鉴、中国统计摘要、中国劳动统计年鉴、中国财政年鉴、中国西部统计年鉴、中国地区统计公报、中国人口年鉴等2有关期刊中国经济景气月报(国家统计局主办)中国经济数据分析(中国信息中心主办)21五、二手资料的主要来源渠道五、二手资料的主要来源渠道3有关网站(见教材P23)中国国家统计局:http:/中国人民银行:http:/天津统计信息网:http:/www.stats-联合国统计署:http:/unstats.un.org中国科技统计:http:/中国经济信息网:http:/国研网:http:/其他网站22小结:小结:统计数据的收集统计数据的收集统计调查方案23第二节第二节 统计数据的整理统计数据的整理(参见袁卫等(参见袁卫等统计学统计学P15-23“2.1P15-23“2.1统计数据的整理统计数据的整理”)一、数据整理概述一、数据整理概述(袁卫等(袁卫等统计学统计学没有)没有)1 1统计数据整理的含义统计数据整理的含义统计数据整理是指对统计调查所收集到的各种数据进行分类和汇总,又称为汇总性整理。2 2统计数据整理方案的设计统计数据整理方案的设计确定如何对所研究的总体进行统计分组;确定描述总体数量特征的统计指标体系。243统计数据整理的程序统计数据整理的程序(袁卫等袁卫等统计学统计学没有概括没有概括)(1)统计资料的审核(2)统计资料的分组与汇总(3)编制统计表或绘制统计图(4)统计资料的积累、保管和公布25二、二、统计分组统计分组(重点重点)(一)统计分组的概念和种类(一)统计分组的概念和种类1.1.统计分组的概念统计分组的概念根根据据统统计计研研究究的的目目的的和和客客观观现现象象的的内内在在特特点点,按按某某个个标标志志(或或几几个个标标志志)把把被被研研究究的的总总体体划划分分为为若若干干个个不不同同性性质质的的组组,称称为为统统计计分分组组。(袁袁卫卫等等统计学统计学P16的定义不严谨)的定义不严谨)统统计计分分组组标标志志:可可以以是是品品质质标标志志或或数数量量标标志志。(袁袁卫卫等等统统计计学学没没有有定定义义“品品质质标标志志”和和“数量标志数量标志”这两个概念,但这两个概念,但P16用到了)用到了)262.2.统计分组的性质统计分组的性质 (袁卫等(袁卫等统计学统计学没有)没有)统计分组兼有统计分组兼有“分分”和和“合合”双重含义。双重含义。对对于于现现象象总总体体,是是“分分”;对对于于总总体体单单位位,是是“合合”。统统计计分分组组在在突突出出一一种种差差异异时时,必必然然掩掩盖盖其其他他差异。差异。所所以以,必必须须根根据据统统计计研研究究的的任任务务和和分分组组对对象象的的特点,特点,正确选择分组标志正确选择分组标志。273.3.统计分组的种类统计分组的种类 (袁卫等(袁卫等统计学统计学没有)没有)按分组标志的多少,分为简单分组和复合分组按分组标志的多少,分为简单分组和复合分组简简单单分分组组是是对对研研究究现现象象按按一一个个标标志志进进行行分分组组。许许多多简简单单分分组组从从不不同同角角度度说说明明同同一一总总体体,就就构构成成一一个个平行分组体系平行分组体系。复复合合分分组组是是把把两两个个或或两两个个以以上上的的分分组组标标志志层层叠叠起起来来对对研研究究现现象象所所作作的的分分组组。即即:先先按按一一个个标标志志分分组组,在在此此基基础础上上再再按按第第二二个个标标志志分分组组,依依此此类类推推。复合分组构成一个复合分组构成一个复合分组体系复合分组体系。翻页28 某班学生按年龄分组某班学生按年龄分组年龄(周岁)人数1718192021合计返回返回29高校教师按专业技术职务和年龄分组高校教师按专业技术职务和年龄分组按专业技术职务分组按专业技术职务分组按年龄分组按年龄分组人数人数教授30岁及以下31-4546-6061及以上小计副教授30岁及以下31-4546-6061及以上小计合 计返回返回303.3.统计分组的种类统计分组的种类按按分分组组标标志志的的性性质质不不同同,分分为为品品质质分分组组和数量分组和数量分组品品质质分分组组(或或属属性性分分组组):就就是是按按品品质质标标志分组志分组数数量量分分组组(或或变变量量分分组组):就就是是按按数数量量标标志分组志分组31(二)统计分组的原则和方法(二)统计分组的原则和方法1 1统统计计分分组组必必须须遵遵循循两两个个原原则则:(袁袁卫卫等等统计学统计学P18将其概括为:将其概括为:“不重不漏不重不漏”)穷穷尽尽原原则则:总总体体中中的的每每一一个个单单位位都都应应有有组组可可归归,或或者者说说各各个个分分组组一一起起足足以以包包容容总总体所有的单位。体所有的单位。互互斥斥原原则则:在在特特定定的的分分组组标标志志下下,总总体体中中的的任任何何一一个个单单位位只只能能归归属属于于某某一一组组,而而不能同时可以归属于几个组。不能同时可以归属于几个组。322 2统计分组的方法统计分组的方法 (袁卫等(袁卫等统计学统计学没有展开说明)没有展开说明)(1 1)按品质标志分组:按品质标志分组:有的简单,如按性别分组。有的简单,如按性别分组。有有的的很很复复杂杂,如如按按职职业业分分组组、城城乡乡划划分分等等。此此时时也也叫叫分分类类,需需由由国国家家统统计计部部门门制制定定统统一的分类标准。一的分类标准。332 2统计分组的方法统计分组的方法 (袁卫等(袁卫等统计学统计学没有展开说明)没有展开说明)(2 2)按数量标志分组按数量标志分组单单项项式式分分组组:用用数数量量标标志志的的每每个个取取值值作作为为组的名称。组的名称。组组距距式式分分组组:把把数数量量标标志志的的取取值值范范围围依依次次划划分分为为若若干干个个满满足足互互斥斥原原则则和和穷穷尽尽原原则则的的区间,用这些数值区间作为组的名称。区间,用这些数值区间作为组的名称。34例例1:某班学生按年龄分组某班学生按年龄分组年龄(周岁)人数1718192021合计返回返回35组组距式分距式分组组的几个概念的几个概念组组限限:在在组组距距式式分分组组中中,每每一一组组变变量量值值中中的的最最大大值值称为称为上限上限,最小值称为,最小值称为下限下限。按照组限的写法不同,组距式分组有两种:按照组限的写法不同,组距式分组有两种:间间断断型型组组距距式式分分组组:指指相相邻邻两两组组的的组组限限不不相相连连的的组组距距式式分分组;组;连连续续型型组组距距式式分分组组:指指相相邻邻两两组组的的组组限限相相连连(重重叠叠),即即以同一数值作为相邻组的共同界限的组距式分组。以同一数值作为相邻组的共同界限的组距式分组。对对于于连连续续型型组组距距式式分分组组,为为满满足足互互斥斥原原则则,需需遵遵循循“上组限不在内上组限不在内”原则。原则。“上上组组限限不不在在内内”原原则则:是是指指总总体体某某个个单单位位的的变变量量值值是是相相邻邻两两组组的的界界限限值值时时,这这个个单单位位应应归归入入作作为为下下组组限限的的那那一一组组内。内。(袁卫等(袁卫等统计学统计学P18)组距:组距:每组数值区间的距离。每组数值区间的距离。等距分组等距分组与与不等距分组不等距分组(袁卫等(袁卫等统计学统计学P18)36例例2:人口按年龄分组人口按年龄分组年龄(周岁)人数05612131516181922合计返回返回37例例3:全班同学按统计学成绩分组全班同学按统计学成绩分组成绩人数90以上80907080607060以下合计返回返回38组距式分组相关指标的计算组距式分组相关指标的计算(1 1)组距的计算)组距的计算连续型组距式分组连续型组距式分组的组距的组距=本组上限本组上限本组下限本组下限 间间断断型型组组距距式式分分组组的的组组距距=本本组组上上限限本本组组下下限限+相相邻组的组限间隔邻组的组限间隔(2 2)组组中中值值(上上下下限限之之间间的的中中点点数数值值,代代表表各各组组标标志志值的平均水平)的计算值的平均水平)的计算(3 3)开口组的组距与组中值)开口组的组距与组中值开口组:开口组:指指“以上以上”、“以下以下”这种未规定上限或这种未规定上限或未规定下限的组。未规定下限的组。开口组的组距:开口组的组距:以相邻组的组距作为开口组的组距。以相邻组的组距作为开口组的组距。该公式对该公式对连续变量离连续变量离散化(舍尾)散化(舍尾)得到的得到的组距式分组组距式分组不适用!不适用!补充补充39全班同学按统计学成绩分组全班同学按统计学成绩分组成绩组距组中值人数90以上109580901085708010756070106560以下1055合计返回返回40企业按职工人数分组企业按职工人数分组职工人数(人)组界组距组中值企业数190.59.59510199.519.51014.5204919.549.53034.5509910019949.599.599.5199.55010074.5149.5200及以上199.5以上100249.5合计返回返回41同学们按身高分组同学们按身高分组按身高分组(米)组界组距组中值人数1.49及以下1.495以下0.11.4451.501.591.495-1.5950.11.5451.601.691.595-1.6950.11.6451.701.791.695-1.7950.11.7451.80及以上1.795以上0.11.845合计返回返回此时教材P27的(2.2)式不适用!不适用!说明:公式“间断型组距式分组间断型组距式分组的组距的组距=本组上限本组上限本组下限本组下限+1+1”,仅适用于相邻组的组限间隔为1的情形。42人口按年龄分组人口按年龄分组按年龄分组(周岁周岁)组界组距组中值人数05066361261379.513151316314.516181619317.519221923421合计返回返回注意这一列!注意这一列!43补充:补充:关于关于间断型组距式分组间断型组距式分组的组距、的组距、组中值的计算方法组中值的计算方法间断型组距式分组间断型组距式分组的组距、组中值,最好采用的组距、组中值,最好采用组界组界(组与组之间的真实界限)(组与组之间的真实界限)来计算来计算。分组标志为分组标志为离散变量离散变量时,时,组界组界是相邻组组限的中点是相邻组组限的中点;分组标志为连续变量经过离散化处理得到时,组界分组标志为连续变量经过离散化处理得到时,组界的确定要视离散化处理的方式而定:的确定要视离散化处理的方式而定:舍尾法舍尾法(如:(如:年龄表示为周岁),挑尾法(如:年龄表示为虚岁),年龄表示为周岁),挑尾法(如:年龄表示为虚岁),四舍五入四舍五入(如:身高表示为多少公分)。(如:身高表示为多少公分)。间断型组距式分组间断型组距式分组的组距的组距=上组界上组界下组界下组界翻页翻页44企业按职工人数分组企业按职工人数分组职工人数(人)组界组距组中值企业数190.59.59510199.519.51014.5204919.549.53034.5509910019949.599.599.5199.55010074.5149.5200及以上199.5以上100249.5合计返回返回45人口按年龄分组人口按年龄分组按年龄分组(周岁)组界组距组中值人数05066361261379.513151316314.516181922161919233417.521合计返回返回46同学们按身高分组同学们按身高分组按身高分组(米)组界组距组中值人数1.49及以下1.495以下0.11.4451.501.591.495-1.5950.11.5451.601.691.595-1.6950.11.6451.701.791.695-1.7950.11.7451.80及以上1.795以上0.11.845合计返回返回47三、次数分布三、次数分布(一)次数分布的基本概念1.次数分布的定义将统计总体按某个标志分组,并将总体中的所有单位按组归类,计算各组的单位数,这样得到的特殊分组特殊分组就叫次数分布(或次数次数分布(或次数分配)分配)。(袁卫等(袁卫等统计学统计学P17)次数分布的各组名称与相应的次数结合在一起,形成反映总体单位在各组之间分布状况的数列,所以也叫作分布数列。48全班同学按统计学成绩分组形成的次数分布全班同学按统计学成绩分组形成的次数分布成绩人数90以上88090127080146070960以下2合计45返回返回492.分布数列的两个要素一是总体按某标志所分的组。若总体按数量标志分组,分组标志在各组有不同的数量表现,形成标志值数列,亦称变量,一般用 x 表示。二是各组所出现的单位数,即次数(亦称频数),一般用 f 表示。3.频率用各组频数与总体单位总数相除,可以得到频率。50频率的性质:4.频数密度与频率密度 对对于于不不等等距距分分组组,各各组组次次数数的的多多少少还还受受到到组组距距大大小小的的影影响响。为为消消除除不不等等距距分分组组所所造造成成的的这种影响,需计算频数密度与频率密度。这种影响,需计算频数密度与频率密度。(A A)频数密度频数密度=频数频数/组距组距 (B B)频率密度频率密度=频率频率/组距组距51四、累计频数与累计频率四、累计频数与累计频率1累计次数分布在数量标志分布数列的基础上,将各组频数或频率依次累计,可以得到累计频数或累计频率。(袁袁卫卫等等统统计计学学P19用用的的是是“累积累积”二字)二字)52例例4 60对新婚青年按结婚费用分组返回返回翻页翻页53可见,累计次数分布有向上累计(上限以下累向上累计(上限以下累计)计)和向下累计(下限以上累计)向下累计(下限以上累计)之分:(袁(袁卫等卫等统计学统计学P19的文字表述和表的文字表述和表2.9都有问题都有问题!)向上累计:向上累计:是由标志值低的组向标志值高的组依次累计,某一组的累计频数或频率是指该组上限以下各组频数或频率的累计数;向下累计:向下累计:是由标志值高的组向标志值低的组依次累计,某一组的累计频数或频率是指该组下限以上各组频数或频率的累计数。54累计频数或累计频率有如下特点:开始累计第一组的累计频数或累计频率等于第一组本身的频数或频率;累计到最后一组的累计频数或累计频率等于总体的总频数或总频率(总频率为1)。55第三节第三节 统计数据的显示统计数据的显示1统计表的定义和结构(1)统计表的定义把统计数据按一定的顺序排列在表格上,就形成了统计表统计表。一、统计表(参见袁卫等(参见袁卫等统计学统计学P39-40)56(2)统计表的结构从从表表式式上上看看,统统计计表表包包括括表表头头、行行标标题题、列列标标题题和和数数字字资资料料四四个个部部分分。必必要要时时,在在统计表的下方还有统计表的下方还有表外附加表外附加。从从内容内容上看,统计表由上看,统计表由主词主词和和宾词宾词组成。组成。主词:统计表所要说明的总体及其组成部分;宾词:统计表用来说明总体数量特征的各个统计指标。翻页翻页57统计表的结构统计表的结构2005年我国三次产业比例年我国三次产业比例数字资料行标题44.823.831.412.647.539.9第一产业第二产业第三产业占就业人口比重(%)占GDP比重(%)三次产业表头列标题主词宾词返回返回582 2统计表的分类统计表的分类(1 1)按主词的结构分类按主词的结构分类根根据据主主词词是是否否分分组组和和分分组组的的程程度度,分分为为简单表、简单分组表和复合分组表。简单表、简单分组表和复合分组表。简单表:主词未经任何分组的统计表。简单表:主词未经任何分组的统计表。简简单单分分组组表表:主主词词只只按按一一个个标标志志分分组组的的统统计表。计表。复复合合分分组组表表:主主词词按按两两个个或或两两个个以以上上标标志志复合分组的统计表。复合分组的统计表。592 2统计表的分类统计表的分类 (2 2)按宾词设计分类按宾词设计分类按按宾宾词词的的排排列列方方式式不不同同,可可分分为为宾宾词词简简单单排排列列、宾宾词词分分组组平平行行排排列列和和宾宾词词分分组组层叠排列等三种。层叠排列等三种。宾词简单排列:宾词简单排列:宾词未进行任何分组。宾词未进行任何分组。宾宾词词分分组组平平行行排排列列:宾宾词词栏栏中中各各指指标标按按几几个分组标志分组,平行排列。个分组标志分组,平行排列。宾宾词词分分组组层层叠叠排排列列:宾宾词词栏栏中中各各指指标标按按几几个分组标志分组,层叠排列。个分组标志分组,层叠排列。翻页翻页60高校教师按专业技术职务和年龄分组高校教师按专业技术职务和年龄分组按专业技术职务分组按专业技术职务分组按年龄分组按年龄分组人数人数教授30岁及以下31-4546-6061及以上小计副教授30岁及以下31-4546-6061及以上小计合 计返回返回61我国独立核算工业企业的生产及销售成果我国独立核算工业企业的生产及销售成果返回返回62各地区社会商品零售总额按地区分组按商品性质和用途分组按城乡分组按经济类型分组消费品零售总额农业生产资料销售额城镇乡村国有集体个体其他北京天津河北合计返回返回63地区各种经济类型房地产企业经营情况表地区各种经济类型房地产企业经营情况表单位:亿元按经济类型分组实收资本经营收入总额其中:国家资本总额其中土地转让收入商品房销售收入小计住宅办公楼其他国有集体外资总计返回返回643 3统计表的设计统计表的设计统计表的设计,需特别注意以下几个方面统计表的设计,需特别注意以下几个方面:(1 1)开口式开口式(2 2)标题)标题(3 3)合计栏)合计栏(4 4)数据)数据(5 5)计量单位计量单位(6 6)注释或资料来源注释或资料来源65二、统计图二、统计图(袁卫等(袁卫等统计学统计学P19-21、P40-50)常常用用的的统统计计图图有有:直直方方图图、折折线线图图、曲曲线线图图和累计曲线图。和累计曲线图。还有还有茎叶图茎叶图、箱线图箱线图等。等。1 1直方图直方图(袁卫等(袁卫等统计学统计学P19-20)以横轴表示分组变量,以以纵纵轴轴表表示示频频数数或或频频率率,以各组的组距为宽宽,以各组的频数或频率为高高,绘制直立于横轴上的长方形,便成为分布直方图。例:见袁卫等统计学P19图2.1但是,对于不等距分组,绘制直方图时,应以频频数数密密度度或频频率率密密度度为纵轴。(教教材材未未提提!)!)66二、统计图二、统计图2 2折线图折线图(见袁卫等统计学P20)是用直线段依次连结分布直方图各直条顶端中点画成的。在直方图的左右两侧应各延伸一个相邻组组距的长度,以其中点作为折线图的两个端点。(教教材材未未提提,但但画画图图正正确确!)!)只有这样,折线图与直方图的面积才相等。(袁卫等统计学P20)例:见袁卫等统计学P20图2.2 67二、统计图二、统计图3 3曲线图曲线图(见袁卫等统计学P20)当把组距式分组分得无穷多(无限地密),以至各组组距趋近于0时,次数分布折线便演变成一条平滑的曲线,称之为分分布布曲曲线线图图。曲线图的绘制方法与折线图基本相同,只是用平滑曲线连接各个坐标点。例:见袁卫等统计学P20图2.3684 4茎茎叶叶图图(stem-and-leaf display,见袁卫等统计学P41)用于显示未分组的原始数据的分布由“茎”和“叶”两部分构成,其图形是由数字组成的以该组数据的高位数值作树茎,低位数字作树叶树叶上只保留一位数字茎叶图类似于横置的直方图,但又有区别:直方图可观察一组数据的分布状况,但没有给出具体的数值茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息例:见袁卫等统计学P41表2.17二、统计图二、统计图69例:未分组数据的茎叶图表二、统计图二、统计图70例:未分组数据茎叶图(扩展的茎叶图,不要求)二、统计图二、统计图71二、统计图二、统计图5 5累计分布曲线图累计分布曲线图以分组变量为横轴,以累计频数(频率)为纵轴。绘制向上累计分布图向上累计分布图时,由变量值低的组开始,用各组的累计频率与该组上限确定坐标点,然后从最低组的下限开始从最低组的下限开始将这些点依次连接。绘制向下累计分布图向下累计分布图时,由变量值高的组开始,用各组的累计频率与该组下限确定坐标点,然后从最高组的上限开始从最高组的上限开始将这些点依次连接。72洛伦茨曲线洛伦茨曲线(参见袁卫等(参见袁卫等统计学统计学P21P21)洛洛伦伦茨茨曲曲线线:一种特殊的累计分布曲线图,用于研究社会财富、土地、收入等分配公平与否。洛伦茨曲线的绘制方法洛伦茨曲线的绘制方法:(袁卫等(袁卫等统计学统计学P21P21例例2.22.2)1.将分配对象(如收入)和接受分配者(如家庭)的数量用比重(频率)表示,并进行向上累计。2.纵轴和横轴均为百分比尺度,纵轴自下而上,用以反映分配对象的累计百分比;横轴自左向右,用以反映接受分配者的累计百分比。3.根据计算所得的分配对象和接受分配者的累计百分比,在图中标出相应的坐标点,然后从原点开始用平滑曲线连接各点,所得曲线即为洛伦茨曲线。73洛伦兹曲线洛伦兹曲线(Lorenz Curve)图 洛伦兹曲线绝对不平均线10050010050人口百分比收入百分比BA绝对平均线在左图中,在左图中,纵轴纵轴为收入为收入百分比,百分比,横横轴轴为人口为人口(或家庭)(或家庭)百分比,百分比,450线为线为绝对平绝对平均线均线,而横,而横轴与其右侧轴与其右侧的垂直线共的垂直线共同组成同组成绝对绝对不平均线不平均线。74基尼系数基尼系数基尼系数:基尼系数:在洛伦茨曲线图的基础上计算得到,用以衡量收入分配的平等与否。具体讲,用洛伦茨曲线与绝对平均线所包围的面积A,除以绝对平均线和绝对不平均线所包围的面积(A+B),所得之商就是基尼系数:Gini=A/(A+B)基尼系数的值越小,即洛伦茨曲线越靠近绝对平均线,则收入分配越平等;反之,基尼系数的值越大,即洛伦茨曲线越靠近绝对不平均线,则收入分配越不平等。75三、次数分布图的类型次数分布图的形状大致有三种:钟型分布、U型分布和J型分布。()()()图图 钟型分布钟型分布示意图示意图【袁卫等袁卫等统计学统计学P20-21的说法有所不同的说法有所不同】76 10 20 30 40 50 60 70 805040302010 0死亡率年龄(岁)图图 U型分布型分布示意图示意图【袁卫等袁卫等统计学统计学P21P21“死亡率曲线死亡率曲线”】77图图 J型分布型分布示意图示意图【袁卫等袁卫等统计学统计学P21P21“供给曲线供给曲线”和和“需求曲线需求曲线”】正J型图反J型图78本章小结本章小结详见曾五一,肖红叶详见曾五一,肖红叶 主编主编统计学导论统计学导论P44-45,袁卫等袁卫等统计学统计学教材教材P51提示:提示:每章学完之后,同学们都应该读一读每章后每章学完之后,同学们都应该读一读每章后面的面的“本章小结本章小结”,以便抓住本章的要点;同时,以便抓住本章的要点;同时,把把“思考与练习思考与练习”中的代表性习题做一做,检验一中的代表性习题做一做,检验一下自己的学习效果!下自己的学习效果!79

    注意事项

    本文((精品)第二章 统计数据的收集、整理与显示.ppt)为本站会员(gsy****95)主动上传,得力文库 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知得力文库 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于得利文库 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

    © 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

    黑龙江省互联网违法和不良信息举报
    举报电话:0468-3380021 邮箱:hgswwxb@163.com  

    收起
    展开