【教学课件】第二章统计资料的整理与分析.ppt
《【教学课件】第二章统计资料的整理与分析.ppt》由会员分享,可在线阅读,更多相关《【教学课件】第二章统计资料的整理与分析.ppt(83页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、第二章第二章 统计资料的整理与分析统计资料的整理与分析下一张下一张 主主 页页 退退 出出 上一张上一张 1 数理统计中的常用术语数理统计中的常用术语 1.1 总体与样本总体与样本 总体:总体:总体:总体:根据研究目的确定的研究对象的全体称为根据研究目的确定的研究对象的全体称为根据研究目的确定的研究对象的全体称为根据研究目的确定的研究对象的全体称为总体总体总体总体(population)(population);个体:个体:个体:个体:总体中的每一个研究单位称为总体中的每一个研究单位称为总体中的每一个研究单位称为总体中的每一个研究单位称为个体个体个体个体(individual)(individ
2、ual);样本:样本:样本:样本:依据一定方法由总体中抽取部分个体所组成的依据一定方法由总体中抽取部分个体所组成的依据一定方法由总体中抽取部分个体所组成的依据一定方法由总体中抽取部分个体所组成的集合称为集合称为集合称为集合称为样本样本样本样本(sample)(sample);有限总体:有限总体:有限总体:有限总体:含有含有含有含有有限个个体有限个个体有限个个体有限个个体的总体称为的总体称为的总体称为的总体称为有限总体有限总体有限总体有限总体;无限总体:无限总体:无限总体:无限总体:包含有包含有包含有包含有无限多个个体无限多个个体无限多个个体无限多个个体的总体称为的总体称为的总体称为的总体称为无
3、限总体无限总体无限总体无限总体;下一张下一张 主主 页页 退退 出出 上一张上一张 样本容量:样本容量:样本中所包含的个体数目样本中所包含的个体数目叫叫样本容量样本容量或或大小大小(sample size),样本容量常记为,样本容量常记为n。通常把。通常把n30的样本叫的样本叫小样本小样本,n 30的样本叫的样本叫大样本大样本。试验研究的目的:了解总体,然而能试验研究的目的:了解总体,然而能观测到的却是样本,观测到的却是样本,通过样本来推断通过样本来推断总体是统计分析的基本特点总体是统计分析的基本特点。下一张下一张 主主 页页 退退 出出 上一张上一张 为了能可靠地从样本来推断总体,要求为了能
4、可靠地从样本来推断总体,要求样本具有一定的含量和代表性。样本具有一定的含量和代表性。如何获取有代表性的样本?采用随机抽取。如何获取有代表性的样本?采用随机抽取。所谓所谓随机抽取随机抽取(random sampling)是指总体中的每一个个体都有同等的机会被是指总体中的每一个个体都有同等的机会被抽取到样本中。抽取到样本中。样本毕竟只是总体的一部分,尽管样本具样本毕竟只是总体的一部分,尽管样本具有一定的含量也具有代表性,通过样本来推有一定的含量也具有代表性,通过样本来推断总体也不可能是百分之百的正确。断总体也不可能是百分之百的正确。有很大有很大的可靠性但有一定的错误率这是统计分析的的可靠性但有一定
5、的错误率这是统计分析的特点特点。下一张下一张 主主 页页 退退 出出 上一张上一张 1.2 参数与统计量参数与统计量 为了表示总体和样本的数量特征,需要计算为了表示总体和样本的数量特征,需要计算为了表示总体和样本的数量特征,需要计算为了表示总体和样本的数量特征,需要计算特征数。特征数。特征数。特征数。参数:参数:参数:参数:由总体计算的特征数叫由总体计算的特征数叫由总体计算的特征数叫由总体计算的特征数叫参数参数参数参数(parameter)(parameter);常用希腊字母表示参数,例如;常用希腊字母表示参数,例如;常用希腊字母表示参数,例如;常用希腊字母表示参数,例如用用用用 表示总体平均
6、数,用表示总体平均数,用表示总体平均数,用表示总体平均数,用 表示总体标准差;表示总体标准差;表示总体标准差;表示总体标准差;统计量:统计量:统计量:统计量:由样本计算的特征数叫由样本计算的特征数叫由样本计算的特征数叫由样本计算的特征数叫统计量统计量统计量统计量(staistic)(staistic)。常用拉丁字母表示统计量,例如用。常用拉丁字母表示统计量,例如用。常用拉丁字母表示统计量,例如用。常用拉丁字母表示统计量,例如用 表表表表 示样本平均数,用示样本平均数,用示样本平均数,用示样本平均数,用s s表示样本标准差,用表示样本标准差,用表示样本标准差,用表示样本标准差,用RR表表表表示极
7、差。示极差。示极差。示极差。下一张下一张 主主 页页 退退 出出 上一张上一张 总体总体样本样本参数参数 统计量统计量s s2方 差s2标准差平均数R极 差抽样抽样推断、估计推断、估计为了了解总体分布、特征为了了解总体分布、特征构构 造造 总体参数由相应的统计量来估计,例如总体参数由相应的统计量来估计,例如用用 估计估计,用,用S估计估计等。等。1.3 准确性与精确性准确性与精确性 准确性准确性(accuracy)也叫也叫准确度准确度,指观指观测值与其真值的接近程度。测值与其真值的接近程度。设某一试验指标设某一试验指标或性状的真值为或性状的真值为,观测值为,观测值为 x,若,若 x与与相差的绝
8、对值相差的绝对值|x|越小,越小,则观测值则观测值x的的准确性越高;准确性越高;反之则低。反之则低。下一张下一张 主主 页页 退退 出出 上一张上一张 精确性精确性精确性精确性(precision)(precision)也叫也叫也叫也叫精确度精确度精确度精确度,指同一试验指同一试验指同一试验指同一试验指标或性状的重复观测值彼此接近的程度。指标或性状的重复观测值彼此接近的程度。指标或性状的重复观测值彼此接近的程度。指标或性状的重复观测值彼此接近的程度。若观测若观测若观测若观测值彼此接近,即任意二个观测值值彼此接近,即任意二个观测值值彼此接近,即任意二个观测值值彼此接近,即任意二个观测值x xi
9、i 、x xj j 相差的绝对相差的绝对相差的绝对相差的绝对值值值值|x xi i x xj j|越小,则观测值精确性越高;反之则低。越小,则观测值精确性越高;反之则低。越小,则观测值精确性越高;反之则低。越小,则观测值精确性越高;反之则低。准确性、精确性的意义见图准确性、精确性的意义见图准确性、精确性的意义见图准确性、精确性的意义见图2-12-1。下一张下一张 主主 页页 退退 出出 上一张上一张 图2-1 准确性与精确性的关系示意图随机误差随机误差 也叫也叫 抽样误差抽样误差 (sampling error),是由于许多无法控制的内在和外在的是由于许多无法控制的内在和外在的偶然因偶然因素素
10、所造成的所造成的。随机误差带有偶然性质,在试验。随机误差带有偶然性质,在试验中,即使十分小心的进行试验操作也难以消除。中,即使十分小心的进行试验操作也难以消除。随机误差不可避免,但可减少。随机误差不可避免,但可减少。随机误差影响试验的精确性。随机误差影响试验的精确性。下一张下一张 主主 页页 退退 出出 上一张上一张 1.4 随机误差随机误差(random error)与系统误与系统误差差(systematic error)统计上的试验误差是指随机误差。这统计上的试验误差是指随机误差。这种误差愈小,试验的精确性愈高。种误差愈小,试验的精确性愈高。系统误差系统误差 也叫也叫 片面误差片面误差 (
11、lopsided error),这是这是 由于试验对象由于试验对象相差较大,测量的仪器不准相差较大,测量的仪器不准、标准试剂未标准试剂未经校正,以及观测、记载、抄录、计算中的经校正,以及观测、记载、抄录、计算中的错误等等所引起。错误等等所引起。系统误差可以通过改进方系统误差可以通过改进方法、正确试验设计来避免、消除。法、正确试验设计来避免、消除。系统误差影响试验的准确性。系统误差影响试验的准确性。下一张下一张 主主 页页 退退 出出 上一张上一张 正确地进行试验数据资料的分类是统计正确地进行试验数据资料的分类是统计资料整理的前提。在调查或试验中,由观察、资料整理的前提。在调查或试验中,由观察、
12、测量所得的数据资料按其性质的不同,一般测量所得的数据资料按其性质的不同,一般可以分为可以分为数量性状资料、数量性状资料、质量性状资料和质量性状资料和半定量(等级)资料半定量(等级)资料三大类。三大类。下一张下一张 主主 页页 退退 出出 上一张上一张 2 统计资料的分类统计资料的分类 数量性状数量性状(quantitative character)是指能是指能够以测量、计量或计数的方式表示其特征的性状够以测量、计量或计数的方式表示其特征的性状。观察测定数量性状而获得的数据就是观察测定数量性状而获得的数据就是数量性状资料数量性状资料 数量性状资料的获得有数量性状资料的获得有测量测量和和计数计数两
13、种方式两种方式,因而数量性状资料因而数量性状资料 又分为又分为计量资料计量资料和和计数资料计数资料两种。两种。下一张下一张 主主 页页 退退 出出 上一张上一张 2.1 数量性状资料数量性状资料 用测量方式获得的数量性状资料,即用用测量方式获得的数量性状资料,即用用测量方式获得的数量性状资料,即用用测量方式获得的数量性状资料,即用度、量、衡等计量工具直接测定获得的数度、量、衡等计量工具直接测定获得的数度、量、衡等计量工具直接测定获得的数度、量、衡等计量工具直接测定获得的数量性状资料。其数据是用长度、容积、重量性状资料。其数据是用长度、容积、重量性状资料。其数据是用长度、容积、重量性状资料。其数
14、据是用长度、容积、重量等来表示。这种资料的各个观测值不一量等来表示。这种资料的各个观测值不一量等来表示。这种资料的各个观测值不一量等来表示。这种资料的各个观测值不一定是整数,两个相邻的整数间可以有带小定是整数,两个相邻的整数间可以有带小定是整数,两个相邻的整数间可以有带小定是整数,两个相邻的整数间可以有带小数的任何数值出现,其小数位数的多少由数的任何数值出现,其小数位数的多少由数的任何数值出现,其小数位数的多少由数的任何数值出现,其小数位数的多少由度量工具的精度而定度量工具的精度而定度量工具的精度而定度量工具的精度而定 ,它们之间的变异它们之间的变异它们之间的变异它们之间的变异是连续性的。因此
15、,计量资料也称为是连续性的。因此,计量资料也称为是连续性的。因此,计量资料也称为是连续性的。因此,计量资料也称为连续连续连续连续性变异资料性变异资料性变异资料性变异资料。下一张下一张 主主 页页 退退 出出 上一张上一张 2.1.1 计量资料计量资料 2.1.2 计数资料计数资料 指用计数方式获得的数量性状资指用计数方式获得的数量性状资指用计数方式获得的数量性状资指用计数方式获得的数量性状资料。在这类资料中,它的各个观察值料。在这类资料中,它的各个观察值料。在这类资料中,它的各个观察值料。在这类资料中,它的各个观察值只能以整数表示,在两个相邻整数间只能以整数表示,在两个相邻整数间只能以整数表示
16、,在两个相邻整数间只能以整数表示,在两个相邻整数间不得有任何带小数的数值出现。这些不得有任何带小数的数值出现。这些不得有任何带小数的数值出现。这些不得有任何带小数的数值出现。这些观察值只能以整数来表示,各观察值观察值只能以整数来表示,各观察值观察值只能以整数来表示,各观察值观察值只能以整数来表示,各观察值是不连续的,因此该类资料也称为是不连续的,因此该类资料也称为是不连续的,因此该类资料也称为是不连续的,因此该类资料也称为不不不不连续性变异资料连续性变异资料连续性变异资料连续性变异资料或或或或间断性变异资料间断性变异资料间断性变异资料间断性变异资料。下一张下一张 主主 页页 退退 出出 上一张
17、上一张 2.2 质量性状资料质量性状资料 质量性状质量性状(qualitative character)是指能是指能观察到而不能直接测量的,只能用文字来描述其观察到而不能直接测量的,只能用文字来描述其特征的性状,如食品颜色、特征的性状,如食品颜色、风味等等。这类性状风味等等。这类性状本身不能直接用数值表示,要获得这类性状的数本身不能直接用数值表示,要获得这类性状的数据资料,须对其观察结果作数量化处理,其方法据资料,须对其观察结果作数量化处理,其方法有以下两种:有以下两种:下一张下一张 主主 页页 退退 出出 上一张上一张 2.2.1 统计次数法统计次数法 在一定的总体或样本中,根据某一质量性在
18、一定的总体或样本中,根据某一质量性在一定的总体或样本中,根据某一质量性在一定的总体或样本中,根据某一质量性状的类别统计其次数,以次数作为质量性状的状的类别统计其次数,以次数作为质量性状的状的类别统计其次数,以次数作为质量性状的状的类别统计其次数,以次数作为质量性状的数据。例如,苹果中全红果个数与半红果个数。数据。例如,苹果中全红果个数与半红果个数。数据。例如,苹果中全红果个数与半红果个数。数据。例如,苹果中全红果个数与半红果个数。由质量性状数量化而得来的资料又叫由质量性状数量化而得来的资料又叫由质量性状数量化而得来的资料又叫由质量性状数量化而得来的资料又叫 次数次数次数次数资料。资料。资料。资
19、料。下一张下一张 主主 页页 退退 出出 上一张上一张 评分法评分法 对某一质量性状对某一质量性状对某一质量性状对某一质量性状 ,因其类别不同,分别给因其类别不同,分别给因其类别不同,分别给因其类别不同,分别给予评分。例如,分析面包的质量,可以按照国际予评分。例如,分析面包的质量,可以按照国际予评分。例如,分析面包的质量,可以按照国际予评分。例如,分析面包的质量,可以按照国际面包评分细则进行打分,综合评价面包质量。新面包评分细则进行打分,综合评价面包质量。新面包评分细则进行打分,综合评价面包质量。新面包评分细则进行打分,综合评价面包质量。新产品开发中的评价打分等等。产品开发中的评价打分等等。产
20、品开发中的评价打分等等。产品开发中的评价打分等等。2.3 半定量(等级)资料半定量(等级)资料 半定量或等级资料半定量或等级资料半定量或等级资料半定量或等级资料(semi-quantitative(semi-quantitative or ranked data)or ranked data)是指将观察单位按所考察是指将观察单位按所考察是指将观察单位按所考察是指将观察单位按所考察的性状或指标的等级顺序分组,然后清点各组的性状或指标的等级顺序分组,然后清点各组的性状或指标的等级顺序分组,然后清点各组的性状或指标的等级顺序分组,然后清点各组观察单位的次数而得的资料。这类资料既有次观察单位的次数而得
21、的资料。这类资料既有次观察单位的次数而得的资料。这类资料既有次观察单位的次数而得的资料。这类资料既有次数资料的特点,又有程度或量的不同。如某种数资料的特点,又有程度或量的不同。如某种数资料的特点,又有程度或量的不同。如某种数资料的特点,又有程度或量的不同。如某种果实的褐变程度是视果实变色面积将其分组,果实的褐变程度是视果实变色面积将其分组,果实的褐变程度是视果实变色面积将其分组,果实的褐变程度是视果实变色面积将其分组,然后统计各级别果数。然后统计各级别果数。然后统计各级别果数。然后统计各级别果数。三种不同类型的资料相互间是有区别的,三种不同类型的资料相互间是有区别的,但有时可根据研究的目的和统
22、计方法的要求将但有时可根据研究的目的和统计方法的要求将一种类型资料转化成另一种类型的资料。一种类型资料转化成另一种类型的资料。例如,酸奶中的乳杆菌总数得到的资料属例如,酸奶中的乳杆菌总数得到的资料属于计数资料,根据化验的目的,可按乳杆菌总于计数资料,根据化验的目的,可按乳杆菌总数正常或不正常分为两组,清点各组的次数,数正常或不正常分为两组,清点各组的次数,计数资料就转化为质量性状次数资料;如果按计数资料就转化为质量性状次数资料;如果按乳杆菌总数过高、正常、过低分为三组乳杆菌总数过高、正常、过低分为三组,清,清点各组次数点各组次数 ,就转化成了半定量资料,就转化成了半定量资料。下一张下一张 主主
23、 页页 退退 出出 上一张上一张 3 数据资料的整理数据资料的整理 3.1 数据资料的检查与核对数据资料的检查与核对 目的:目的:目的:目的:在于确保原始资料的在于确保原始资料的在于确保原始资料的在于确保原始资料的完整性完整性完整性完整性和和和和正确性正确性正确性正确性。所谓所谓所谓所谓完整性完整性完整性完整性是指原始资料无遗缺或重复。是指原始资料无遗缺或重复。是指原始资料无遗缺或重复。是指原始资料无遗缺或重复。所谓所谓所谓所谓正确性正确性正确性正确性是指原始资料的测量和记载无差错是指原始资料的测量和记载无差错是指原始资料的测量和记载无差错是指原始资料的测量和记载无差错或未进行不合理的归并。检
24、查中要特别注意特大、或未进行不合理的归并。检查中要特别注意特大、或未进行不合理的归并。检查中要特别注意特大、或未进行不合理的归并。检查中要特别注意特大、特小和异常数据(可结合专业知识作出判断)。对特小和异常数据(可结合专业知识作出判断)。对特小和异常数据(可结合专业知识作出判断)。对特小和异常数据(可结合专业知识作出判断)。对于有重复、异常或遗漏的资料于有重复、异常或遗漏的资料于有重复、异常或遗漏的资料于有重复、异常或遗漏的资料 ,应予以删除或补,应予以删除或补,应予以删除或补,应予以删除或补齐齐齐齐 ;对有错误、相互矛盾的资料应进行更正,必要;对有错误、相互矛盾的资料应进行更正,必要;对有错
25、误、相互矛盾的资料应进行更正,必要;对有错误、相互矛盾的资料应进行更正,必要时进行复查或重新试验。时进行复查或重新试验。时进行复查或重新试验。时进行复查或重新试验。下一张下一张 主主 页页 退退 出出 上一张上一张 未整理的资料为原始资料,是零星的、孤立的和杂乱无章,无规律可循,未整理的资料为原始资料,是零星的、孤立的和杂乱无章,无规律可循,未整理的资料为原始资料,是零星的、孤立的和杂乱无章,无规律可循,未整理的资料为原始资料,是零星的、孤立的和杂乱无章,无规律可循,通过科学的整理和分析,可发现其规律性,揭示事物内在本质通过科学的整理和分析,可发现其规律性,揭示事物内在本质通过科学的整理和分析
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教学课件 教学 课件 第二 统计资料 整理 分析
限制150内