田间试验与统计方法--第三章-统计数据的搜集与整理.ppt
《田间试验与统计方法--第三章-统计数据的搜集与整理.ppt》由会员分享,可在线阅读,更多相关《田间试验与统计方法--第三章-统计数据的搜集与整理.ppt(79页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、第三章第三章 统计数据的搜集与整理统计数据的搜集与整理第一节第一节 常用术语(总体及其样本)常用术语(总体及其样本)其次节其次节 资料分类与整理(次数分布)资料分类与整理(次数分布)第三节第三节 平均数平均数第四节第四节 变异数变异数第五节第五节 理论总体理论总体(群体群体)的平均数和标准差的平均数和标准差第一节 统计学常用术语 统计数据的不齐性 1、变异性是自然界存在的客观规律(生物体的变异性主要由遗传因素、环境因素和发育噪音造成)。2、生物学探讨的对象都是很大的群体,不行能探讨全部对象,只能通过探讨其中的一部分,来推断全部对象。总体和样本总体和样本 p35l总体总体(population)
2、-(population)-共同性质共同性质 探讨对象的全体探讨对象的全体l 无限总体无限总体-如,大黄鱼一龄时的体长、生长率如,大黄鱼一龄时的体长、生长率l 有限总体有限总体-如,今年我校大二学生的英语四级成果如,今年我校大二学生的英语四级成果l 个体:构成总体的每个成员个体:构成总体的每个成员l样本样本(sample)-(sample)-从总体中抽取若干个个体的集合,是总体的一部分。从总体中抽取若干个个体的集合,是总体的一部分。l 随机样本随机样本(random sample)-(random sample)-从总体中随机抽取的样本。可无偏的估计总体从总体中随机抽取的样本。可无偏的估计总体
3、l 样本容量样本容量(sample size)-(sample size)-样本中包含的个体数,又称样本含量。样本中包含的个体数,又称样本含量。l 一般在生物学探讨中,一般在生物学探讨中,l 样本含量在样本含量在3030个以下称为小样本,个以下称为小样本,l 30 30个以上称为大样本。个以上称为大样本。l l统计学的核心问题是探讨如何通过样本推断总体。统计学的核心问题是探讨如何通过样本推断总体。l 统计推断统计推断总体指标:总体指标:参数参数(未知量)(未知量)样本指标:样本指标:统计统计量(已知量)量(已知量)总体总体总体特征与样本特征示意总体特征与样本特征示意总体总体随机样本随机样本非随
4、机样本非随机样本与总体分布与总体分布特征相同特征相同与总体分布与总体分布特征不同特征不同l视察值视察值(observation)l变数变数(variable),又称为随机变数又称为随机变数(random variable)。l变量(变量(variate)l统计数统计数(statistic)l参数参数l参数:由总体计算的数,是描述总体特征的数。是一个真值,不受抽参数:由总体计算的数,是描述总体特征的数。是一个真值,不受抽样变动的影响。常用希腊字母表示,如总体均数样变动的影响。常用希腊字母表示,如总体均数、总体标准差、总体标准差。l统计量:由样本计算的数,是描述样本特征的数,是参数的估计值,统计量
5、:由样本计算的数,是描述样本特征的数,是参数的估计值,受抽样变动的影响。常用英语字母表示,如样本均数受抽样变动的影响。常用英语字母表示,如样本均数x、样本标准差、样本标准差s。其次节其次节 资料的分类与整理资料的分类与整理一、试验资料的性质与分类一、试验资料的性质与分类二、试验资料的整理二、试验资料的整理三、常用统计图三、常用统计图一、试验资料的性质与分类一、试验资料的性质与分类正确地进行资料的分类是资料整理的前提。正确地进行资料的分类是资料整理的前提。数据按其性质分为:数据按其性质分为:(一一)数量性状资料数量性状资料(定量)(定量)(二二)质量性状资料质量性状资料(定性)(定性)(三)(三
6、)半定量(等级)资料半定量(等级)资料(一一)数量性状资料(定量)数量性状资料(定量)(data of quantitative characteristics)数量性状数量性状(quantitative character):能够以量测或计数的方式:能够以量测或计数的方式表示其特征的性状表示其特征的性状。数量性状资料数量性状资料 :视察测定数量性状而获得的数据。:视察测定数量性状而获得的数据。数量性状资料(数量性状资料(quantitative trait)间断性变数间断性变数Discontinuous or discrete variable连续性变数连续性变数continuous var
7、iable小麦基本苗数、菌落数、穗数、分孽数等等病斑长度、作物产量、株高、土壤水分含量等等 计数计数(整数)(整数)量测量测离散型数据离散型数据连续型数据连续型数据依据度量方式分:依据度量方式分:(二二)质量性状资料质量性状资料 p36 p36 质量性状质量性状(qualitative trait)(qualitative trait):能视察而不能量测的:能视察而不能量测的性状,如颜色、性别等。性状,如颜色、性别等。这类性状本身不能干脆用数值表示,要获得这类性状这类性状本身不能干脆用数值表示,要获得这类性状的数据资料,的数据资料,须对其视察结果作数量化处理:须对其视察结果作数量化处理:统计次
8、数法统计次数法 :于确定总体或样本内,依据某一质量性状于确定总体或样本内,依据某一质量性状的类别统计其次数,以次数作为质量性状的数据。的类别统计其次数,以次数作为质量性状的数据。例,例,例,例,在探讨猪的毛色遗传时,白猪与黑猪杂交,子二代中白猪、黑猪和花猪的头在探讨猪的毛色遗传时,白猪与黑猪杂交,子二代中白猪、黑猪和花猪的头在探讨猪的毛色遗传时,白猪与黑猪杂交,子二代中白猪、黑猪和花猪的头在探讨猪的毛色遗传时,白猪与黑猪杂交,子二代中白猪、黑猪和花猪的头数分类统计如下表。数分类统计如下表。数分类统计如下表。数分类统计如下表。1.统计次数法统计次数法2.给分法:赐予每类性状以相对数量的方法给分法
9、:赐予每类性状以相对数量的方法例如,如小麦籽粒有红白两种颜色,可用例如,如小麦籽粒有红白两种颜色,可用0表示白色,用表示白色,用1表示红色表示红色质量性状资料(质量性状资料(qualitative trait)统计次数法统计次数法给分法给分法统计某特性状的个体数目,按类别计其次数或相对次数赐予每类性状以相对数量的方法量化处理量化处理量化处理量化处理能视察而不能量测的性状能视察而不能量测的性状三、半定量(等级)资料三、半定量(等级)资料(semi-quantitative or ranked data)半定量或等级资料:将视察单位按所考察的性状或指标的等半定量或等级资料:将视察单位按所考察的性状
10、或指标的等级依次分组,然后清点各组视察单位的次数而得的资料。级依次分组,然后清点各组视察单位的次数而得的资料。例,例,用某种药物治疗某种疾病,疗效分为用某种药物治疗某种疾病,疗效分为“无效无效”、“好转好转”、“显效显效”和和“限制限制”四个级别四个级别;然后统计各级别的供试畜;然后统计各级别的供试畜禽数。禽数。二、试验资料的整理二、试验资料的整理资料的检查与核对资料的检查与核对 确保原始资料的完整性和正确性。确保原始资料的完整性和正确性。完整性:指原始资料无遗缺或重复。完整性:指原始资料无遗缺或重复。正确性:指原始资料的测量和记载无差错或未进行不合理正确性:指原始资料的测量和记载无差错或未进
11、行不合理的归并。的归并。检查中要特殊留意特大、特小和异样数据。检查中要特殊留意特大、特小和异样数据。对于有重复、异样或遗漏的资料,应予以删除或补齐对于有重复、异样或遗漏的资料,应予以删除或补齐 对有错误、相互冲突的资料应进行更正对有错误、相互冲突的资料应进行更正 必要时进行复查或重新试验。必要时进行复查或重新试验。资料的整理方法资料的整理方法当观测值当观测值(n30)时,不必分组,干脆进行统时,不必分组,干脆进行统计分析。计分析。当观测值当观测值(n30)时,分成若干组后,制成次数时,分成若干组后,制成次数分布表。分布表。(一一)间断性变数资料的整理间断性变数资料的整理(二二)连续性变数资料的
12、整理连续性变数资料的整理(三三)属性变数资料的整理属性变数资料的整理数量性状资料数量性状资料质量性状资料质量性状资料1、确定视察值的个数;、确定视察值的个数;2、将每个视察值确定为一组,该视察值即为该组的组值;、将每个视察值确定为一组,该视察值即为该组的组值;3、将原始数据表中数据,用唱票的方式(划线)填入频数、将原始数据表中数据,用唱票的方式(划线)填入频数表中,计算出和组的频数和频率。表中,计算出和组的频数和频率。(一一)间断性变数资料的整理(离散型数据整理)间断性变数资料的整理(离散型数据整理)表3.1 100个麦穗的每穗小穗数例,随机实行例,随机实行100个麦穗,计数每穗小穗数,未加整
13、理的资料列成表个麦穗,计数每穗小穗数,未加整理的资料列成表3.1。表表3.2 100个麦穗每穗小穗数的次数分布表个麦穗每穗小穗数的次数分布表50枚受精种蛋出雏天数的次数分布表枚受精种蛋出雏天数的次数分布表调调查查每每天天诞诞生生的的1010名名新新生生儿儿中中体体重重超超过过3 3公公斤斤的的人人数数(共共调调查查120120天)天)每每1010名新生儿中体重超过名新生儿中体重超过3Kg3Kg的人数的频数(率)分布表的人数的频数(率)分布表 图每图每1010名新生儿中体重超过名新生儿中体重超过3Kg3Kg的人数的频数分布图的人数的频数分布图 留意:有些离散型数据,视察值较多,变异范围较大,留意
14、:有些离散型数据,视察值较多,变异范围较大,若以每一视察值为一组,则组数太多,每组包含若以每一视察值为一组,则组数太多,每组包含的视察值太少,数据的规律性显示不出来。的视察值太少,数据的规律性显示不出来。对于这样的数据,可扩大将几个相邻视察值合对于这样的数据,可扩大将几个相邻视察值合为一组,适当削减组数。为一组,适当削减组数。例例,观测观测100只鸡每年每只鸡产蛋数只鸡每年每只鸡产蛋数 原始资料:数据多:原始资料:数据多:100个数据,个数据,数据变异大:数据变异大:200-299枚枚/鸡鸡/年。年。100只鸡每年产蛋数的次数分布表只鸡每年产蛋数的次数分布表 以表以表3.4的水稻试验的产量为例
15、,说明整理方法。的水稻试验的产量为例,说明整理方法。表表3.4 140行水稻产量行水稻产量(单位:克单位:克)(二二)连续性变数资料的整理(连续型数据)连续性变数资料的整理(连续型数据)具体步骤:具体步骤:1.数据排序数据排序(sort)首先对数据按从小到大排列首先对数据按从小到大排列(升序升序)或从大到小排列或从大到小排列(降序降序)。2.全距:求极差全距:求极差(range),全部数据中的最大视察值和全部数据中的最大视察值和最小视察值的差数,亦即整个样本的变异幅度。最小视察值的差数,亦即整个样本的变异幅度。从表从表3.4中查到最大视察值为中查到最大视察值为254g,最小视察值为,最小视察值
16、为75g,极差为极差为254-75=179g。3.分组:确定组数和组距分组:确定组数和组距 在确定组数和组距时应考虑:在确定组数和组距时应考虑:(1)视察值个数的多少(样本大小);视察值个数的多少(样本大小);(2)极差的大小;极差的大小;(3)便于计算;便于计算;(4)能反映出资料的真实面貌等方面。能反映出资料的真实面貌等方面。样本大小与组数多少的关系可参照表样本大小与组数多少的关系可参照表3.5来确定。来确定。表3.5样本容量与组数多少的关系确定组数确定组数确定组距:组距确定组距:组距=极差极差/组数组数每组最大值与最小值之差称为组距每组最大值与最小值之差称为组距例表例表3.4,样本视察值
17、个数为样本视察值个数为140,查表可分为查表可分为8-16组,组,假定分为假定分为12组,组,组距为组距为179/12=14.9g,为分组便利起见,可以,为分组便利起见,可以15g作为组距。作为组距。4.组中点值组中点值(组值,组值,class value)和选定组限和选定组限(class limit)(1)组距确定后,)组距确定后,首先要选定第一组的组中值。首先要选定第一组的组中值。在分组时为了避开第一组中视察值过多,一般第一组的组中在分组时为了避开第一组中视察值过多,一般第一组的组中值以接近或等于资料中的最小值为好。值以接近或等于资料中的最小值为好。以表以表3.4为例,选定第一组的中点值为
18、为例,选定第一组的中点值为75g,与最小视察,与最小视察值值75g相等;则其次组的中点值为相等;则其次组的中点值为75+15=90g,余类推。,余类推。(2)各组的中点值选定后,就可以求得各组组限。每组有)各组的中点值选定后,就可以求得各组组限。每组有两个组限,数值小的称为下限两个组限,数值小的称为下限(lower limit),数值大的称为,数值大的称为上限上限(upper limit)上述资料中,第一组的组限为上述资料中,第一组的组限为67.582.5g。(3)依据此法计算其余各组的组限,就可写出分组数列。)依据此法计算其余各组的组限,就可写出分组数列。5.数据归组、划线计数、做次数分布表
19、 为了使恰好等于前一组上限和后一组下限的数据能准确归组,约定将其归入后一组。通常将上限略去不写。例,表3.4中第一个视察值177应归于表3.6中第8组,组限为172.5187.5;。依次把140个视察值都进行归组,即可制成140行水稻产量的次数分布表(表3.6)。表3.6 140行水稻的次数分布 注:注:第一组的中点值接近于最小值第一组的中点值接近于最小值最终一组的中点值接近于最大值最终一组的中点值接近于最大值实际的组数比原来确定的要多一实际的组数比原来确定的要多一个组,为个组,为13组。组。表表2-7 126头基础母羊的体重的次数分布表头基础母羊的体重的次数分布表(三三)属性变数资料的整理属
20、性变数资料的整理 属性变数的资料,也可以用类属性变数的资料,也可以用类似次数分布的方法来整理。似次数分布的方法来整理。按各种质量性状进行分类,分类数按各种质量性状进行分类,分类数等于组数,等于组数,归组归组计数,做分布表计数,做分布表例如,某水稻杂种其次代植株例如,某水稻杂种其次代植株米粒性状的分别状况,归于表米粒性状的分别状况,归于表3.7。表3.7 水稻杂种二代植株 米粒性状的分别状况三、常用统计图三、常用统计图(一一)方柱形图方柱形图(二二)多边形图多边形图(三三)条形图条形图(四四)饼图饼图 (一一)方柱形图方柱形图(直方图)直方图)柱形图柱形图(histogram)(histogra
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 田间试验 统计 方法 第三 统计数据 搜集 整理
限制150内