CM5Y1-医学统计学方法.ppt
《CM5Y1-医学统计学方法.ppt》由会员分享,可在线阅读,更多相关《CM5Y1-医学统计学方法.ppt(67页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、2013.10.31,1,医学统计学方法,主讲人 陶育纯,2,http:/ 卫生学 第7版 仲来福 主编 人民卫生出版社年级、专业:2011级医学五年制第一教班授课时间:2013年11月5日授课时数:4h,2013.10.31,3,目录,第九章 数值变量资料的统计分析,第一节 数值变量资料的统计描述,一、数值变量资料的频数分布 二、集中趋势的描述 算术均数 几何均数 中位数和百分位数 三、离散趋势的描述 全距,2013.10.31,4, 四分位数间距 方差 标准差 变异系数,第二节 正态分布及其应用,目录,一、正态分布 正态分布的概念和图形 正态分布的特征 正态分布曲线下面积分布规律,2013
2、.10.31,5,目录, 标准正态分布二、正态分布的应用 估计变量值的频数分布 制定参考值范围 质量控制 正态分布是很多统计方法的基础,2013.10.31,6,第九章 数值变量资料的统计分析,第一节 数值变量资料的统计描述,一、数值变量资料的频数分布,分布(distribution)是一个统计概念。,分布在生活、医学等上的理解是很具体的。如绿化地带在城市中的分布;血液中红细胞的分布;某种疾病的发病部位在人体中的分布;某班全体学生的考试成绩的分布等。 分布上升到数学上,就被抽象起来。抽象的目的在于概括具体。,2013.10.31,7,我们以后要学习很多统计的分布理论,如正态分布、t分布、二项分
3、布、Poisson分布等等。,我们正是利用统计分布的理论方法来揭示具体事物的内在联系和变化规律。,频数分布表(frequency distribution table)通过变量值分布在其取值范围内各组段中的频数大小来揭示具体资料的分布规律。,了解资料的分布规律对于我们选择合理的统计方法来分析资料大有帮助。,2013.10.31,8, 频数分布表 频数分布表的编制步骤:,例9-1 某市2002年150名2029岁的正常成年男子的尿酸浓度(mol/L)的资料如下,试编制频数分布表。,2013.10.31,9,1. 计算全距 全距(range)亦称极差,用R表示,R=最大值最小值。本例 R=428.
4、7278.6=150.1(mol/L)。,2. 确定组距和组段 组距即组段间隔数,用i表示。常取全距的1/10取整作为组距。,本例 i = 150.1/10 = 15.0115。,组段即由组距分隔的区间,每个组段的起点称下限,终点称上限。每个组段规定为: 下限,上限),2013.10.31,10,要求第一组段包含最小值,最后组段包含最大值;一般划分815个组段为宜。,本例 第一组段可定为 270,285),最后一个组段为 420,435),共分11个组段。,3. 列表划记计频 列成如表9-2的形式,采用划记法把全部原始数据划归到每个组段中,以频数统计。划记法可采用划“正”字法或划“ ”法,最后
5、统计出每个组段的笔画总数即得频数。,本例见下表9-2:,2013.10.31,11,2013.10.31,12,表9-2中的第(1)和第(3)栏构成频数表 。, 频数分布图,频数分布图是频数分布表的直观表达,亦称直方图(histogram)。本例见图9-1。,2013.10.31,13, 频数分布特征,频数分布有两个特征:, 集中趋势(central tendency), 离散趋势(tendency of dispersion), 频数分布类型, 对称分布 正态分布是最常用的对称分布。医学上常见的有体温、身高、脉搏等的频数分布。, 偏峰分布 即不对称分布。,2013.10.31,14,偏峰,正
6、偏峰(频数多集中在观察值较小的一侧),负偏峰(频数多集中在观察值较大的一侧),下图为一正偏峰的直方图。,2013.10.31,15, 频数分布表的用途, 揭示资料的分布特征和分布类型,便于选择适当的统计分析方法。 便于发现某些特大或特小的可疑值。,二、集中趋势的描述,平均数(average)是统计学中描述定量资料的集中趋势,反映资料的平均水平或集中位置的最常用、最重要的指标体系。常用的平均数有:均数、几何均数和中位数。,2013.10.31,16, 算术均数,算术均数简称均数(mean)。总体均数用希腊字母表示,样本均数用 表示。适用于描述对称分布,尤其是正态分布或近似正态分布的数值变量资料的
7、平均水平。 计算方法有:,1. 直接法 将所有观测值相加求和除以观测值个数。公式为:,式中是希腊字母,为求和符号。,式(9-1),2013.10.31,17,例9-2a 现有10名女大学生的口腔温度()分别为:37.7、36.8、36.8、37.0、37.1、37.2、37.1、37.0、36.9、37.3。求其平均体温。,代入式(9-1)得:,2. 加权法 适合于频数分布表资料求均数。公式为:,式(9-2),2013.10.31,18,式中k是组段;fi为每组段的频数;Xi为每组段的组中值。组中值等于本组段的下限和上限相加除以2。i=1,2 k 。,用加权法计算例9-1的均数见表9-3。,2
8、013.10.31,19,代入式(9-2)得:, 几何均数,几何均数(geometric mean)用G表示。适用于描述各观测值之间呈倍数关系(等比数列),或偏态分布资料的变量值经对数变换后呈正态分布(简称对数正态分布)资料的平均水平。,2013.10.31,20,计算方法有: 1. 直接法 公式为:,式(9-3),例9-3a 现有7份血清的抗体效价为:1:2、1:4、1:8、 1:32、1:32、 1:64、 1:64 。求其平均效价。,式中lg-1表示lg 的反函数,即lg-1 =10x。,为简化计算,用抗体效价的倒数为X代入式(9-3)得:,2013.10.31,21,该7份血清的平均抗
9、体效价为 1 : 16。,2. 加权法 适合于有较多观测值或频数分布表资料。公式为:,式(9-4),式中X是观测值或组中值。,2013.10.31,22,例9-4 某地34名儿童接种麻疹疫苗后,血清血凝抑制抗体滴度见表9-4的(1)、(2)栏,求其平均滴度。,2013.10.31,23,代入式(9-4)得:,34名儿童接种麻疹疫苗后平均血凝抑制抗体滴度为 1 : 10.206。, 中位数与百分位数,中位数(median)用M表示。一组观测值从小到大顺序排列,位次居中的观测值即为中位数。适用于各种资料,但常用于描述偏态分布分布不清有特大、特小值端点无确定数值的资料的集中位置。 计算方法有:,20
10、13.10.31,24,1. 直接法 适合例数较少的资料。先将所有观测值从小到大排序,当例数为奇数时,居中的观测值即为中位数;当例数为偶数时,居中的两个观测值相加除以2即为中位数。公式为:,n为奇数时,n为偶数时,式(9-5),式(9-6),式中下标为排序后的观测值的位次。,别忘先排序呦!,2013.10.31,25,例9-5a 某传染病患者9例,他们的潜伏期分别为:6、5、 4、7、 12、 4、5、7、9天 。求中位数。,首先排序:4、4、5、5、6、7、7、9、12 位次: 1 2 3 4 5 6 7 8 9,本例n=9为奇数,故M=6天。,用式(9-5),,例9-6a 若例10.5增加
11、潜伏期为20天的一例 。求中位数。,首先排序:4、4、5、5、6、7、7、9、12、20 位次: 1 2 3 4 5 6 7 8 9 10,本例n=10为偶数,故M=(6+7)/2=6.5(天)。,用式(9-6),,2013.10.31,26,2. 频数分布表法 适用于频数分布表资料。公式为:,式(9-7),式中L为中位数所在组段的下限;fM为该组段的频数;i为该组段的组距;fL为小于L的各组段累计频数。,要想判断出中位数所在组段,可从频数分布表中先计算累计频数或累计频率,再利用n/2或50%找出中位数所在组段,最后代入式(9-7)求中位数。,2013.10.31,27,例9-7 某研究者测得
12、某年某市308名6岁以下儿童的尿铅值,见表9-5的(1)、(2)栏,求其中位数及P25、P75、P95。,2013.10.31,28,求出累计频数或累计频率,见表9-5的(3)、(4)栏。本例n/2=308/2=154,累计频数176刚好包含n/2,则中位数落在176所在的第三组段;累计频率57.14%刚好包含50%,则中位数落在57.14%所在的第三组段。,则 L =50,i =25 ,fM =95 ,fL =81。代入式 (9-7)得:,308名6岁以下儿童的尿铅值中位数为12.94小时。,2013.10.31,29,百分位数(percentile,Px)百分位数是一组从小到大排列的观测值
13、的百等份分割值。用Px表示。和中位数一样,都是位置指标。中位数是一个特定的百分位数,即M=P50。百分位数的计算公式为:,式(9-7a),式中L为Px所在组段的下限;fx为该组段的频数;i为该组段的组距;fL为小于L的各组段累计频数。,求例9-7资料中尿铅值的P25 、P75和P95 。,2013.10.31,30,首先根据表9-5的(4)栏累计频率,累计频率26.30%刚好包含25%,则P25落在26.30%所在的第二组段。,则 L=25,i=25 ,fx=54 ,fL=27。代入式(9-7a) 得:,同理可知:P75落在第四组段,则L=75,i=25 ,fx = 55 ,fL=176。代入
14、式(9-7a)得:,同理可得:,2013.10.31,31,三、离散趋势的描述,本章一部分讲授的频数分布有集中趋势和离散趋势两个特征,说明描述资料的全面变化规律需把二者结合起来。通过下例可说明这个问题。,例9-8a 现有3组健康女大学生的口腔温度测得值如下,试分析其集中趋势和离散趋势。,1组 36.8 36.9 37.0 37.1 37.2,2组 36.5 36.9 37.0 37.1 37.5,3组 36.5 36.7 37.0 37.3 37.5,2013.10.31,32,前面三组学生的平均口腔温度都是37.0(),即集中趋势相同,但能说明三组数据的变化规律相同吗?我们通过把上述三组数据
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- cm5y1 医学 统计学 方法 法子
限制150内