医学统计学复习资料最终版(共12页).doc
《医学统计学复习资料最终版(共12页).doc》由会员分享,可在线阅读,更多相关《医学统计学复习资料最终版(共12页).doc(12页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上第1章 绪论医学统计学是一门“运用统计学的原理和方法,研究医学科研中有关数据的收集、整理和分析的应用科学。1个体:又称观察单位,是统计研究的最基本单位,也是构成总体的最基本的观察单位。2总体:根据研究目的确定的同质观察单位某项指标测量值(观察值)的集合。分为有限总体(明确规定了空间、时间、人群范围内有限个观察单位)和无限总体(无时间和空间范围的限制)。反映总体特征的指标为参数,常用小写希腊字母表示。3样本:从总体中随机抽取的一部分有代表性的观察单位组成的整体。(抽样,随机化原则,样本含量)根据样本资料计算出来的相应指标为统计量,常用大写英文字母表示。4抽样研究:从总体
2、中随机抽取样本,根据样本信息推断总体特征的方法。抽样误差是由随机抽样(样本的偶然性)造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。其根源在于总体中的个体存在变异性。只要是抽样研究,就一定存在抽样误差,不能用样本的指标直接下结论。统计分析主要是针对抽样误差而言。5变量(一个个体的任意“特征”);资料(变量值的集合),资料类型:计量资料/定量资料/数值变量资料:表现为数值大小,一般有度量衡单位,又可分为连续型和离散型两类;计数资料/定性资料/无序分类变量资料/名义变量资料:表现为互补相容的属性或类别,一般无度量衡单位,可分为二分类和多分类;等级资料/半定量资料/有序分类变量资料:表现
3、为等级大小或属性程度。各类资料间可相互转化。可选分析方法有:t检验、方差分析、相关回归分析等;可选分析方法有:2检验、z检验等;可选分析方法有:秩和检验、Ridit分析等。6误差:实测值与真实值之差。可分为随机误差(随机测量误差+抽样误差)与非随机误差(系统误差与非系统误差)。随机误差:是一类不恒定、随机变化的误差,由多种尚无法控制的因素引起,它是不可避免的;系统误差:是实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原因往往是可知的或可以掌握的,它是可以消除或控制的;非系统误差:又称过失误差,是指在实验过程中由于研究者偶然失误而造成的误差,可以消除。7概率(P):描述随机
4、事件发生可能性大小的值,其取值为0P1。其中,P=1为必然事件,P=0为不可能事件,0P60:Xu/2,X或Xu/2, X*正态分布:Xu/2,S*偏态分布:PXP100X用途总体均数的区间估计,也可间接进行假设检验绝大多数(如95%)观察对象某项指标的分布范围样本量作用样本量越大,可信区间越小样本量越大,参考值范围越稳定*t/2, 也可用于t, (对应于单尾概率时);* u/2,也可用于u,(对应于单尾概率时)。9假设检验:又称显著性检验,是利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立,然后在H0成立的条件下计算检验统计量,最后获得P值来判断。基本思想
5、:小概率思想:小概率事件在一次试验中认为基本上不发生,其概率是相对的,在进行统计分析时要事先规定,即检验水准。反证法思想:首先提出一个假设,用适当的统计方法确定当假设成立时,获得现在样本的概率大小,如果是小概率事件,则推断假设是假的,拒绝它;如果不是小概率事件,则不能认为假设是假的,不能拒绝它。10假设检验的基本步骤:1)建立检验假设,确定检验水准:=0:即检验假设,常称无效假设或零/原假设,用H0表示;0:即备择假设,常称对立假设,用H1表示;:即检验水准,也称显著性水准,属于型错误的范畴,是预先规定的概率值,确定了小概率事件的标准。2)计算检验统计量:根据变量或资料类型、设计方案、统计推断
6、的目的、方法的适用条件等选择检验统计量,所有检验统计量都是在H0成立的前提条件下计算出来的。3)确定P值,做出推断结论:P的:是指从H0规定的总体随机抽样,抽得等于及大于或(和)等于及小于现有样本获得的检验统计量值(如t、u等)的概率。(当样本含量n 较大时,t值近似和u值相等,有人将其称为u检验或Z检验,实际是t检验的特例。)对于检验假设须注意:检验假设是针对总体而言,而不是针对样本;H0和H1是相互联系、对立的假设;H0为无效假设,其假定通常是:某两个总体参数相等,或某两个总体参数之差等于0,或无效,或某一资料服从某一特定分布;H1的内容直接反映了检验的单双侧。11t检验(方差相等):单样
7、本t检验:即已知样本均数与已知总体均数的比较,要求样本取自正态总体(样本均数与已知总体均数不等,原因有二:a.非同一总体即0;b.虽为同一总体即=0,但有抽样误差)。配对样本t检验:简称配对t检验,也称成对t 检验,适用于配对设计的计量资料,要求差值服从正态分布。(配对设计是将受试对象按照某些重要特征配成对子,每对中的两个受试对象随机分配到两处理组。主要有以下情形:a.两同质受试对象配成对子分别接受两种不同的处理;b.同一受试对象分别接受两种不同处理;c. 同一受试对象接受一种处理前后。)两样本t检验:又称成组t检验,适用于完全随机设计两样本均数的比较,要求样本来自正态总体,且两总体方差齐性。
8、当两样本含量较小,且均来自正态总体时,要根据两总体方差是否不同而采用不同检验方法。t检验(方差不等):Cochran&Cox近似t检验对临界值校正;Satterthwaite近似t检验对自由度校正;Welch近似t检验对自由度校正。12型错误:拒绝了实际上成立的H0,即“弃真”,其概率大小用表示,检验水准就是预先规定的允许犯型错误概率的最大值,可取单尾也可取双尾。型错误:“接受”了实际上不成立的H0,即“取伪”,其概率用表示,只取单尾。把握度:又称检验效能,是指1。其意义是当两总体确有差异,按规定检验水准所能发现该差异的能力。13假设检验应注意的问题:1)要有严密的研究设计假设检验前提。2)不
9、同类型的资料应选用不同检验方法。3)正确理解“显著性”一词的含义,一般假设检验结果并不指差异的大小,只能反映两者是否有差异,采用“有无统计学意义”表达。4)因结论具有概率性质,故结论不能绝对化,报告结论时最好列出检验统计量的值,尽量写出具体的P值或P值的确切范围。5)统计“显著性”与医学/临床/生物学“显著性”:若统计结论和专业结论一致,则最终结论就和这两者一致;若统计结论和专业结论不一致,则最终结论需根据实际情况。当统计结论有意义,而专业结论无意义时,可能是由于样本含量过大或设计存在问题,那么结论最终无意义。当统计结论无意义,而专业结论有意义,则应当检查设计是否合理、样本含量是否足够。6)可
10、信区间与假设检验的区别和联系:可信区间用于说明量的大小即判断总体均数的范围,而假设检验用于推断质的不同即判断两总体均数是否不等;可信区间可回答假设检验的问题,算得的可信区间若包含了H0,则按水准不拒绝H0;若不包含H0,则按水准拒绝H0接受H1。可信区间不但能回答差别是否具有统计学意义,而且能比假设检验提供更多的信息,即提示差别有无实际的专业意义。可信区间只能在预先规定的概率检验水准的前提下进行计算,而假设检验能够获得一个较为确切的概率P值。验证一个假设时,可选择假设检验,而只是对总体参数做一个估计时,可选用区间估计,两者结合可对问题进行更全面的说明。14正态性检验:图示法:概率图(P-P图)
11、和分位数图(Q-Q图);计算法:a.对峰度和偏度各用一个指标来评定,以矩法效率最高。偏度指分布不对称的程度和方向,样本偏度系数g1,总体偏度系数r1。(r1=0对称,r10正偏态,r10尖峭峰,r10平阔峰)b.仅用一个指标来综合评定。15两样本方差比较的F检验:即方差齐性检验,目的是判断两样本所代表的两总体方差是否不等,资料要求服从正态分布。若方差齐,采用一般的t检验;若方差不齐,则采用近似t检验。16变量变换:是将原始数据作某种函数转换,如转换为对数值等。它可使各组方差齐同、稳定,亦可使偏态资料正态化,以满足t检验或其它统计分析方法对资料的要求。方法:对数变换:适用于a.对数正态分布资料,
12、即原始数据的效应是相乘时;b.各样本标准差与均数成比例或变异系数是常数或接近某一常数的资料。平方根变换:即将原始数据开算术平方根。平方根反正弦变换。倒数变换。第4章 多个样本均数比较的方差分析1方差分析:由fisher首创,又称F检验。(F分布有两个参数:两个自由度)基本思想:根据试验设计的类型,将全部观测值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,如组间变异SS组间可由处理因素的作用加以解释。方差分析是综合的F检验。实验数据有三个不同的变异:总变异:全部观测值大小不同,这种变异称为总变异,其大小可以用
13、离均差平方和表示SS总;组间变异:各处理组由于接受处理的水平不同,各组的样本均数也大小不等,这种变异称为组间变异,记为SS组间;组内变异:在同一处理组中,虽然每个受试对象接受的处理相同,但观测值仍各不相同,这种变异称为组内变异(误差),记为SS组内。SS总=SS组间+SS组内,总=组间+组内。变异程度与离均差平方和和自由度有关。各部分离均差平方和除以相应的自由度,其比值称为均方差,简称均方(MS)。应用条件:各样本是相互独立的随机样本;均来自正态分布总体;相互比较的各样本的总体方差相等,即具有方差齐性。2完全随机设计资料的方差分析:完全随机设计是采用完全随机化的分组方法,将全部试验对象分配到g
14、个处理组(水平组),各组分别接受不同的处理,实验结束后比较各组均数间的差别有无统计学意义,推论处理因素的效应。变异分解:SS总=SS组间+SS组内,总=组间+组内。分析步骤:略。3随机区组设计资料的方差分析:随机区组设计又称配伍组设计,是配对设计的扩展,先按影响试验结果的非处理因素将受试对象配成区组,再分别将各区组的受试对象随机分配到各处理组或对照组。随机分配的次数要重复多次,每次随机分配都对同一个区组内的受试对象进行,且各个处理组受试对象数量相同,区组内均衡。区组内各试验对象具有较大的差异为好,利用区组控制非处理因素的影响,并在方差分析时将区组间的变异从组内变异中分解出来。误差比完全随机设计
15、小,试验效率高。变异分解:SS总=SS处理+SS区组+SS误差,总=处理+区组+误差。分析步骤:略。4拉丁方设计资料的方差分析:拉丁方设计是在随机区组设计的基础上发展的,实验涉及一个处理因素和两个控制因素,将两个控制因素分别安排在拉丁方设计的行和列上,每个因素的类别数或水平数相等,增加了均衡性,减少了误差,提高了效率。变异分解:SS总=SS处理+SS行+SS列+SS误差,总=处理+行+列+误差。分析步骤:略。5两阶段交叉设计资料的方差分析:二阶段交叉设计是A、B两种处理先后以同等的机会出现在两个试验阶段中,不仅平衡了处理顺序的影响,而且能把处理方法间的差别、时间先后之间的差别和受试者间的差别分
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学 统计学 复习资料 最终版 12
限制150内