第九章_方差分析.ppt
《第九章_方差分析.ppt》由会员分享,可在线阅读,更多相关《第九章_方差分析.ppt(70页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、第九章第九章 方差分析方差分析(analysisofvariance,ANOVA)中山大学医学统计与流行病学系中山大学医学统计与流行病学系张张晋晋昕昕1多个均数比较时为什么不能直多个均数比较时为什么不能直接两两之间作接两两之间作t检验?检验?以五以五个个样本均数的比较为例:样本均数的比较为例:进行进行t 检验时,检验时,=0.05,则,则5个均数的两两比个均数的两两比较将发生较将发生10次,这时,次,这时,10次比较都不犯次比较都不犯(类)错误的概率为类)错误的概率为0.9510=0.599,有(,有(类)类)错误发生的概率则为错误发生的概率则为1-0.599=0.401。远大于设定的检验水准
2、远大于设定的检验水准(=0.05)!2应用方差分析的条件应用方差分析的条件:1.各样本是相互独立的随机样本;各样本是相互独立的随机样本;2.各样本都来自正态总体;各样本都来自正态总体;3.各个总体方差相等。各个总体方差相等。3一、方差分析的基本思想一、方差分析的基本思想第一节完全随机设计资料的方差分析第一节完全随机设计资料的方差分析4方差分析的基本思想是首先将总方差分析的基本思想是首先将总变异分解为组间变异和误差变异,然变异分解为组间变异和误差变异,然后比较平均变异后比较平均变异MSB和和MSE,比较时比较时采用两者的比值采用两者的比值F值,即值,即51.1m30位跳高的位跳高的“苗苗苗苗”2
3、000年年9月月1日进入广东省体校日进入广东省体校62 2年后年后A A组的跳高成绩组的跳高成绩A72002年年9月月1日,三组各自的情形日,三组各自的情形ABC8广西的情形广西的情形9单因素方差分析的变异分解单因素方差分析的变异分解12变异分解变异分解总变异总变异N个观察值与总均数的差异,个观察值与总均数的差异,由组内变异和组间变异构成;由组内变异和组间变异构成;组内变异(误差变异)组内变异(误差变异)每组内每组内ni个观察个观察值与该组均数的差异,由随机误差所值与该组均数的差异,由随机误差所致;致;组间变异组间变异各组的样本均数与总均数的各组的样本均数与总均数的差异,除随机误差影响外,差异
4、,除随机误差影响外,可能可能存在存在处理因素的作用。处理因素的作用。13组间变异组内变异总变异14单因素方差分析单因素方差分析15单因素方差分析单因素方差分析检验统计量检验统计量F:16表表9-5成组设计方差分析的计算公式成组设计方差分析的计算公式变异来源变异来源SSMSF总总组间组间组内组内N-1K-1N-KSS组间组间/组组间间SS组内组内/组组内内MS组间组间MS组内组内SS总总-SS组间组间17二、完全随机设计资料方差分析的基本步骤二、完全随机设计资料方差分析的基本步骤18(1)建立假设并确定检验水准建立假设并确定检验水准 H0:三个总体均数相等,三个总体均数相等,即即1=2=3H1:
5、三个总体均数不等或不全相等三个总体均数不等或不全相等=0.05(2)计算检验统计量计算检验统计量F值值19表表9-6例例9-1的方差分析表的方差分析表变异来源变异来源SSdfMSFP组组间(处理组间)间(处理组间)176.7612288.38065.5370.01组组内(误差)内(误差)909.87235715.9627总总1086.633559213)确定)确定P值并作出推断结论值并作出推断结论以分子的自由度以分子的自由度组间组间=2为为1,分母的自由度分母的自由度组内组内=57为为2,查附表查附表3.1,方差分析用,方差分析用F界界值表值表,F0.05(2,60)=3.15F0.01(2,
6、60)=4.98,F=5.537F0.01(2,60)=4.98,P0.01。在在=0.05水准上拒绝水准上拒绝H0,接受接受 H1可以认为可以认为三种人的血糖下降值的总体水平不同。三种人的血糖下降值的总体水平不同。22 注意:注意:以上结论表明,以上结论表明,总的说三种人的血糖总的说三种人的血糖下降水平不同,但并不能说明任何两种人间下降水平不同,但并不能说明任何两种人间均不同。均不同。只能说可能至少有两组人的血糖下只能说可能至少有两组人的血糖下降水平不同,可能有的组间相同。要了解那降水平不同,可能有的组间相同。要了解那些组均数间不同,那些组均数间却水平相同,些组均数间不同,那些组均数间却水平
7、相同,需要进一步做两两比较。需要进一步做两两比较。当当k=2=2时,对同一资料,单因素方差分析时,对同一资料,单因素方差分析等价于成组设计等价于成组设计的的t检验检验,且,且F=t2 2。23第二节第二节 随机区组设计资料的方差分析随机区组设计资料的方差分析一、基本思想一、基本思想242526例例9.2为探索丹参对肢体缺血再灌注损伤的影响,将为探索丹参对肢体缺血再灌注损伤的影响,将30只纯种新西兰实验用大白兔,按窝别相同、体重相只纯种新西兰实验用大白兔,按窝别相同、体重相近划分为近划分为10个区组。每个区组间个区组。每个区组间3只大白兔随机采用只大白兔随机采用A、B、C三种处理方案即在松止血带
8、前分别给予丹参三种处理方案即在松止血带前分别给予丹参2ml/kg、1ml/kg、生理盐水生理盐水2ml/kg在松止血带前及松在松止血带前及松后后1小时分别测定血中白蛋白含量(小时分别测定血中白蛋白含量(g/L),算出白蛋白算出白蛋白减少量如下表减少量如下表97,问,问A、B两方案分别与两方案分别与C方案的处方案的处理效果是否不同?理效果是否不同?27表表9 97 A.B.C7 A.B.C三种方案处理后大白兔血中白蛋白减少量三种方案处理后大白兔血中白蛋白减少量(g/L)(g/L)区组号区组号A方案方案B方案方案C方案方案123456789102.212.323.151.862.561.982.3
9、72.883.053.422.912.643.673.292.452.743.153.442.612.864.254.564.333.893.784.624.713.563.774.233.12333.17333.71673.01332.93003.11333.41003.29333.14333.5033102.58000.2743102.97600.1581104.17000.160530(N)3.24200.6565(S2)28总变异总变异误差变异:误差变异:个体差异及血白蛋白的随机测定误差。个体差异及血白蛋白的随机测定误差。处理组间变异:处理组间变异:A、B、C不同方案的影响及机测量误差
10、。不同方案的影响及机测量误差。区组间区组间变异:变异:既反映了十个区组不同的影响既反映了十个区组不同的影响同时又包括同时又包括了随机测量误差。了随机测量误差。29表表9-10随机区组设计方差分析的计算公式随机区组设计方差分析的计算公式变异来源变异来源SSvMS F处理间处理间区组间区组间k-1n-1v总总-v处理处理-v配伍配伍SS处理处理/v处处理理SS区组区组/v区区组组SS误差误差/v误误差差MS处理处理/MS误差误差MS区组区组/MS误误差差总总N1误误差差SS总总-SS处理处理-SS配伍配伍30表表9-9例例9-2的方差分析表的方差分析表变异来源变异来源SSdfMSFP组组间(处理组
11、间)间(处理组间)13.708026.850932.6390.05误误差差3.7790180.2099总总19.03852931二二 分析计算步骤分析计算步骤(1 1)建立假设并设定检验水准)建立假设并设定检验水准对于处理组:对于处理组:H0:三个总体均数全相等,即三个总体均数全相等,即1 1=2 2=3 3 H1:三个总体均数不等或不全相等三个总体均数不等或不全相等对于区组:对于区组:H0:十个总体均数全相等十个总体均数全相等 H1:十个总体均数不等或不全相等十个总体均数不等或不全相等 =0.05=0.05(2 2)计算检验统计量)计算检验统计量F F 值值32(3)确定确定P P 值并作出
12、推断结论值并作出推断结论以分子的自由度以分子的自由度处理处理 =2=2为为1 1,分母的自由度分母的自由度误差误差 =18=18为为2 2,查附表查附表3 3,方差分析用,方差分析用F F 界值表界值表,F F0.05(2,18)0.05(2,18)=2.62=2.62,F F处理处理=32.639=32.639 F F0.05(2,18)0.05(2,18)=2.62=2.62,P P 0.050.05。在。在=0.05=0.05水准上拒绝水准上拒绝H0,认为认为三种方案的处三种方案的处理不同。理不同。以分子的自由度以分子的自由度区组区组 =9=9为为1 1,分母的自由度分母的自由度误差误差
13、 =18=18为为2 2,查附表查附表3 3,方差分析用,方差分析用F F 界值表界值表,F F0.05(90.05(9,18)18)=2.00=2.00,F F处理处理=0.825=0.8250.05 0.05。在。在=0.05=0.05水准上不拒绝水准上不拒绝H0,还还不能认为十个区组间平均不能认为十个区组间平均水平不同。水平不同。33第三节第三节析因设计资料的方差分析析因设计资料的方差分析方差分析中,影响观察指标的因素称为因方差分析中,影响观察指标的因素称为因子子(factor);因子所处的状态称为因子的一个水因子所处的状态称为因子的一个水平平(leveloffactor);各因子水平的
14、组合称为处各因子水平的组合称为处理理(treatment)。例例9-39-3 某研究人员为了解升白细胞药物某研究人员为了解升白细胞药物(A)(A)和纯苯和纯苯(B)(B)对大鼠对大鼠吞噬指数吞噬指数的影响,以及两者同时使用作用。将的影响,以及两者同时使用作用。将2020只性别相同、体重相近的大只性别相同、体重相近的大鼠,按鼠,按A、B两因素有两因素有无分为四个处理组,无分为四个处理组,A因素有两个水平即用升白细胞因素有两个水平即用升白细胞药物和不用升白细胞药物,药物和不用升白细胞药物,B因素也分为两个水平即因素也分为两个水平即用用0.3ml/kg0.3ml/kg纯苯给大鼠皮下注射染毒和未用纯苯
15、染毒。纯苯给大鼠皮下注射染毒和未用纯苯染毒。测得其吞噬指数结果见表测得其吞噬指数结果见表9-119-11。34表表9-1120只大鼠的吞噬指数只大鼠的吞噬指数用用升升白细胞药物白细胞药物(ai,i=1)不用升白细胞药物不用升白细胞药物(ai,i=2)合计合计用用纯苯纯苯不用纯苯不用纯苯用纯苯用纯苯不用纯苯不用纯苯(bi,j=1)(bi,j=2)(bi,j=1)(bi,j=2)1.943.801.853.882.254.902.013.842.034.062.103.962.103.851.923.922.083.842.043.805555202.08003.89001.98401.98402
16、.95850.01290.01030.00980.00980.9126101010102.98502.73202.03202.032035一、单独效应、主效应和交互效应一、单独效应、主效应和交互效应表表9-12例例9-3大鼠的吞噬指数均数的差别大鼠的吞噬指数均数的差别B因素因素A因素因素平均平均a1-a2用用(a1)不用不用(a2)用用(b1)2.08001.98402.03200.0960不用不用(b2)3.89003.88003.88500.0100平均平均2.98502.93202.95850.0530 b1-b2-1.8100-1.8960-1.8530单独效应单独效应主效应主效应二者
17、差值为交互效应二者差值为交互效应36二、离均差平方和与自由度的分解:二、离均差平方和与自由度的分解:析因设计是将两个或多个实验因素的各析因设计是将两个或多个实验因素的各水平进行排列组合、交叉分组进行实验,因水平进行排列组合、交叉分组进行实验,因此其方差分析的总变异可以分为处理和误差此其方差分析的总变异可以分为处理和误差两部分。两部分。22析因设计处理变异包含了析因设计处理变异包含了A因素、因素、B因素的主效应及因素的主效应及A、B两因素间的交互效应。两因素间的交互效应。37383940表表914两因素两因素ab析因设计方差分析的计算公式析因设计方差分析的计算公式变异来源变异来源SSdfMSF处
18、处理理ABAB误误差差总总41三、析因设计资料方差分析的基本步骤三、析因设计资料方差分析的基本步骤(略)(略)42第四节第四节 重复测量资料的方差分析重复测量资料的方差分析重复测量资料重复测量资料(repeatedmeasurementdata)是同一对象的同一观察指标在不同时间点上进行是同一对象的同一观察指标在不同时间点上进行多次测量所得的资料,常用来分析该指标在不同多次测量所得的资料,常用来分析该指标在不同时间时间点上的变化特点。这类资料在临床试验和流点上的变化特点。这类资料在临床试验和流行病学研究中常见。行病学研究中常见。43例例9-4为研究减肥新药盐酸西布曲明片和盐酸为研究减肥新药盐酸
19、西布曲明片和盐酸西布曲明胶囊的减肥效果是否不同,以及肥胖患西布曲明胶囊的减肥效果是否不同,以及肥胖患者服药后不同时间的体重随时间的变化情况。分者服药后不同时间的体重随时间的变化情况。分别于平衡期别于平衡期(0周周)、服药后的、服药后的8周、周、16周、周、24周测周测定肥胖患者的体重定肥胖患者的体重(kg)见表见表9-1344受试受试对象对象j剂型剂型k服药后测定时间服药后测定时间(周周)0816241184.482.882.283.021105.0100.897.496.63163.862.061.660.44186.285.583.081.85175.673.474.073.06161.2
20、60.460.860.27167.866.063.463.68177.273.672.672.09173.272.272.274.610165.463.662.660.811180.077.072.469.412174.477.075.277.413182.680.481.279.614168.665.063.263.415179.077.073.872.516169.466.864.460.817172.671.068.270.218172.472.672.872.619175.673.473.472.24520180.078.076.474.821264.461.461.862.02229
21、1.088.487.489.623276.076.272.871.624271.072.069.868.425269.466.662.860.826289.987.492.695.527266.863.662.661.628263.461.262.662.029270.067.669.869.430286.684.081.478.031290.484.477.471.032274.873.672.876.633267.464.461.058.234284.482.280.275.435279.076.076.578.536287.483.281.277.237268.765.863.066.4
22、38283.081.878.478.439266.564.463.465.440264.662.664.262.046随机区组与重复测量资料的区别主要有二随机区组与重复测量资料的区别主要有二:1)1)重复测量资料中同一受试对象的数据高度相关重复测量资料中同一受试对象的数据高度相关2)表表9-14 9-14 表表9-139-13数据的简单相关系数数据的简单相关系数r(n=20)=20)3)2)重复测量资料中的处理因素在受试对象间为随机分配,重复测量资料中的处理因素在受试对象间为随机分配,但受试对象内的各时间点往往是固定的,不能随机分配;但受试对象内的各时间点往往是固定的,不能随机分配;随机区组设
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第九 方差分析
限制150内