临床研究资料常用统计分析方法的知识.ppt
《临床研究资料常用统计分析方法的知识.ppt》由会员分享,可在线阅读,更多相关《临床研究资料常用统计分析方法的知识.ppt(91页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、第二军医大学临床流行病学与循证医学中心第二军医大学临床流行病学与循证医学中心张罗漫张罗漫临床研究资料常用统计分析方法临床研究资料常用统计分析方法临床研究资料常用统计分析方法临床研究资料常用统计分析方法1统计数据分析是一门综合技术,统计数据分析是一门综合技术,也是一门高超的艺术!也是一门高超的艺术!n医学专业知识医学专业知识n医学统计学理论知识医学统计学理论知识 n计算机统计软件技术计算机统计软件技术2q学习了统计学理论知识,并不代表已经有学习了统计学理论知识,并不代表已经有 能力进行统计数据分析。要不断进行实践。能力进行统计数据分析。要不断进行实践。q实际科研工作中的实际科研工作中的“原型原型
2、”资料与教科书上资料与教科书上的的“标准型标准型”例子有一定差距。例子有一定差距。q应用统计软件进行计算分析应用统计软件进行计算分析一定要有正确的一定要有正确的 综合的统计理论方法的后台背景指导。综合的统计理论方法的后台背景指导。q不但要注重对统计方法的选择,而且要注重不但要注重对统计方法的选择,而且要注重 对分析结果的解释。对分析结果的解释。3一、概述一、概述二、原始数据的录入二、原始数据的录入三、数据处理的几个基本问题三、数据处理的几个基本问题四、统计方法选择的基本思路四、统计方法选择的基本思路五、统计分析结果的表述五、统计分析结果的表述4医学统医学统计计 学学研究研究设计设计数据数据处理
3、处理观察性研究观察性研究实验性研究实验性研究统计描述统计描述统计推断统计推断假设检验假设检验参数估计参数估计(调查调查)5调查设计调查设计系统系统 分层随机分层随机 整群整群调查方法调查方法调查对象调查对象 调查指标调查指标研究目的研究目的按范围按范围按时间按时间抽样抽样普查普查横向横向(现况调查现况调查)非概率非概率概概 率率简单随机简单随机纵向纵向 病例对照研究病例对照研究队列研究队列研究 调查工具调查工具 调查员调查员nested case control study6实验设计实验设计实验分类实验分类动物实验动物实验临床试验临床试验社区干预试验社区干预试验基本要素基本要素处理因素处理因素
4、受试对象受试对象实验效应实验效应诊断试验诊断试验疾病防治疾病防治病因病因疾病预后疾病预后7实验设计实验设计基本原则基本原则随机化、盲法随机化、盲法对对 照照重重 复复(样本含量样本含量)形式形式原则:原则:专设、同步、均衡专设、同步、均衡 1-1-、自身处理前后自身处理前后平行:平行:无治疗无治疗 安慰剂安慰剂 阳性治疗阳性治疗 不同剂量不同剂量8统计描述统计描述资料资料类型类型数学数学 连续型连续型(计量计量)离散型:计数离散型:计数 计量:脉搏次数计量:脉搏次数/分分统计统计 等级等级(有序分类有序分类)计量计量 计数计数(无序分类无序分类)定比定比(0表示无,如体重表示无,如体重kg)定
5、距定距(0不表示无,如温度不表示无,如温度0C)9统计描述统计描述统计表统计表制表原则制表原则制表要求制表要求 简单明了简单明了主辞在左、宾辞在右主辞在左、宾辞在右一张表表达一个中心内容一张表表达一个中心内容备注备注数字数字 线条线条 标目标目标题标题10统计描述统计描述统计图统计图制图原则制图原则制图要求制图要求 连续型资料连续型资料(计量计量)离散型资料离散型资料(计数、计量计数、计量)图例图例刻度刻度 纵轴、横轴纵轴、横轴 标目标目标题标题 条图、圆图、百分比条图条图、圆图、百分比条图 线图、直方图、散点图线图、直方图、散点图11统计描述统计描述 统计统计指标指标计量资料计量资料(单变量
6、单变量)中心中心位置位置 正态:正态:非正态:非正态:对数正态:对数正态:离散离散 程度程度 个体值个体值 样本均数:样本均数:正态正态非正态非正态:量纲相同量纲相同:量纲不同量纲不同:计量资料计量资料(双变量双变量)偏度:偏度:g1 峰度:峰度:g212统计描述统计描述 统计统计指标指标计量资料计量资料(单变量单变量)计量资料计量资料(双变量双变量)离散程度:离散程度:r、b13统计描述统计描述 中心位置:均数向量中心位置:均数向量离散程度:离均差平方离散程度:离均差平方 和矩阵和矩阵 协方差矩阵协方差矩阵相互关系:相关矩阵相互关系:相关矩阵计量资料计量资料(多变量多变量)统计统计指标指标1
7、4统计描述统计描述等级等级资料资料统计统计指标指标计数资料计数资料率、构成比、相对比率、构成比、相对比 RR(OR)离散程度:离散程度:标准误标准误离散程度:离散程度:秩号、秩和秩号、秩和秩和的标准误秩和的标准误单变量单变量双变量:双变量:rs15统计描述统计描述参参 考考 值值 范围估计范围估计正态正态偏态偏态或或双侧:双侧:单侧:单侧:双侧:双侧:单侧:单侧:或或16统计推断统计推断区间区间估计估计参数参数估计估计点估计点估计双侧:双侧:单侧:单侧:或或双侧:双侧:单侧:单侧:或或RR(OR):17统计推断统计推断假设假设检验检验步骤步骤1.进行检验假设进行检验假设 假设样本来自某一特定总
8、体假设样本来自某一特定总体2.确定检验水准确定检验水准 确定最大允许误差确定最大允许误差3.选定检验方法计算检验统计量选定检验方法计算检验统计量 计算样本与总体的偏离程度计算样本与总体的偏离程度4.根据某一特定分布计算与检验统根据某一特定分布计算与检验统 计量对应的计量对应的P值值5.作出结论作出结论 根据小概率反证法思想作出推断根据小概率反证法思想作出推断18统计推断统计推断比较比较差别:差别:2、t、F、q、log-rank、秩和检验等秩和检验等联系:相关、回归分析联系:相关、回归分析分类:回归分析、判别分析分类:回归分析、判别分析推测:回归分析推测:回归分析筛选影响因素:回归分析筛选影响
9、因素:回归分析综合变量信息:主成分分析综合变量信息:主成分分析寻找潜在支配因素:因子分析寻找潜在支配因素:因子分析假设假设检验检验方法方法19 统计分析软件统计分析软件q SPSS(有人称有人称“鼠标软件鼠标软件”)q SAS(Statistical Analysis System)q Stataq R(方法新、提供源程序、免费方法新、提供源程序、免费)20qSPSS软件软件 Statistical Package for Social Science (社会科学统计软件包社会科学统计软件包)后改名为后改名为:Statistical Product and Service Solutions
10、(统计产品与服务解决方案统计产品与服务解决方案)q现现改名为改名为PASW Predictive Analytics Software 预测分析软件预测分析软件21一、概述一、概述二、原始数据的录入二、原始数据的录入三、数据处理的几个基本问题三、数据处理的几个基本问题四、统计方法选择的基本思路四、统计方法选择的基本思路五、统计分析结果的表述五、统计分析结果的表述22原始数据的记录形式原始数据的记录形式行:观察单位行:观察单位 列:变量列:变量23标识变量标识变量分析变量分析变量24标识变量标识变量分析变量分析变量自变量自变量(解释变量解释变量)反应变量反应变量反应变量反应变量25原始数据的录入
11、原始数据的录入文件类型:文件类型:数据库文件:数据库文件:EpiDataExcel文件:文件:Excel统计软件数据文件:统计软件数据文件:SPSS(PASW)、SAS、Stata 变量名及标签:变量名及标签:变量值及标签:变量值及标签:名义变量值的量化:名义变量值的量化:有序、无序分类资料有序、无序分类资料2627数据编辑窗口数据编辑窗口数据窗数据窗标题栏标题栏菜单栏菜单栏工具按钮栏工具按钮栏数据单元格显示数据单元格显示数据文件建立原则数据文件建立原则一个观测占一行一个观测占一行一个变量占一列一个变量占一列 2728变变量量度度量量类类型型变变量量名名变变量量类类型型变变量量宽宽度度保保留留
12、小小数数位位数数变变量量名名标标签签变变量量值值标标签签缺缺失失值值显显示示数数据据列列宽宽数数据据对对齐齐方方式式数据编辑窗口数据编辑窗口变量窗变量窗2829定量变量定量变量 Scale 等级变量等级变量 Ordinal 名义变量名义变量 Nominal2930标准数值型标准数值型科学记数法科学记数法圆点数值型圆点数值型逗号数值型逗号数值型日日 期期 型型带美元符号数值型带美元符号数值型自自 定定 义义字字 符符 型型3031名义变量的哑变量化名义变量的哑变量化原资料原资料姓名姓名性别性别X1年龄年龄X2 疗法疗法 X3张三张三150中西医中西医李四李四120西医西医王五王五018中医中医刘
13、六刘六070中医中医赵七赵七135中西医中西医孙八孙八029西医西医哑变量化哑变量化姓名姓名X1X2X31X32张三张三15001李四李四12010王五王五01800刘六刘六07000赵七赵七13501孙八孙八0291032一、概述一、概述二、原始数据的录入二、原始数据的录入三、数据处理的几个基本问题三、数据处理的几个基本问题四、统计方法选择的基本思路四、统计方法选择的基本思路五、统计分析结果的表述五、统计分析结果的表述33数据的净化数据的净化 逻辑检查逻辑检查 计算检查计算检查离群数据的处理离群数据的处理 离群值离群值(outliner)与与P25或或P75的距离为的距离为“四分位数间距四分
14、位数间距”的的1.53.0倍。倍。极端值极端值(extreme value)与与P25或或P75的距的距离为离为“四分位数间距四分位数间距”的的3.0倍以上。倍以上。剔除离群或极端值要予以合理解释。剔除离群或极端值要予以合理解释。34数据质量有问题,数据质量有问题,使用的统计方法越高级,使用的统计方法越高级,欺骗性越大欺骗性越大!35一、概述一、概述二、原始数据的录入二、原始数据的录入三、数据处理的几个基本问题三、数据处理的几个基本问题四、统计方法选择的基本思路四、统计方法选择的基本思路五、统计分析结果的表述五、统计分析结果的表述36设计类型:设计类型:完全随机、随机区组、拉丁方、完全随机、随
15、机区组、拉丁方、交叉、析因、正交、嵌套、裂区设计交叉、析因、正交、嵌套、裂区设计处理因素:处理因素:单因素、双因素、多因素单因素、双因素、多因素 水平:水平:单水平、两水平、多水平单水平、两水平、多水平处理效应:处理效应:单变量、双变量、多变量单变量、双变量、多变量资料类型:资料类型:计量、无序分类、有序分类计量、无序分类、有序分类数据情况:数据情况:完全数据、不完全数据、完全数据、不完全数据、重复测量数据、层次结构数据重复测量数据、层次结构数据假设检验方法前提条件:假设检验方法前提条件:独立、方差齐性、正态分布独立、方差齐性、正态分布重要重要37二个处理因素,观测指标为单变量。二个处理因素,
16、观测指标为单变量。38一个处理因素,观测指标为三个变量。一个处理因素,观测指标为三个变量。39(一一)单变量计量资料单变量计量资料1.样本均数与总体均数比较样本均数与总体均数比较 单因素单因素 服从正态分布服从正态分布 单样本单样本t检验检验 可信区间法可信区间法 不服从正态分布不服从正态分布 单个样本中位数与总体中位数比较单个样本中位数与总体中位数比较402.两个相关样本均数的比较两个相关样本均数的比较 单因素单因素 配对设计或自身前后对照设计配对设计或自身前后对照设计 差值服从正态分布差值服从正态分布 成对成对t t检验检验 可信区间法可信区间法 差值不服从正态分布差值不服从正态分布 Wi
17、lcoxon符号秩检验符号秩检验(一一)单变量计量资料单变量计量资料(1-)可信区间不可信区间不包括包括 d=0,P T 1 Pearson 2 检验检验 (Yates 校正公式校正公式)N40 或或 T 1 Fisher 确切概率法确切概率法 (2)配对设计配对设计 McNemar 2 检验检验Logistic回归分析回归分析55Y(疗效疗效)=1 有效有效0 无效无效X1(疗法疗法)=1 新疗法新疗法0 传统疗法传统疗法组别组别 疗效疗效 频数频数 1 1 99 1 0 5 0 1 75 0 0 21数据输数据输入格式入格式563.病例对照研究成组资料分层分析病例对照研究成组资料分层分析(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 临床 研究 资料 常用 统计分析 方法 知识
限制150内