主成分回归分析与多元线性回归的对比研究.pdf
《主成分回归分析与多元线性回归的对比研究.pdf》由会员分享,可在线阅读,更多相关《主成分回归分析与多元线性回归的对比研究.pdf(4页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、J o u r n a l o f Ma t h e ma t i c a l Me d i c i n e Vo 1 1 6 NO2 2 0 0 3 文章 编号:1 0 0 4 4 3 3 7(2 0 0 3)0 2 0 1 4 0 0 4 中图分类号:R1 9 5 1 文献标识码:A 主成分回归分析与多元线性回归的对比研究 罗文海 万巧云 高永(滨州 医学 院滨 州 2 5 6 6 0 3)摘要,为探讨 医学本科生 毕业成绩 的影 响因素 以1 0 5 例医学本科毕业生 的1 9 f l 主要课程 成绩作为 自变量。以其 毕生成绩 作 为因变量。进 行了多元线性 回归分 析和主成分 回归分
2、析 关键词:主成分 回归;多重共 线性 在 医 学资 料 的多变 量数 据分 析 中,经 常采 用多元 线性 回 归 分析方 法。采 用这 种方法分 析得到 的结果,在多数 情况下 比 较合 理,即自变 量 与因变量 的关系与 现代 医学 理论相 吻合。然 而 我们遇 到的 资料在采 用多元线 性 回归 分析时得 到的结果 却 并 不令 人满 意,即 自变 量与 因变 量的关 系 与现代 医学 理论 相 违背,致使多元线性回归分析得到的结果无法用现代医学理 论进 行解 释,因而此 时多元线 性 回归 分析 的结 果难 以被采用。多元线性 回归 分析结果 的这种不 合理 性可 以用 主成分 回归
3、 分 析 方法 加 以校 正C 1 。医学本科 生 的 毕业成 绩是 对 学生所 学 的 主要课 程 的熟 练程 度和综 合 应用能 力 的综合 测评,是 反映 学 生 素质 和能 力 的重要 测度。深 入 研究 医学本 科生 毕业成 绩 的 影 响因 素 对 于加 强教学 管理 和提 高学 生 的学 习效果具 有 重 要 意义。1 资料与 方法 本 文 资料 来 自我 院两个 班 的学生 档案 记 录,随机抽 取 其 中1 0 5 例的数 据 进行 分析。由于所 学课 程 的数 目较 多,故 只选 取 其 中主要 的课 程成 绩 1 9 门作 为 自变量。用 毕业 成绩 作为 因 变量。用
4、S P S S统 计分 析软 件进行数 据 录入 和分析。少 数学 生 的个 别课 程的成绩 为补 考6 O 分,因其 与非补考 6 O 分不 同,故 数 据 录入前 将 其剔 除。由于最初 多元 线 性 回归 分析 的部 分结 果 不合 理 难 以用现有 的医学理 论进行解 释,故再使 用主成分 分 析、变量 转换 和主成分 回归分 析等方法。最终 的分析结 果符 合 现 有 医学 理 论 的解 释,多元线 性 回归 和主成 分 回归分析 中均 使用逐 步法进行 处理。2结 果 表 1 为1 0 5 例 医学 本科生 1 9 N课 程考试成绩 及 毕业成绩 的 均数 和标准差。2 1 多元线
5、 性 回归 分析 以1 9 门课 程成绩 作 为 自变量,以毕业 成绩 作 为 因变量 进 1 4 0 行逐 步 回归 分析,选 人和剔 除变量 的概率水 准均取 默认值,分 别为o 0 5、o 1 O,所得结果见 表2、3。表 1 医学生 1 9 门课程及毕业成 绩(,I=1 0 5)表2 多元线性 回归 方程的方差分 析 由表2 可 见,多元 回归方程 的假设 检验,P0 0 0 1 故拒 绝 各 均 为O 的假 设,可 以认 为部 分 自变 量对 因变量 毕业 成绩 的影 响有统计学意义。由表 3 可 见,卫 生 学、神 经 科、妇产 科 和 内科 成 绩 4 个 自变 量对毕业成绩因变
6、量的作用均有显著性(P 0 0 5)。其 中卫 生学、神 经科 和妇产 科成 绩 的偏 回归系 数为 正值 其 与 因变量 为 正 向变 化关 系,这符合 实际情 况。但内科成绩 的偏 回归 系数 为负 值,其与因变量为负向变化关系,这有悖常理 可能是由于 自 变量共 线性的影响,进一步作共 线性诊 断分析 其结果见 表4。维普资讯 http:/ 数理 医药 学杂 志 2 0 0 3 年 第1 6 卷第2 期 裹3 多元线性 回归参数估计 及其共线性统计 裹4多元线性回归 自变 共线性诊 断统 计 表4 中的维数与 特征值 的大小有关,当特征值小 和条件数 大时,表示共线性强。当条件数大于3
7、O 时,表示有高度共线性。由表4 可见,维数随特征值变化,条件数也随特征值变化 第二 维数行中的条件数为2 8 2 4 3,接近3 O,第3、第4 和第5 维数行中 的条 件数 均大 于3 O,这些指 标数 据 均表示 自变 量共 线性 关 系 严重。同一维数行 中 自变量 方差 比较大 者表示其共 线性较重。2 2 主成 分回归分析 对多 元线性 回归分析 中有 显著性 的4 个 自变量 卫生 学、神 经科、妇产科和内科进行主成分分析,采用默认 的不旋转 计算方法。选取 主成分 的个 数为4,其分析 的结果见表 5 裹 5 不旋 转时主成分分析 的结果 表 5 中主 成 分个 数 的选 取
8、通 常 以 累计 方 差 百 分 比大 于 8 5 为 准。由表5-3 见,本资料 选取 3 个 主成 分才能 使累计方 差 百 分 比大 于8 5 。表5 中 自变量 系数 用于 确定 主成 分,如第 一 个主成 分为0 7 1 0 卫 生学+0 7 8 9 内科+0 6 1 3 神经 科+0 6 5 9 妇产 科。分别 对 上述 4 个 自变 量 和 因变 量毕 业成 绩 进行 标 准 化,然 后用于 主成 分 回归 分析。主成 分 回归分析 的结果见表6。裹6 未旋转 时主 尬发 回归分 析的结果 表 6 中对 于没有 被选人的 主成分(PO 0 5),S P S S系统没 有 给 出回
9、归 系数 的标 准误 和标 化 回归 系 数。由表 6-J 见,只有 第 一和第 四主成 分 的 回归 系数 的假设 检 验有 显著意 义,而第 二 和第 三主 成分 的回归系数 的假设检 验均无 显著意义。在 表5 中第 一 和第 四主成 分 的累 计方 差 百分 比 只有 6 2 0 7 6 ,故 回 归分析 的结果 不够好。由表6 中的第一 和第 四主成 分建立标 化 主成分 回归方程,再将表 5 中的主成分代 入该标 化主成 分 回归 方 程后,经整 理得到 的一般 多元线性 回归方程为。y=一6 0 0 1 8+0 4 1 8 卫 生学+0 1 9 6 内科+0 4 4 9 神经科+
10、0 5 2 7 妇产科 虽然上述一般 多元 线性 回归 方程 中的卫 生学、内科、神经 科 和妇产科成 绩 的回归系数均 为正值,这 与医学理论 相 吻合,纠正了表 3 中 的内科成绩 的回归系数 为负值 的不合理 情况。但 是因为该 回归方程只解释了方差 的6 2 0 7 6 ,故效果不够理 想。为 了改进 这种 不满 意 的结 果,在 主成 分分析 中,试 用最 大 方差 旋转 方法进 行 运算,经过 这 种旋转 后 的主成 分分 析结 果 见表7。由表7 和表5 比较可知,旋转后 的特 征值、方差 百分 比和 累 计方 差百 分 比均与旋 转前 相 同,但 各 主成分 中各 自变 量 的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 成分 回归 分析 多元 线性 对比 研究
限制150内