《因子分析中因子得分的估计.pdf》由会员分享,可在线阅读,更多相关《因子分析中因子得分的估计.pdf(4页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、第卷第期黄冈职业技 术学学报、,年月院因子分析中因予得分的估计邵 晓锋,李龙星黄冈职业技术学院湖北黄冈摘要本文由 因子分析的基本定理推导出因子得分的佑计方法,并通过实例说明了因子得分的计算方法及其现实意义。关键词因子分析因子得分 佑计中图分类号兄文献标识码文章编号一一一因子分析中曾提到因子分析是通过变量或样品的相关系数阵 对样品是相似系数阵内部结构的研究,找出控制着所有变量 或样品的少数几个随机变量即公因子 去描述多个变量 或样品之间的相关 或相似关系。为加深对因子分析法的理解,下 面给出因子分析基本定理,它给出正交因子模型对应的艺结构。定理设正交因子模型为定间汉其中“。,。昭战,嵘今则艺二事
2、实上这个关系式的成立是显然的。因为艺。,它意味着因子模型中第个变量和第个变量护的协方差呱由下式给出币柳如二玛蝙如果原始变量已被标准化为单位方差,在见二十中将用相关阵代替协差阵。在这种意义上,公共因子解释了观测变量的相关性。用正交因子模型预测的相关与实际的相关之间的差异就是剩余相关。评估正交因子模型拟合优度的好方法就是考察剩余相关的大小。因此,因子分析所要解决的重要 问题,就是首先用样本协差阵估计艺,然后求出和,通过求出的因子载荷阵,预测出公共因子,并给以实际背景的解释。下面介绍的的因子得分的估计就解决了上面的问题。因子分析的数学模型是将变量 或样品表示为公共因子的线性组合蝙“,由于公共因子能反
3、映原始变量 的相关关系,用公共因子代表原始变量时,有 时更有利于描述研究对象的特征,因而往往需要反过来将公共因子表示为变量或样品的线性组合,即巩,十几凡,称上式为因子得分的函数。用它来计算每个样品的公共因子得分。比如二,则将每个样品的个变量值代人上式即可算出每个样品的因子得分,和凡,这样就可以在二维平面上作出因子得分的散点图,进而对样品进行分类或作为下一步分析原始数据时对问题做更深人的研究。由于因子得分函数中方程的个数小于变量的个数,因此不能精确计算出因子得分,只能对因子得分进行估计。估计因子得分有很多方法,下面仅介绍 回归法,它是年由提出来的,所以又称为汤姆森回归法。假设公共因子可以对个变量
4、作回归,二,对变量,二,的回归方程为二。,十场凡二,由于假设变量及公共因子都已经标准化 了,所以饰八卜一,凡二。下面先求这些回归系数,然后给出因子得分的计算公式。州月润口月】乙剐一一白作者简介邵晓锋,女黄冈职业技术学院基础课部教师李龙星男黄冈职业技术学院经济贸易系教师。第期因子分析中因子得分的估计第卷由于 因子得分巩的值是待估的,由因子载荷的意义知飞乓二三一一翅即,”,旨、一“祛一砂匈札、,那十饰瞬十场物二若作型 因子分析,则建立样品的相似系数阵马。其中骨私二隽,二,其中二,帐,饰二,因此场一妈,孚,妈叱硕藐库队曰动以下步骤类似,只是将相关阵改变成相似阵即可。第三步求的特征根及相应的单位特征向
5、量,分别记为从从,二杯和,娜记门洲副叮匕日比二一,一尸“,”门一比伟,一育犷”犷夕”尸一庄创一一,一“根据 累计贡献率的要求比女口、鬓长氢、,取前个特征根及相应的特征向量写出因子载荷阵姗训川两福蜘其中,凡这就是估计因子得分的计算公式。其具体的计算步骤如下设原始数据资料如下表次次次及及及凡凡一、心心心标标两。仄间日味两而二阮巨阵际第一步记为。第二步其中将原始数据标准化,为书写方便仍建立变量的相关系数阵义第四步对放行方差最大正交旋转。第五步计算因子得分。下面我们通过一个具体的例子来说明因子得分的岭估计及其现实意义。例利用年的数据对我国社会发展状况进行综合考察。原始数据如下地地区区人均元元新增固定资
6、 产产城镇居民人均均农村居民家庭庭高 等 学校数数卫生 机 构数数亿元年可支配收人人均纯收入入所凡凡个凡凡元为为元 从从从从北北京京天天津津河河北北山山西西内内蒙蒙辽辽宁宁吉吉林林黑黑龙斌斌第期因子分析中因子得分的估计第卷地地区区人均元元新增固定资产产城镇居 民人均均农村居 民家庭庭高等学 校数数卫生机 构 数数亿元及及年可支配收人人均纯 收人人所 凡凡个 凡凡元凡凡元茂茂茂茂上上海海巧江江苏苏浙浙江江安安徽徽福福建建江江西西山山东东科河河南南湖湖北北湖湖南南、广广东东别列广广西西海海南南四四川川段如贵贵州州云云南南陕陕西西甘甘肃肃青青海海宁宁夏夏新新获获资料来源 中国统计年鉴第一步将数据标准
7、化。第二步建立指标间相关系数阵如下凡凡凡凡为为凡凡一及及及的的凡凡凡凡凡凡一第三步求的特征值和累计贡献率。序序号号特征值值方差贡献率率累计贡献率率,印佣第四步建立因子载荷阵。由于前三个特征值的累计贡献率已达,故取前三个特征值建立因子载荷阵如下第期因子分析中因子得分的估计第卷一一一了了工兀兀指指标、一一一第五步将因子载荷阵实行方差最大正交旋转,得正交因子表如下亏亏乒变几白一从从从凡凡凡一为为为凡凡凡一第六步将六个指标按高载荷分成三类,并结合专业知识对各因子给此命名如下高高高载荷指标标因子命名名人均收人因子子城城城镇居民人均年可支配收入入入农农农村居 民家庭人均纯收人人人只只只高等学校数数社会因子子卫卫卫生机构数数数新增固定资产产投资因子子由以上讨论可知因子得分的估计可以通过较少数几个公共因子来描述个相关变量间的协方阵的结构,进而对样品进行分类或作为下一步分析原始数据时对问题做更深入的研究。参考文献头,二已弱即,【陈希孺,王松桂近代实用回归分析南宁广西人民出版社,【方开泰,全辉,陈庆云实用 回归分析北京科学出版社,张尧庭,方开泰多元统计分析引论北京科学出版社,责任编辑张孝忠一,一们用笋乡代。交,什故,及犯。“砚犯岌 一对,田汉邓对如台州
限制150内