浅谈网站影响力.doc
《浅谈网站影响力.doc》由会员分享,可在线阅读,更多相关《浅谈网站影响力.doc(8页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、【精品文档】如有侵权,请联系网站删除,仅供学习与交流浅谈网站影响力.精品文档.浅谈网站影响力课 程: 数据仓库与数据挖掘 班 级: 信息管理与信息系统1101 学 号: 111104020、111104022 姓 名: 黄 伟、赖振志 指导老师: 孙 剑 斌 老 师 完成日期: 2014 - 6 - 4 目录一、 问题提出2二 、数据采集(来源)2三、统计方法3四统计分析过程31、输数据32、主成分分析43、主成分评价54、聚类分析8五、结论9一、 问题提出随着我国互联网的迅速发展,人们对信息使用的要求也在不断的提高。本文对2012年08月 “网站影响力榜”排行中的网站用户信息的分析与评价问题
2、进行探讨,运用定量与定性分析相结合的方法对网站影响力进行纵横研究,采用主成分分析和聚类分析等多元统计分析对重要变量进行综合分析。二 、数据采集(来源)由数据堂下载而来,由于名人堂中的用户基本经过认证,因此数据较为可信。故挑选了名人堂中在2012年08月间最有影响力的100家网站。影响力由活跃度、传播力和覆盖度三大指标构成,这三项指标各自又有着极为复杂、精密的科学算法。其中,活跃度代表每天主动发博、转发、评论的有效条数;传播力与微博被转发、被评论的有效条数和有效人数相关;覆盖度的高低则取决于微博的活跃粉丝数的多少。数据保存于Excel表WebsiteCloutList20120911_Users
3、.xls之中。三、统计方法主成分分析是设法将原来众多具有一定相关性,重新组合成一组新的互相无关的综合指标来代替原来的指标。聚类分析是根据事物本身的特性研究个体分类的方法。四统计分析过程运用SPSS软件的主成分分析法,对指标体系中各相应数据进行分析,得出6个指标的相关系数矩阵特征根,方差贡献率,累计特征根,累计方差贡献率。SPSS软件分析步骤:1、输数据将Excel表WebsiteCloutList20120911Users.xls中的数据导入到SPSS中,部分数据截图如下:2、 主成分分析1)选择方法:选择菜单分析-降维-因子分析.;2)确定变量:将变量粉丝数、关注数、微博数、收藏数、用户互粉
4、数放入变量框;3)确定统计量:在抽取窗口中选择方法为主成分,在得分窗口中选择保存为变量;4)得结果:按确定按钮执行,步骤和结果如下:解释的总方差成份初始特征值提取平方和载入合计方差的 %累积 %合计方差的 %累积 %11.98239.64839.6481.98239.64839.64821.15923.18762.8351.15923.18762.83531.01120.22783.0621.01120.22783.0624.77115.41998.4815.0761.519100.000提取方法:主成份分析。 由于前三个主成分累计方差贡献率大于80%,说明这三个主成分已基本包含了全部指标具有
5、的信息,故取前三个主成分为综合指标。3、主成分评价以各主要成分的方差贡献率为权,得到综合评价指标函数F=39.648*FAC1_1+23.187* FAC2_1+20.227* FAC3_1这里FAC1_1、FAC2_1、FAC3_1分别为第一、二、三主成分的因子得分,选择菜单转换-计算变量计算综合得分F。公因子方差初始提取粉丝数1.000.683关注数1.000.941微博数1.000.679收藏数1.000.891用户的互粉数1.000.958提取方法:主成份分析。解释的总方差成份初始特征值提取平方和载入合计方差的 %累积 %合计方差的 %累积 %11.98239.64839.6481.9
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 浅谈 网站 影响力
限制150内