聚类分析的案例分析.doc
《聚类分析的案例分析.doc》由会员分享,可在线阅读,更多相关《聚类分析的案例分析.doc(10页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、|应用多元统计分析报告班级:学号:姓名:|聚类分析的案例分析摘要本文主要用 SPSS 软件对实验数据运用系统聚类法和 K 均值聚类法进行聚类分析,从而实现聚类分析及其运用。利用聚类分析研究某化工厂周围的几个地区的气体浓度的情况,从而判断出这几个地区的污染程度。经过聚类分析可以得到,样本 6 这一地区的气体浓度值最高,污染程度是最严重的,样本 3 和样本 4 气体浓度较高,污染程度也比较严重,因此要给予及时的控制和改善。关键词:SPSS 软件 聚类分析 学生成绩|1、数学模型聚类分析的基本思想是认为各个样本与所选择的指标之间存在着不同程度的相似性。可以根据这些相似性把相似程度较高的归为一类,从而
2、对其总体进行分析和总结,判断其之间的差距。系统聚类法的基本思想是在这几个样本之间定义其之间的距离,在多个变量之间定义其相似系数,距离或者相似系数代表着样本或者变量之间的相似程度。根据相似程度的不同大小,将样本进行归类,将关系较为密切的归为一类,关系较为疏远的后归为一类,用不同的方法将所有的样本都聚到合适的类中,这里我们用的是最近距离法,形成一个聚类树形图,可据此清楚的看出样本的分类情况。K 均值法是将每个样品分配给最近中心的类中,只产生指定类数的聚类结果。2、数据来源应用多元统计分析第一版 164 页第 6 题我国山区有一某大型化工厂,在该厂区的邻近地区中挑选其中最具有代表性的 8 个大气取样
3、点,在固定的时间点每日 4 次抽取 6 种大气样本,测定其中包含的 8 个取样点中每种气体的平均浓度,数据如下表。试用聚类分析方法对取样点及大气污染气体进行分类。|3、建立数学模型1、运行过程(一)系统聚类分析在 SPSS 界面对上述数据进行系统聚类分析如图 1 和图 2 所示,进行最近距离分类。图 1图 2|(二)K 均值聚类分析对数据进行 K 均值聚类分析,如下图所示:图 3图 4图 5|2、运行结果(1)聚类树形图图 6由图可以看出,将数据进行聚类分析,根据设定的分为了二类到三类。若分为两类则样本 6 为一类,其他为一类;若分为三类则将样本四分离出来,其他分为一类。(2)新变量图 7该图
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 聚类分析 案例 分析
限制150内