2022年数据统计模型参照 .pdf
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《2022年数据统计模型参照 .pdf》由会员分享,可在线阅读,更多相关《2022年数据统计模型参照 .pdf(8页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、数据统计模型多变量统计分析主要用于数据分类和综合评价。综合评价是区划和规划的基础。从人类认识的角度来看有精确的和模糊的两种类型,因为绝大多数地理现象难以用精确的定量关系划分和表示,因此模糊的模型更为实用,结果也往往更接近实际,模糊评价一般经过四个过程:(1)评价因子的选择与简化;(2)多因子重要性指标(权重)的确定;(3)因子内各类别对评价目标的隶属度确定;(4)选用某种方法进行多因子综合。1.主成分分析地理问题往往涉及大量相互关联的自然和社会要素,众多的要素常常给模型的构造带来很大困难,为使用户易于理解和解决现有存储容量不足的问题,有必要减少某些数据而保留最必要的信息。主成分分析是通过数理统
2、计分析,求得各要素间线性关系的实质上有意义的表达式,将众多要素的信息压缩表达为若干具有代表性的合成变量,这就克服了变量选择时的冗余和相关,然后选择信息最丰富的少数因子进行各种聚类分析,构造应用模型。设有 n 个样本,p 个变量。将原始数据转换成一组新的特征值主成分,主成分是原变量的线性组合且具有正交特征。即将x1,x2,,,xp综合成m(m p)个指标 zl,z2,,,zm,即 z1=l11*x1+l12*x2+.+l1p*xp z2=l21*x1+l22*x2+.+l2p*xp .zm=lm1*x1+lm2*x2+.+lmp*xp名师资料总结-精品资料欢迎下载-名师精心整理-第 1 页,共
3、8 页 -这样决定的综合指标z1,z2,,,zm分别称做原指标的第一,第二,,,第 m主成分,且 z1,z2,,,zm 在总方差中占的比例依次递减。而实际工作中常挑选前几个方差比例最大的主成分,从而简化指标间的关系,抓住了主要矛盾。从几何上看,找主成分的问题,就是找多维空间中椭球体的主轴问题,从数学上容易得到它们是x1,x2,,,xp 的相关矩阵中 m个较大特征值所对应的特征向量,通常用雅可比(Jaobi)法计算特征值和特征向量。主成分分析这一数据分析技术是把数据减少到易于管理的程度,也是将复杂数据变成简单类别便于存储和管理的有力工具。地理研究和生态研究的GIS用户常使用上述技术,因而应把这些
4、变换函数作为GIS的组成部分。2.层次分析法(AHP)Hierarahy Analysis 是 T.L.Saaty等在 70 年代提出和广泛应用的,是系统分析的数学工具之一,它把人的思维过程层次化、数量化,并用数学方法为分析、决策、预报或控制提供定量的依据。AHP方法把相互关联的要素按隶属关系分为若干层次,请有经验的专家对各层次各因素的相对重要性给出定量指标,利用数学方法综合专家意见给出各层次各要素的相对重要性权值,作为综合分析的基础。例如要比较n个因素 yyl,y2,,,yn 对目标 Z 的影响,确定它们在z 中的比重,每次取两个因素 yi 和 yJ,用 aij表示 yi 与 yJ 对 Z
5、的影响之比,全部比较结果可用矩阵 A(aij)n*n表示,A叫成对比矩阵,它应满足:aij0,aij=1/aij (i,j=1,2,.n)使上式成立的矩阵称互反阵,必有aij l。在旅游问题中,假设某人考虑 5 个因素:费用 yl、景色 y2,居住条件 y3,饮食条件 y4、旅途条件 y5。他用成对比较法得到的正互反阵是:在上式中 a122 表示 yl 与景色 y2 对选择旅游点(目标 Z)的重要性之比为 2:1;a137,表示费用 yl 与居住条件 y3 之比为 7:1;a234,则表示景色 y2 与居住条件 y3 之比为 4:1。如果 A不是一致阵(即 A12、A23;不等于 A13;),
6、需求正互友阵最大特征值对应的特征向量,作为权向量。名师资料总结-精品资料欢迎下载-名师精心整理-第 2 页,共 8 页 -3.系统聚类分析60 年代末到 70 年代初人们把大量精力集中于发展和应用数字分类法,且将这类方法应用于自然资源、土壤剖面、气候分类、环境生态等数据,形成“数字分类学”学科。目前聚类分析已成为标准的分类技术,在许多大型计算机中都存储了这种分析程序,从 GIS 数据库中将点数据传送到聚类分析程序也不困难。聚类分析的主要依据是把相似的样本归为一类,而把差异大的样本区分开来。在由 m个变量组成为 m维的空间中可以用多种方法定义样本之间的相似性和差异性统计量。例:用 xik表示第
7、i 个样本第 k 个指标的数据 xik表示第 j 个样本第 k 个指标数据;dij表示第 i 个样本和第 j 个样本之间的距离,根据不同的需要,距离可以定义为许多类型,最常见、最直观的距离是欧几里德距离,其定义如下:依次求出任何两个点的距离系数dij(i,j l,2,,,n)以后,则可形成一个距离矩阵:它反映了地理单元的差异情况,在此基础上就可以根据最短距离法或最长距离法或中位线法等。进行逐步归类,最后形成一张聚类分析谱系图,如图:名师资料总结-精品资料欢迎下载-名师精心整理-第 3 页,共 8 页 -4.判别分析判别分析是根据表明事物特点的变量值和它们所属的类求出判别函数,根据判别函数对未知
8、所属类别的事物进行分类的一种分析方法,与聚类分析不同,它需要已知一系列反映事物特性的数值变量值及其变量值。判别分析就是在已知研究对象分为若干类型(组别)并已经取得各种类型的一批已知样品的观测数据基础上,根据某些准则,建立起尽可能把属于不同类型的数据区分开来的判别函数,然后用它们来判别未知类型的样品应该属于哪一类。根据判别的组数,判别分析可以分为两组判别分析和多组判别分析;根据判别函数的形式,判别分析可以分为线性判别和非线性判别;根据判别时处理变量的方法不同,判别分析可以分为逐步判别、序贯判别等;根据判别标准的不同,判别分析有距离判别、Fisher判别、Bayes判别等。判别分析与聚类分析同属分
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年数据统计模型参照 2022 数据 统计 模型 参照
![提示](https://www.deliwenku.com/images/bang_tan.gif)
限制150内