空间统计分析方法PPT讲稿.ppt
《空间统计分析方法PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《空间统计分析方法PPT讲稿.ppt(93页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、空间统计分析方法空间统计分析方法第1页,共93页,编辑于2022年,星期一本讲内容本讲内容探索性空间统计分析探索性空间统计分析地统计分析方法地统计分析方法 第2页,共93页,编辑于2022年,星期一空间统计分析空间统计分析,即空间数据(即空间数据(spatial data)的统)的统计分析,是现代计量地理学中一个快速发展的方向计分析,是现代计量地理学中一个快速发展的方向和领域。和领域。空间统计分析,其核心就是认识与地理位置相关的空间统计分析,其核心就是认识与地理位置相关的数据间的数据间的空间依赖、空间关联或空间自相关空间依赖、空间关联或空间自相关,通过,通过空间位置建立数据间的统计关系。空间位
2、置建立数据间的统计关系。空间统计分析的任务,就是运用有关统计方法,建空间统计分析的任务,就是运用有关统计方法,建立立空间统计模型空间统计模型,从凌乱的数据中,从凌乱的数据中挖掘空间自相关挖掘空间自相关与空间变异规律与空间变异规律。空间统计分析空间统计分析第3页,共93页,编辑于2022年,星期一空间数据分析与传统统计分析主要有空间数据分析与传统统计分析主要有两大差异:两大差异:(1)空间数据间并非空间数据间并非独立独立,而是在维空间中具有某种空间相关性,且,而是在维空间中具有某种空间相关性,且在不同的空间分辨率下呈现不同之相关程度;在不同的空间分辨率下呈现不同之相关程度;(2)地球只有一个,大
3、多数空间问题仅有一组(空间分布不规则的)观地球只有一个,大多数空间问题仅有一组(空间分布不规则的)观测值,而测值,而无重复观测数据无重复观测数据。因此,空间现象的了解与描述是极为复。因此,空间现象的了解与描述是极为复杂的,而传统方法,尤其是建立在独立样本上的统计方法,不适合杂的,而传统方法,尤其是建立在独立样本上的统计方法,不适合分析空间数据。分析空间数据。空间统计空间统计 VS.经典统计经典统计n经典统计:独立性、随机性假设经典统计:独立性、随机性假设n空间统计:自相关、依赖性、异质性空间统计:自相关、依赖性、异质性第4页,共93页,编辑于2022年,星期一地理学第一定律(地理学第一定律(F
4、LGFLG):everything is related to everything everything is related to everything else,but near things are more related than distant things else,but near things are more related than distant things(Tobler,1970).(Tobler,1970).空间统计的基本思想:Waldo Tobler(born in 1930)receiving a plaque for his contributions t
5、o geography.On the event of his November 2000 birthday.http:/en.wikipedia.org/wiki/Waldo_R._Tobler Tobler,W.R.(1970).A computer movie simulating urban growth in the Detroit region.Economic Geography,46(2):234-240.FLGFLG的一般性的一般性:自然地理、人文地理、社会经济第5页,共93页,编辑于2022年,星期一n空间自空间自相关相关是普遍存在的是普遍存在的,否则地理分析便没有多大意义
6、。经典统计:独立 空间自相关的存在,使得经典统计学所要求的样本独立性假设不满足。n如果地理学从根本上值得研究,必然是因为地理现象在空间上的变化地理现象在空间上的变化不是随机的不是随机的。经典统计:随机第6页,共93页,编辑于2022年,星期一可以借助空间统计更好地理解地理现象。可以借助空间统计更好地理解地理现象。或许学习空间统计最重要的原因是我们不仅仅想知道问题或许学习空间统计最重要的原因是我们不仅仅想知道问题“怎么样怎么样”,更想知道更想知道“哪里怎么样哪里怎么样”v空间统计学可以帮助我们准确地判断具体地理模空间统计学可以帮助我们准确地判断具体地理模式的原因。式的原因。John Snow的霍
7、乱地图的霍乱地图 当发现某种病仅仅发生在靠近河流的村庄时,河流中的寄生物可能是当发现某种病仅仅发生在靠近河流的村庄时,河流中的寄生物可能是病源。病源。空间统计学可以帮助我们处理大的复杂数据集空间统计学可以帮助我们处理大的复杂数据集,这是这是GIS经常面对的事情。经常面对的事情。为什么要用空间统计为什么要用空间统计第7页,共93页,编辑于2022年,星期一霍乱病死者居住分布图(John Snow,1854)v18541854年年8 8月到月到9 9月月英国伦敦霍乱流行英国伦敦霍乱流行时,当局始终找不到发病的原因,时,当局始终找不到发病的原因,后来医生约翰后来医生约翰斯诺斯诺(John Snow)
8、(John Snow)参与调查。参与调查。v他在绘有霍乱流行地区所有道路、他在绘有霍乱流行地区所有道路、房屋、饮用水机井等内容的房屋、饮用水机井等内容的1 1:65006500比例尺地图上,标出了每个霍乱病比例尺地图上,标出了每个霍乱病死者的死者的居住位置居住位置,得到了,得到了霍乱病死者居霍乱病死者居住分布图住分布图。第8页,共93页,编辑于2022年,星期一一一.探索性空间统计分析探索性空间统计分析 基本原理与方法 应用实例 第9页,共93页,编辑于2022年,星期一探索性空间数据分析探索性空间数据分析(ESDA)ESDA是指利用统计学原理统计学原理和图形图表图形图表相结合对空间信息的性质
9、进行分析、鉴别,用以引导确定性模型的结构和解法。ESDA与EDA区别在于它考虑了数据的空间特性,它考虑了数据的空间特性,在方法上它将数据分解为一般趋势和叠加于其上的局在方法上它将数据分解为一般趋势和叠加于其上的局部变化两部分部变化两部分。然后用一定的数学函数去拟合由样本点产生的经验变率函数,进行诸如克立格内插等空间操作。第10页,共93页,编辑于2022年,星期一 通常定义一个二元对称空间权重矩阵W,来表达n个位置的空间区域的邻近关系,其形式如下式中:Wij表示区域i与j的临近关系,它可以根据邻接标准或距离标准来度量。1.基本原理与方法基本原理与方法 (一)空间权重矩阵 第11页,共93页,编
10、辑于2022年,星期一 简单的二进制邻接矩阵简单的二进制邻接矩阵 基于距离的二进制空间权重矩阵基于距离的二进制空间权重矩阵 n两种最常用的确定空间权重矩阵的规则 第12页,共93页,编辑于2022年,星期一(二)全局空间自相关(二)全局空间自相关 Moran指数反映的是空间邻接或空间邻近的区域单元属性值的相似程度。Geary 系数与Moran指数存在负相关关系。Patrick A.P.Moran(1917-1988)Moran指数和Geary系数是两个用来度量空间自相关的全局指标。全局空间自相关概括了在一个总的空间范围内空间依赖的程度。第13页,共93页,编辑于2022年,星期一 如果是位置(
11、区域)的观测值,则该变量的全局Moran指数I,用如下公式计算 式中:I 为Moran指数;。第14页,共93页,编辑于2022年,星期一 Geary 系数C计算公式如下 式中:C为Geary系数;其他变量同上式。v 如果引入记号 第15页,共93页,编辑于2022年,星期一 则全局Moran指数I的计算公式也可以进一步写成 Moran指数指数I的取值一般在的取值一般在-1,1之间之间,小于小于0表示负相关,表示负相关,等于等于0表示不相关,大于表示不相关,大于0表示正相关;表示正相关;Geary系数系数C的取值一般在的取值一般在0,2之间,大于之间,大于1表示负相关,等表示负相关,等于于1表
12、示不相关,而小于表示不相关,而小于1表示正相关。表示正相关。第16页,共93页,编辑于2022年,星期一 (三)局部空间自相关(三)局部空间自相关 描述一个空间单元与其领域的相似程度,能够表示每个局部单元服从全局总趋势的程度(包括方向和量级),反映了空间异质性,说明空间依赖是如何随位置变化的。局部空间自相关分析方法包括局部空间自相关分析方法包括3种种:v 空间联系的局部指标空间联系的局部指标(LISA);v G统计量统计量;v Moran散点图散点图第17页,共93页,编辑于2022年,星期一n空间联系的局部指标空间联系的局部指标(LISA)(LISA)空空间间联联系系的的局局部部指指标标(l
13、ocal indicators of spatial association,缩写为,缩写为LISA)满足下列两个条件:)满足下列两个条件:(1)每每个个区区域域单单元元的的LISA,是是描描述述该该区区域域单单元元周周围围显显著著的相似值区域单元之间空间集聚程度的指标的相似值区域单元之间空间集聚程度的指标;(2)所所有有区区域域单单元元LISA的的总总和和与与全全局局的的空空间间联联系系指指标标成成比比例。例。第18页,共93页,编辑于2022年,星期一 LISA包括包括局部局部Moran指数指数(local Moran index)和)和局局部部Geary指数指数(local Geary
14、index),下面重点介绍和),下面重点介绍和讨论局部讨论局部Moran指数。指数。第19页,共93页,编辑于2022年,星期一局部局部Moran指数被定义为指数被定义为可进一步写成可进一步写成 式中:式中:和和 是经过标准差标准化的观测值。是经过标准差标准化的观测值。局部局部Moran指数检验的标准化统计量为指数检验的标准化统计量为 第20页,共93页,编辑于2022年,星期一n G统计量统计量 v全局全局G统计量的计算公式为统计量的计算公式为v对每一个区域单元的统计量为对每一个区域单元的统计量为 探测区域单元是属于高值集聚还是低值集聚的空间分探测区域单元是属于高值集聚还是低值集聚的空间分布
15、模式布模式.第21页,共93页,编辑于2022年,星期一 对统计量的检验与局部对统计量的检验与局部Moran指数相似,其检验值为指数相似,其检验值为 显著的正值表示在该区域单元周围,高观测值的区域单元趋显著的正值表示在该区域单元周围,高观测值的区域单元趋于空间集聚,而显著的负值表示低观测值的区域单元趋于空间集聚于空间集聚,而显著的负值表示低观测值的区域单元趋于空间集聚,与与Moran指数只能发现相似值指数只能发现相似值(正关联正关联)或非相似性观测值或非相似性观测值(负关联负关联)的空间集聚模式相比,的空间集聚模式相比,具有能够探测出区域单元属于高值集聚还是具有能够探测出区域单元属于高值集聚还
16、是低值集聚的空间分布模式低值集聚的空间分布模式。第22页,共93页,编辑于2022年,星期一n Moran散点图散点图 以以(Wz,z)为为坐坐标标点点的的Moran散散点点图图,常常来来研研究究局局部部的的空空间间不不稳稳定定性性,它它对对空空间间滞滞后后因因子子Wz和和z数数据据对对进进行行了了可可视视化化的的二二维维图图示。示。全全局局Moran指指数数,可可以以看看作作是是Wz对对于于z的的线线性性回回归归系系数数,对对界界外外值值以以及及对对Moran指指数数具具有有强强烈烈影影响响的的区区域域单单元元,可可通通过过标标准准回回归来诊断出。归来诊断出。由由于于数数据据对对(Wz,z)
17、经经过过了了标标准准化化,因因此此界界外外值值可可易易由由2sigma规则可视化地识别出来。规则可视化地识别出来。第23页,共93页,编辑于2022年,星期一 Moran散点图的散点图的4 4个象限个象限,分别对应于区域单元与其邻居分别对应于区域单元与其邻居之间之间4 4种类型的局部空间联系形种类型的局部空间联系形式:式:v 第第1 1象限代表了象限代表了高观测值高观测值的的区域单元被区域单元被高值高值的区域所包围的区域所包围的空间联系形式;的空间联系形式;v 第第2 2象限代表了象限代表了低观测值低观测值的的区域单元被区域单元被高值高值的区域所包围的区域所包围的空间联系形式;的空间联系形式;
18、第24页,共93页,编辑于2022年,星期一 v 第第3 3象限代表了象限代表了低观测值低观测值的区域单元被的区域单元被低值低值的区域所的区域所包围的空间联系形式;包围的空间联系形式;v 第第4 4象限代表了象限代表了高观测值高观测值的区域单元被的区域单元被低值低值的区域所的区域所包围的空间联系形式。包围的空间联系形式。第25页,共93页,编辑于2022年,星期一2.应用实例应用实例 中国大陆30个省级行政区人均GDP的空间关联分析。根据各省(直辖市、自治区)之间的邻接关系,采用二进制邻接权重矩阵,选取各省(直辖市、自治区)19982002年人均GDP的自然对数,依照公式计算全局Moran指数
19、I,计算其检验的标准化统计量Z(I),结果如下表所示。年份年份IZP19980.50014.503 50.000 019990.506 94.555 10.000 020000.511 24.597 80.000 020010.505 94.553 20.000 020020.501 34.532 60.000 0第26页,共93页,编辑于2022年,星期一 从从表表中中可可以以看看出出,在在19982002年年期期间间,中中国国大大陆陆30个个省省级级行行政政区区人人均均GDP的的全全局局Moran指指数数均均为为正正值值;在在正正态态分分布布假假设设之之上上,对对Moran指指数数检检验验
20、的的结结果果也也高高度度显显著著。这这就就是是说说,在在19982002年年期期间间,中中国国大大陆陆30个个省省级级行行政政区区人人均均GDP存存在在着着显显著著的的、正正的的空空间间自自相相关关,也也就就是是说说各各省省级级行行政政区区人人均均GDP水水平平的的空空间间分分布布表表现现出出相相似似值值之之间间的的空空间间集集聚聚,其其空空间间联联系系的的特特征征是是:较较高高人人均均GDP水水平平的的省省级级行行政政区区相相对对地地趋趋于于和和较较高高人人均均GDP水水平平的的省省级级行行政政区区相相邻邻,或或者者较较低低人人均均GDP水水平平的的省省级级行行政政区区相相对对地地趋趋于于和
21、和较低人均较低人均GDP水平的水平的省级行政区省级行政区相邻。相邻。第27页,共93页,编辑于2022年,星期一 选取2001年我国30个省级行政区人均GDP数据,计算局部Gi统计量和局部Gi统计量的检验值Z(Gi),并绘制统计地图如下。第28页,共93页,编辑于2022年,星期一 检验结果表明,贵州、四川、云南西部3省的Z值在0.05的显著性水平下显著,重庆的Z值在0.1的显著性水平下显著,该4省市在空间上相连成片分布,而且从统计学意义上来说,与该区域相邻的省区,其人均GDP趋于为同样是人均GDP低值的省区所包围。由此形成人均GDP低值与低值的空间集聚,据此可认识到西部落后省区趋于空间集聚的
22、分布特征。第29页,共93页,编辑于2022年,星期一 东部的江苏、上海、浙江三省市的Z值在0.05的显著性水平下显著,天津的Z值在0.1的显著性水平下显著。而东部上海、江浙等发达省市趋于为一些相邻经济发展水平相对较高的省份所包围,东部发达地区的空间集聚分布特征也显现出来。第30页,共93页,编辑于2022年,星期一 以(Wz,z)为坐标,进一步绘制Moran散点图 可以发现,多数省(直辖市、自治区)位于第1和第3象限内,为正的空间联系,属于低低集聚和高高集聚类型,而且位于第3象限内的低低集聚类型的省(直辖市、自治区)比位于第1象限内的高高集聚类型的省(直辖市、自治区)更多一些。第31页,共9
23、3页,编辑于2022年,星期一第32页,共93页,编辑于2022年,星期一 上图进一步显示了30个省级行政区人均GDP局部集聚的空间结构。可以看出,从人均GDP水平相对地来看:高值被高值包围的高高集聚省(直辖市)有:北京、天津、河南、安徽、湖北、江西、海南、广东、福建、浙江、山东、上海、江苏;低值被低值包围的低低集聚省(自治区)有:黑龙江、内蒙古、新疆、吉林、甘肃、山西、陕西、青海、西藏、四川、云南、辽宁、贵州;被低值包围的高值省(直辖市)有:重庆、广西、河北;被高值包围的低值省份只有湖南。第33页,共93页,编辑于2022年,星期一1978、1990、2001、2007年全国各省市人均GDP
24、的LISA显著水平图第34页,共93页,编辑于2022年,星期一二、地统计分析方法二、地统计分析方法地统计方法的基本原理 应用实例 第35页,共93页,编辑于2022年,星期一地统计学地统计学(Geostatistics),又称地质统计学,是法国著名统计学家又称地质统计学,是法国著名统计学家G.Matheron在大量理论研究基础上提出的。在大量理论研究基础上提出的。地统计学是以地统计学是以区域化变量理论区域化变量理论为基础,以变异函数为主要工具,研究为基础,以变异函数为主要工具,研究那些在空间分布上既有随机性又有结构性,或空间相关和依赖性,那些在空间分布上既有随机性又有结构性,或空间相关和依赖
25、性,或空间格局与变异,并对这些数据进行最优无偏内插估计,或模拟或空间格局与变异,并对这些数据进行最优无偏内插估计,或模拟这些数据的离散性、波动性。这些数据的离散性、波动性。协方差函数协方差函数和和变异函数变异函数是以区域化变量理论为基础建立起来的地统计学是以区域化变量理论为基础建立起来的地统计学的两个最基本的函数。地统计学的主要方法之一,克立格法就是建立在的两个最基本的函数。地统计学的主要方法之一,克立格法就是建立在变异函数理论和结构分析基础之上的。变异函数理论和结构分析基础之上的。第36页,共93页,编辑于2022年,星期一 当一个变量当一个变量呈现为空间分布呈现为空间分布时,就称之为区域化
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 空间 统计分析 方法 PPT 讲稿
限制150内