基于多时相landsat8数据的南方丘陵区典型地物信息提取--以秦淮河流域为例-宋明明.pdf
《基于多时相landsat8数据的南方丘陵区典型地物信息提取--以秦淮河流域为例-宋明明.pdf》由会员分享,可在线阅读,更多相关《基于多时相landsat8数据的南方丘陵区典型地物信息提取--以秦淮河流域为例-宋明明.pdf(8页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、第16卷第18期 2016年6月1671 1815(2016)018-0209-08科学技术与工程Science Technology and EngineeringVol 16 No 18 Jun. 2016 2016 Sci Tech Engrg自动化技术、计算机技术基于多时相Landsat8数据的南方丘陵区典型地物信息提取 以秦淮河流域为例宋明明郑文龙卞国栋都金康(南京大学地理与海洋科学学院,江苏省地理信息资源开发与利用协同创新中心,江苏省地理信息技术重点实验室,南京210000)摘要以南方丘陵区秦淮河流域为研究区,采用多时相Landsat8遥感影像进行典型地物的光谱采样。根据典型地物光
2、谱特征统计结果,针对各地类特点选取最优的指数提取模型,最终形成具有分层提取特点的决策树分类模型。结果表明:借助植物的物候特征,采用多时相遥感影像进行水田与植被的划分能够取得较好效果;秦淮河流域水田与旱地交错分布,水田主要分布于秦淮河河流洼地,夏季的水田与旱地光谱特征差异最明显,是遥感信息提取最好的时间,短波红外波段为水的吸收波段,在区分水田与旱地信息上具有明显优势;归一化植被指数NDVI可区分农田信息与非农田信息,但由于部分绿化程度好的建筑用地在光谱信息上与农田存在一定的相似性,仍然存在一部分明显的误分现象,采用裸土指数BSI可以有效地将这部分建筑用地从农田信息中剔除;建筑用地与裸地的混分问题
3、是土地利用信息提取的难点之一,研究中尝试了多种指数模型与监督分类方法,结果显示监督分类方法在区分建筑用地与裸地信息方面效果最好;决策树分类模型较单一的监督分类方法总体精度提高了23 1%。关键词 Landsat 8 多时相 分层提取 决策树 秦淮河中图法分类号 TP79; 文献标志码 A2016年2月5日收到国家自然科学基金项目(41371044)资助第一作者简介:宋明明(1992 ),硕士研究生。研究方向:遥感与GIS应用,城市化水文效应。 E-mail: smmjy1228126 com。通信作者简介:都金康(1964 ),教授。研究方向:水文水资源及遥感与GIS的应用。 E-mail:n
4、judjk163 com。土地利用/覆被变化(land use/ cover change,LUCC)是全球环境变化和可持续发展研究的重要内容1。准确、快速获得地物信息是土地利用现状研究的关键内容,遥感技术凭借其快速、准确、范围广、周期短的特点,在土地利用/土地覆盖分类及变化监测方面得以广泛应用。遥感影像分类一直是遥感研究领域里的一项重要内容2。遥感影像分类方法主要以目视解译和计算机自动分类为主。目视解译虽然精度较高,但具有人工投入大、结果不确定性高、效率低、精度控制困难、解译经验要求高等缺点3。传统的计算机自动分类方法主要有监督分类和非监督分类,然而由于推理规则单一,难以解决“同物异谱”、“
5、同谱异物”的问题,错分、漏分等现象较多。为提高分类精度,国内外学者在自动分类领域做了大量的研究并取得一定进展4 7,目前人工神经网络、模糊理论分类、支持向量机、决策树等分类技术逐渐成为自动分类的热门技术8,9。决策树分类法作为一种基于空间数据挖掘和知识发现的方法,通过决策树学习过程建立分类规则并进行分类。决策树分类具有非参数性,灵活性与鲁棒性较好。因此针对数据特征空间分布复杂或多源数据各维的统计分布与尺度存在差异的情况,决策树分类具有一定优势10。同时决策树分类可以使其他地学知识有效地参与分类,结构直观清晰,计算效率高11,12。目前,决策树分类已经广泛应用于遥感影像信息提取和土地利用/土地覆
6、盖分类中。Muchoney等采用MODIS数据对美国中部进行土地利用分类,比较了决策树、神经网络、最大似然法3种分类方法效果,结果显示决策树分类精度最高13;姜亮亮等将NDVI、PCI作为主要特征变量,将MNDWI、TM7、Mean作为辅助特征变量,利用决策树进行干旱区盐碱化土壤信息的提取并取得较高精度14;韩婷婷等以TM波段1 5和7,以及由植被指数、缨帽变换、主成分变换、DEM组成的18个变量组,建立决策树,逐一分离各区的所有森林类型,得到了较最大似然法高的分类精度15。传统的地物信息提取方法主要凭借地物光谱特征差异分析,依据谱间关系法、指数模型法等构建地物信息提取模型,且大多着眼于某特定
7、地物信息的提取,而在实际应用中,有效结合多种研究方法提高典型地物信息提取精度至关重要。南方丘陵地区大小型河网交错纵横,湖泊、池塘广泛分布,水田是主要的农业土地利用类型之一,该地区的土地利用信息提取存在特定的难点:水稻收割后以及播种前的时期,水田信息与旱地信息和水体信息易发生混分,7、8月份农作物生长茂盛期,水田由于其含水量高,光谱特征表现为深绿色,与林地信息存在较多混分现象。同时,绿化程度较好的居民区与地表植被含量较少的旱地混分现象同样突出。针对以上问题,本文以秦淮河流域为研究区,选取多时相Landsat 8数据,针对农田的物候特点,结合决策树方法、MNDWI、ND-VI、BSI等指数信息模型
8、与监督分类等多种研究方法,构建研究区典型地物信息分层提取模型,总体精度较单一时相的分类结果提高了23 1%,有效解决了南方丘陵地区地物信息提取存在的问题。1研究区与数据1 1研究区概况秦淮河流域位于江苏省西南部,流域面积2 631km2,是一个闭合的流域,呈方形,长、宽各约50 km(图1)。流域范围介于东经11839 11919,北纬3134 3210之间16。秦淮河流贯穿全境,属典型的江南低山丘陵地区。流域高程介于0 417m之间,四面环山,中间低平。从流域四周到腹部,地貌可分为山地丘陵、黄土岗地、平原圩区。流域处于亚热带湿润季风气候区,具有气候湿润,四季分明,冬暖夏热、雨热同季、光照充足
9、的特点。主要的农业土地利用类型为灌溉农田、旱地。水田主要是指有水源保证和灌溉设施,在一般年景能正常灌溉,用以种植水稻,莲藕等水生农作物的耕地,旱地主要种植小麦、玉米、油菜等农作物。土地类型的空间分布特征明显。水田多分布在秦淮河的谷地,旱地主要分布在西南部和东北部丘陵17,林业用地分布较为广泛,流域四周山区广泛分布针叶林、阔叶林、灌木等,此外农业种植区以及建筑区均分布有林网。图1研究区位置示意图Fig 1 Location of the study area1 2数据源与预处理遥感影像数据为landsat8 OLI影像的生长季2013年8月11日数据和非生长季的2014年1月2日数据。云百分比分
10、别为0 37%、0%,两景影像均从USGS官网(http:/ / www. usgs. gov)获取。 Land-sat8卫星携带的陆地成像仪(operational land ima-ger, OLI)包括9个波段,其中有8个分辨率为30 m的多光谱波段:b1(Coastal, 0 43 0 45 m)、b2(Blue, 0 45 0 51 m)、b3(Green, 0 53 0 59m)、b4(Red, 0 64 0 67 m)、b5(NIR, 0 85 0 88 m)、 b6 ( SWIR1, 1 57 1 65 m)、 b7(SWIR2, 2 11 2 29 m)、b9(Cirrus,
11、 1 36 1 38m),1个分辨率为15 m的全色波段:b8 (Pan,0 50 0 68 m),成像宽幅为185 km 185 km。其中近红外波b5排除了0 825 m处水汽吸收特征;全色波段b8范围收窄,这种方式可以在全色图像上更好地区分植被和无植被特征。OLI数据和TM数据类似,发布的数据产品为L1T级,已进行了几何校正。因此可直接对Landsat8数据进行辐射校正、波段合成、研究区裁剪等处理,将30 m分辨率的全色波段与15 m分辨率的多光谱波段进行融合,融合后的影像质量大大提升。2研究方法2 1分类体系确定综合考虑研究目的、遥感影像地类光谱信息,结合研究区土地利用实际,确定土地利
12、用分类体系为6类,即建筑用地(城乡居民用地、商业、工矿、交通、机场用地等)、旱地、水田、林地(有林地、园地、灌木地、草地等)、水体(河流、湖泊以及水库等)、裸地(在建用地、其他裸露地表)。2 2典型地物光谱特征统计为了分析各地类的反射率特征,在Landsat8OLI影像上选取6类典型地物,结合Google Earth同时期高分影像,进行坐标配准,样本选取过程中保证样本选取的准确性与可靠性。建筑用地选取样本5 009个像元,水田、水体、林地分别选取样本2 000个像元,裸地1 858个像元,旱地1 257个像元,样本点在研究区内均匀分布。图2为6类典型地物在各个波段的图像反射率的平均值统计结果,
13、从各地类的图像反射率特征可以看出:水体较其他地类有较大差异,由于在近红外波段水体具有强吸收特性,因此其在近红外波段的值明显低于其他五类地物,可以利用水体光谱特征的特殊性,首先提取出水体;旱地、水田和林地的共同特征是地表均有植被覆盖,其光谱特征反映了植012科学技术与工程16卷被在红外波段吸收性强,在近红外波段反射性强的特性。由于该影像的获取时间在盛夏,林地与农作物均处于生长期,因此三类光谱特征较相似,尤其是林地与水田的光谱均值曲线几乎重叠,很难直接区分;此外,建筑用地与裸地均具有较高的反射率,特别是农村建筑用地地区,夹杂有大量的裸土、沙地,两地类的光谱特征较接近,准确区分建筑用地与裸地一直是土
14、地利用分类中的难点之一。为了有效提取各类地物信息,下面采用决策树分类的方法。图2典型地物图像反射率均值统计图Fig 2 Typical features image reflectance mean statistical figure2 3决策树提取模型构建基于对研究区地物光谱特征的分析,论文构建以归一化差异水体指数(modified normalized differ-ence water index, MNDWI)、归一化植被指数(nor-malized difference water index, NDWI)、裸土指数BSI、非生长季林地提取结果、裸地监督分类提取结果、SWIR1 (
15、short-wave-infrared band)波段为特征节点的决策树分类器。按照每个节点所确定的所有特征值的阈值进行地类划分。在遥感图像上,光谱维特征不仅是地物表现出的亮度值(或是反射率),还包括某些图像变换处理后反映出的特征值18,决策树节点特征值的选择与构建是研究的关键。2 3 1水体提取徐涵秋19在Mcfeeters提出的归一化差异水体指数NDVI20的基础上将用于抑制植被信息的近红外波段替换成中红外波段,提出了改进的归一化差异水体指数MNDWI,达到同时抑制植被与建筑物信息,更加突出水体信息的目的,该指数可以很好区分阴影和水体,适用于高大建筑物聚集的大城市水体信息提取,其表达式为M
16、NDWI = (green - mir1) / (green + mir1) (1)式(1)中, green和mir1分别指绿光波段和短波红外波段SWIR1的反射率。统计了六类典型地物样本在MNDWI指数波段的分布情况,从图3可以看出,MNDWI可有效区分水体与其他地类,给定合适的阈值,就可将水体首先提取出来。图3典型地物在MNDWI指数波段特征值直方图Fig 3 The eigenvalue histogram of typical featuresin MNDWI index band2 3 2林地提取由于2013年8月11日数据中,旱地、水田和林地光谱特征比较相似,难以通过单波段或指数波
17、段设定阈值对三者进行区分。而根据农田(旱地、水田)的物候特性, 11月之后,南京秦淮河流域水田、旱地处于收割期,而林地落叶时间相对较晚,且南京秦淮河流域分布有大量的常绿阔叶林,因此依照农田与林地的物候时间差,加入冬季影像进行林地与农田的划分。本文选取成像质量较好的2014年1月2日影像作为辅助数据进行林地提取。图4(a)为2013年8月11日影像林地、旱地和水田在各波段的反射率均值统计图,图4(b)为2014年1月2日影像林地、旱地和水田在各波段的亮度值均值统计图,由图4的对比结果可以看出,2014年1月2日影像中,林地与水田、旱地的光谱特征差异明显,说明非生长季影像在提取林地信息方面存在明显
18、的优势。对2014年1月2日数据进行预处理,选取可靠的训练区样本,采用监督分类的最大似然法提取出林地信息。2 3 3农田与非农田分离农田主要包括水田与旱地,在8月的影像上表现为植被特征,为了与非农田(建筑用地与裸地)区分,采用植被指数进行提取。植被指数是对植被覆盖、生长状况和生物量等有一定指示意义的指标。NDVI是植被生长状态及植被生长空间分布密度的最佳指示因子,与植物分布密度呈线性相关。是区分植被与建筑用地、裸地等地物的常用指数,其表达式为21NDVI = (nir - red) / (nir + red) (2)式(2)中,nir和red分别指近红外波段和红光波段的反射率。图5是4种地物的
19、植被指数分布。从图中可看出,NDVI增强了水田与旱地等有植被覆盖的地类的11218期宋明明,等:基于多时相Landsat8数据的南方丘陵区典型地物信息提取 以秦淮河流域为例图4生长季(a)与非生长季(b)影像水田和林地亮度均值统计对比图Fig 4 Paddy fields and woodland mean brightness statisticalcomparison in growing (a) and non-growing season (b)光谱信息,相反,水泥地地物及裸露地表的光谱信息得到抑制,给定NDVI一定的阈值(如0 48),基本上能将农田全部提取出来,但是提取的农田中包括
20、部分建筑用地中绿化程度好,植被覆盖度较高的小区、道路。在此基础上,再采用裸土指数法将这部分建筑用地从农田中分离出来。图5典型地物在NDVI指数波段特征值直方图Fig 5 The eigenvalue histogram of typical featuresin NDVI index bandRikimaru22在1996年提出了裸土指数(baresoil index, BSI),其模型的表达式为BSI = (mir1 + red) - (nir + blue)(mir1 + red) + (nir + blue)(3)式(3)中, mir1、 red、 nir和blue分别指短波红外波段SW
21、IR1、红光波段、近红外波段和蓝光波段的反射率。裸地在BSI指数波段亮度最高,其他地物的亮度由高到低依次为建筑用地、水体和植被。为提高农田与非农田两地类划分的精度,分析图5中农田(水田、旱地)和非农田(建筑用地、裸地)存在部分重合的原因,发现建筑用地中绿化程度较好的部分地区和农田中植被覆盖率较低(可能与水田和旱地此时处于休耕期有关)的部分在NDVI指数波段光谱值接近,因此在重合的这两部分地类中各选取样本1 000个像元,统计其在BSI指数波段的特征值直方图,发现BSI波段可以将二者较好的区分,见图6,为方便表示,建筑用地中绿化程度较好的部分地区用“建筑用地2”表示,部分处于休耕期、植被覆盖度较
22、低的农田用“农田2”表示。这样可以利用BSI指数阈值将非农田从农田中分离出去,得到更为精确的农田与非农田。图6两类地物在BSI指数波段特征值直方图Fig 6 The eigenvalue histogram of two typesof features in BSI index band2 3 4水田与旱地分离短波红外波段SWIR1为水的吸收波段,用于探测植物含水量及土壤湿度,而水田与旱地在植物含水量及土壤湿度上都存在一定差异。因此借助两者的差异性,试验两地类在该波段的可分性。通过图7中两地类在SWIR1波段的特征值统计结果可以看出,通过该波段设定阈值划分两地类的方法是可行的。图7水田与旱地
23、在SWIR1波段特征值直方图Fig 7 The eigenvalue histogram of Paddy fieldand dry field in SWIR1 band212科学技术与工程16卷2 3 5建筑用地与裸地分离建筑用地与裸地由于光谱特征较为相似,区分建筑用地和裸地信息一直是遥感专题信息提取的难点之一。吴志杰等23利用水体在绿光波段和近红外波段反射率的均值都远高于其在SWIR2波段的反射率,构建了归一化差值裸地与建筑用地指数(normalized difference bareness and built-up index,NDBBI),在提取建筑用地信息时可排除水体与植被的干扰
24、。其表达式为NDBBI = 1 5mir2 - (nir + green) /21 5mir2 + (nir + green) /2(4)式(4)中,mir2、nir和green分别代表地物在短波红外波段SWIR2,近红外波段,绿光波段的反射率。本文先后采用裸土指数BSI22、归一化差值裸地与建筑用地指数NDBBI23、监督分类三种方法,从相近的两地类中提取出裸地信息。但是前两个指数波段中,由于部分建筑用地中厂房的棚顶在影像上为高亮显示,与亮度值同样处于高值区的裸地容易混淆。而监督分类的结果显示可以较好地将裸地信息突出,从而实现两地类的区分。这可能与监督分类是按照统计决策理论来进行分类的有关,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 多时 landsat8 数据 南方 丘陵 典型 地物 信息 提取 秦淮河 流域 明明
限制150内