蓝藻水华预报模型及基于遗传算法的参数优化.pdf
《蓝藻水华预报模型及基于遗传算法的参数优化.pdf》由会员分享,可在线阅读,更多相关《蓝藻水华预报模型及基于遗传算法的参数优化.pdf(8页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、生 态 学 报2010,30(4):10031010Acta Ecologica Si n icahttp:/基金项目:国家重点基础研究发展计划(973)资助项目(2008CB418106);江苏省自然科学基金资助项目(BK2005164);中国科学院重大交叉资助项目(KZCX12Y W214)收稿日期:2008212213;修订日期:20092032253 通讯作者Corresponding author.E2mail:蓝藻水华预报模型及基于遗传算法的参数优化黄佳聪1,2,吴晓东1,高俊峰1,3,孔繁翔1(1.中国科学院南京地理与湖泊研究所,南京 210008;2.中国科学院研究生院,北京
2、100049)摘要:蓝藻水华预报是应对水危机,保障水资源供给的一项重要工作。以太湖北部三湾(竺山湖、梅梁湾、贡湖)为研究对象,采用动态空间环境建模技术,构建了蓝藻水华预报模型,并通过实地观测建立了模拟的初始参数集。利用2008年0409月太湖水环境、气象等实测数据,采用遗传算法优化叶绿素a浓度预报模型中敏感度较高的4个参数。研究结果表明,该模型在蓝藻水华空间分布的预报上达到了一定的精度;采用遗传算法能全面、高效地进行参数优化,降低了模拟结果的相对残差,提高了模型预报精度。关键词:蓝藻水华;预报模型;动态空间环境模拟;参数优化;遗传算法;太湖Cyanobacteria bloom predict
3、ion model and parameters opti m ization based ongenetic algorithmHUANG Jiacong1,2,WU Xiaodong1,GAO Junfeng1,3,KONG Fanxiang11Nanjing Institute of Geography and Limnology,Chinese Academy of Sciences,Nangjing210008,China2Graduate University of Chinese Academy of Sciences,Beijing100049,ChinaAbstract:Cy
4、anobacteria bloom prediction is very important for water crisis and water resource security.Technique ofdynamic spatial environmental modelling is used to develop cyanobacteria bloom prediction model used in three bays(Meiliang Bay,Zhushan Bay,Gong Bay)of northern Taihu Lake.The initial model parame
5、ters are obtained from fieldobservation.The four parameters highly sensitive in chlorophyll2a concentration prediction are determined using GeneticAlgorithm optimization technique.The observed field data ofwater environment and meteorological conditions in Taihu Lakefrom April to September 2008 are
6、used for this purpose.The results showed that,Genetic Algorithm is comprehensive andefficient in optimizing model parameters,thus effective in improving prediction accuracy of the model and the relativeresidual decreases.Key W ords:cyanobacteria bloom;prediction model;dynamic spatial environmental m
7、odelling;parameter optimization;Genetic Algorithm;Taihu Lake近几年来,蓝藻水华频繁暴发,湖泊水环境、生态系统健康以及人们的生产、生活受到极大影响1。蓝藻水华预报可预报蓝藻水华分布范围与堆积程度,为提前采取应对措施,减轻蓝藻水华危害提供科学依据2。引起湖泊蓝藻水华因素众多,蓝藻水华形成机理复杂,尽管国内外学者对湖泊蓝藻水华预报开展了大量研究,但建立有效的蓝藻水华预报模型相当困难,蓝藻水华预报模型的精度亟待提高,以满足应用的需求。蓝藻水华模型涉及到很多参数,参数的选择和估计对预报结果影响甚大,参数优化显得十分重要。常规的模型参数优化方法都
8、是与初始数据有关,对计算者的经验要求高,往往无法提供全局最优解,使得这些传统方法难以做到真正优化的目的3;遗传算法(genetic algorithm,GA)是一种启发式算法,具有全局搜索特征,在模型参数优http:/化有广泛的应用4。通过实地观测及分析获取数据,本研究建立基于蓝藻水华平衡方程的预报模型,利用中国科学院太湖湖泊生态系统研究站的数据,以与实测结果符合最好为优选准则,采用GA算法优化模型参数,提高水体叶绿素a浓度的模拟精度,进而提高蓝藻水华的预报精度。1 蓝藻水华预报模型近几年来,国内外大量学者对湖泊蓝藻水华模型开展大量研究,孔繁翔等认为研究蓝藻水华的形成机理必须寻找导致水华形成的
9、各主要生理阶段的触发因子或特异性因子,针对不同阶段蓝藻的生理特性,进行深入研究5。大量的模型应用于蓝藻水华的模拟,并取得一定的应用价值,如利用历史时间系列数据训练人工神经网络模型,建立蓝藻水华模型628;以水温和总磷为藻类总生物量的显著相关因子,运用统计方法进行太湖梅梁湾蓝藻水华的模拟9。目前的模型大多是建立在获取水环境数据基础上的统计模型,难以做到蓝藻水华的预报;同时受人力、经费的限制,模型应用难以推广。部分模型采用遥感影像反演叶绿素a浓度作为模型的输入,而目前遥感影像反演叶绿素a浓度仍存在很多不确定性因素,反演精度有限,且受天气因素影响大,不能保证获得连续的数据。本文提出基于蓝藻水华平衡方
10、程的预报模型,模型的原理如下。图1研究区与采样点位置图Fig.1Study area and location of sampling points1.1 模拟原理蓝藻水华形成与很多因素相关,如风速、风向、降雨、叶绿素a浓度、温度、营养盐等诸多因素,其中叶绿素a浓度是藻类细胞生物量的一个指标,也是水体富营养化程度的重要指标10,但是各指标与蓝藻水华发生之间的关系并非简单的线性关系,在蓝藻水华机理研究尚不成熟的情况下,只能预报短期的蓝藻水华。一般蓝藻水华发生的短期预报主要是通过风速、风向、气温以及某时刻水体叶绿素a浓度预测未来某一段时间的水体叶绿素a浓度的变化趋势。本文以太湖北部三湾(竺山湖、梅
11、梁湾、贡湖)为研究对象(图1),基于气象预报信息建立蓝藻水华平衡方程的预报模型,预报未来水体叶绿素a浓度。为定量描述叶绿素a浓度的变化过程,本研究将研究区水体网格化,水体网格单元大小为250m250m。通过蓝藻水华采样数据,可获得研究范围12个采样点的叶绿素a浓度值,采用空间插值算法获得模拟初始时刻研究区水体网格单元的叶绿素a浓度(C0)分布图。水体网格单元叶绿素a浓度平衡方程可表示为:Ci=Ci-1+(Bi-1-Di-1)+(Ii-1-Ei-1)(1)其中,Ci为预报时刻(i=1,n)网格单元叶绿素a浓度值(g/L),Ci(i=0)为初始时刻网格单元的叶绿素a浓度值,Bi-1、Di-1、Ii
12、-1、Ei-1分别是i-1时刻网格单元蓝藻的生长、死亡、迁入、迁出而引起叶绿素a浓度变化。(Ii-1-Ei-1)可通过公式2计算。(Ii-1-Ei-1)=vtarCi-1p(2)式中,v为叶绿素a漂移速度(m/s);p为网格单元漂移叶绿素a数量占总数量的百分比(%);t为模拟时间步长(3600s);r为网格单元的分辨率(250m);a表示漂移方向,当风向为东风、西风、南风、北风时,a取1,当风向为东北风、东南风、西北风、西南风时,a取2。根4001生 态 学 报 30卷 http:/据实验,p、v与风力等级存在表1所示的关系。(Bi-1-Di-1)由(公式3)计算:(Bi-1-Di-1)=Ci
13、-1(1+q)124-1(3)表1 不同风力等级条件下水体叶绿素a漂移的比例和速度Table 1Percentage of the drift chlorophyll a to total chlorophyll aand drift velocity under different wind scales风力等级W ind scale漂移百分比/%Drift percentage漂移速度v/(m/s)Drift percentage0级、1级、2级Grade 0,Grade 1,Grade 2500.073级Grade 3400.044级Grade 4250.035级Grade 5100.0
14、15级以上Over 5 Grade50.005式中,q为叶绿素a浓度的日变化率(%),其他符号同上。由于蓝藻死亡率的研究较少,难以对其进行估算,本研究中暂不考虑Di-1,以Bi-1来代替(Bi-1-Di-1),因此,在各气象条件下,q的经验值为非负,根据实验,q与风力等级、天气存在表2所示的关系。根据公式(13),可计算短期任一时刻(i=1,n)研究区水体网格单元的叶绿素a浓度(Ci)。1.2 数据输入蓝藻水华预报涉及到的数据分为气象预报数据和水体叶绿素a浓度数据。叶绿素a浓度数据是由中国科学院太湖湖泊生态系统研究站在不同日期同步采样分析获得,采样点为12个(图1),采用Kriging空间插值
15、算法获得研究区的叶绿素a浓度分布图。气象预报数据由江苏省气象局提供未来气象预报数据,气象条件是影响蓝藻变化的主要因素,包括天气、风向、风力等级,气象数据以表格(表3)形式输入模型。表2 不同气象条件下水体叶绿素a浓度日变化率/%观测值Table 2Observed values of the change rate of chlorophyll2a concentration/%in a day under differentmetrological conditions天气Weather风力等级W ind scale0级、1级、2级Grade 0,Grade 1,Grade 23级Grade
16、 34级Grade 45级Grade 55级以上Over Grade 5晴Clear sky60403080晴到多云Clear sky to cloudy50302060多云cloudy4020750多云到阴Cloudy to overcast sky2010550阴/降雨Overcast sky to rain00000本研究选取2008年49月期间的16组蓝藻水华事件进行预报研究,其中的12组作为优化模型数据,4组用于模型优化的精度检验。2 模型参数优化GA是源于生物界自然选择思想和自然遗传机制的一种全局优化算法,是70年代初期由美国Michigan大学Holland教授提出11。与传统优
17、化算法不同,GA从一组随机产生的称为种群的初始解开始搜索,种群中每个个体是问题的一个解,称为染色体。染色体在后代迭代中不断进化,称为遗传。在每一代中用适应度来评价染色体的优劣,生成的下一代染色体称为后代。后代由前一代染色体通过自然选择、变异和杂交形成。在新一代形成过程中,根据适应度的大小选择后代,适应度高的染色体被选中的概率较高,经过若干代之后,算法收敛于最好的染色体,它很可能就是问题的最优解或近似最优解。GA在模型参数率定方面有广泛的应用,可优化不同的生态环境模型参数,包括作物生长模型、净生态系统二氧化碳交换量估算模型、水文模型等12215。2.1 基于GA优化蓝藻水华预报模型参数模型参数优
18、化是以保持残差最小作为约束条件,搜索参数空间中的最优参数,基本计算包含编码、初始化群体、个体评价、选择、交叉、变异运算过程16218。利用GA优化蓝藻水华预报模型参数的步骤如下:(1)确定待优化参数及其空间 蓝藻水华预报模型中有较多的参数(表1、表2),为确定影响模拟结果的50014期 黄佳聪 等:蓝藻水华预报模型及基于遗传算法的参数优化http:/主要参数,反复模拟,分析模型各个参数的灵敏度,并统计输入气象数据(表4),在12组模型优化数据中,天气为“多云”或“阴/降雨”的模拟天数占模拟总天数的85.4%,风力等级为“2级”或“3级”的模拟天数占模拟总天数的85.4%,因此,确定r1、r2、
19、r3、r4为重点参数,根据各参数的未优化值,确定参数空间(表5)。表3 气象数据表Table 3M eteorological data模型参数优化数据Data for optimizingmodel parameters日期Date天气Weather风向W ind direction风力等级W ind scale2008204221阴/降雨阴/降雨阴/降雨多云NWNWNWS W33332008204228晴晴多云多云SSSS W33332008205205多云多云阴/降雨阴/降雨S WS WSE33332008205219晴晴多云阴/降雨SSS WS W33222008205226阴/降雨阴
20、/降雨阴/降雨多云SESENN11312008206209阴/降雨阴/降雨多云阴/降雨EENEE33432008206230阴/降雨阴/降雨阴/降雨阴/降雨SSSSE22332008207221多云多云多云多云SSSS12342008208204晴晴晴多云SSSES22222008208211阴/降雨阴/降雨阴/降雨阴/降雨SSSS22232008208225多云多云多云多云NENEESE32222008209215多云多云多云多云NENENESE2422模型精度检验数据Data formodel accuracy test2008205212多云多云多云多云NWNWSESE553120082
21、06223阴/降雨阴/降雨多云阴/降雨EESEE33232008208218多云多云阴/降雨阴/降雨SESESS22222008209208多云多云多云多云EESEE2223表4 气象条件统计表Table 4Statistical table of meteorological conditions天气Weather时间Time/d风力等级W ind scale时间Time/d晴Clear sky71级4晴到多云Clear sky to cloudy02级13多云Cloudy213级23多云到阴Cloudy to overcast sky04级3阴/降雨Overcast sky to rain
22、205级0表5 优化参数Table 5Selected parameters for opti m ization参数Parameter天气Weather风力等级W ind scale未优化值/%Un2optimized value参数空间/%Parameter ranger1多云Cloudy2级201030r2多云Cloudy3级7020r3阴/降雨Overcast sky to rain2级0-1010r4阴/降雨Overcast sky to rain3级0-1010(2)算法控制参数配置 GA主要包括4个参数:初始群体的个体数、交换率、变异率、最大遗传的代数。4个参数的选择对算法的寻优
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 蓝藻 预报 模型 基于 遗传 算法 参数 优化
限制150内