自动目的识别与跟踪技术研究综述.docx
《自动目的识别与跟踪技术研究综述.docx》由会员分享,可在线阅读,更多相关《自动目的识别与跟踪技术研究综述.docx(27页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、自动目的识别与跟踪技术研究综述自动目的识别与跟踪技术研究综述余静,游志胜(四川大学图形图像研究所,四川成都610064)摘要:对复杂背景下扩展目的进行有效的识别和跟踪是一个具有挑战性的难题。对当前的目的自动识别系统(ATR)所采用的算法进行了归类和叙述,对目的识别问题中具有旋转、尺度、平移不变性的特征及目的跟踪算法进行了讨论,最后对自动目的识别和跟踪进一步的研究方向进行了瞻望。关键词:自动目的识别;目的跟踪;扩展目的;特征提取中图法分类号:TP391.41文献标识码:A文章编号:1001-3695(2005)01-0012-04SurveyofAutomaticTargetRecognitio
2、nandTrackingMethodYUJing,YOUZhi-sheng(InstituteofImage&Graphics,SichuanUniversity,ChengduSichuan610064,China)Abstract:Theeffectiverecognitionandtrackingforextendedtargetinthecomplexbackgroundisachallengedproblem.ThispaperclassifiesthealgorithmofcurrentAutomaticTargetRecognition(ART).Thosefeatures,wh
3、ichhaveRSTinvarianceandtrackingmethodofmovingtarget,arealsodiscussed.Atlast,someissuesthatshouldbesolvedinthefutureareproposed.Keywords:AutomaticTargetRecognition;TargetTracking;ExtendedTarget;FeatureExtraction能够肯定,信息战将成为将来高技术战争的一种重要作战形式,对战争的结局起着关键性的作用。目前世界很多国家都在积极发展军用高技术及其武器装备,红外热成像、微光夜视、电视摄像、微波和激光
4、雷达等高新技术得到迅猛发展,大大促进了信息获取的实时性及其深度和广度,使当代军队具有昼夜、全天候、大范围监视和捕获目的的能力,因而,对目的进行准确、有效的识别和跟踪便成为一项重要的任务1。自动目的识别(AutomaticTargetRecognition,ATR)技术和稳定的跟踪方法是获得战场控制信息权的关键因素之一。它在民用领域也得到大量的应用,例如用于身份确认的指纹识别、人脸识别、虹膜识别以及在智能交通管理、机动车检测、停车场管理等场合的车牌识别等。由于目的所处场景的复杂性,以及目的本身可能发生的姿态变换、缺损、模糊和遮挡,使得ATR技术是一个复杂的经过。总的讲来,一个ATR系统应该具有在
5、复杂背景以及各种天气情况下检测、分类、识别目的的能力24,这样才能有针对性地对目的进行持续的跟踪。1ATR技术的发展状况由于ATR技术的重要性,它已成为国内外信息处理技术发展的重点。近十年来,ATR已由理论探索、实验室仿真逐步走向实际应用。目前ATR技术方法主要有下面五种:(1)经典的统计形式识别方法。该方法主要是利用目的特性的统计分布,依靠目的识别系统的大量训练和基于形式空间距离度量的特征匹配分类技术,可在较窄的场景定义域内获得较有效的识别。该方法是早期使用的方法,仅在很窄的场景定义域内,且在目的图像和周围背景变化不大的情况下才比拟有效,难以解决姿态变化、目的污损变模糊、目的部分被遮蔽等问题
6、。(2)基于知识的自动目的识别方法。20世纪70年代末,人工智能专家系统开场应用到ATR的研究,构成了基于知识的ATR,即知识基(KnowledgeBased,KB)系统。基于知识的ATR算法在一定程度上克制了经典统计形式识别法的局限性和缺陷,该方法目前存在的主要问题是可供利用的知识源的辩识和知识的验证很困难,同时难以在适应新场景中有效地组织知识。(3)基于模型的自动目的识别方法。模型基(ModelBased,MB)的方法首先是将复杂的目的识别的样本空间模型化,这些模型提供了一种描绘样本空间各种重要变化特性的简便途径。典型的MB系统抽取一定的目的特性,并利用这些特性和一些辅助知识来标记目的的模
7、型参数,进而选择一些初始假设,实现目的特性的预测。一个MB系统的最终目的是匹配实际的特性和预测后面的特性,若标记准确,匹配经过则会成功和有效。MB方法目前尚限于实验室研究阶段。(4)基于多传感器信息融合的自动目的识别方法。单一传感器的导引头在有光、电干扰的复杂环境中,目的搜索和知识识别的能力、抗干扰能力及其工作可靠性都将降低。20世纪80年代兴起的基于多传感器信息融合(Multi-sensorInforma-tionFusionBased,MIFB)的ATR方法克制了单一传感器系统的缺陷,每个传感器将数据馈入各自的信号处理机,先分别进行目的检测,得出有无目的的判决以及目的的位置信息或运动轨迹,
8、然后将这些信息送入数据融合单元,对目的位置或运动轨迹进行关联后再做进一步的判决5。从输入信息的形式来看,信息融合可在决策层、特征层或像素层等各个层次进行。像素层融合是最低层次的属性融合,收稿日期:2004-05-25即将各个图像传感器数据直接融合,而后对融合的数据进行特征提取。这一层次的信息融合能够提供其他层次的融合所不具备的细节信息,采用的融合方法有逻辑滤波器、数学形态学、模拟退火、小波变换等。特征层融合是中间层次的融合,它是先对各个传感器的观测进行特征提取,产生特征矢量,再将这些特征矢量融合,并作出基于联合特征矢量的属性讲明。该层次的融合是像素层融合和决策层融合的折中形式,兼有二者的优缺点
9、,具有较大的灵敏性,常用的方法有扩展Kalman滤波、约束高斯马尔可夫估计、分片统计等。决策层融合是最高层次的融合,这种方法是在传感器的观测基础上产生特征矢量,对这些特征矢量进行形式识别处理并作出相应的关于目的的属性讲明,再将各图像传感器的属性讲明数据进行关联和合成,得到该目的的一个联合的属性讲明。常用方法有Bayes推理、D-S证据推理、模糊逻辑以及近年来涌现的人工神经网络和支撑向量机等。(5)基于人工神经网络和专家系统的自动目的识别方法。专家系统是以逻辑推理为基础,模拟人类思维的人工智能方法。人工神经网络(ANN)是以神经元连接构造为基础,通过模拟人脑构造来模拟人类形象思维的一种非逻辑、非
10、语言的人工智能方法。ANN自底向上的训练和归纳判定特性与专家系统的积累知识的自顶向下的利用特性,能够实现很好的相互补充结合,提供更强的处理信息能力。二者混合使用的构造形式有并接构造、串接构造和嵌入构造三种。并接构造系统可并列使用专家系统和神经网络;在串接构造中,各模块独立工作,实现各自特定的功能串联连接;嵌入构造是在专家系统内嵌入小型神经网络或者在ANN内嵌入小型专家系统以改善系统性能。ANN技术能够提供ATR算法固有的直觉学习能力,在目的分类处理中有很多算法都可由ANN有效地实现。神经网络应用到形式识别中能解决很多传统的识别方法所不能克制的困难,文献6综合了神经网络、模糊逻辑、形式识别的相关
11、算法对车型进行识别;文献7利用图像特征点和神经网络对有遮挡的目的进行识别,也获得了较高的识别准确率。神经网络实现工程应用的瓶颈是实时性欠佳。2ATR技术的关键特征提取2.1特征提取的基本概念在传统的目的识别算法中通常是提取出目的的轮廓,然后根据轮廓线的特征对目的进行识别。但在实际操作中,很难从实景图像中得到目的的实际轮廓,而且轮廓修复中的误差也会引起目的轮廓的失真而影响目的识别的正确性。因而,在ATR系统中,怎样使目的特征化是实现实时、准确目的识别的关键。作为关键步骤,特征提取的目的是获取一组“少而精的分类特征,即获取特征数目少且分类错误概率小的特征向量。特征提取经常分几步进行8:(1)特征构
12、成。根据被识别的对象产生一组原始特征,它们能够是传感器的直接测量值,可以以是将传感器的测量值作某些计算后得到的值。(2)特征选择。由特征构成经过得到的原始特征可能很多,假如把所有的原始特征都作为分类特征送往分类器,不仅使得分类器复杂,分类计算判别量大,而且分类错误概率也不一定小,因而需要减少特征维数。特征选择就是从L个度量值集合(x1,x2,xL)中,按某一准则(挑出一些最有效的特征)选出供分类用的子集,作为降维(m维,m利用边缘点和角点CRF值的明显区别,剔除混杂在角点中的边缘点。角点在目的识别中获得了广泛的应用。能够将形心到相邻两角点的直线所成的夹角作为识别的特征,这组特征对于比例、平移和
13、旋转都是不变的14;将角点与线矩的分类结果融合对缺损目的进行识别,能够有效提高识别的精度25。由于角点的检测容易出现漏检和虚假角点,而且有时也会出现角点定位不准或目的发生几何畸变而导致夹角变化等情况,因而在利用角点作为不变量对目的进行识别时,能够考虑与其他特征结合起来进行识别。2.2.2矩Hu于1961年首先提出了矩的概念,他在文献16中给出了连续函数矩的定义和关于矩的基本性质。Y.R.Wong在文献17中进一步给出了离散情况下的各阶矩的计算方法。二维矩的平移不变性、伸缩不变性和旋转不变性使之具有良好的识别性能,因此已成功地应用于图像处理的很多方面,如飞机识别、船只识别、场景匹配和字符识别等1
14、820。在自动控制领域,矩技术还可用于运动追踪和方向计算。对于存储于二维矩阵中的数字图像,(p+q)阶原始矩由下式给出:mpq=Mm=1Nn=1mpnqf(m,n)p,q=0,1,2,(1)其中,M和N为图像水安然平静垂直方向的维数;f(m,n)是图像在点(m,n)处的密度(灰度级)。原始矩值中含有大量有用信息,也就是讲,由有限的、但足够多的原始矩值能够重建出原图像。图像的中心矩可由下式计算:upq=Mm=1Nn=1(m-xp(n-yqf(m,n)(2)其中x=Mm=1Nn=1mf(m,n)Mm=1Nn=1f(m,n)y=Mm=1Nn=1nf(m,n)Mm=1Nn=1f(m,n)(3)是图像质
15、心的坐标。由中心矩可得到另一套同时具有平移不变性和伸缩不变性的矩值pq,称为归一化中心矩,其定义由下式给出:pq=upq/urpqr=(p+q)/2,p+q=2,3,(4)直接用普通矩或中心矩进行特征表示,不能使特征同时具有平移、旋转和比例不变性。事实上,假如仅用中心矩表示图像的特征,则特征仅具有平移不变性;假如利用归一化中心矩,则特征不仅具有平移不变性,而且还具有比例不变性。而要同时具有平移、旋转和比例变换不变性,直接使用普通矩或中心矩是不够的,但假如利用它们的某些线性组合,理论上能到达这种预期的目的。矩对于平移、旋转、尺度变化有良好的不变性,但矩不变量需要对目的图像的每一个像素点进行运算,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 自动 目的 识别 跟踪 技术研究 综述
限制150内