基于多特征融合与adaboost算法的轨面缺陷识别方法-闵永智.pdf
《基于多特征融合与adaboost算法的轨面缺陷识别方法-闵永智.pdf》由会员分享,可在线阅读,更多相关《基于多特征融合与adaboost算法的轨面缺陷识别方法-闵永智.pdf(9页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、第 14卷第 12期 铁道科学与工程学报 Volume 14 Number122017 年 12 月 Journal of Railway Science and Engineering December 2017基于多特征融合与AdaBoost 算法的轨面缺陷识别方法闵永智1, 程天栋1, 马宏锋2(1. 兰州交通大学 自动化与电气工程学院 , 甘肃 兰州 730070;2. 兰州工业学院 电子信息工程学院 , 甘肃 兰州 730050)摘要: 针对钢轨表面缺陷检测精度易受采集装置振动与异物干扰的影响等问题 , 通过分析缺陷的位置 , 设计钢轨图像采集装置 。 在此基础上 , 首先根据钢轨的
2、形状特征 , 结合 Hough 变换与最小二乘法提取钢轨表面区域 , 再结合超熵理论与模糊理论对钢轨表面缺陷进行 分 割 , 然后建立正样本及负样本数据库 , 并通过提取样本的 Harr-like 特征与低层特征建立样本特征数据库 , 最后结合 C4.5与 AdaBoost 算法设计缺陷分类器 , 对非缺陷进行排除并对缺陷进行分类 。 通过在 5001000lx,100010000lx, 10000100000lx3 种不同的光照强度区间内对木枕及混凝土枕轨道的钢轨表面缺陷进行识别 , 识别时间平均为 698ms, 识别正确率平均为 97.02%, 与传统的识别方法对比具有明显的优势 。关键词
3、: 振动 ; 轨面提取 ; Hough变换 ; 图像特征 ; AdaBoost; 光照强度 ; 缺陷识别中图分类号: TP391.4 文献标志码: A 文章编号: 1672-7029(2017)12-2554-09Rail surface defect recognition method based onmulti feature fusion and adaboost algorithmMINGYongzhi1,CHENGTiandong1,MAHongfeng2(1.SchoolofAutomationandElectricalEngineering,LanzhouJiaotongUni
4、versity,Lanzhou730070,China;2.SchoolofElectronicalInformationEngineering,LanzhouInstituteofTechnologyUniversity,Lanzhou730050,China)Abstract: In view of the detection of surface defects are vulnerable to the vibrationof theacquisitiondevice andforeigninterference,therailimageacquisitiondevicewasdesi
5、gnedbyanalyzingthepositionofthedefect.Firstly,according to the shape characteristics of rail, the rail surface area was extracted by combining Hough transformand least square method. Second, the excess entropy theory and the fuzzy theory were combined to divide railsurfacedefects.Then,byestablishing
6、thepositiveandnegativesampledatabases,thesamplefeaturedatabasewasestablishedby extractingthe Harr-like features and low-levelfeaturesof the samples.Finally,the defect classifierwasdesignedwithC4.5andAdaBoostalgorithm,andthenondefectregionswereexcludedandthedefectregionswereclassified.Byidentifying50
7、01000lx,100010000lx,10000100000lxinthreedifferentlightintensityranges of concrete sleeper and sleeper track rail surface defects, the average recognition time is 698 ms, theaveragerecognitionrateis97.02%.Comparedwiththetraditionalrecognitionmethod,ithasobviousadvantages.Key words: vibration; rail su
8、rface extraction; Hough transform; image feature;AdaBoost; light intensity; defectrecognition收稿日期: 2016-11-22基金项目: 国家自然科学基金资助项目 (61663022, 61461023);长江学者和创新团队发展计划资助项目 (IRT_16R36);甘肃省高原信息工程及控制重点实验室开放课题基金资助项目 (20161105);兰州交通大学优秀科研团队资助项目 (201701)通信作者: 闵永智 (1975-),男,陕西汉中人,教授,博士,从事机器视觉、模式识别的研究; E-mail: 万
9、方数据第 12 期 闵永智,等:基于多特征融合与 AdaBoost 算法的轨面缺陷识别方法 2555钢轨的状态是制约列车提速的重要因素之一,随着列车高速、重载、高密度运行,列车对钢轨会产生不同程度的伤损,当伤损超过一定限度会使列车产生剧烈振动,不仅影响受电弓与接触线的接触状态,也会对铁路的路基沉降等产生严重影响,更有可能发生断轨进而造成严重的交通事故。因此,及时了解钢轨伤损状态并进行维护修理,以确保安全、稳定和连续的铁路运营是十分必要的1。现有的轨面缺陷检测方法有人工巡视法、电涡流法、磁粉法等2。而随着计算机技术的发展,基于机器视觉的检测方法得到了很好的发展,并在钢轨表面缺陷检测领域得到了应用
10、,且受到了越来越多的关注3-4。 如 TANG 等5通过采用逻辑操作组合检测的方法提取轨面缺陷区域,并采用 BP 神经网络对缺陷进行分类; Andamuthu 等6通过采用轨面模板图像与被测图像匹配的方法使轨面区域不受光照的影响,进而采用阈值分割的方法提取缺陷区域;金艳等7则通过结合神经网络和形态学的方法识别钢表面的各种缺陷。由于基于机器学习的轨面缺陷识别方法对于识别缺陷的精度与速度等性能参差不齐, 为排除树叶、 杂草和鸟粪等对识别结果的干扰,加快缺陷识别的速度,学者们进行了大量的研究,如段志娟等8通过 ICA建立缺陷图像的统计生成模型,再将目标图像变换到 ICA 域,利用特征元素之间的对应关
11、系对其进行识别分类,但该方法整体精度较低,且速度较慢;汤勃等9通过提取带钢表面缺陷图像区域的灰度、纹理和几何形状等 20 维特征向量,利用模糊集理论设计出缺陷图像识别分类器,但该方法对于不同的缺陷类型识别精度变化较大;徐科等10通过 Tetrolet 变换将热轧钢板表面图像分解成不同尺度和方向的子带,提取子带的Tetrolet 高通稀疏矩阵特征, 再利用支持向量机实现热轧钢板表面缺陷的分类识别,但识别速度较慢,且识别结果受参数设置影响较大。针对以上问题,本文提出一种通过提取图像多特征,利用改进的AdaBoost 分类器进行缺陷识别的方法。 首先通过分析钢轨的形状特征以及铁路的线路特征,利用Ho
12、ugh变换检测直线的原理对钢轨表面区域的边缘线段进行检测,通过在线段上提取轨面边缘参考点,利用最小二乘法对轨面区域进行精确定位。再针对缺陷区域与正常轨面区域之间边界模糊的问题,结合超熵理论与模糊理论对缺陷区域进行分割。然后通过建立正、负样本空间,并提取样本的Harr-like 特征与低层特征建立样本特征空间,最后结合 C4.5 与 AdaBoost 算法设计缺陷分类器。通过与传统的轨面缺陷识别方法对比,本文方法具有更高的效率,更适宜于复杂环境的轨检测试。1 缺陷类型及缺陷高频出现区域介绍钢轨伤损是指钢轨发生断裂、裂纹或其他影响和限制钢轨使用性能、危及行车安全的情况。通过统计分析发现,目前在役钢
13、轨伤损主要可分为钢轨冶金质量以及表面缺陷引起的伤损、接触疲劳伤损和淬火钢轨的伤损等。而由于视觉检测技术的特性,本文只针对表面缺陷的检测。由于伤损的原因不同,使得伤损的位置、形状等特征也不同。通过分析伤损的面积、周长、矩形度、质心和 Haar-like特征,从而确定钢轨伤损状态及类型,如图 1 所示为根据我国铁路钢轨伤损分类标准定义的几种常见的伤损类型11。(a) 轨头压溃; (b) 踏面压陷; (c) 轨头磨耗; (d) 轨头碾边; (e) 踏面裂纹; (f) 踏面剥离图 1 常见的缺陷类型Fig.1 Commondefecttypes万方数据铁道科学与工程学报 2017年 12月2556根据
14、列车车轮经过钢轨对钢轨产生应力的位置,以及对以往伤损位置、程度、类型的统计,伤损主要集中在钢轨的踏面中线与工作边之间,如图2 所示为钢轨表面接触斑示意图,其中阴影部分为伤损集中区域11, P 为轮载垂直力, H 为轮载侧向力, N 为接触法向力, T 为接触切向力。根据此特点,可在设计轨检车时确定辅助光源的位置,使得采集到的钢轨图像,轨面边缘与缺陷边缘较为突出。图 2 钢轨表面接触斑示意图Fig.2 Schematicdiagramofrailsurfacecontactpatch2 钢轨表面缺陷分割由于钢轨图像中含有大面积干扰区域,如轨底、砟石、树叶和杂草等。因此,直接提取钢轨表面缺陷区域不
15、仅冗余图像数据量大,而且对缺陷的提取精度存在干扰12。而本文算法侧重于实际应用,因此,对采集的钢轨图像先进行轨面区域提取以缩小缺陷的搜索范围是十分有必要的,然后利用图像分割技术对轨面缺陷进行精确分割。2.1 轨面区域提取钢轨具有线路长、缺陷少、形状规则等特点,在相机的视场范围内, 钢轨的边界通常为直线 (轨头压馈等除外 ),因此,可通过检测轨面边界直线特征对钢轨表面进行定位。Hough 变换是检测直线的常用方法,其检测直线的基本思想是点与线的对偶性,设在直角坐标系中存在一条直线 l,该直线到原点的垂直距离为 ,该直线的垂线与 x 轴的夹角为 ,则该直线方程为:xcos+ysin=。因此,直线
16、l 用极坐标表示则为点(,),即直角坐标系中的直线对应于极坐标系中的点13-14。采用 Hough 变换提取轨面区域边界的具体步骤如下所示:1) 采用 Canny 算法提取钢轨图像的边缘;2) 利用 Hough 变换提取钢轨边缘图像中的直线边缘;3) 由于钢轨的一些损伤或异物干扰导致通过Hough变换检测出的轨面边缘通常不是一条完整的直线,因此,需要在各线段上等间距的选取参考点作为轨面边缘直线的参考点。4) 利用最小二乘法对上边界参考点及下边界参考点进行直线拟合,得到精确的轨面边界直线;针对第 2 步中的参数选择,由于采集的钢轨图像中轨面边缘直线特征最为明显,且边缘直线最长,方向在水平方向附近
17、,因此,可选取极坐标系中交点最多的几个极坐标值作为待确定的边缘,同时删除角度偏离过大的极坐标值。图 3 d 与拟合时间及拟合精度关系图Fig.3 Relationshipbetween dandfittingtimeandfittingaccuracy针对第 3 步中间距的选择,由于设置不同的距离 d,可选择不同数量的参考点,进而影响拟合后的边界与实际边界之间的误差及拟合时间,定义拟合误差 为:100221, 1()()pe peepx xyy(1)其中: (xp, yp)为人工绘制标准直线上的以 10pixel 为等间距的 64 个点坐标; (xe, ye)为拟合后直线上以10pixel 为
18、等间距的 64 个点坐标。通过统计绘制如图 3 所示的 d 与拟合时间及拟合精度的关系图。可万方数据第 12 期 闵永智,等:基于多特征融合与 AdaBoost 算法的轨面缺陷识别方法 2557知,当 d=10pixel 时拟合效率最高,此时拟合时间为 7.51ms,拟合误差为 17.47。2.2 轨面缺陷分割通过分析现有的轨面缺陷分割算法,分割难点主要在于缺陷区域与正常区域交界处的像素具体属于哪个区域往往难以确定。也就是说,分割阈值通常在最优阈值附近的几个灰度值之间难以确定。而基于模糊理论的模糊逻辑可对模糊集合描述与处理以达到消除模糊的逻辑,超熵则通过对信息熵理论改进,提高了类内的预测性。通
19、过结合模糊理论与超熵理论得到图像的总超熵值函数,可根据此函数再结合模糊理论中的隶属度函数与遗传算法计算可得最优的分割阈值,具体实现过程如下15:1) 设 L 个随机变量组成的变量子集为:XL=x1, , xL,其发生的概率可用联合概率表示为p(xL)=p(x1,x2, , xL),变量集的信息熵为 h(L),熵率为 h,则超熵的定义如下:1() )LE hL h(2)2) 对于一副 M N* 大小,灰度级为 K 的图像,存在阈值 t 可将图像分为暗类 Cd和亮类 Cb2 种类型,暗类由灰度值较低的像素组成,亮类由灰度值较高的像素组成。结合模糊理论可知,它们分别对应的隶属度函数 d和 b为:2d
20、21 012 2(;,)2 20 kakb abakbakabka abkbbabkK (3)bd(,) 1 (,)kab kab (4)其中: k 为图像像素灰度值,则在图像 F 中具有灰度值 k 的像素属于暗类 Cd和亮类 Cb 的概率 Pkd与Pkb分别为:dd|bb|() , ()kI kkI kP Pk P P Pk P (5)其中: PI(k)为图像一维直方图的概率分布; Pd|k 和Pb|k 分别为灰度值为 k 的像素属于暗类和亮类的条件概率。3) 令d| db| b(,), (,)kkP kabP kab,可 得 2类 Cd和 Cb的概率 Pkd与 Pkb, 进而可得其信息熵为
21、:ddd20() () (,)/ log( ()KIIkH k Pk kab P Pk dd(,)/ )kab P (6)b bb0() () (,)/KIkHk Pk kabP 2b blog ( ( ) ( , , )/ )IP kkabP (7)4) 将式 (6)(7)分别代入式 (2)中, 则可得 2 类总的模糊超熵值为:db(,) (,) (,)fffEab Eab Eab (8)5) 需要寻找一个最优的参数组合 (a*, b*)使得Ef(a*, b*)取得最大值,即使得图像经过阈值分割后类内必须具有较高的统一性,类间具有较高的差异性。利用遗传算法求得 (a*, b*)组合后,根据式
22、 (3)可知, 当 b(k*, a*, b*)=d(k*, a*, b*)时, 必然存在 b(k*, a*,b*)=d(k*, a*, b*)=0.5,此时灰度值为 k*的像素既属于暗类又属于亮类,因此选择隶属度为 0.5的灰度值作为图像分割的阈值 ,最终根据式 (3)和式 (4)可得此时 k*=(a*+b*)/2。2.3 缺陷区域特征提取Haar-Like特征是由 Viola 等在其人脸检测系统中引入的一种简单矩形特征,因类似于 Haar 小波(Haarwavelet)而得名16,其定义为图像中相邻区域内像素灰度值总和的差,这种矩形特征能够反映检测对象局部特征的灰度变化,由于将积分图像的思想
23、应用到 Haar-Like 小波特征的计算中,因此极大地提高了用于检测器的特征获取速度。目前, Haar特征主要分为 4 类:边缘特征、线性特征、中心特征和对角线特征17,见图 4。矩形特征可位于图像任意位置,大小也可以任意改变,因此矩形特征值是矩形模版类别、矩形位置和矩形大小这 3 个因素的函数。(a) 边缘特征; (b) 线性特征;(c) 圆心环绕特征; (d) 对角线特征图 4 Haar-like4 种类型特征Fig. 4 Haar-likefourtypesofcharacteristics万方数据铁道科学与工程学报 2017年 12月2558为了排除非缺陷的干扰,提高缺陷识别分类的精
24、度, 同时提取了图像的低层视觉特征, 包括面积、周长、矩形度和质心。3C4.5算法简介C4.5算法是 Quinlan 在 1993 年提出的, 其算法思想基于信息论理论,利用信息增益率作为分类属性,同时在构造决策树的过程中进行剪枝,可以对连续性数据或不完整数据进行分类18-19。 利用 C4.5算法构造决策树的基本步骤如下。1) 读取并统计样本数据;2) 按照分类标签 (假设分为 m 类 )对训练数据集 X 的属性 A(假设有 n 个特征 )进行划分,并计算信息熵 IX(X):21() logmiiXiXXIXXX (9)其中: Xi表示数据集 X 中属于类别 i 的个数。3) 选择一个特征作
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 特征 融合 adaboost 算法 缺陷 识别 方法 闵永智
限制150内