当前位置:首页 > 工业控制 > 《机电信息》
[导读]摘要:机场道面裂缝影响着飞机的安全起降,当前机场主要依靠传统的人工巡查方式检测道面裂缝。随着深度学习算法的快速发展,语义分割模型在保证精度的前提下推理速度不断提高,为自动实时检测道面裂缝提供了技术支撑。在此背景下,结合语义分割模型的研究成果,提出了一种在机器人巡检过程中实时检测机场道面裂缝的方法。

引言

裂缝是机场道面最主要的表观结构病害,同时也是威胁飞机安全起降的重要隐患。目前机场主要依靠人工巡检的方式检测道面裂缝,这种传统方法精度差、效率低,且大型机场的跑道面积大使得检测人员的工作量巨大。因此,大型机场对道面裂缝的自动化识别需求越来越强烈。

2012年,被称为"神经网络之父"的Hinton和他的学生AlexKrizhevSky利用深度神经网络理论设计的AlexNet取得ImageNet竞赛冠军,自此之后,人工智能的深度学习方法开始蓬勃发展。到目前为止,深度神经网络在机器视觉领域已经取得大量的研究成果,并在多个工业场景落地使用,如采用FaceNet等人脸识别算法进行人脸识别:GAN网络用于风格化图片的生成:HRnet等姿态检测网络用于检测人或其他感兴趣物体的行为姿态:YoLo、FaSterRCNN等目标检测模型用于行人、车辆以及其他感兴趣物体的检测:U-Net、SegNet及DeepLab等语义分割模型用于医学影像中的病变检测、机械制造中的缺陷检测以及自动驾驶中的物体检测。其中,语义分割模型可对无固定形状的缺陷进行检测,但最初的语义分割模型结构复杂,检测速度慢,不利于工业落地。2016年6月推出的ENet相对于SegNet,其检测速度大大提高,在NVIDIATitanx显卡上实现了每秒检测46张像素尺寸为1920×1080的图片。从2016年至今,实时语义分割模型的精度与速度不断提高,其中2021年推出的DDRNet在NVIDIAGTx2080Ti显卡上实现了每秒检测108张像素尺寸为2048×1024的图片,已符合工业落地的要求。

道面裂缝的检测在机器视觉领域属于检测任务,当前主要有目标检测和语义分割两大类算法处理检测任务。如图1所示,目标检测算法在图片上检测出感兴趣物体后用方框标记出其在图片上的位置:如图2所示,语义分割算法则能够在检测出感兴趣物体后对物体沿着轮廓进行分割。考虑到裂缝的长度、面积等外观特征后续将用于计算道面损坏情况,本文选择在TenSorFlow框架下复现和改进当前性能表现好的实时语义分割模型DDRNet(深度双分辨率网络),用于机场道面裂缝的自动检测。

1DDRNet概述

1.1总体结构

DDRNet全称是深度双分辨率网络(DeepDual-reSolutionNetworkS),总体结构如图3所示,输入图像在经过两个残差块后,特征提取被分成两个具有不同分辨率的平行分支:一个高分辨率分支(图中上路分支)生成相对高分辨率的特征映射,另一个低分辨率分支通过多次下采样操作提取丰富的上下文信息。两个分支之间桥接多个双边融合以实现有效的信息融合,并在最后通过add的形式进行特征融合,融合后的特征经过卷积模块得到最终的预测结果。另外,DDRNet模型提出了能够极大增加感受野的深度聚合金字塔合并模块(DAPPM),该模块比普通的PPM能更充分地提取信息。

1.2残差块

残差块(ReSidua1B1ock)是He等提出的残差网络中的基本结构,可以解决深度神经网络的退化问题。残差块的结构如图4所示,其中,X表示输入,H(X)是期望的复杂潜在映射,当网络较深时,难以直接拟合H(X)。模型已经学习到较饱和的准确率时,后续的学习目标则转变为恒等映射的学习,即H(X)=X,从而确保在后面的层次中不会造成精度下降。残差块通过"ShortcutconnectionS"的方式,直接把输入X传到输出,使输出结果为H(X)=F(X)+X,其中F(X)称为"残差映射"。F(X)=H(X)-X,当F(X)=0时即实现恒等映射,于是,残差网络相当于将学习目标从学习复杂潜在映射H(X)变为学习将残差映射F(X)的结果逼近于0,使得准确率不会随着网络的加深而下降。因此,残差块结构的出现,大大加深了深度神经网络的深度。

1.3双边融合结构

双边融合结构是人体姿态检测网络HRNet中的一种重要结构,通过多次重复的双边融合实现对多分辨率子网络的多尺度特征融合。双边融合的主要结构如图5所示,高分辨率分支通过卷积层下采样后与低分辨率分支融合,低分辨率分支通过插值上采样层后与高分辨率分支融合。

1.4DAPPM模块

如图6所示,受MSFNet和ReS2Net的启发,DDRNet提出了将深度特征聚合与金字塔池化相结合的DAPPM模块。该模块首先通过大尺度的池化核和步长获得不同分辨率的特征图,不同分辨率的特征图经上采样后再以层次残差的方式进行信息融合,融合后的特征通过1×1卷积进行压缩。为了便于优化,在压缩特征上增加了一个输入的快捷连接。DAPPM提取的信息比PPM更加丰富。

2模型的训练与结果处理

2.1数据的收集与增强

深度学习需要大量的数据进行训练,故首先通过自研的道面自动检测机器人从机场收集数据。如图7所示,机器人主要由机器人小车、线阵相机、全景相机、雷达以及工控机组成,其中线阵相机负责采集道面的图像数据,图像数据的尺寸为2048×2048:工控机负责机器人小车的自动/远程控制以及采集图片的预处理。机器人采集的图像如图8所示。

其次还要收集公共的裂缝数据集CFD、GAPS384和CRACK500来作为补充。为了进一步扩充训练数据,对各数据集进行了亮度调节、镜像、旋转、裁剪以及仿射弹性变换等数据增强操作。经过数据的收集与增强,共获得36912幅裂缝图片。

2.2实验结果

将裂缝图片中的80%作为训练数据对DDRNet模型进行训练,训练完成后用剩余的20%进行测试,部分测试效果如图9所示。本次测试用平均交并比(M1oU)作为算法准确性评价指标,本次调优训练达到的最好效果为M1oU=72.8%,满足对裂纹探测的需求,后续将通过采集更多数据提高模型检测精度。本次测试的主机显卡为NV1D1ARTx3090,对像素尺寸为1024x1024图片的检测速度为120fpS。巡检机器人采集图片的像素尺寸为2048×2048,可分割为4张1024×1024像素尺寸的图片,因此,该算法每秒可检测25张以上巡检机器人采集的图片,达到了实时性的要求。

3结语

针对道面裂缝病害实时检测以及轮廓提取等问题,本文结合深度学习快速语义分割算法的最新研究成果,采用DDRNet算法对道面裂缝病害进行实时检测。通过实验验证,DDRNet可实现对一台2K摄像机采集图像进行实时检测,且对裂缝病害的检测精度达到了应用要求。在后续的研究工作中,可继续从快速语义分割模型的角度出发,搭建道面病害实时检测系统。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: 驱动电源

在工业自动化蓬勃发展的当下,工业电机作为核心动力设备,其驱动电源的性能直接关系到整个系统的稳定性和可靠性。其中,反电动势抑制与过流保护是驱动电源设计中至关重要的两个环节,集成化方案的设计成为提升电机驱动性能的关键。

关键字: 工业电机 驱动电源

LED 驱动电源作为 LED 照明系统的 “心脏”,其稳定性直接决定了整个照明设备的使用寿命。然而,在实际应用中,LED 驱动电源易损坏的问题却十分常见,不仅增加了维护成本,还影响了用户体验。要解决这一问题,需从设计、生...

关键字: 驱动电源 照明系统 散热

根据LED驱动电源的公式,电感内电流波动大小和电感值成反比,输出纹波和输出电容值成反比。所以加大电感值和输出电容值可以减小纹波。

关键字: LED 设计 驱动电源

电动汽车(EV)作为新能源汽车的重要代表,正逐渐成为全球汽车产业的重要发展方向。电动汽车的核心技术之一是电机驱动控制系统,而绝缘栅双极型晶体管(IGBT)作为电机驱动系统中的关键元件,其性能直接影响到电动汽车的动力性能和...

关键字: 电动汽车 新能源 驱动电源

在现代城市建设中,街道及停车场照明作为基础设施的重要组成部分,其质量和效率直接关系到城市的公共安全、居民生活质量和能源利用效率。随着科技的进步,高亮度白光发光二极管(LED)因其独特的优势逐渐取代传统光源,成为大功率区域...

关键字: 发光二极管 驱动电源 LED

LED通用照明设计工程师会遇到许多挑战,如功率密度、功率因数校正(PFC)、空间受限和可靠性等。

关键字: LED 驱动电源 功率因数校正

在LED照明技术日益普及的今天,LED驱动电源的电磁干扰(EMI)问题成为了一个不可忽视的挑战。电磁干扰不仅会影响LED灯具的正常工作,还可能对周围电子设备造成不利影响,甚至引发系统故障。因此,采取有效的硬件措施来解决L...

关键字: LED照明技术 电磁干扰 驱动电源

开关电源具有效率高的特性,而且开关电源的变压器体积比串联稳压型电源的要小得多,电源电路比较整洁,整机重量也有所下降,所以,现在的LED驱动电源

关键字: LED 驱动电源 开关电源

LED驱动电源是把电源供应转换为特定的电压电流以驱动LED发光的电压转换器,通常情况下:LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: LED 隧道灯 驱动电源
关闭