自监督学习在扫地机器人视觉定位中的应用路径
扫描二维码
随时随地手机看文章
视觉定位是扫地机器人自主清洁的前提,其核心是让机器人实时获取自身在环境中的位置信息,避免定位漂移,确保清洁路径的准确性。自监督学习主要从“特征提取、位姿估计、定位优化”三个维度,赋能扫地机器人视觉定位,结合相关技术优化,提升定位精度与稳定性,适配复杂家居场景,解决传统定位技术的痛点。
自监督特征提取:提升环境特征识别能力
环境特征提取的准确性,直接决定视觉定位的精度。传统视觉定位模型采用人工设计的特征提取算法(如SIFT、ORB),难以适配家居环境中复杂的纹理、光照变化,易出现特征提取失效、匹配错误等问题,尤其是在弱光、反光、纹理稀疏等场景中,特征提取效果大幅下降。自监督学习通过训练特征提取模型,自主学习家居环境中的关键特征,提升特征提取的准确性与鲁棒性,为视觉定位提供可靠的特征支撑。
在扫地机器人视觉定位中,常用的自监督特征提取方法主要有两种:一是基于对比学习的自监督特征提取,通过构建“正样本-负样本”对,让模型学习不同图像帧中相同特征的一致性与不同特征的差异性,例如将连续图像帧中的同一环境特征作为正样本,不同环境特征作为负样本,训练模型提取具有区分度的特征描述子,提升特征匹配的准确性。这种方法可借鉴SimCLR对比学习框架的思路,通过对图像进行随机增强,生成同一图像的不同视图作为正样本,不同图像的视图作为负样本,训练特征提取网络,让模型学会捕捉环境特征的本质,不受光照、角度变化的影响。二是基于自监督重建的特征提取,通过训练模型对图像进行重建(如去模糊、补全),让模型在重建过程中学习环境的深层特征,例如针对家居环境中的弱光、反光图像,通过自监督重建模型修复图像质量,提取清晰的环境特征,确保定位的稳定性。
例如,优化后的GN2_SuperPoint网络模型,采用类VGG架构的编码层降低输入图像维度,通过自监督训练优化特征提取能力,可精准提取家居环境中的边缘、纹理等关键特征,同时减少高维特征冗余,提升特征提取效率,为视觉定位提供可靠的特征支撑。该模型可在PyTorch 1.2框架上,采用Adam优化器、0.001学习率、16批处理大小的参数设置完成训练,适配扫地机器人端侧算力需求;在实际测试中,该模型在弱光环境下的特征提取准确率较传统模型提升30%以上,有效解决了弱光场景下定位不准的问题。此外,将自监督学习与双目视觉结合,可进一步提升特征提取的立体感,助力机器人精准感知空间位置,适配沙发底部、床底等低矮空间的定位需求。
自监督位姿估计:实现精准的自身定位
位姿估计是视觉定位的核心环节,其目标是让扫地机器人实时获取自身的位置与姿态信息,确保机器人能够精准感知自身在环境中的位置,避免定位漂移。传统位姿估计方法多依赖人工标注的位姿数据训练模型,不仅成本高,还难以适配动态场景,易出现估计偏差。自监督学习通过利用环境的运动约束、几何约束,自动生成位姿估计的伪标签,训练位姿估计模型,实现精准的自身定位,无需人工标注位姿数据。
自监督位姿估计的核心思路是,利用扫地机器人运动过程中采集的连续图像帧,挖掘帧间的运动关系,生成位姿伪标签,训练模型学习从图像特征到位姿信息的映射关系。常用的方法包括基于光流估计的自监督位姿估计、基于深度估计的自监督位姿估计等。基于光流估计的自监督位姿估计,通过计算连续图像帧之间的光流场,捕捉图像像素的运动轨迹,进而估计机器人的位姿变化;基于深度估计的自监督位姿估计,通过自监督模型估计图像的深度信息,结合几何约束,计算机器人的位姿信息,这种方法可适配纹理稀疏的家居场景,提升位姿估计的鲁棒性。
例如,基于自监督深度估计的位姿估计模型,通过训练模型自主学习图像的深度特征,结合连续帧的几何约束,生成位姿伪标签,训练位姿估计网络,可实现精准的位姿估计。该模型在训练过程中,无需人工标注深度与位姿数据,仅利用机器人采集的无标注图像帧,即可完成训练,大幅降低训练成本;在实际应用中,该模型能够实时输出机器人的位置与姿态信息,定位误差控制在5cm以内,可有效避免定位漂移,适配复杂家居场景的定位需求。同时,结合IMU(惯性测量单元)的数据融合,可进一步提升位姿估计的稳定性,在机器人快速移动、转弯时,依然能够保持精准定位。
自监督定位优化:提升定位的稳定性与鲁棒性
家庭环境的复杂性与动态性,要求扫地机器人的视觉定位具备较强的稳定性与鲁棒性,能够应对光照变化、动态障碍物、纹理稀疏等复杂场景的挑战。自监督学习通过持续学习环境特征,动态优化定位策略,提升定位的稳定性与鲁棒性,解决传统定位模型在复杂场景下定位失效的问题。
自监督定位优化的核心的是,利用模型在实际运行过程中采集的环境数据,持续更新监督信号,优化模型参数,让模型能够自适应环境变化。例如,当机器人进入弱光环境时,自监督模型可通过持续学习弱光环境下的图像特征,调整特征提取策略,提升弱光环境下的特征提取准确性,进而优化定位效果;当环境中出现动态障碍物时,自监督模型可快速识别动态特征与静态特征的差异,排除动态障碍物对定位的干扰,确保定位的稳定性。
此外,自监督定位优化还可结合回环检测技术,进一步提升定位的准确性。回环检测的核心是识别机器人曾经经过的区域,通过对比当前图像与历史图像的特征,判断机器人是否回到已遍历区域,进而修正定位误差,避免长期运行导致的定位漂移。自监督学习可训练回环检测模型,自主学习区域特征的一致性,提升回环检测的准确性,无需人工标注回环区域数据。例如,基于自监督对比学习的回环检测模型,可自主学习不同区域的特征差异,精准识别回环区域,修正定位误差,让机器人在大户型家居环境中,长期运行依然能够保持精准定位。





