自监督学习在扫地机器人视觉定位
扫描二维码
随时随地手机看文章
自监督学习在扫地机器人视觉定位与建图中的应用,最终需要落地到实际产品中,工程化实现过程中,需适配扫地机器人的端侧算力约束、硬件成本限制,结合家庭场景的多样性,开展专项优化,确保技术的实用性、可靠性与经济性,推动技术从实验室走向批量应用,同时兼顾不同价位产品的需求。
工程化适配策略
针对端侧算力约束,进一步优化自监督模型的轻量化水平,平衡模型性能与算力消耗。通过模型剪枝、量化、蒸馏等技术,精简模型结构、降低参数数量,减少模型的计算量与内存占用,适配扫地机器人端侧嵌入式芯片的算力需求。例如,对自监督特征提取网络进行通道剪枝,剔除冗余特征通道,将模型参数量降低70%以上,同时保留核心特征提取能力;采用8位整型量化技术,将模型参数从32位浮点型转换为8位整型,大幅降低计算量,提升模型推理速度,适配ARM架构嵌入式芯片。
优化传感器与自监督模型的协同适配,结合单目相机、双目相机、RGBD相机等不同视觉传感器的特点,定制化设计自监督模型,提升模型的特征提取能力与场景适配性。例如,针对RGBD相机能够采集深度信息的优势,设计基于深度辅助的自监督特征提取模型,提升空间特征提取的准确性;针对单目相机成本低、部署便捷的特点,优化自监督深度估计模型,弥补单目相机无法直接获取深度信息的不足,降低硬件成本,适配中低端扫地机器人产品。
控制硬件成本,推动自监督技术的规模化应用。通过优化自监督模型的训练方案,减少训练过程中的算力消耗,降低模型训练成本;利用机器人在清洁过程中采集的无标注数据,无需额外收集标注数据,进一步降低数据成本;针对不同价位的扫地机器人,设计差异化的自监督技术方案,中高端机型采用“自监督+多源传感器融合”的方案,提升定位与建图精度;中低端机型采用轻量化自监督模型,在控制成本的同时,保障基础的定位与建图性能。
典型家庭场景专项优化
针对家庭场景的多样性与痛点,结合实际应用场景,开展自监督模型的专项优化,提升不同场景下的定位与建图性能。
弱光与全黑场景:优化自监督特征提取模型,结合红外图像辅助识别,提升弱光、全黑环境下的特征提取准确性;强化自监督深度估计模型的鲁棒性,通过挖掘图像的纹理细节与几何约束,弥补光照不足导致的特征缺失,确保定位与建图的稳定性。例如,在自监督模型中加入红外图像处理模块,利用红外图像捕捉环境轮廓,结合可见光图像的纹理特征,提升弱光环境下的特征提取准确率,让机器人在夜间也能实现精准定位与建图。
动态障碍物场景:优化自监督动态特征识别模型,提升对宠物、行人等动态障碍物的识别速度与准确率,区分动态特征与静态特征,排除动态障碍物对定位与建图的干扰;结合强化学习技术,让模型自主学习动态障碍物的运动规律,提前预判障碍物的移动路径,调整定位与建图策略,确保地图的准确性与定位的稳定性。例如,当检测到宠物移动时,模型可自动标记动态区域,不将其纳入地图的静态轮廓,避免地图出现冗余标注,同时调整定位策略,避免因宠物遮挡导致的定位漂移。
低矮与狭窄区域场景:优化自监督特征提取与深度估计模型,强化对低矮区域(如沙发底部、床底)、狭窄区域(如沙发缝隙、墙角)的特征提取能力,提升这些区域的定位与建图精度;结合超声波传感器的数据融合,补充低矮、狭窄区域的深度信息,避免地图出现缺失,确保清洁覆盖的完整性。例如,优化自监督模型的特征提取范围,捕捉低矮区域的纹理与轮廓特征,结合超声波传感器的近距离感知数据,精准构建低矮区域的地图,让机器人能够精准进入这些区域进行清洁。
纹理稀疏场景:优化自监督特征提取模型,挖掘环境中的细微特征,提升纹理稀疏区域(如空白墙面、光滑地面)的特征提取能力,避免因特征不足导致的定位漂移与地图偏差;结合几何约束与运动约束,强化自监督位姿估计模型的鲁棒性,确保在纹理稀疏场景下,依然能够实现精准定位。例如,在纹理稀疏区域,模型可通过捕捉墙面与地面的边界特征、家具的边角特征,结合连续帧的运动约束,实现精准定位与地图构建。





