多目视觉在扫地机器人定位中的应用实现
扫描二维码
随时随地手机看文章
定位是扫地机器人自主作业的基础,核心是实时确定机器人在环境中的坐标位置与姿态角度,多目视觉通过多视角特征跟踪、位姿解算、误差融合,实现高精度、高鲁棒性的自主定位,适配家居复杂场景的动态变化。
多目视觉定位的核心流程
多目视觉定位流程分为图像采集、特征提取与匹配、位姿解算、定位优化四个阶段。首先,多摄像头同步采集连续帧图像,完成镜头畸变校正与视角校准,消除硬件安装偏差带来的定位误差;其次,提取图像中的SIFT、SURF、ORB等稳定特征点,通过极线约束与双向匹配算法,完成多视角、连续帧间的特征点匹配,剔除误匹配特征,保留有效匹配对;随后,基于匹配特征点与三维空间坐标,结合PnP算法与IMU、里程计数据,解算机器人的旋转矩阵与平移向量,确定当前位姿;采用滑动窗口优化、闭环检测算法,修正累计误差,提升长时间作业的定位稳定性。
家用场景定位优化策略
针对家居环境的特殊性,多目视觉定位系统做了多项适配优化。针对家具、墙面等静态场景,通过多视角特征复用,提升特征点跟踪的连续性,减少位姿跳变;针对行人、宠物等动态障碍物,采用动态特征剔除算法,过滤移动目标干扰,仅依靠静态环境特征进行定位;针对低光照、弱纹理区域(如纯色墙面、空旷地面),结合多视角深度信息与IMU数据融合定位,弥补视觉特征缺失的短板;针对狭小空间(如床下、沙发下、走廊),利用多摄像头互补视角,扩大特征感知范围,避免定位丢失。
此外,多目视觉定位可实现厘米级定位精度,配合闭环检测功能,当机器人重新经过已探测区域时,快速匹配历史特征,修正定位漂移,保证长时间清扫、大面积户型作业时的定位准确性,为路径规划、区域覆盖、断点续扫提供可靠的位置依据。
多目视觉在扫地机器人建图中的应用实现
建图与定位同步进行,多目视觉不仅能构建传统几何地图,还能结合语义信息生成三维语义地图,让扫地机器人不仅知晓空间轮廓,更能理解环境属性,实现精细化清洁规划,这也是多目视觉相较于传统方案的核心突破。
多目视觉建图的类型与构建流程
多目视觉建图分为三维几何地图与语义地图两类,满足不同层级的清洁需求。三维几何地图依托多目立体视觉获取的环境深度信息,记录家居空间的轮廓、障碍物位置、地面起伏、楼梯落差等几何信息,构建栅格地图或点云地图,为避障、路径规划提供空间依据;语义地图则在几何地图基础上,叠加多目视觉识别的物体类别、区域功能、地面材质等语义标签,标记客厅、卧室、厨房等功能区域,区分地毯、瓷砖、家具、杂物等目标属性,实现场景化清洁。
建图流程中,多目视觉系统实时采集环境三维点云数据,通过滤波算法剔除噪声点,保留有效环境特征;将连续帧的点云数据进行配准融合,逐步扩展地图范围;结合定位位姿信息,优化地图拼接精度,消除重叠区域误差;针对家居动态变化,采用增量式建图策略,实时更新地图中的临时障碍物、布局变动信息,保证地图与实际环境一致。
家用场景建图优化策略
家用环境存在布局复杂、障碍物多样、透明/反光物体多等特点,多目视觉建图通过多视角信息融合,有效解决传统建图方案的痛点。针对玻璃茶几、镜子等透明/反光物体,多目视觉通过多视角纹理特征与深度信息校验,区分真实障碍物与反光干扰,避免地图空洞或误标障碍物;针对地毯、脚垫等低矮物体,结合底部与前部多摄像头数据,精准检测物体高度与边界,完善地图细节;针对复式户型、楼梯等落差区域,利用多目深度感知能力,标记防跌落区域,构建分层地图,支持跨楼层建图与定位。
此外,多目视觉建图可生成稠密三维地图,相较于激光雷达的稀疏点云地图,能更细腻地还原家居环境细节,为区域划分、禁区设置、重点清洁区标记提供更精准的载体,提升用户自定义清洁的灵活性。





