极线校正:立体视觉中的几何约束与匹配加速技术(二)
扫描二维码
随时随地手机看文章
极线校正的实现方法可根据技术路径分为 “基于基础矩阵的间接法” 与 “基于标定参数的直接法”,两种方法在精度与效率上各有侧重,适用于不同场景。基于基础矩阵的方法无需相机内参,仅通过图像特征点匹配即可估计 F 矩阵,进而求解旋转矩阵,这种方法灵活性强,适用于未标定的临时双目系统,如手持手机拍摄的立体图像对。其典型流程为:使用 SIFT 或 ORB 算法提取左右视图的特征点,通过 RANSAC 算法剔除误匹配,利用 8 点法计算基础矩阵 F,再从 F 中分解出本质矩阵 E(E=KᵀFK,K 为相机内参矩阵),最后通过奇异值分解(SVD)从 E 中得到旋转矩阵 R 与平移向量 t,生成校正所需的同形变换矩阵。但这种方法受特征匹配精度影响较大,当图像纹理稀疏时,F 矩阵估计误差可能导致极线倾斜角超过 5°,因此更适合纹理丰富的场景。基于标定参数的直接法则利用预先标定的内外参,直接计算旋转矩阵,精度更高且稳定性强,是工业级立体系统的首选方案。其核心是通过相机外参(旋转矩阵 R 与平移向量 T)构建校正旋转矩阵,使校正后的左右相机坐标系满足 RₗRₗ⁻¹=RᵣRᵣ⁻¹,即光轴平行,常用的 Bouguet 算法通过最小化重投影误差优化旋转参数,可将极线偏差控制在 0.5 像素以内。校正过程中的图像重投影通常采用双线性插值或双三次插值,前者计算速度快(约 1ms / 帧)但可能产生锯齿,后者精度高但耗时增加 3 倍,需根据实时性需求权衡选择。
极线校正的技术性能通常通过 “极线偏差” 与 “图像质量损失” 两个指标衡量,前者反映几何精度,后者体现信息保留程度。极线偏差定义为校正后同名点的行坐标差,理想情况下应趋近于 0,实际应用中需控制在 1 像素以内,否则会显著增加匹配难度。影响偏差的主要因素包括:相机标定误差(尤其是畸变系数拟合不准)、旋转矩阵计算精度、图像插值误差等,在广角相机等畸变较大的场景中,即使经过校正,边缘区域的极线偏差仍可能达到 3-5 像素,需要结合局部畸变补偿算法进一步优化。图像质量损失则源于重投影过程中的像素拉伸与插值,当旋转角度较大(如超过 30°)时,图像边缘可能出现明显模糊,此时需采用自适应插值算法(如基于边缘检测的加权插值),在保持极线精度的同时减少信息丢失。此外,校正后的图像通常需要裁剪以去除无效黑边,裁剪比例与相机基线长度相关,基线越长,有效视场损失越大,因此在系统设计时需在基线长度(影响深度测量范围)与视场保留之间进行平衡,例如自动驾驶双目相机的基线通常设为 0.5-1.5 米,裁剪后有效视场仍能覆盖 80° 水平角。





