极线校正：立体视觉中的几何约束与匹配加速技术(二)

极线校正的实现方法可根据技术路径分为 “基于基础矩阵的间接法” 与 “基于标定参数的直接法”，两种方法在精度与效率上各有侧重，适用于不同场景。基于基础矩阵的方法无需相机内参，仅通过图像特征点匹配即可估计 F 矩阵，进而求解旋转矩阵，这种方法灵活性强，适用于未标定的临时双目系统，如手持手机拍摄的立体图像对。其典型流程为：使用 SIFT 或 ORB 算法提取左右视图的特征点，通过 RANSAC 算法剔除误匹配，利用 8 点法计算基础矩阵 F，再从 F 中分解出本质矩阵 E（E=KᵀFK，K 为相机内参矩阵），最后通过奇异值分解（SVD）从 E 中得到旋转矩阵 R 与平移向量 t，生成校正所需的同形变换矩阵。但这种方法受特征匹配精度影响较大，当图像纹理稀疏时，F 矩阵估计误差可能导致极线倾斜角超过 5°，因此更适合纹理丰富的场景。基于标定参数的直接法则利用预先标定的内外参，直接计算旋转矩阵，精度更高且稳定性强，是工业级立体系统的首选方案。其核心是通过相机外参（旋转矩阵 R 与平移向量 T）构建校正旋转矩阵，使校正后的左右相机坐标系满足 RₗRₗ⁻¹=RᵣRᵣ⁻¹，即光轴平行，常用的 Bouguet 算法通过最小化重投影误差优化旋转参数，可将极线偏差控制在 0.5 像素以内。校正过程中的图像重投影通常采用双线性插值或双三次插值，前者计算速度快（约 1ms / 帧）但可能产生锯齿，后者精度高但耗时增加 3 倍，需根据实时性需求权衡选择。

极线校正的技术性能通常通过 “极线偏差” 与 “图像质量损失” 两个指标衡量，前者反映几何精度，后者体现信息保留程度。极线偏差定义为校正后同名点的行坐标差，理想情况下应趋近于 0，实际应用中需控制在 1 像素以内，否则会显著增加匹配难度。影响偏差的主要因素包括：相机标定误差（尤其是畸变系数拟合不准）、旋转矩阵计算精度、图像插值误差等，在广角相机等畸变较大的场景中，即使经过校正，边缘区域的极线偏差仍可能达到 3-5 像素，需要结合局部畸变补偿算法进一步优化。图像质量损失则源于重投影过程中的像素拉伸与插值，当旋转角度较大（如超过 30°）时，图像边缘可能出现明显模糊，此时需采用自适应插值算法（如基于边缘检测的加权插值），在保持极线精度的同时减少信息丢失。此外，校正后的图像通常需要裁剪以去除无效黑边，裁剪比例与相机基线长度相关，基线越长，有效视场损失越大，因此在系统设计时需在基线长度（影响深度测量范围）与视场保留之间进行平衡，例如自动驾驶双目相机的基线通常设为 0.5-1.5 米，裁剪后有效视场仍能覆盖 80° 水平角。