极线校正：立体视觉中的几何约束与匹配加速技术(一)

极线校正是立体视觉系统中连接几何理论与工程实践的关键技术，通过对双目相机采集的左右视图进行几何变换，将三维空间中复杂的对应点搜索问题约束到二维图像的同一条水平线上，从而大幅降低立体匹配的计算复杂度。在人类感知世界的过程中，双眼视差赋予了深度感知能力，而极线校正则模拟了人类视觉系统的生理机制 —— 当双眼注视同一点时，该点在视网膜上的成像必然落在对应水平线上，这种天然的几何约束使大脑无需全域搜索即可快速融合双眼信息。在计算机视觉领域，这一技术的价值同样显著：未经校正的立体匹配需在整幅图像范围内搜索对应点，时间复杂度高达 O (N²)，而极线校正后仅需在单行内匹配，复杂度降至 O (N)，为实时三维重建、自动驾驶环境感知等场景提供了可行性基础。从早期基于基础矩阵的理论推导到如今结合深度学习的畸变校正，极线校正的技术演进始终围绕着 “几何精度” 与 “计算效率” 的双重追求，成为立体视觉 pipeline 中不可或缺的前置步骤。本文将系统阐述极线校正的理论基础、实现方法、应用场景及技术挑战，揭示其在三维感知领域的核心支撑作用。

极线校正的理论根基源于立体几何中的极线约束，这一约束关系由相机内外参数与空间点位置共同决定，构成了双目视觉的数学框架。在双目系统中，两个相机的光心分别为 Oₗ与 Oᵣ，空间中任意一点 P 在左视图的成像为 pₗ，在右视图的成像为 pᵣ，这三个点与光心共同构成 “极平面”，该平面与左右像平面的交线即为极线。根据透视投影原理，pᵣ必然落在左视图 pₗ对应的极线上，反之亦然，这种约束将三维空间中的对应点搜索从二维平面压缩至一维线段。极线校正的目标正是通过对左右图像施加旋转变换，使所有极线均平行于像平面的水平轴，此时同名点在左右视图中的行坐标完全一致，仅需在列方向上搜索匹配。实现这一目标的核心是求解两个相机的旋转矩阵 Rₗ与 Rᵣ，使校正后的左右相机内参矩阵相同且主光轴平行，通常通过以下步骤完成：首先计算描述双目相对姿态的基础矩阵 F，其满足 pᵣᵀFpₗ=0，反映了极线约束的代数关系；然后从 F 中分解出旋转矩阵与平移向量，再根据 “零倾斜” 准则（使校正后图像的径向畸变最小）优化旋转参数；最终通过重投影变换将原始图像映射到校正平面，完成极线对齐。这一过程中，相机内参（焦距、主点坐标）与畸变系数的精度直接影响校正效果，因此需要通过张氏标定法等预先完成精确标定，否则极线偏差可能超过 10 像素，导致后续匹配失效。