计算机视觉的核心目标是让机器“看懂”现实世界,而相机作为视觉系统的“眼睛”,其成像精度直接决定了后续算法的可靠性。相机标定技术,作为连接三维物理世界与二维图像平面的关键桥梁,是计算机视觉领域的基础支撑技术,广泛应用于自动驾驶、三维重建、工业检测、AR/VR、机器人导航等多个核心场景。本质上,相机标定是通过特定方法求解相机内参、外参及畸变系数的过程,其核心价值在于修正相机成像的固有偏差,建立精准的成像模型,让机器能够通过图像反推现实世界的三维信息。本文将全面综述相机标定技术的核心原理、主流方法、关键技术要点、应用场景及发展趋势,系统梳理该技术的发展脉络与核心突破,为相关领域的研究与工程实践提供参考。
要理解相机标定技术,首先需明确相机的成像模型及标定的核心目标。现实中的相机并非理想成像设备,其镜头存在光学畸变,成像过程会受到自身硬件特性和外部姿态的影响,而相机标定的本质,就是通过数学建模,量化这些影响因素,建立“三维世界点→二维图像点”的精准映射关系。
核心成像模型
相机成像的基础是针孔模型,该模型假设光线沿直线传播,三维空间中的点经过镜头光学中心(针孔)投射到二维图像传感器上,形成倒立、缩小的实像。理想针孔模型的投影关系可通过简单的几何关系推导,但现实中相机镜头由多片透镜组成,光线经过透镜折射时会产生偏差,因此实际成像模型需在针孔模型的基础上,引入畸变校正项,形成“针孔模型+畸变模型”的完整成像模型。
完整的成像过程分为两步:一是通过外参将三维世界坐标系中的点转换为相机坐标系中的点;二是通过内参和畸变系数,将相机坐标系中的点转换为二维图像像素坐标系中的点。
标定的核心参数
相机标定的核心目标是求解三类关键参数,这三类参数共同决定了相机的成像特性和与世界的相对关系,也是后续视觉算法的基础。
(1)内参:相机的固有参数,由硬件结构决定,包括焦距(fx, fy)、主点(cx, cy)、像素倾斜系数(s,通常为0)及畸变系数(k1, k2, k3, p1, p2)。内参描述相机自身的光学特性,一旦镜头固定、焦距不变,内参便保持稳定,无需重复标定(除非硬件发生变动)。其中,焦距决定成像的放大倍数和视野范围,主点是光轴与传感器平面的交点,畸变系数则量化镜头的光学畸变程度。
(2)外参:描述相机在世界坐标系中的位置和姿态,包括旋转矩阵R(3×3)和平移向量t(3×1)。旋转矩阵表征相机的朝向(绕x、y、z轴的旋转角度),平移向量表征相机坐标系原点相对于世界坐标系原点的偏移量。外参是动态参数,会随着相机的移动、旋转而实时变化,需根据场景动态标定。
(3)畸变系数:分为径向畸变系数(k1, k2, k3)和切向畸变系数(p1, p2)。径向畸变由镜头球面特性导致,表现为图像边缘物体的拉伸或压缩(桶形、枕形、S形畸变);切向畸变由镜头与传感器装配偏差导致,表现为物体的倾斜或偏移。畸变系数是内参的重要补充,直接影响标定精度和后续成像校正效果。
相机标定的核心意义
相机标定是计算机视觉系统不可或缺的前置步骤,其意义主要体现在三个方面:一是修正成像偏差,消除镜头畸变带来的图像变形,还原真实场景;二是建立精准的坐标映射关系,为三维重建、目标定位、尺寸测量等任务提供可靠的参数支撑;三是统一多相机系统的坐标系,实现多视角图像的精准对齐,满足复杂场景(如自动驾驶多传感器融合、多相机三维重建)的应用需求。没有精准的相机标定,后续的视觉算法会出现严重偏差,甚至无法正常工作。