相机标定的核心基础：成像模型与关键参数

计算机视觉的核心目标是让机器“看懂”现实世界，而相机作为视觉系统的“眼睛”，其成像精度直接决定了后续算法的可靠性。相机标定技术，作为连接三维物理世界与二维图像平面的关键桥梁，是计算机视觉领域的基础支撑技术，广泛应用于自动驾驶、三维重建、工业检测、AR/VR、机器人导航等多个核心场景。本质上，相机标定是通过特定方法求解相机内参、外参及畸变系数的过程，其核心价值在于修正相机成像的固有偏差，建立精准的成像模型，让机器能够通过图像反推现实世界的三维信息。本文将全面综述相机标定技术的核心原理、主流方法、关键技术要点、应用场景及发展趋势，系统梳理该技术的发展脉络与核心突破，为相关领域的研究与工程实践提供参考。

要理解相机标定技术，首先需明确相机的成像模型及标定的核心目标。现实中的相机并非理想成像设备，其镜头存在光学畸变，成像过程会受到自身硬件特性和外部姿态的影响，而相机标定的本质，就是通过数学建模，量化这些影响因素，建立“三维世界点→二维图像点”的精准映射关系。

核心成像模型

相机成像的基础是针孔模型，该模型假设光线沿直线传播，三维空间中的点经过镜头光学中心（针孔）投射到二维图像传感器上，形成倒立、缩小的实像。理想针孔模型的投影关系可通过简单的几何关系推导，但现实中相机镜头由多片透镜组成，光线经过透镜折射时会产生偏差，因此实际成像模型需在针孔模型的基础上，引入畸变校正项，形成“针孔模型+畸变模型”的完整成像模型。

完整的成像过程分为两步：一是通过外参将三维世界坐标系中的点转换为相机坐标系中的点；二是通过内参和畸变系数，将相机坐标系中的点转换为二维图像像素坐标系中的点。

标定的核心参数

相机标定的核心目标是求解三类关键参数，这三类参数共同决定了相机的成像特性和与世界的相对关系，也是后续视觉算法的基础。

（1）内参：相机的固有参数，由硬件结构决定，包括焦距（fx, fy）、主点（cx, cy）、像素倾斜系数（s，通常为0）及畸变系数（k1, k2, k3, p1, p2）。内参描述相机自身的光学特性，一旦镜头固定、焦距不变，内参便保持稳定，无需重复标定（除非硬件发生变动）。其中，焦距决定成像的放大倍数和视野范围，主点是光轴与传感器平面的交点，畸变系数则量化镜头的光学畸变程度。

（2）外参：描述相机在世界坐标系中的位置和姿态，包括旋转矩阵R（3×3）和平移向量t（3×1）。旋转矩阵表征相机的朝向（绕x、y、z轴的旋转角度），平移向量表征相机坐标系原点相对于世界坐标系原点的偏移量。外参是动态参数，会随着相机的移动、旋转而实时变化，需根据场景动态标定。

（3）畸变系数：分为径向畸变系数（k1, k2, k3）和切向畸变系数（p1, p2）。径向畸变由镜头球面特性导致，表现为图像边缘物体的拉伸或压缩（桶形、枕形、S形畸变）；切向畸变由镜头与传感器装配偏差导致，表现为物体的倾斜或偏移。畸变系数是内参的重要补充，直接影响标定精度和后续成像校正效果。

相机标定的核心意义

相机标定是计算机视觉系统不可或缺的前置步骤，其意义主要体现在三个方面：一是修正成像偏差，消除镜头畸变带来的图像变形，还原真实场景；二是建立精准的坐标映射关系，为三维重建、目标定位、尺寸测量等任务提供可靠的参数支撑；三是统一多相机系统的坐标系，实现多视角图像的精准对齐，满足复杂场景（如自动驾驶多传感器融合、多相机三维重建）的应用需求。没有精准的相机标定，后续的视觉算法会出现严重偏差，甚至无法正常工作。