相机标定：从几何建模到像素精准映射的视觉基础(一)

相机标定作为计算机视觉领域连接三维物理世界与二维图像空间的核心技术，通过建立相机成像的数学模型，求解内参（焦距、主点坐标）与外参（旋转矩阵、平移向量）及畸变系数，实现像素坐标到真实世界坐标的精准映射。在人类通过视觉感知环境的过程中，大脑会自动校正眼球的光学畸变并融合双眼视差，而相机作为人工视觉系统，必须通过标定消除镜头制造误差、安装偏差带来的成像扭曲，才能为后续的三维重建、目标定位等任务提供可靠的几何基准。从早期依赖精密机械装置的标定方法，到如今基于棋盘格的自动标定算法，相机标定的技术演进始终围绕 “精度提升” 与 “操作简化” 两大目标，其成果已广泛支撑起工业检测、自动驾驶、机器人导航等领域的高精度视觉需求。本文将系统阐述相机标定的理论基础、实现方法、应用场景及技术挑战，揭示其在视觉系统中的基础性作用与发展潜力。

相机标定的理论根基源于透视投影原理与镜头畸变模型，二者共同构成了从三维空间到二维图像的完整映射关系。针孔相机模型是标定的基础几何框架，该模型假设光线通过一个理想针孔投射到像平面，空间点 P (X,Y,Z) 与其像点 p (u,v) 的映射关系可表示为：u = fx*(X/Z) + cx，v = fy*(Y/Z) + cy，其中 fx、fy 为 x、y 方向的焦距（像素单位），cx、cy 为主点坐标（图像中心）。然而，真实镜头因光学设计与制造工艺限制，存在非线性畸变，主要包括径向畸变（由镜头曲率不均导致，表现为图像边缘的放射状扭曲）和切向畸变（由镜头装配偏差导致，表现为图像的倾斜拉伸），其数学模型通常采用多项式表示：径向畸变 δr = k1r² + k2r⁴ + k3r⁶，切向畸变 δt = p1(r²+2x²) + 2p2xy，其中 k1、k2、k3 为径向畸变系数，p1、p2 为切向畸变系数，r 为像素到主点的距离。相机标定的核心任务即通过已知的空间点与对应像点，求解内参矩阵 K（包含 fx、fy、cx、cy）、外参矩阵（R,t）及畸变系数，使重投影误差（实际像点与理论像点的像素距离）最小化，理想情况下应控制在 0.5 像素以内。

相机标定的实现方法可根据是否依赖已知结构的靶标分为 “基于靶标的标定法” 与 “自标定法”，两类方法在精度、操作复杂度上各有侧重，适用于不同场景。基于靶标的标定法是工业界的主流选择，其通过拍摄已知三维坐标的特征点（如棋盘格角点），利用透视约束求解相机参数，其中张氏标定法因操作简便、精度可靠成为最广泛应用的方案。该方法的典型流程为：打印棋盘格靶标并从不同角度拍摄 10-20 张图像，通过角点检测算法提取棋盘格角点的图像坐标，结合其已知的世界坐标（通常设棋盘格平面为 Z=0），构建透视方程 AX=0，利用最小二乘法求解内参与外参的初始值，再通过光束平差法（Bundle Adjustment）优化所有参数，使整体重投影误差最小。为提升精度，靶标设计需满足特征点分布均匀、角点数量充足（如 8×11 格点），拍摄时需覆盖相机视场的不同区域，避免姿态单一导致的参数退化。基于主动靶标的标定法则适用于高精度场景，如利用激光跟踪仪或运动捕捉系统提供靶标三维坐标，可将标定精度提升至 0.1 像素以内，但设备成本高昂，仅用于航空航天等高端领域。