相机标定-从世界到像素的“三步接力”

相机标定中，从世界坐标系到像素坐标系的转换，并不是“一步到位”，而是分为三个连贯的步骤，就像“接力赛”一样，由三个坐标系依次传递，最终完成从“真实物体”到“图像像素”的转换。整个过程无需手动计算，全部由标定软件自动完成，但我们需要理解每个步骤的核心逻辑，才能更好地掌握相机标定的原理，避免实操中的误区。

第一步：世界坐标系 → 相机坐标系：“确定相机与物体的相对关系”

这一步的核心目的，是将世界坐标系中物体的真实位置，转换为相机坐标系中的相对位置，本质是“消除相机位置和姿态的影响”。无论相机在什么位置、以什么角度拍摄，通过这一步转换，都能得到物体相对于相机镜头光心的位置。

具体逻辑很简单：我们已经通过世界坐标系，知道了物体的真实位置（比如标定板角点的位置），同时通过相机标定，我们能获取相机的“姿态和位置信息”（也就是外参中的旋转矩阵和平移向量）——旋转矩阵描述相机的朝向（比如水平、倾斜），平移向量描述相机在世界坐标系中的位置（比如距离标定板50cm）。

软件会根据这些信息，自动计算出物体相对于相机光心的位置：比如，世界坐标系中某个角点的位置是“距离原点30mm，高度20mm”，相机在世界坐标系中的位置是“距离原点100mm，高度50mm”，通过转换，就能得到这个角点在相机坐标系中的相对位置，比如“距离相机光心70mm，在光心左下方30mm”。

这一步的关键是“相机外参”——外参的准确性，直接决定了这个转换的精度。如果外参求解不准确，物体在相机坐标系中的相对位置就会出现偏差，后续的像素转换也会跟着出错。

第二步：相机坐标系 → 图像坐标系：“将三维位置投射到二维平面”

这一步是转换的核心，本质是“将相机坐标系中的三维相对位置，投射到二维的图像平面上”，相当于“把相机视野中的物体，投射到图像传感器上”。我们可以用“小孔成像”的比喻来理解：相机镜头的光心是小孔，图像传感器是投影屏幕，光线从物体出发，穿过小孔，投射到屏幕上，形成物体的倒影，这个倒影的位置，就是图像坐标系中的位置。

在这个转换过程中，相机的“内参”起到了关键作用——内参中的焦距，决定了物体投射到图像平面上的大小：焦距越长，物体投射的影像越大（比如长焦镜头能拉近远处物体）；焦距越短，物体投射的影像越小，但能容纳更广阔的场景（比如广角镜头）。

简单来说，这一步就是“缩小或放大”物体的影像，并将其投射到二维平面上，得到物体在图像坐标系中的位置（单位是物理单位，比如毫米）。比如，相机坐标系中某个角点距离光心70mm，通过焦距的换算，投射到图像平面上的位置是“距离图像中心10mm”，这个位置就是图像坐标系中的坐标。

第三步：图像坐标系 → 像素坐标系：“给影像分配像素地址”

这是转换的最后一步，核心是将图像坐标系中的物理位置（毫米），转换为像素坐标系中的像素位置（像素），让物体的影像能够在图像上精准呈现。我们可以把这个过程理解为“给图像平面划分格子”——图像传感器上的每个像素，都是一个小格子，我们需要确定物体的影像，落在哪个格子里。

这个转换的关键，是“像素尺寸”——图像传感器上每个像素的实际大小（比如1μm×1μm），软件会根据这个尺寸，将图像坐标系中的物理位置，换算成像素位置。比如，图像坐标系中某个点的位置是“距离图像中心10mm”，而每个像素的尺寸是1μm，那么这个点在像素坐标系中的位置就是“距离图像中心10000像素”（10mm=10000μm）。

同时，内参中的“主点坐标”（图像传感器的中心像素位置），也会影响这个转换——主点坐标是图像坐标系和像素坐标系的“基准点”，确保转换后的像素位置，能够精准对应图像的中心，避免出现影像偏移。

到这一步，从世界坐标系到像素坐标系的转换就完成了：真实世界中的物体，通过“世界→相机→图像→像素”的接力转换，最终在二维图像上形成了对应的像素点，这就是相机成像的完整转换逻辑，也是相机标定的核心底层原理。