相机标定中,从世界坐标系到像素坐标系的转换,并不是“一步到位”,而是分为三个连贯的步骤,就像“接力赛”一样,由三个坐标系依次传递,最终完成从“真实物体”到“图像像素”的转换。整个过程无需手动计算,全部由标定软件自动完成,但我们需要理解每个步骤的核心逻辑,才能更好地掌握相机标定的原理,避免实操中的误区。
第一步:世界坐标系 → 相机坐标系:“确定相机与物体的相对关系”
这一步的核心目的,是将世界坐标系中物体的真实位置,转换为相机坐标系中的相对位置,本质是“消除相机位置和姿态的影响”。无论相机在什么位置、以什么角度拍摄,通过这一步转换,都能得到物体相对于相机镜头光心的位置。
具体逻辑很简单:我们已经通过世界坐标系,知道了物体的真实位置(比如标定板角点的位置),同时通过相机标定,我们能获取相机的“姿态和位置信息”(也就是外参中的旋转矩阵和平移向量)——旋转矩阵描述相机的朝向(比如水平、倾斜),平移向量描述相机在世界坐标系中的位置(比如距离标定板50cm)。
软件会根据这些信息,自动计算出物体相对于相机光心的位置:比如,世界坐标系中某个角点的位置是“距离原点30mm,高度20mm”,相机在世界坐标系中的位置是“距离原点100mm,高度50mm”,通过转换,就能得到这个角点在相机坐标系中的相对位置,比如“距离相机光心70mm,在光心左下方30mm”。
这一步的关键是“相机外参”——外参的准确性,直接决定了这个转换的精度。如果外参求解不准确,物体在相机坐标系中的相对位置就会出现偏差,后续的像素转换也会跟着出错。
第二步:相机坐标系 → 图像坐标系:“将三维位置投射到二维平面”
这一步是转换的核心,本质是“将相机坐标系中的三维相对位置,投射到二维的图像平面上”,相当于“把相机视野中的物体,投射到图像传感器上”。我们可以用“小孔成像”的比喻来理解:相机镜头的光心是小孔,图像传感器是投影屏幕,光线从物体出发,穿过小孔,投射到屏幕上,形成物体的倒影,这个倒影的位置,就是图像坐标系中的位置。
在这个转换过程中,相机的“内参”起到了关键作用——内参中的焦距,决定了物体投射到图像平面上的大小:焦距越长,物体投射的影像越大(比如长焦镜头能拉近远处物体);焦距越短,物体投射的影像越小,但能容纳更广阔的场景(比如广角镜头)。
简单来说,这一步就是“缩小或放大”物体的影像,并将其投射到二维平面上,得到物体在图像坐标系中的位置(单位是物理单位,比如毫米)。比如,相机坐标系中某个角点距离光心70mm,通过焦距的换算,投射到图像平面上的位置是“距离图像中心10mm”,这个位置就是图像坐标系中的坐标。
第三步:图像坐标系 → 像素坐标系:“给影像分配像素地址”
这是转换的最后一步,核心是将图像坐标系中的物理位置(毫米),转换为像素坐标系中的像素位置(像素),让物体的影像能够在图像上精准呈现。我们可以把这个过程理解为“给图像平面划分格子”——图像传感器上的每个像素,都是一个小格子,我们需要确定物体的影像,落在哪个格子里。
这个转换的关键,是“像素尺寸”——图像传感器上每个像素的实际大小(比如1μm×1μm),软件会根据这个尺寸,将图像坐标系中的物理位置,换算成像素位置。比如,图像坐标系中某个点的位置是“距离图像中心10mm”,而每个像素的尺寸是1μm,那么这个点在像素坐标系中的位置就是“距离图像中心10000像素”(10mm=10000μm)。
同时,内参中的“主点坐标”(图像传感器的中心像素位置),也会影响这个转换——主点坐标是图像坐标系和像素坐标系的“基准点”,确保转换后的像素位置,能够精准对应图像的中心,避免出现影像偏移。
到这一步,从世界坐标系到像素坐标系的转换就完成了:真实世界中的物体,通过“世界→相机→图像→像素”的接力转换,最终在二维图像上形成了对应的像素点,这就是相机成像的完整转换逻辑,也是相机标定的核心底层原理。