当前位置:首页 > 汽车电子 > 汽车电子
[导读]一辆智能汽车驶入复杂的城市路口,它的“眼睛”——遍布车身的多个摄像头——同时捕捉着前后左右的海量图像信息。传统感知系统的处理方式是将这些独立摄像头“看到”的特征进行简单拼接,如同让一个人同时盯着多块屏幕却难以形成统一的空间认知。这种“特征拼接”模式的局限性日益凸显:视角差异导致语义错位,动态目标在不同画面中的位置难以对齐,遮挡和深度模糊问题更是让系统频频误判。

一辆智能汽车驶入复杂的城市路口,它的“眼睛”——遍布车身的多个摄像头——同时捕捉着前后左右的海量图像信息。传统感知系统的处理方式是将这些独立摄像头“看到”的特征进行简单拼接,如同让一个人同时盯着多块屏幕却难以形成统一的空间认知。这种“特征拼接”模式的局限性日益凸显:视角差异导致语义错位,动态目标在不同画面中的位置难以对齐,遮挡和深度模糊问题更是让系统频频误判。

BEV+Transformer架构的出现,正在从根本上改变这一局面。它不再将多摄像头视为独立的传感器,而是构建一个统一的空间坐标系——鸟瞰视角下的“上帝之眼”——让车辆像资深司机一样理解周围三维环境中每个元素的位置、运动和意图。从华为ADS系统上车,到天瞳威视等方案的大规模量产定点,这场从“特征拼接”走向“空间智能”的技术范式革命,正在重新定义自动驾驶感知的边界。

一、BEV:从二维图像到统一空间的思维跃迁

自动驾驶感知系统的核心矛盾在于:摄像头采集的是二维图像,而驾驶决策需要的是三维空间理解。传统方案依赖逆透视映射将不同摄像头的画面投影到统一平面,但这种方法要求完美的道路平面假设,遇到坡道、起伏路面时投影误差急剧放大。

BEV(Bird‘s Eye View,鸟瞰视角)技术的本质,是为车辆构建一张“动态数字地图”。这张俯视地图以自车为中心,覆盖周围数十至数百米范围,每个网格单元存储的不是简单的像素值,而是高维特征向量——这些向量编码了该位置是否存在物体、物体的类别、速度、朝向等丰富信息。与传统方法的根本区别在于,BEV不再是通过几何公式“计算”投影关系,而是让神经网络从海量数据中“学习”如何将二维图像特征映射到三维空间。

这一思维跃迁的价值在复杂场景中尤为突出。当车辆通过一个被公交车遮挡的十字路口时,传统方案只能依靠当前可见区域做出判断;而基于BEV的系统可以利用时序信息,将多帧图像中观测到的片段拼接成完整的空间认知,推断出被遮挡区域可能存在的风险。这正是空间智能的核心——不是简单地“看到”物体,而是理解空间结构、预判运动趋势。

二、Transformer:信息融合的高效引擎

有了统一的空间坐标系,下一个问题是如何将多摄像头、多时刻的信息高效地填入这个坐标系。Transformer的注意力机制为解决这一融合难题提供了理想工具。

Transformer的核心能力可以用一句话概括:它提供了一种灵活的信息查询机制。以BEVFormer框架为例,系统在BEV空间中预定义一组网格状的查询向量,每个查询对应空间的特定位置。这些查询通过空间交叉注意力机制,主动在多个摄像头的图像特征中寻找相关信息,自动判断哪个摄像头的哪个区域对该位置的感知贡献最大。这就像一个导演同时指挥多个摄像机,让每个摄像头在恰当的时机聚焦恰当的焦点。

时序信息的融合是Transformer的另一关键贡献。驾驶不是一个静态瞬间,而是连续的过程。Transformer的时间自注意力机制将过去数秒的BEV特征串联起来,使系统具备了类似人类的短期记忆能力。这意味着当一辆摩托车短暂被路旁树木遮挡时,系统依然能通过历史轨迹推断其当前位置和运动趋势——这对“鬼探头”等极端场景的应对至关重要。

三、从稠密到稀疏:Sparse4D的效率革命

BEV感知的早期方案采用稠密网格表示,将周围空间均匀划分为数以万计的网格单元。然而真实交通场景中的目标通常只有几十个,对全空间进行稠密建模存在巨大的计算浪费。Sparse4D算法通过引入稀疏化策略解决了这一矛盾。

Sparse4D的核心创新在于:不再维护整个BEV网格,而是仅关注可能存在目标的空间位置。系统维护一组可学习的对象查询向量,每个查询代表一个潜在的目标,通过可变形注意力机制直接从多摄像头特征中提取信息并更新目标状态。这种“以目标为中心”的设计将计算复杂度从O(N²)降至O(N),在nuScenes数据集上实现了推理速度37%的提升,同时将硬件成本控制在150美元以内——仅为传统激光雷达方案的1/5到1/8。

在性能层面,Sparse4D V3版本通过端到端跟踪头实现了检测与跟踪的联合优化,AMOTA指标提升12%,跨帧ID保持率达到98.4%。这意味着系统能够更稳定地追踪每个目标的运动轨迹,显著减少“跟丢后重新识别”的困扰。

四、产业落地:从技术突破到规模化验证

BEV+Transformer架构的先进性正在得到产业界的规模化验证。天瞳威视基于地平线J6B芯片的行泊一体方案,将自研Transformer BEV感知算法与Sparse4D架构融合,已获得近百万辆级量产定点。该方案在城市NOA场景中实现了无高精地图条件下的自动变道与复杂路口通行能力,自适应巡航与车道居中的控制更加平顺自然,重刹率较传统方案降低70%。

华为乾崑ADS系统同样是这一技术路线的坚定践行者。阿维塔06搭载的ADS系统采用BEV+Transformer+GOD端到端架构,系统响应时延降低50%,通行效率提升20%,决策逻辑更加类人化——会主动避让大车、预判加塞、礼让行人。这些数字背后代表的不是实验室的极限性能,而是每天行驶在真实道路上的数十万辆车积累的经验。

学术基准测试进一步验证了BEV+Transformer的先进性。在nuScenes数据集上,Sparse4D的3D检测mAP达到68.7%,远超行业平均的59.2%;轨迹预测ATE降至0.32米,ID切换率低至0.8次/千帧。BEVFusion等融合方案在激光雷达与摄像头协同场景下实现了69.2%至74.1%的NDS指标。这些数据共同指向一个结论:纯视觉+Transformer的感知方案,正在逼近甚至超越融合激光雷达的传统方案。

五、技术边界与演进方向

BEV+Transformer架构的成功并不意味着感知问题的彻底解决。极端天气条件下图像质量下降、罕见异形物体的检测、以及Transformer模型计算量对嵌入式平台的算力压力,仍是亟待突破的瓶颈。

当前的技术演进正在多个方向同时推进:占用网络引入了对空间中每个体素是否被占据的稠密建模,使系统能够识别任意形状的障碍物而不受预设类别限制;世界模型尝试在感知基础上增加对未来演变的预测能力,让车辆不仅理解“现在有什么”,还能预判“接下来会发生什么”;大语言模型的蒸馏技术则将语义知识注入BEV表征,使系统能够理解“交警手势”这类隐性交通规则。

结语

BEV+Transformer正在从根本上改变自动驾驶的感知范式。它不再让车辆像拼图一样拼接零散的视觉信息,而是赋予其构建统一空间认知的能力——这正是“空间智能”的本质。从实验室的算法突破,到百万辆级的量产验证,再到端到端大模型的深度融合,这场技术变革的核心驱动力始终未变:让自动驾驶系统像人类一样理解世界,而不是像机器一样处理数据。当BEV成为系统的标准“数字地图”,当Transformer成为连接时空的通用引擎,纯视觉自动驾驶正在无限接近那个曾被激光雷达垄断的性能高度。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除( 邮箱:macysun@21ic.com )。
换一批
延伸阅读

全民健身与竞技体育双重需求,AI运动姿态矫正系统正通过IMU数据与骨骼关键点检测的深度融合,构建起覆盖训练、康复、教学的实时反馈生态。这项技术不仅将运动损伤风险降低42%,更使运动员动作效率提升28%,标志着运动科学进入...

关键字: AI健康管家 Transformer

全球老龄化加速与慢性病负担加剧的双重压力,慢性病管理正从“被动治疗”向“主动健康”转型。AI健康管家通过整合Transformer架构的深度学习能力与多模态健康数据,构建起覆盖疾病预测、风险分层、动态干预的全周期管理体系...

关键字: AI健康管家 Transformer

智能制造与智慧物流,机器人动态避障技术已成为衡量系统智能化水平的核心指标。面对复杂工业场景中毫米级操作精度与微秒级响应时延的双重挑战,多模态融合感知的“语义-几何”联合建模结合Transformer架构,正推动机器人从“...

关键字: 多模态融合 Transformer

碳化硅 (SiC) MOSFET 因其技术固有的特性(例如高电压能力、较低的导通电阻、耐高温操作以及相对于硅更高的功率密度)而越来越受到电源系统设计人员的欢迎。因此,基于 SiC 的转换器和逆变器是电池供电车辆 (BEV...

关键字: SiC BEV

作为未来出行的终极模式,BEV最终将为客户提供比ICE或混合动力汽车更低的TCO(总拥有成本)。随着电池成本的持续下降以及密集充电基础设施网络的部署,未来十年内BEV将大规模普及。

关键字: BEV 电动汽车 电池

电池电动汽车 (BEV) 在过去几年中获得了巨大的发展势头,超过了汽车行业此前对未来影响的预期。几乎每家汽车制造商现在都计划在未来十年左右将 BEV 打造为他们的主导产品系列。三年前,大多数原始设备制造商都计划推出 BE...

关键字: 电池电动汽车 BEV

电池价格的快速下降是 BEV 兴趣上升的一个主要因素,最终使 BEV 与内燃机价格持平。当电池成本达到每千瓦时 100 美元时,普遍认为 BEV 将等于许多汽车领域内燃发动机的购买价格。

关键字: BEV 电池
关闭