当前位置:首页 > 芯闻号 > 美通社全球TMT
[导读]北京2025年10月28日 /美通社/ -- 近日,在ICCV 2025自动驾驶国际挑战赛(Autonomous Grand Challenge 2025)中,浪潮信息AI团队凭借其提出的创新框架"SimpleVSF",以53.06的EPDMS综合得分,在端到...

北京2025年10月28日 /美通社/ -- 近日,在ICCV 2025自动驾驶国际挑战赛(Autonomous Grand Challenge 2025)中,浪潮信息AI团队凭借其提出的创新框架"SimpleVSF",以53.06的EPDMS综合得分,在端到端自动驾驶赛道中夺得冠军。该项目创新构建以鸟瞰视图感知轨迹预测为核心、视觉-语言多模态大模型辅助判断的融合方案,发挥大模型泛化能力,突破现有端到端自动驾驶模型在复杂交通场景"难以自主判断"的局限,实现性能领先,为高动态、高交互交通环境下的智能决策提供了全新思路。

浪潮信息AI团队斩获端到端自动驾驶赛道第一名


浪潮信息AI团队斩获端到端自动驾驶赛道第一名

ICCV2025自动驾驶挑战赛是自动驾驶与具身智能领域极具影响力的国际赛事。本届比赛共设三大赛道,此次浪潮信息AI团队所登顶的端到端自动驾驶赛道(NAVSIM v2 End-to-End Driving Challenge)是ICCV2025最受关注的赛道之一。比赛以NAVSIM v2数据驱动仿真框架作为评估平台,主要考验纯视觉环视相机输入的轨迹预测与行为规划能力,要求在保证行车安全性的前提下,优化车辆的前进效率、避障能力、可行驶区域、驾驶舒适度等九项关键指标,避免模型只在某一单项上表现突出的缺陷。该赛道吸引了来自中国、韩国、瑞典的多家头部智驾企业及知名高校与研究机构。

端到端自动驾驶:挑战基于语义理解的类人决策

当前,端到端自动驾驶(End-to-End Autonomous Driving)通过端到端优化有效减少了传统模块化方法中各组件间的误差累积与信息损失,被广泛认为是实现智能驾驶的重要发展方向。然而,端到端自动驾驶系统在复杂现实路况中的决策能力仍不理想,主要问题在于:现有方法虽能准确识别车辆、车道等实体元素,却难以理解如礼让行人、拥堵跟车等高层次语义与场景常识。因此,在复杂长尾场景下,系统往往仅能依据数据关联做出反应,而无法真正解读交通参与者意图或交互逻辑,从而出现次优决策,限制了其在真实开放道路中的可靠性与泛化能力。

在此基础上,如何将深层语义认知能力融入轨迹规划流程,成为了更深层次的技术挑战。首先,将视觉语言模型输出的抽象认知指令,转化为驱动控制系统所需的具象数值化特征,本身就是一个复杂的表示学习问题。其次,在轨迹选择阶段,如何平衡数据驱动的量化评分与知识驱动的语义判断,确保所选轨迹不仅在数学上最优,也在语义和场景常识上合理安全,成为感知与决策间的关键障碍。

本届赛题旨在提升端到端自动驾驶模型在复杂动态环境中高效可靠决策的能力。竞赛分为两阶段:第一阶段采用真实场景数据,第二阶段则基于真实场景通过Gaussian Splatting技术生成合成场景,以测试模型对"非真实但物理合理"场景的泛化能力;同时引入"反应式背景交通参与者",即周围车辆和行人不再是预先设定、机械运动的,而是会根据自车的实时行为做出动态、仿真的反应,这要求模型具备更深层次的交互式预测与意图理解能力,而非简单的轨迹外推。

NAVSIM v2端到端自动驾驶赛题任务概览


NAVSIM v2端到端自动驾驶赛题任务概览

EPDMS 53.06分,SimpleVSF框架让自动驾驶模型"懂场景、会思考"

在端到端自动驾驶赛道中,浪潮信息AI团队所提出的SimpleVSF(Simple VLM-Scoring Fusion)框架,有效弥合了传统轨迹规划与视觉语言模型语义理解之间的关键鸿沟,推动自动驾驶决策从"纯几何式"向"认知式"转变。该框架通过引入VLM(Vision-Language Model)与双重融合决策机制,赋予系统深层的场景理解与推理能力,从根本上解决了现有方案在复杂交通语义认知上的不足,成为应对NAVSIM v2等高难度挑战、实现高鲁棒性驾驶的关键。其主要技术创新包括:

  • VLM增强打分机制,决策质量与场景适应性显著提升

通过将前视图像与车辆状态输入VLM模型,生成"加速、右转"等认知指令,再经编码器转换为数值特征,与感知特征融合后输入评分网络。该机制使轨迹评估不再局限于几何信息,更融入了对交通意图与场景语义的理解,从而显著提升了系统在复杂与长尾场景下的决策质量与鲁棒性。实验表明,此VLM增强打分机制为单一模型带来2%的性能提升,在融合决策中提升幅度达到6%。

SimpleVSF算法架构图


SimpleVSF算法架构图

  • 双重融合决策机制,量化权衡与语义裁决能力双重突破

权重融合器作为定量聚合的核心,采用固定权重与动态权重相结合的策略,对多个评分器给出的分数进行精准的加权融合,确保最终轨迹在各项量化指标上达到最优。

基于VLM的选择融合器则将各评分器选出的最优轨迹进行视觉渲染,并交由VLM进行最终评判,利用其高层次语义理解能力,选择出最符合上下文场景、最安全合理的轨迹路径。

融合机制的引入使决策效果显著提升,融合后的结果相比单一模型性能提升达10%。

基于VLM的轨迹选择方法


基于VLM的轨迹选择方法

  • 更坚实的基础模型协同,系统性能与鲁棒性全面提升

该框架采用扩散模型生成高质量的多样化候选轨迹,奠定规划基础;运用ViT-L等先进视觉骨干网络进行高效、鲁棒的环境特征提取,为下游任务提供可靠表征;并引入Qwen2.5VL系列视觉语言模型,利用其在场景理解与指令生成方面的语义优势,确保系统整体性能基础的坚实与领先。

基于VLM自动驾驶决策系统的算法创新,"SimpleVSF"算法框架成功登顶端到端自动驾驶赛道(NAVSIM v2 End-to-End Driving Challenge)榜单,以53.06的EPDMS综合得分创造了本赛道的最高成绩,为探索更高级别的端到端自动驾驶技术提供了有力的支撑与经验。

浪潮信息AI团队此次夺冠,是继22、23年登顶nuScenes 3D目标检测纯视觉及多模态榜单,24年在CVPR自动驾驶国际挑战赛"Occupancy & Flow"赛道夺冠后的又一重要成果。未来,浪潮信息AI团队将践行多角度切入,发挥算法、算力融合的AI全栈优化能力,推动自动驾驶领域的技术创新发展。

* 备注:文内所涉术语解释如下 

扩展预测性驾驶模型评分(The Extended Predictive Driver Model Score,EPDMS):该指标综合考量轨迹预测与真实轨迹的贴合度、碰撞风险、可行驶区域规范性、车道居中性、通行效率及舒适性等多个维度,全面反映自动驾驶系统的综合表现;

高斯泼溅(Gaussian Splatting):一种新兴的三维场景表示与渲染技术;

鸟瞰视图(Bird's Eye View,BEV):是指将特征信息转化至鸟瞰视角;

自车(ego-car):在自动驾驶领域指代当前车辆自身,通常作为运动主体参与轨迹规划、环境感知等任务;

鲁棒(Robust):是指系统在一定的参数摄动下,维持其它某些性能的特性。

 

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除( 邮箱:macysun@21ic.com )。
换一批
延伸阅读

特朗普集团近日取消了其新推出的T1智能手机“将在美国制造”的宣传标语,此举源于外界对这款手机能否以当前定价在美国本土生产的质疑。

关键字: 特朗普 苹果 AI

美国总统特朗普在公开场合表示,他已要求苹果公司CEO蒂姆·库克停止在印度建厂,矛头直指该公司生产多元化的计划。

关键字: 特朗普 苹果 AI

4月10日消息,据媒体报道,美国总统特朗普宣布,美国对部分贸易伙伴暂停90天执行新关税政策,同时对中国的关税提高到125%,该消息公布后苹果股价飙升了15%。这次反弹使苹果市值增加了4000多亿美元,目前苹果市值接近3万...

关键字: 特朗普 AI 人工智能 特斯拉

3月25日消息,据报道,当地时间3月20日,美国总统特朗普在社交媒体平台“真实社交”上发文写道:“那些被抓到破坏特斯拉的人,将有很大可能被判入狱长达20年,这包括资助(破坏特斯拉汽车)者,我们正在寻找你。”

关键字: 特朗普 AI 人工智能 特斯拉

1月22日消息,刚刚,新任美国总统特朗普放出重磅消息,将全力支持美国AI发展。

关键字: 特朗普 AI 人工智能

特朗普先生有两件事一定会载入史册,一个是筑墙,一个是挖坑。在美墨边境筑墙的口号确保边境安全,降低因非法移民引起的犯罪率过高问题;在中美科技产业之间挖坑的口号也是安全,美国企业不得使用对美国国家安全构成威胁的电信设备,总统...

关键字: 特朗普 孤立主义 科技产业

据路透社1月17日消息显示,知情人士透露,特朗普已通知英特尔、铠侠在内的几家华为供应商,将要撤销其对华为的出货的部分许可证,同时将拒绝其他数十个向华为供货的申请。据透露,共有4家公司的8份许可被撤销。另外,相关公司收到撤...

关键字: 华为 芯片 特朗普

曾在2018年时被美国总统特朗普称作“世界第八奇迹”的富士康集团在美国威斯康星州投资建设的LCD显示屏工厂项目,如今却因为富士康将项目大幅缩水并拒绝签订新的合同而陷入了僵局。这也导致富士康无法从当地政府那里获得约40亿美...

关键字: 特朗普 富士康

今年5月,因自己发布的推文被贴上“无确凿依据”标签而与推特发生激烈争执后,美国总统特朗普签署了一项行政令,下令要求重审《通信规范法》第230条。

关键字: 谷歌 facebook 特朗普

众所周知,寄往白宫的所有邮件在到达白宫之前都会在他地进行分类和筛选。9月19日,根据美国相关执法官员的通报,本周早些时候,执法人员截获了一个寄给特朗普总统的包裹,该包裹内包含蓖麻毒蛋白。

关键字: 美国 白宫 特朗普
关闭