当前位置:首页 > 芯闻号 > 行业动态

2025年11月13日,安谋科技Arm China在上海隆重发布新一代NPU IP“周易”X3。作为专为大模型时代打造的尖端产品,采用革命性的DSP+DSA混合架构,具备全面精度支持与多项自研硬件加速技术,致力于为智能汽车、移动终端、智能物联网等关键领域注入强大AI算力,提升端侧计算效率,推动边缘AI规模化部署。

安谋科技发布NPU IP“周易”X3,驱动架构革新再定义端侧AI

 

一、架构革新:专为大模型而生,开启浮点计算新纪元

“周易”X3的核心突破在于其底层架构的彻底革新。它采用了专为应对复杂大模型计算挑战而设计的最新DSP+DSA架构,实现了从传统定点计算向高性能浮点计算的关键跨越。该架构支持灵活的算力配置,单计算集群Cluster可提供高达8-80 FP8 TFLOPS的算力,同时单核心Core带宽飙升至256GB/s,为数据密集型的大模型应用提供了坚实的数据吞吐保障。

尤为关键的是,“周易”X3原生支持了端侧高效运行大模型所必需的W4A8与W4A16计算加速模式。通过对模型权重进行低比特量化,有效大幅降低了内存带宽消耗,打通了云端大模型向资源受限的端侧设备高效迁移的技术路径。

安谋科技发布NPU IP“周易”X3,驱动架构革新再定义端侧AI

 

二、性能飞跃:算力密度与效率双提升,大模型能力激增十倍

得益于架构的根本性升级,“周易”X3在性能上实现了质的飞跃。官方数据显示,相较于前代“周易”X2,新一代“周易”X3在处理广泛应用的CNN模型时,性能提升高达30%至50%。更为惊人的是,在相同算力规格下,其AIGC大模型处理能力实现了10倍级的跨越式增长。这一惊人表现,源于其16倍的FP16 TFLOPS算力提升、4倍的计算核心带宽增长,及超过10倍的Softmax和LayerNorm关键运算性能强化。实测标明,多核协同工作的算力线性度达到了优异的70%-80%,确保了算力的高效利用。

在实际大模型推理测试中,“周易”X3的表现同样耀眼。在运行Llama2 7B等主流大模型时,其预填充Prefill阶段的算力利用率高达72%,而在关键的解码Decode阶段,在安谋科技自研解压硬件WDC的加持下,有效带宽利用率更是突破了100%,远超行业平均水平,充分释放了硬件的潜在算力,为大模型在端侧的流畅运行提供了极致性能保障。

安谋科技发布NPU IP“周易”X3,驱动架构革新再定义端侧AI

 

三、关键技术突破:四大核心引擎,精准破解端侧AI难题

“周易”X3并非简单的性能堆砌,而是通过一系列集成化的硬件创新,精准解决了端侧部署AI大模型面临的带宽、调度、精度适配等核心难题。

“周易”X3搭载自研解压硬件WDC,创新性地集成了权重解压硬件单元,支持对大模型权重进行软件无损压缩后直接硬件解压,带来约15%的等效带宽提升,有效缓解了内存墙压力。同时,集成的AI专属硬件引擎AIFF与专用硬化调度器,将CPU负载降至0.5%以下,并显著降低了任务调度延迟。这使得NPU在并行处理多路AI任务时,即使在高优先级任务需即时响应的复杂场景下,仍能保持系统流畅高效运行。

“周易”X3还支持int4/int8/int16/int32/fp4/fp8/fp16/bf16/fp32等多精度融合计算与强浮点运算能力。凭借其全面的整数与浮点计算支持,该NPU IP能够无缝适配从传统CNN模型到前沿Transformer大模型的多样化计算需求,在智能手机边缘推理、AI PC、智能汽车等不同应用中实现性能与能效的精准平衡。此外,新增的端侧大模型必备W4A8/W4A16计算加速模式,可对模型权重进行低比特量化,大幅降低带宽消耗,有效支持云端大模型向端侧的高效迁移。

安谋科技发布NPU IP“周易”X3,驱动架构革新再定义端侧AI

 

写在最后

安谋科技Arm China “周易”X3 NPU IP的发布,标志着端侧AI计算能力迈上了一个全新台阶。其兼具高性能、高能效与高灵活性的特点,将直接赋能智能汽车、移动终端、智能物联网、基础设施等领域。配合其成熟易用的“周易”NPU Compass AI软件平台,构成了一个完整的软硬件一体化解决方案,将极大降低开发门槛,推动创新AI应用在各行各业的快速孵化和部署。


本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除( 邮箱:macysun@21ic.com )。
换一批
延伸阅读

在电子工程领域,JTAG(Joint Test Action Group)技术已成为芯片测试和系统调试的核心工具。从1980年代为解决PCB制造问题而诞生,到如今广泛应用于FPGA配置、嵌入式系统调试和芯片级编程,JTA...

关键字: JTAG ARM

在万物互联的智能时代,嵌入式微处理器如同数字世界的神经末梢,支撑着从智能手表到工业机器人的各类设备运行。ARM、MIPS、RISC-V三大主流架构凭借各自的技术优势,在嵌入式领域形成了三足鼎立的格局。本文将从技术特性、应...

关键字: ARM MIPS RISC - V

当地时间周三,Arm 控股公司CEO(首席执行官)雷内・哈斯(Rene Haas)在接受 CNBC 主持人吉姆・克莱默采访时表示,将部分 AI 功能移出云端,有助于降低能源消耗。

关键字: 数据中心 ARM AI

北京2025年10月13日 /美通社/ -- 秋风送爽,丰收正当时。2025年10月10日至11日,"再生农业,生生不息——梨树耘远农场主题研讨会暨丰收测产活动"在吉林省拜耳梨树耘远农场成功举办。产学...

关键字: 可持续发展 研讨会 ARM BSP

Arm Lumex CSS平台的发布,不仅标志着移动计算迈向AI优先的新时代,更彰显了Arm以生态协同与技术创新驱动未来的雄心。从SME2赋能的5倍AI性能飞跃,到SI L1与MMU L1的系统级优化,Lumex为旗舰智...

关键字: AI ARM Lumex CCS

ARM系统几乎都采用Linux的操作系统,而且几乎所有的硬件系统都要单独构建自己的系统,与其他系统不能兼容,这也导致其应用软件不能方便移植,这一点一直严重制约了ARM系统的发展和应用。GOOGLE开发了开放式的Andro...

关键字: Linux x86 ARM
关闭