当前位置:首页 > 芯闻号 > 美通社全球TMT
[导读]北京2025年7月21日 /美通社/ -- 浪潮信息宣布元脑企智一体机已率先完成对Kimi K2 万亿参数大模型的适配支持,并实现单用户70 tokens/s的流畅输出速度,为企业客户高效部署应用大模型提供高处理性能和完善的软件工具平台支持。 Kimi K2是月之...

北京2025年7月21日 /美通社/ -- 浪潮信息宣布元脑企智一体机已率先完成对Kimi K2 万亿参数大模型的适配支持,并实现单用户70 tokens/s的流畅输出速度,为企业客户高效部署应用大模型提供高处理性能和完善的软件工具平台支持。

万亿参数!元脑企智一体机率先支持Kimi K2大模型


Kimi K2是月之暗面推出的开源万亿参数大模型,创新使用了MuonClip优化器进行训练,大幅提升了模型的学习效率。K2在代码生成、数学推理、Agent多步骤任务上展现出领先能力,评测指标达到业界领先水平。自发布以来,K2在开发者和研究社区引起广泛关注,迅速获得在编码辅助和Agent驱动自动化任务中的部署应用。

Kimi K2的模型总参数量达1万亿,激活参数为320亿。K2使用混合专家(MoE)模型结构,较DeepSeek V3采用了更大的参数量和更多的专家数。K2模型1万亿的参数量对AI计算系统提出至少1TB的显存容量需求,384个路由专家所带来的专家负载不均衡性对推理速度有很大影响。目前业界可公开访问的K2 API的输出速度一般低于20 tokens/s,这样较低的性能对于编程或Agent类场景很不友好,会严重影响用户体验。Kimi K2凭借其为智能体任务设计的架构和优秀的智能体验,展现出巨大的应用潜力,但提升推理速度和输出稳定性是其成为可信赖的生产力工具需要解决的核心挑战。

元脑企智一体机采用元脑服务器NF5688G7作为算力底座,其搭载FP8计算引擎,配备1128GB HBM3e高速显存,单台服务器即可支持K2 万亿参数全量模型部署。NF5688G7服务器具备900GB/s的GPU P2P带宽,为Kimi K2提供了专家间高速并行通信,最大化并行效率。该服务器可支持3200Gbps的RDMA扩展网络,为预填充-解码分离部署和大规模专家并行预留了充足的扩展空间。

浪潮信息已完成元脑企智一体机对K2的适配,支持64K上下文长度和多路用户实时并发访问。基于SGLang推理框架,通过减少MoE对齐块大小内核的小批量模式开销和fused_moe的内存消耗,并复用deepGEMM等高效算子,实现单用户并发下输出速度超过70 tokens/s,25用户并发时每用户输出速度超过25 tokens/s。优化后的计算性能可保证用户在进行复杂的代码生成、长文本书写或Agent调用时,能够获得流畅、低延迟的交互体验。

SGLang启动K2推理服务,用户交互时的解码速度


SGLang启动K2推理服务,用户交互时的解码速度

元脑企智一体机提供了元脑企智(EPAI)平台与K2大模型的无缝集成,为企业用户提供了一套软硬件协同优化、开箱即用的端到端大模型私有化部署解决方案。通过元脑企智平台,企业可利用低代码、可视化界面,便捷地进行数据准备、模型微调、知识检索(RAG)和智能体(Agent)构建。

元脑企智一体机已成功部署于金融、制造、能源、医疗等多个关键行业,帮助企业快速、安全、经济地构建专属大模型应用,加速产业智能化转型步伐。

浪潮信息是全球领先的IT基础设施产品、方案和服务提供商,通过发展新一代以系统为核心的计算架构,打造开放、多元、绿色的元脑智算产品和方案。浪潮信息致力于AI计算平台、资源平台和算法平台的研发创新,并通过元脑生态携手领先伙伴,加速人工智能的创新和应用落地。

 

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除( 邮箱:macysun@21ic.com )。
换一批
延伸阅读

重庆2026年2月11日 /美通社/ -- 2026年是国家"十五五"规划的开局之年,也是成渝地区双城经济圈建设由"积厚成势"迈向"成型成势"的关键节点。为抢占...

关键字: 智能体 人工智能 模型 节点

上海2026年2月11日 /美通社/ -- 2026年2月6日,智云上海AI STORE服务站(漕河泾)揭牌及签约仪式在桂平路391号新漕河泾国际商务中心B座1楼漕河泾共梦引擎空间隆重举行。上海梵数智算算力科技有限公司旗...

关键字: AI STORE 电信 模型

美国旧金山和中国苏州2026年2月8日 /美通社/ -- 信达生物制药集团(香港联交所股票代码:01801),一家致力于研发、生产和销售肿瘤、自身免疫、代谢、眼科等重大疾病领域创新药物的生物制药公司,宣布与礼来制药达成战...

关键字: COM 代码 创始人 控制

NLRP3是一个经过验证的抗炎靶点,可介导促炎细胞因子IL-1β和IL-18的释放。ISM5059通过靶向NLRP3,从源头阻断炎症级联反应,有望用于全身性炎症疾病治疗。 和英矽智能已经取得FDA临床试验批件的...

关键字: ISM ARMA 人工智能 模型

香港2026年2月4日 /美通社/ -- 华钦科技集团(纳斯达克代码:CLPS,以下简称"华钦科技"或"集团")今日宣布其董事会已通过一项集团股份回购计划的决议。该决议声明,当集团股价低于每股2美元时,集团可在公开市场上...

关键字: PS BSP 代码 纳斯达克

北京2026年2月4日 /美通社/ -- 从最初只能完成基础问答的聊天助手,到如今不断深入业务核心、具备自主行动能力的AI Agent,生成式AI浪潮正迈入企业创新的深水区。当AI开始深度介入企业运营和决策流程,企业应当...

关键字: AI 云服务 AGENT 亚马逊

宁波2026年2月2日 /美通社/ -- 当前,以大模型为"大脑"的智能体正掀起新一轮生产力变革。我们期待它们能像人一样理解任务、规划步骤、执行操作,成为企业的"数字员工"。 然...

关键字: 模型 AI 智能体 离散

上海2026年2月2日 /美通社/ -- 日前,在2026年美国气象学会年会上,英伟达正式推出Earth-2开放模型系列——面向人工智能气象领域的全开放、加速型模型与工具套件...

关键字: 模型 英伟达 AI NVIDIA

北京2026年1月29日 /美通社/ -- 1月22日,佛山市南海区"人工智能+医疗卫生"生态共建研讨会成功举办。市、区相关部门领导,佛山市南海区人民医院、浪潮信息、天锐医健等医疗机构及企业代表齐聚一...

关键字: AI 人工智能 模型 智慧医疗

上海2026年1月28日 /美通社/ -- 1月28日,领先的人工智能计算平台公司黑芝麻智能正式发布FAD2.0开放平台。此前,其核心算力平台——华山A2000高性能全场景通识辅助驾驶芯片已顺利通过美国商务部与国防部相关...

关键字: AD 模型 软件 芯片
关闭