当前位置:首页 > 芯闻号 > 美通社全球TMT
[导读]全面定义大模型长时运行与混沌负载特征,推进行业分工与消费端质量监控标准化 北京2026年6月11日 /美通社/ --  2026年以来,随着Claude Code、OpenClaw等智能体(AI Agent)技术的全面破圈,AGI正式迈入新纪元。正如黄仁勋在GTC 2...

全面定义大模型长时运行与混沌负载特征,推进行业分工与消费端质量监控标准化

北京2026年6月11日 /美通社/ --  2026年以来,随着Claude Code、OpenClaw等智能体(AI Agent)技术的全面破圈,AGI正式迈入新纪元。正如黄仁勋在GTC 2026主题演讲中所强调的:大语言模型(LLM)正从简单的对话机器人,加速演进为能够自主规划、推理并采取行动以达成复杂目标的长时运行系统。这一趋势下,大模型推理算力需求呈井喷式增长,"Token工厂"概念跃升为资本、产业与技术界的核心焦点。

然而,智能体(Agentic)的工作负载与传统的人类对话交互在结构上截然不同。它通常呈现为长周期的多轮循环,在"推理阶段"和"行动阶段"之间高频切换。随着AI从"对话式生成"全面驶入"自主智能体"的深水区,算力基础设施的生产、度量与消耗标准迎来解构性变革。

今日,软通动力正式宣布,其首个标杆示范项目——"北京壹号词元工厂" 正式投入运行,并同步向全球发布并开源"软通动力词元工厂性能基准"。这标志着大模型算力消耗正式告别粗放式的吞吐量比拼,步入标准化、工业化的"Token流水线"时代。

软通动力


北京壹号词元工厂:面向智能体时代的"新型电厂"

作为软通动力AI战略的重要组成部分,北京壹号词元工厂聚焦Agentic Serving(智能体服务)场景,通过极限工程化手段压榨硬件性能,集成前沿算力调度与KV Cache极致复用算法,以确定性的服务质量与极致的性价比,向全社会输出标准化的"数字燃料"——Token,为智算时代提供确定性、高弹性的供应保障。

北京壹号词元工厂项目负责人表示:"北京作为全国AI创新高地,集聚了最多的大模型公司和智能体应用团队,对新型算力服务的需求最迫切、最前沿。建设与之匹配的'Token工厂'是北京打造'全球数字经济标杆城市'的必然要求。Agentic Serving带来了天然复杂的业务逻辑。一个简单的最终指令背后,可能是模型内部数十次推理循环、工具调用与自我反思的叠加。这种极度的不确定性,使得传统的静态压测指标完全失效。行业陷入'指标迷雾':底层建设者不知如何针对长上下文优化架构,算力运营者难以预估动态波动下的并发水位,企业级使用者缺乏明确的SLA作为采购依据,最终用户则频繁遭遇首字延迟不可控和推理中途断线的糟糕体验。我们发布这一基准,正是为了打造统一的'标杆之镜'。"

软通动力


同步发布:开源词元工厂性能基准

为了精准捕捉并复现智能体服务环境中的极端压力,软通动力在发布会上宣布:正式开源词元工厂性能基准,该基准不是单一工具,而是一个三层递进的完整评测体系,遵循"一个基准(刻画方法)",采用"三类测试方法",构建"分领域标准数据集" ,实现对算力集群真实服务能力的精准评估与公平对比。

软通动力对基于大模型发展初期行业通用的MLPerf LoadGen进行了深度重构,实现了从静态并发注入到动态行为仿真的跨越,发展出了 LoadGen 2.0。其核心突破在于:成功在测试环境中定义并重现了真实的"混沌局面",它定义了"大家共识的混沌系统如何刻画和重现"——这是所有评测的根基。

以此为根基,软通动力构建了三层递进的完整评测体系:

  • 底层——混沌负载刻画方法:LoadGen 2.0通过引入"多轮状态保持(Stateful Turn-based)"模拟机制和混合泊松分布逻辑,成功在测试环境中模拟出真实的"混沌局面"——包括轮次间隔的严重抖动、上下文指数级膨胀(Context Ballooning)、KV Cache反复置换等高动态场景。它能够还原灰度生产环境中长时智能体之间交织、重叠且不可预测的计算请求,帮助开发者和运营者在系统上线前探明集群面对极端混沌负载时的性能崩溃边界与资源调度瓶颈。
  • 中层——三类标准测试方法:额定功率测试、业务测试、精度正确性测试,形成完整的评测流程,确保评测结果可复现、可对比。
  • 上层——分领域标准数据集:面向代码生成、科学研究、通用对话等不同领域的标准数据集,使评测与真实应用场景对齐,避免"高分低能"或参数虚标。

软通动力


LoadGen 2.0已完全开源(GitHub: github.com/issair/loadgen2)。

软通动力的核心能力

随着技术成熟,大模型行业正复制传统工业的发展轨迹——模型算法研发、算力基础设施运营(Token生产)、智能体路由分发以及垂直场景应用逐步解耦。专业的Token工厂需要具备"软硬一体"的全栈能力。

软通动力在以下方面形成了差异化能力

  • 硬件端:具备万卡级信创+国际混合集群的规划建设能力,拥有芯片级维修与全国备件库,保障硬件基础设施的持续可用。
  • 软件端:自主研发天元调度平台与全栈观测指标体系(TTFT、TPOT、TPS per GPU等),实现Token生产的全链路透明与智能调度。
  • 国家级调度平台经验:作为牵头单位承建"韶关公共算力服务平台"(全国一体化算力网算力监测调度项目),具备跨域、跨主体的算力并网与调度实战经验。北京壹号Token工厂正是这一调度能力的集中体现。
  • 行业生态:软通动力深耕企业服务20年,覆盖金融、政务、能源、制造、互联网等关键行业,能够将Token能力与行业场景深度结合。

目前,软通动力正深度参与平潭两岸融合算力中心、韶关公共算力服务平台等国家一体化算力网络重点项目建设,并依托睿动智能体平台,打造连接国际云厂商与国产AI新势力的全球化AI双向枢纽。北京壹号词元工厂的启动,是公司推进AI基础设施布局、构建Token生态体系的重要实践。

未来,软通动力将持续推进"Token工厂"建设,并从消费者视角出发推出"实时监测"等一系列质量监控方法——如同在城市自来水管网中部署实时纯净度探针一般,在运行端动态监控Token生成的幻觉率、语义一致性及毫秒级延迟波动。这将帮助用户更直观地了解所使用算力服务的真实质量,推动行业建立更加透明、可信的评测体系。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除( 邮箱:macysun@21ic.com )。
换一批
延伸阅读

上海2026年6月11日 /美通社/ -- 6月5日,杭州柯林电气股份有限公司(以下简称"杭州柯林")召开2026年第一次临时股东会,审议通过《关于收购参股公司上海开普勒机器人有限公司部分股权暨取得控...

关键字: 进程 供应链 模型 电气

香港、北京和深圳2026年6月9日 /美通社/ -- 金融垂域 AI 大模型公司 GIM(Grace Investment Machine)近期完成天使+轮融资,由赛富投资基金(SAIF Partners)领投,某千亿市...

关键字: 模型 AI ALPHA 时序

据 Checkout.com 调研显示,33% 的消费者预计在未来一年内将有至少 10% 的购物由 AI 驱动,但消费者的愿景与全行业就绪度之间仍存在显著落差 英、美两国的商户已感知到这股速度:72% 的两国商...

关键字: 智能体 AI COM CK

上海2026年6月8日 /美通社/ -- "人工智能给软件行业带来根本性变化,以推理能力为核心的全新系统体系正在构建成型。"6月5日,在高通汽车技术与合作峰会上,阿里巴巴集团合伙人、达摩院院长、斑马智...

关键字: 模型 AI NI 高通

上海2026年6月8日 /美通社/ -- 人口老龄化加速、银发经济持续升温,智慧养老正迎来关键窗口期。6月4日至6日,在上海国际养老、辅具及康复医疗博览会(简称"上海老博会")上,国内数智照护领军企业...

关键字: 模型 温度 腾讯云 集成

宁波2026年6月8日 /美通社/ -- 6月6日,2026第23届浙商(投融资)合作周现场,一份"2026浙商AI智能体TOP40"榜单引发产业界注目。阿里巴巴、深度求索、宇树科技、云深处、强脑科技...

关键字: EPS 智能体 TOP PSE

宁波2026年6月9日 /美通社/ -- 6月6日,2026第23届浙商(投融资)合作周现场,一份"2026浙商AI智能体TOP40"榜单引发产业界注目。阿里巴巴、深度求索、宇树科技、云深处、强脑科技...

关键字: EPS 智能体 TOP PSE

作为开源的智能体 AI 安全框架,Arm Metis 支持大规模 AI 驱动的上下文安全分析,助力更早识别软件漏洞、节省时间与成本

关键字: AI 驱动 开源 软件

深圳2026年6月8日 /美通社/ -- 当人工智能加速迈入工程化深水区,产业界对实战型人才的渴求正达到前所未有的高度。近日,多部门联合印发《2026年提升全民数字素养与技能工作要点》(以下简称《工作要点》),这份文件不...

关键字: LAB OS AI 模型

深圳和上海和北京2026年6月8日 /美通社/ -- 2026年6月8日,深圳迅策科技股份有限公司(迅策科技,股票代码:3317.HK)宣布,与博泰车联网科技(上海)股份有限公司(博泰车联)、北京赛目科技股份有限公司(赛...

关键字: TOKEN 模型 AI 智能网联汽车
关闭