当前位置:首页 > 厂商动态 > 亚马逊云科技
[导读]北京——2025年8月6日 亚马逊云科技宣布,Anthropic最新一代模型Claude Opus 4.1与Claude Sonnet 4,现已在Amazon Bedrock全面上线。这批新型双模推理模型支持在即时响应与“深度思考”模式间动态切换,为编码、高级推理及多步骤工作流树立了全新行业标杆,能够在复杂且长耗时的任务中保持稳定性能,驱动AI Agents将耗时数小时的工作压缩至分钟级完成。

北京——2025年8月6日 亚马逊云科技宣布,Anthropic最新一代模型Claude Opus 4.1与Claude Sonnet 4,现已在Amazon Bedrock全面上线。这批新型双模推理模型支持在即时响应与“深度思考”模式间动态切换,为编码、高级推理及多步骤工作流树立了全新行业标杆,能够在复杂且长耗时的任务中保持稳定性能,驱动AI Agents将耗时数小时的工作压缩至分钟级完成。

将Claude Opus 4.1和Claude Sonnet 4引入Amazon Bedrock,为客户提供了Anthropic最先进模型的选择,简化了客户借助企业级安全保障和负责任的AI管控机制,构建更优质、更具变革性应用程序的流程。

评估方法说明:

1.使用pass@1指标,结合bash、编辑器工具对Opus 4.1、Opus 4和Sonnet 4进行测试。在10次试验中取平均值,单次尝试修补,测试时不进行额外计算,采用核采样(nucleus sampling)方法,设置top_p值为0.95。

2.本文报告的所有分数均基于默认Agent框架(“Terminus 1”),并在5次试验中取平均值。

3.Claude在MMMLU上的得分,取自14种非英语语言得分的平均值。

4.Opus 4.1、Opus 4和Sonnet 4在AIME上的测试采用核采样方法,设置top_p值为0.95。

全新的Claude 4模型从根本上改变了团队处理复杂项目的方式。对于那些需要持续投入精力和深厚专业知识的大型企业而言,这一变革尤为显著。Claude 4双模推理模型支持客户在即时响应与深度推演间灵活选择,这些模型可彻底改变企业将AI应用于复杂任务和日常高容量业务操作的方式。两款模型均旨在为跨数千个步骤的多步骤工作流,提供更强大、更自主的AI Agents支持。Claude Opus 4.1也是Anthropic迄今为止功能最强的模型,编程能力冠绝业界。

Claude Opus 4.1如同一位精明能干的协作伙伴,在Agentic搜索与研究、内容创作以及记忆和上下文管理方面表现出色,能够综合提炼深刻见解、产出高质量内容并实现高效总结。

Claude Opus 4.1可直接替代Opus 4,它在实际编码和Agent任务中,展现出更出色的性能和精准度。Anthropic表示,Claude Opus 4.1是其迄今为止最智能的模型,且在编码和Agent领域处于行业领先地位。该模型具备先进的编码能力,能够独立规划并执行复杂的端到端开发任务,同时根据用户风格进行调整,并始终保持高质量输出。此外,该模型还改进了前端代码生成功能,在有效处理复杂逻辑的同时,能输出高质量的视觉效果。

另外,Opus 4.1具备出色的长期任务处理能力和复杂问题解决能力,是持续推理和长链行动中的理想虚拟协作伙伴。它还能提升AI Agents的性能,使其能够以极高的准确度应对复杂的多步骤任务。

Claude Sonnet 4则以高效性著称,将敏捷思维与实用智能完美融合,适用于各类项目。凭借速度与性能的平衡,Claude Sonnet 4可在各项任务间无缝切换,秉持务实态度,确保首次执行即能圆满完成。

Claude Sonnet 4在编码和推理能力上,均超越了其前代产品Claude Sonnet 3.7,并在性能与成本优化之间实现了平衡,非常适合处理大批量应用场景,成为大多数生产应用的理想之选。Claude Sonnet 4的应用范围十分广泛,既能为实时客户支持Agent提供支持,也能处理代码审查、漏洞修复等日常开发任务,还可作为特定任务的子Agent同时处理搜索、数据分析或内容合成等多项任务。旅游和酒店业客户可以借助Claude Sonnet 4实时处理客户请求,并以近乎实时的速度提供个性化回复。

这两款模型均具备 “深度思考”功能,使Claude能够在深度推理和行动执行两种模式间灵活切换。Claude可根据需要进行数据分析,并在工作过程中不断提高准确性,从而更精准地预判并执行后续步骤。

Anthropic公司增长与营收部门负责人Kate Jensen表示:“Claude Opus 4和Claude Sonnet 4将AI从一种工具,转变为每个人、每个团队的真正协作伙伴。我们的客户将看到项目周期大幅缩短——在许多情况下,能从数周缩短至数小时。Claude 4系列模型在编码、高级推理及多步骤工作流方面树立了新标杆,同时能全面理解业务背景并输出精准结果。其真正的突破在于,Claude承担了大量繁重工作,让团队人才得以专注于战略性工作。”

核心信息

新一代Claude模型标志着Agentic AI能力的重大飞跃,彻底改变了企业将AI应用于专业复杂任务和日常高容量运营的方式。Claude Opus 4.1和Claude Sonnet 4不再局限于内容生成,而是更像专业的虚拟协作伙伴,能够在复杂任务中保持专注,留存相关上下文信息,无需提供持续指导即可提供完整的解决方案。

这一能力革新了企业应对挑战的方式,从软件开发到营销策略制定均可适用。对于日常用户而言,这意味着他们可以使用更懂自身需求的AI,且该AI能独立承担项目中更大比例的工作。

数据解读:

两款模型均配备20万token的上下文窗口,能让用户处理和生成大篇幅内容(如文档分析和研究工作),且始终保持内容质量与连贯性。token是模型可处理的最小文本数据单位(例如一个单词、短语或单个字符)。较长的响应在丰富的代码生成和内容创作中效果尤为显著。

据Anthropic介绍,Claude Opus 4.1在SWE-bench基准测试中,将其顶尖的编码性能提升至74.5%,实现了稳定且显著的进步,助力开发人员及其应用始终保持领先地位。与前代产品相比,Claude Opus 4.1能够更专注更精准地浏览大型代码库,并擅长处理长时间运行的任务,对编码Agent的规划和协调能力也有所提升。除编码外,Opus 4.1还增强了Claude的深度研究和数据分析能力,尤其是在细节追踪和Agent搜索方面。

两款模型能够在提供快速直接答案与逐步推理解答之间灵活切换,在关键行业基准测试中,大幅提升了多步骤工作流程的性能表现。

据Anthropic公司称,Claude Opus 4.1和Claude Sonnet 4预示着未来AI系统,将在创意工作和知识型工作中成为能力日益强大的合作伙伴。例如,它们可在企业中承担更多专业角色,如处理日常分析工作、跨部门协作,甚至在极少监督的情况下管理完整的工作流程。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

9月2日消息,不造车的华为或将催生出更大的独角兽公司,随着阿维塔和赛力斯的入局,华为引望愈发显得引人瞩目。

关键字: 阿维塔 塞力斯 华为

加利福尼亚州圣克拉拉县2024年8月30日 /美通社/ -- 数字化转型技术解决方案公司Trianz今天宣布,该公司与Amazon Web Services (AWS)签订了...

关键字: AWS AN BSP 数字化

伦敦2024年8月29日 /美通社/ -- 英国汽车技术公司SODA.Auto推出其旗舰产品SODA V,这是全球首款涵盖汽车工程师从创意到认证的所有需求的工具,可用于创建软件定义汽车。 SODA V工具的开发耗时1.5...

关键字: 汽车 人工智能 智能驱动 BSP

北京2024年8月28日 /美通社/ -- 越来越多用户希望企业业务能7×24不间断运行,同时企业却面临越来越多业务中断的风险,如企业系统复杂性的增加,频繁的功能更新和发布等。如何确保业务连续性,提升韧性,成...

关键字: 亚马逊 解密 控制平面 BSP

8月30日消息,据媒体报道,腾讯和网易近期正在缩减他们对日本游戏市场的投资。

关键字: 腾讯 编码器 CPU

8月28日消息,今天上午,2024中国国际大数据产业博览会开幕式在贵阳举行,华为董事、质量流程IT总裁陶景文发表了演讲。

关键字: 华为 12nm EDA 半导体

8月28日消息,在2024中国国际大数据产业博览会上,华为常务董事、华为云CEO张平安发表演讲称,数字世界的话语权最终是由生态的繁荣决定的。

关键字: 华为 12nm 手机 卫星通信

要点: 有效应对环境变化,经营业绩稳中有升 落实提质增效举措,毛利润率延续升势 战略布局成效显著,战新业务引领增长 以科技创新为引领,提升企业核心竞争力 坚持高质量发展策略,塑强核心竞争优势...

关键字: 通信 BSP 电信运营商 数字经济

北京2024年8月27日 /美通社/ -- 8月21日,由中央广播电视总台与中国电影电视技术学会联合牵头组建的NVI技术创新联盟在BIRTV2024超高清全产业链发展研讨会上宣布正式成立。 活动现场 NVI技术创新联...

关键字: VI 传输协议 音频 BSP

北京2024年8月27日 /美通社/ -- 在8月23日举办的2024年长三角生态绿色一体化发展示范区联合招商会上,软通动力信息技术(集团)股份有限公司(以下简称"软通动力")与长三角投资(上海)有限...

关键字: BSP 信息技术
关闭