当前位置:首页 > 厂商动态 > 亚马逊云科技
[导读]Palmyra X5是专为高效驱动多步骤agents而开发的模型,现仅可通过Writer和Amazon Bedrock以完全托管的方式提供。

北京——2025年4月29日 亚马逊云科技宣布,在Amazon Bedrock上正式推出Palmyra X5——这是一款全新的具备一百万token上下文窗口的自适应推理模型。该模型由企业级生成式AI领军企业Writer发布,是首批在Amazon Bedrock提供如此大规模上下文窗口的模型之一。该模型在速度和成本效率方面进行了优化,使客户能够构建先进的多步骤AI agents,并能精确处理海量企业数据,从根本上改变了推理方式。亚马逊云科技现已成为首家且目前唯一提供Writer完全托管、无服务器模型的云提供商,包括最新Palmyra X5及Palmyra X4,其他更多模型也将很快上线。

随着生成式AI技术的加速发展,客户需要广泛的模型选择以精准匹配业务需求。Writer模型在Amazon Bedrock的推出,进一步丰富了Amazon Bedrock广泛的完全托管模型的选择,这些模型均来自领先的AI企业,帮助客户能更轻松、安全地构建和扩展生成式AI应用,推动业务转型与创新。

Palmyra X5是首批在Amazon Bedrock提供一百万token上下文窗口的模型之一,为亚马逊云科技的客户提供更多选择(上下文窗口指一个模型每次输入/请求能处理和"记忆"的信息量。它以模型处理的最小文本单位token为计量单位,可视为模型的"短期记忆")。凭借这种规模的上下文窗口,Palmyra可精准处理1500页内容(相当于6本书)。该模型还是业界首批企业级自适应推理模型之一,并兼具先进的大语言模型能力以及扩展的记忆、处理能力。企业现可在预算范围内处理广泛任务,包括财务报告、法律合同分析、医疗记录整合、客户反馈挖掘等。

除推理能力外,Palmyra X5 还具有多项强大功能,能够支持与系统交互的agents、支持高级代码生成与部署,并支持超过30种语言。

Palmyra X5介绍:

若将Palmyra X5模型拟人化,它就像具有超能力——可在22秒内读完一百万个单词的内容,并即时生成可执行的见解。它不仅能完整记忆200页战略文档的全部内容,更能理解其与昨天的客户会议、上个季度财务数据的内在关联。面对复杂的问题时,它能系统化地逐步推进解决方案,全程清晰阐述思考路径——无论是帮助分析海量客户反馈以提炼共性,还是排查技术故障。

Writer首席技术官兼联合创始人Waseem AlShikh表示:"我们选择亚马逊云科技作为首家提供Writer完全托管模型的主流云服务提供商,源于其无与伦比的安全性,以及双方在变革企业AI应用方式、驱动创新增长愿景上的高度契合。Palmyra X5是Writer迄今最先进的模型,它能高速处理海量企业数据,这对于扩展多代理系统(multi-agent systems)至关重要。通过Amazon Bedrock,我们将这些强大功能带给全球更多企业,帮助客户在安全、可扩展的环境中部署。"

亚马逊云科技Amazon Bedrock总监Atul Deo表示:"基于与Writer的深度战略合作,我们很高兴通过Amazon Bedrock提供Writer的Palmyra系列模型,赋能企业开启智能Agent创新的新时代。Palmyra X5在长上下文窗口中提供卓越性能,兼具企业级可靠性与速度。无缝接入Writer的Palmyra X5将让开发者和企业利用亚马逊云科技的安全性、扩展性和性能,构建和扩展AI agents,实现海量企业数据推理范式的革新。"

数据解析:

• Palmyra X5是最高效的大规模上下文大语言模型之一,对速度与成本均进行了优化。它可在约22秒内处理完整百万token提示词,单次函数调用响应仅需约0.3秒。

• 在最新Longbench v2评测中,Palmyra X5以53%的平均得分展现其同类领先的性价比。企业在大幅降低每百万token成本的同时,可获得接近顶级的准确性,在预算可控的情况下,可执行大量agents与长上下文处理任务。

• 支持30多种语言,为全球企业提供真正的多语言处理能力。

• 定价为每百万输入token 0.60美元,每百万输出token 6美元,是目前最具成本效益的大规模上下文大语言模型之一。

• 在BigCodeBench (完整版, 指令版)评估中,Palmyra X5以48.7分位列顶级模型,展现了其解决实用且具有挑战性的复杂编程任务的能力。

尽管生成式AI正在改变我们创建、分析和交互信息的方式,但Agentic AI将从根本上重塑工作本质。AI的这一新前沿超越了内容生成与洞察提炼,转向能够自主规划、执行和调整复杂动作序列的AI agents。通过Amazon Bedrock提供的Palmyra X5,亚马逊云科技的客户可使用Writer的模型安全私密地构建和扩展AI agents,无需管理底层基础设施。此外,对各行业的企业来说,Palmyra X5最令人振奋的是能够构建和部署更复杂的AI agents,这些agents可以处理海量数据,并与其他agents、大语言模型及外部系统工具进行交互。

Writer提供精确且完全自主的模型,杜绝后期训练量化与知识蒸馏,确保今天验证的行为模式与明天的行为模式保持一致。Palmyra X5在此基础上强化技术承诺,严格保持后向兼容性以避免团队重复调优流程的痛苦,同时发布客户可参与制定的公开企业技术路线图,并通过优化推理延迟,使即便在百万token量级下,大语言模型交互和检索增强生成(RAG)也能实现近乎即时的响应。

Writer宣布,得益于创新型Transformer设计(一种支持输入数据并行处理而非顺序处理的架构)与混合注意力机制(允许多种方式同时关注信息,既保证效率也确保效果),其未来发布的所有大语言模型将以一百万token作为最小上下文窗口规模。这意味着企业可基于持续扩展的AI能力制定长期战略,而不受限于上下文窗口的规模约束。

访问亚马逊云科技新闻博客获取Palmyra X5的详细信息,包括模型在Amazon Bedrock的部署方法与潜在用例,并查看Amazon Bedrock中的Writer产品页面。立即访问Amazon Bedrock控制台开始使用Palmyra X5和 Palmyra X4

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

9月2日消息,不造车的华为或将催生出更大的独角兽公司,随着阿维塔和赛力斯的入局,华为引望愈发显得引人瞩目。

关键字: 阿维塔 塞力斯 华为

加利福尼亚州圣克拉拉县2024年8月30日 /美通社/ -- 数字化转型技术解决方案公司Trianz今天宣布,该公司与Amazon Web Services (AWS)签订了...

关键字: AWS AN BSP 数字化

伦敦2024年8月29日 /美通社/ -- 英国汽车技术公司SODA.Auto推出其旗舰产品SODA V,这是全球首款涵盖汽车工程师从创意到认证的所有需求的工具,可用于创建软件定义汽车。 SODA V工具的开发耗时1.5...

关键字: 汽车 人工智能 智能驱动 BSP

北京2024年8月28日 /美通社/ -- 越来越多用户希望企业业务能7×24不间断运行,同时企业却面临越来越多业务中断的风险,如企业系统复杂性的增加,频繁的功能更新和发布等。如何确保业务连续性,提升韧性,成...

关键字: 亚马逊 解密 控制平面 BSP

8月30日消息,据媒体报道,腾讯和网易近期正在缩减他们对日本游戏市场的投资。

关键字: 腾讯 编码器 CPU

8月28日消息,今天上午,2024中国国际大数据产业博览会开幕式在贵阳举行,华为董事、质量流程IT总裁陶景文发表了演讲。

关键字: 华为 12nm EDA 半导体

8月28日消息,在2024中国国际大数据产业博览会上,华为常务董事、华为云CEO张平安发表演讲称,数字世界的话语权最终是由生态的繁荣决定的。

关键字: 华为 12nm 手机 卫星通信

要点: 有效应对环境变化,经营业绩稳中有升 落实提质增效举措,毛利润率延续升势 战略布局成效显著,战新业务引领增长 以科技创新为引领,提升企业核心竞争力 坚持高质量发展策略,塑强核心竞争优势...

关键字: 通信 BSP 电信运营商 数字经济

北京2024年8月27日 /美通社/ -- 8月21日,由中央广播电视总台与中国电影电视技术学会联合牵头组建的NVI技术创新联盟在BIRTV2024超高清全产业链发展研讨会上宣布正式成立。 活动现场 NVI技术创新联...

关键字: VI 传输协议 音频 BSP

北京2024年8月27日 /美通社/ -- 在8月23日举办的2024年长三角生态绿色一体化发展示范区联合招商会上,软通动力信息技术(集团)股份有限公司(以下简称"软通动力")与长三角投资(上海)有限...

关键字: BSP 信息技术
关闭