GPT-4全面被超越！全球最强大模型一夜易主 - 21ic电子网

当前位置：首页 > > 动态报道

[导读]Anthropic刚刚官宣：Claude 3来了！

Anthropic刚刚官宣：Claude 3来了！

作为OpenAI最强竞争选手，此次它发布的新模型家族，以最强版Claude 3 Opus为代表，“已经实现了接近人类的理解能力”——

在推理、数学、编码、多语言理解和视觉方面，全面超越GPT-4在内的所有大模型，直接重新树立行业基准的那种。

浅看一下这份成绩单，就十分扎眼~

几项数学类评测都是用0-shot超越GPT-4的4-8 shot。

除此之外，此前就以长下文窗口见长的Claude，此次全系列大模型可提供 200K 上下文窗口，并且接受超过100万Tokens输入。

Gemini 1.5 Pro：嗯？

目前可以免费体验第二强Sonnet，Opus最强版供Claude Pro付费用户使用，但大模型竞技场也可以白嫖。于是乎，网友们已经开始疯玩上了。（Doge）

另外，Opus和Sonnet也开放API访问，开发者可以立即使用。

有人直接艾特奥特曼：好了，你现在可以发布GPT-5了。

不过奥特曼可能还在烦马斯克的诉讼……

最新最强大模型发布

此次Claude 3家族共有三个型号：小杯Haiku、中杯Sonnet以及大杯Opus，成本和性能依次递增。

首先，在性能参数上，Claude 3全系多方面全面提升。其中Opus在MMLU、GPQA、GSM8K等评估基准上领先于其他所有模型：

还有在视觉能力上，它能可以处理各种视觉格式，包括照片、图表、图形和技术图表。

对于这样性能结果，有专业人士表达了自己的看法。

比如爱丁堡大学博士生、中文大模型知识评估基准C – Eval提出者之一符尧就表示，像MMLU / GSM8K / HumanEval这些基准，已经严重饱和：所有模型的表现都相同。

他认为，真正区分模型性能基准的是MATH and GPQA。

另外，在拒绝回答人类问题方面，Claude 3也前进了一大步，拒绝回答的可能性显著降低

在上下文以及记忆能力上，他们用大海捞针（Needle In A Haystack，NIAH）来评估衡量大模型从大量数据中准确召回信息的能力。

结果Claude 3 Opus 不仅实现了近乎完美的召回率，超过 99% 的准确率。而且在某些情况下，它甚至能识别出 “针 “句似乎是人为插入原文的，从而识别出评估本身的局限性。

还在生物知识、网络相关知识等方面取得了进步，但出于负责任的考虑，仍处于AI安全级别2（ASL-2）。

其次，在响应时间上，Claude 3大幅缩短，做到近乎实时。

官方介绍，即将发布的小杯Haiku能够在三秒内阅读并理解带有图表的长度约10k token的arXiv论文。

而中杯Sonnet能够在智能水平更高的基础上，速度比Claude 2和Claude 2.1快2倍，尤其擅长知识检索或自动化销售等需快速响应的任务。

大杯Opus的智能水平最高，但速度不减，与Claude 2和Claude 2.1近似。

官方对三款型号的模型也有清晰的定位。

大杯Opus：比别家模型更智能。适用于复杂的任务自动化、研发和制定策略；

中杯Sonnet：比其他同类模型更实惠。更适合规模化。适用于数据处理、RAG、在中等复杂度工作流程中节省时间；

小杯Haiku：比同类模型更快速、实惠。适用于与用户实时互动，以及在简单工作流程中节省成本；

在价格方面，最便宜的小杯定价0.25美元/1M tokens输入，最贵的大杯定价75美元/1M tokens输入

对比GPT-4 Turbo，大杯价格确实高出不少，也能体现AnthropicAI对这款模型非常有信心。

第一手实测反馈

既如此，那就先免费来尝尝鲜~

目前官方页面已经更新，Claude展现了「理解和处理图像」这一功能，包括推荐风格改进、从图像中提取文本、将UI转换为前端代码、理解复杂的方程、转录手写笔记等。

即使是模糊不清的有年代感的手记文档，也能准确OCR识别：

底下写着：你正在使用他们第二大智能模型Claude 3 Sonnet。

然鹅，可能是人太多的原因，尝试了几次都显示“Failed”

不过，网友们也已经po出了一些测试效果，比如让Sonnet解谜题。

为其提供一些示例，要求它找出数字之间的关系，比如“1 Dimitris 2 Q 3”，意思是3是1和2相加的结果。

结果Sonnet成功解出-1.1加8等于6.9，所以“X”的值应该是6.9：

还有网友发现Sonnet现在也可以读取 ASCII 码了，直呼：这是GPT-4 ++的水平了。

在编程任务上，谁写的代码好先不说，Claude 3至少不会像GPT-4一样偷懒。

还有体验到了Opus的玩家，在线给模型挖坑，可opus硬是完美躲避不上当：

初看这效果，感觉还行。这时候应该艾特OpenAI：GPT-5在哪里？

好了，感兴趣的朋友，可以戳下方链接体验啦~

本站声明：本文章由作者或相关机构授权发布，目的在于传递更多信息，并不代表本站赞同其观点，本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者，如若文章内容侵犯您的权益，请及时联系本站删除。

换一批

延伸阅读

[电子设计自动化]

与传统的驱动方式相比，共阴恒流驱动在能效有哪些优势

LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字：驱动电源

[电源]

工业电机驱动电源设计：反电动势抑制与过流保护的集成方案

在工业自动化蓬勃发展的当下，工业电机作为核心动力设备，其驱动电源的性能直接关系到整个系统的稳定性和可靠性。其中，反电动势抑制与过流保护是驱动电源设计中至关重要的两个环节，集成化方案的设计成为提升电机驱动性能的关键。

关键字：工业电机驱动电源

[电源]

如何解决 LED 驱动电源的易损坏问题

LED 驱动电源作为 LED 照明系统的 “心脏”，其稳定性直接决定了整个照明设备的使用寿命。然而，在实际应用中，LED 驱动电源易损坏的问题却十分常见，不仅增加了维护成本，还影响了用户体验。要解决这一问题，需从设计、生...

关键字：驱动电源照明系统散热

[电力电工电路]

LED设计中LED驱动电源的公式

根据LED驱动电源的公式，电感内电流波动大小和电感值成反比，输出纹波和输出电容值成反比。所以加大电感值和输出电容值可以减小纹波。

关键字： LED 设计驱动电源

EV主驱IGBT隔离驱动电源方案选择问题探讨

电动汽车(EV)作为新能源汽车的重要代表，正逐渐成为全球汽车产业的重要发展方向。电动汽车的核心技术之一是电机驱动控制系统，而绝缘栅双极型晶体管(IGBT)作为电机驱动系统中的关键元件，其性能直接影响到电动汽车的动力性能和...

关键字：电动汽车新能源驱动电源

[电源]

合理的驱动电源方案成为大功率区域照明的主流选择

在现代城市建设中，街道及停车场照明作为基础设施的重要组成部分，其质量和效率直接关系到城市的公共安全、居民生活质量和能源利用效率。随着科技的进步，高亮度白光发光二极管(LED)因其独特的优势逐渐取代传统光源，成为大功率区域...

关键字：发光二极管驱动电源 LED

AC-DC电源转换拓扑结构设计

LED通用照明设计工程师会遇到许多挑战，如功率密度、功率因数校正(PFC)、空间受限和可靠性等。

关键字： LED 驱动电源功率因数校正

[电源]

针对于LED照明驱动电源技术中的电磁干扰其中的三大硬件问题措施

在LED照明技术日益普及的今天，LED驱动电源的电磁干扰(EMI)问题成为了一个不可忽视的挑战。电磁干扰不仅会影响LED灯具的正常工作，还可能对周围电子设备造成不利影响，甚至引发系统故障。因此，采取有效的硬件措施来解决L...

关键字： LED照明技术电磁干扰驱动电源

[电源]

LED驱动电源的核心部分“开关管”和“变换器”设计技巧

开关电源具有效率高的特性,而且开关电源的变压器体积比串联稳压型电源的要小得多,电源电路比较整洁,整机重量也有所下降,所以,现在的LED驱动电源

关键字： LED 驱动电源开关电源

[电源]

最全LED驱动电源及散热设计方案介绍

LED驱动电源是把电源供应转换为特定的电压电流以驱动LED发光的电压转换器，通常情况下：LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字： LED 隧道灯驱动电源

关闭