当前位置:首页 > 通信技术 > 通信先锋
[导读]3月3日消息,虽然春节档DeepSeek V4没有发布,但DeepSeek在2月11日发了一个新模型,被称为DeepSeek V4 Lite,只有2000亿参数,规模比较小。

3月3日消息,虽然春节档DeepSeek V4没有发布,但DeepSeek在2月11日发了一个新模型,被称为DeepSeek V4 Lite,只有2000亿参数,规模比较小。

DeepSeek V4 Lite主要特色是1M上下文,之前网友测试其表现除了超长上下文之外也没太惊艳的地方,毕竟参数规模跟主流的大模型差很多。

然而DeepSeek V4 Lite发布之后一直在悄悄升级,2月27日已经有网友测试发现其性能越来越强大,昨天又升级了一波,Linux Do社区大佬HCPTangHY测试之后也大为震惊,称其有点神,在他的测试中已经是国模SOTA(注:SOTA简单认为是第一就行)。

不仅如此,如果继续训练下去,还有可能开源撬动闭源。

从他的测试来看,DeepSeek V4 Lite的0302升级之后分数比之前的0227版更高一层楼,已经逼近目前最顶流的大模型Sonnet 4.6了。

帖子中还有其他的游戏及前端测试,包括业内很有名的天气卡测试,DeepSeek V4 Lite 0302版不论审美还是功能都是在线的。

回顾这一年来的AI大模型来看,国产大模型在对话聊天方面已经跟闭源模型差别不大,但在多模态、编程、数学及智能体等方面是被甩开的,最近发布的GLM5、MiniMax 2.5、Qwen 3.5系列有所提升,但Anthropic、OpenAI及谷歌也发布了最新的模型,差距又拉开了。

在追赶顶流闭源模型上,国内的公司面临着多方面的不利因素,投入没有美国公司的多,而且算力不够,数据资料方面也不如谷歌、OpenAI,毕竟他们要么有此前多年的积累,要么有大量用户。

而且Anthrpoic之前为了搜集数据,竟然从盗版网站上下载了大量书籍,还被判赔偿15亿美元,由此可见他们在这方面的投入之大,不要脸程度之深。

作为全村的希望,DeepSeek在技术探索上已经树立了标杆,如果2000亿小参数的DeepSeek V4 Lite就有如此表现,那完整版的DeepSeek V4确实非常值得期待,发布之后免不了又要对美国AI造成巨大冲击了。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

3月1日消息,据国外媒体最新报道,DeepSeek计划于下周正式发布全新的多模态大语言模型V4版本。

关键字: DeepSeek AI

3月1日消息,三星前不久发布了Galaxy S26系列旗舰机,用上了自家2nm工艺生产的Exynos 2600处理器,整体表现很不错。

关键字: 2nm 三星 台积电

3月2日消息,深开鸿宣布,KaihongOS桌面版(X86)正式升级至5.0版本,并首次面向公众全面开放免费试用。

关键字: 深开鸿

3月1日消息,在全球存储市场持续动荡的背景下,NVIDIA似乎正通过多元化供应链来缓解RTX 50系列显卡的产能压力。

关键字: 美光 AI

3月1日消息,据媒体报道,在广东肇庆,一项承载着国家能源技术突破使命的工程——浪江抽水蓄能电站,正在加速从蓝图变为现实。

关键字: 抽蓄机

智能感应垃圾桶方案集成了单片机、充电IC、滚珠开关、红外收发管等核心部件,实现多模态感应(挥手/屈膝/脚踢),仅用单色红灯动态编码状态,便于安装维护。

关键字: 方案开发 电子方案 纳祥科技 智能感应垃圾桶方案

2月25日消息,据媒体报道,当地时间周三,韩国股市迎来里程碑式突破,韩国综合股价指数(KOSPI)首次站上6000点大关,主要受全球存储芯片需求激增带动,韩国两大芯片巨头三星电子、SK海力士股价持续走强。

关键字: 三星电子 sk海力士

2月25日消息,格力电器今日发布公告称,第一大股东珠海明骏投资合伙企业(有限合伙)拟自公告披露之日起15个交易日后的3个月内,以大宗交易方式减持公司股份不超过11170.28万股,占公司剔除回购专用账户股份后的总股本的2...

关键字: 格力电器

2月26日消息,MWC 2026巴展到来之前,AMD非常低调地发布了新一代EPYC 8005系列处理器,代号“Sorano”(意大利小城索拉诺)。

关键字: AMD 台积电
关闭