6月8日消息,苹果近日发表了一篇研究论文,称推理模型全都没真正思考,无论DeepSeek、o3-mini还是Claude 3.7都只是另一种形式的“模式匹配”,所谓思考只是一种假象。
随着人工智能技术在各领域的广泛应用,将大型语言模型(LLM)部署到嵌入式端侧设备成为重要趋势。Llama 2 - 7B作为一款性能优异的大语言模型,具有广泛的应用前景。然而,其庞大的参数量对嵌入式设备的计算资源和存储能力提出了巨大挑战。瑞萨RZ/V2L处理器集成了强大的NPU(神经网络处理单元),结合INT4量化技术,为在嵌入式端侧部署Llama 2 - 7B提供了可行方案。
自诞生以来,人工智能大模型始终被“幻觉”问题困扰。这里的“幻觉”,指的是大语言模型会将虚构信息当作真实事实输出。
2025年4月29日,阿里巴巴云旗下的Qwen团队正式发布并开源Qwen3,作为Qwen系列的最新一代大型语言模型(LLM),包含一系列密集型(Dense)和混合专家(MoE)模型,参数规模从0.6亿至2350亿不等。同日,海光信息技术股份有限公司(以下简称“海光信息”)在其“智能深算”战略引领下,宣布其深算单元(DCU,Deep Computing Unit)已完成对Qwen3全部8款模型(235B、32B、30B、14B、8B、4B、1.7B、0.6B)的无缝适配与优化,实现零错误、零兼容性问题、秒级部署。这一整合依托基于GPGPU架构的生态优势和海光DTK软件栈的领先特性,展现了Qwen3在DCU上的卓越推理性能与稳定性,充分验证了DCU的高通用性、高生态兼容性及自主可控的技术优势,使其成为支撑AI大模型训练与推理的关键基础设施。
2025年4月25日,中国,北京——人工智能终端产业发展研讨会暨人工智能终端工作组第一次全体大会召开,工业和信息化部副部长熊继军出席会议并致辞,工业和信息化部电子司和科技司、国家发展和改革委员会、商务部、北京市朝阳区有关领导参会,各地行业主管部门以及工作组有关专家学者、企业单位共200余人参加大会。
在当今数字化时代,人工智能(AI)无疑是推动各行业创新与发展的核心力量。从最初的简单算法到如今复杂的大模型,AI 的发展日新月异。而随着数据量呈指数级增长以及实时处理需求的飙升,传统的云端 AI 模式逐渐显露出诸多局限性,尤其是在带宽受限或对隐私要求极为严苛的场景下,依赖远程云服务器进行 AI 计算已难以满足实际需求。在这样的背景下,边缘生成式 AI 异军突起,正引领着智能计算领域的全新变革,将智能体验切实地带到消费者身边。
助力生成式 AI 初创企业释放潜能,加速全球化进程
随着大模型在不断演进的同时将推理应用大规模推向边缘和端点设备,以及物联网智化、具身智能、AI智能体(AI Agent)和物理AI等新的AI应用场景和模式的快速涌现,AI赋能设备的主控芯片设计师正面临着全新的挑战。尤其是对于边缘和端点设备,它们既可能成为大模型的承载设备,也可能是用智能去为应用提供更好的核心功能,新的产品定义方向使主芯片架构师不得不去思考,其芯片在如何应对大模型快速演进的同时,还能实现用智能手段赋能传统应用和实现新兴功能。
4月13日消息,北京大学定量生物学中心钱珑团队研发、构建了全球首个针对功能基因挖掘任务的大语言模型SYMPLEX。
在当今数字化时代,数据量呈爆炸式增长,从人工智能大模型的训练,到实时性要求极高的自动驾驶场景,从大规模数据中心的高效运算,到边缘设备的快速响应,各行各业对计算性能的需求持续攀升。传统的电计算模式在面对如此庞大且复杂的计算任务时,逐渐暴露出其在延迟和能效方面的局限性。而光电混合计算,作为一种融合了光与电优势的新兴计算方式,正悄然崛起,逐步实现商业落地,为低延迟、高能效计算带来了新的曙光,有望成为未来计算领域的主流选择。
近日,百川智能被曝联合创始人焦可已经离职,联合创始人、模型研发负责人陈炜鹏即将离职。对于这些消息,百川智能方面选择保持沉默。
3月12日消息,3月6日,来自中国的创业公司Monica正式对外发布通用型AI Agent(AI智能体)产品Manus。
3月10日消息,Monica联合创始人、首席科学家季逸超(Peak)今日在社交平台透露,Manus使用了Claude大模型和不同的阿里千问大模型(Qwen)的微调模型开发。
最近,OpenAI、DeepSeek、谷歌、Anthropic都推出新模型,它们都宣称模型已经具备真正的推理能力,也就是人类解决问题时运用的思维方式,但问题在于:AI大模型所说的推理真的和人一样吗?
近日,搭载安谋科技最新一代“周易”NPU处理器的硬件平台成功运行DeepSeek-R1系列模型,性能卓越、成本优异,为用户带来了更高效、便捷的AI应用体验。这款创新性NPU处理器采用专为大模型特性优化的架构设计,其beta版本在2024年底已面向早期用户开放评估测试,并获得了广泛认可与积极反馈。预计今年上半年,这款备受期待的NPU产品将正式亮相市场,届时将为更多用户带来突破性的端侧算力体验。
尽管美国出台法律禁止下载和使用DeepSeek,甚至对违规者处以最高20年的刑期,但这一措施似乎并未遏制美国人对DeepSeek的兴趣,反而催生了大量山寨网站。
2025蛇年春节,DeepSeek大语言模型以超低的训练成本震撼全球,预示着大模型技术将以更快的脚步全面走进我们的工作和生活,同时也促进了能够连通各种大模型和应用场景的智能终端将加速演进。语音作为人类与机器最常用的互动沟通媒体,将在大模型和边缘智能并蒂薄发的时代成为可带来巨大便利和效率的媒体,智能语音处理技术也将成为支撑大模型和边缘智能的关键技术之一。
我们正身处一场技术革命的历史开端,以 ChatGPT 为标志的这轮 AI 科技浪潮是算法和软件诞生以来人类科技最重要的技术变革,由此开启了以智能为核心的第四次工业革命。这次 AI 变革是由以 Scaling Law 为底层逻辑的基础模型驱动,其整体的发展脉络由基础模型的技术逻辑主导。
1月10日,由全球计算联盟(简称“GCC”)主办的“2025全球计算大会——全球计算联盟启航大会”在深圳举行。大会期间,同步举办了全球计算联盟(GCC)成立庆典,并在随后的年度系列成果发布仪式上,重磅发布了包括2部白皮书、2部研究报告、1项标准项目合作成果以及案例集等在内的一系列丰硕成果。作为GCC理事单位及白皮书牵头参编的重要代表之一,安谋科技(中国)有限公司(简称“安谋科技”)受邀出席此次盛会,发表了主旨演讲,并参与了GCC成立及成果发布仪式。
在信息技术飞速发展的今天,传统搜索引擎正面临前所未有的挑战。AI大模型的兴起,尤其是其在搜索技术中的应用,预示着搜索行业的未来将发生根本性变革。