Token及其定价门道,你需要了解的一切
扫描二维码
随时随地手机看文章
在人工智能领域,Token 就是这个世界的硬通货。读懂 Token,就能看清 AI 的计费逻辑、成本压力,以及厂商与用户之间的博弈关系。
谷歌衡量 AI 业务爆发式增长,唯一的计量单位就是 Token。谷歌首席执行官桑达尔・皮查伊在最近的 I/O 开发者大会上公布,公司每月处理的 Token 总量高达3.2 千万亿。他笑着补充:“我从没想过自己会说出‘千万亿’这个词,但现实就是如此。”
简单来说,Token 是大语言模型(LLM)处理数据的基本单位,被称作驱动 AI 革命的 “新石油”。对 AI 服务商而言,它是计量用量、设定价格的标尺;对企业用户来说,它是换取算力、实现 AI 能力的核心成本。
市场对 Token 的需求近乎无限,这进一步加剧了全球 GPU 资源短缺,反过来又持续推高使用 AI 工具的整体成本。
Token 究竟是什么?
和人类理解语言的方式类似,大语言模型会把句子拆解成一个个 Token,以此理解语义。皮查伊将其定义为:“模型处理数据的基本单元,每一个 Token 往往对应一个待解决问题的片段。”
Token 的形式不固定,可以是完整单词、词根,也可以是字母串、符号或短语,复合词还会被拆分成多个 Token。比如输入提示词 “I am running after a car”,模型会拆成 “I”“am”“run”“ing”“after”“a”“car”,共 7 个 Token。
Gartner高级总监分析师迪帕克・赛斯给出了通用换算标准:1 个 Token 大约相当于 0.75 个英文单词,100 个单词约等于 135 个 Token。
Token 定价有门道:上传便宜,下载更贵
Token 并非统一定价,核心差异在于 “上传” 和 “下载”——向 AI 系统上传内容的 Token 价格更低,而获取 AI 生成结果的下载 Token 价格更高。
举个例子,用户上传一份简历只需支付少量费用,但下载经 AI 润色优化后的简历,费用会明显增加。ManpowerGroup数据科学与 AI 解决方案负责人马克斯・利明解释:“上传成本低,因为 AI 还未进行深度运算;下载成本高,是因为 AI 已经完成了分析、生成等核心工作。”
目前,Token 计费模式主要面向企业和程序员这类重度用户。Anthropic 的 Claude Code、OpenAI 的 Codex 均采用 Token 计费;微软 GitHub 也宣布,将于 6 月 1 日起推行类似的 Token 计费机制。
企业最终的 AI 账单由两部分组成:Token 费用 + 算力费用(如 GPU 使用时长)。利明提到,Max Leaming一方面向模型厂商支付 Token 费用,另一方面还要承担独立的算力成本。目前,该公司使用微软 Azure 云服务,搭配 Snowflake 数据库运行 AI 相关业务。
高效模型:用更少 Token 办更多事
不同 AI 模型的 Token 使用效率差异很大,优质模型能以更低 Token 消耗,输出更优质的结果,直接帮企业节省成本。
皮查伊在大会上重点提到谷歌新推出的Gemini 3.5 Flash,这款模型采用 Token 计费,却能以不到同类顶级模型一半的价格,提供前沿水平的 AI 能力。
“我们了解到,不少企业已经用光了年度 Token 预算,” 皮查伊说,“如果企业混合使用 Gemini 3.5 Flash 和其他顶级模型,能大幅降低整体成本。”
提示词效率,决定 Token 成本的关键
提示词(Prompt)的编写效率,直接决定 Token 消耗多少。Gartner分析师赛斯举例称,同样完成一项编程任务,有人用 10000 个 Token 才能搞定,有人仅需 1000 个,但目前还没有工具能精准衡量这种效率差异。
“越来越多企业开始转向按最终效果付费,因为大家逐渐认清 Token 的真实成本,开始重视 Token 使用效率。” 赛斯说。
ManpowerGroup就针对这一点,开发了简化用户数据查询流程的看板工具。起初,新用户使用内部劳动力市场数据工具,需要 10 轮追问才能获取目标结果;一年后,用户平均仅需 4 轮追问,Token 消耗大幅减少,效率显著提升,背后核心原因就是提示词编写更精准高效。
不过高效也分两面,部分顶级 AI 工具定价极高。比如 Anthropic 尚未公开的 Mythos 大模型,推理能力远超同类,但单 Token 价格堪称天价。利明认为:“即便单 Token 成本上涨,整体使用成本反而可能下降,因为它的效率足够高。”
AI 厂商的 “成瘾式” 商业模式
头部 AI 厂商投入巨额资金搭建 AI 基础设施,却刻意压低 Token 单价,这被业内称为“成瘾式策略”,即先让用户对 AI 服务产生依赖,后续再通过涨价收割利润。
利明补充,免费 Token 是厂商锁定客户的重要手段。向企业提供免费 Token,会促使企业将核心业务流程绑定到厂商专属的大语言模型和 AI 智能体上。为进一步巩固绑定,主流 AI 厂商还会派出工程师驻场,为客户部署 AI 模型。
这类工程师被称为前线工程师(FDE),相当于 AI 领域的 “专属顾问”,帮客户制定 AI 战略、搭建技术框架、解决推理与上下文理解难题,还负责处理安全问题,深度参与客户 AI 项目落地。
如今,OpenAI、谷歌、微软早已不再只卖 AI 模型,而是转向 “深入企业内部,帮客户搭建专属 AI 基础设施” 的服务模式。
免费 Token,成为工程师的新型职场福利
英伟达CEO黄仁勋曾提到,免费 Token 如今已成为工程师的求职福利,就像企业为员工报销手机话费一样普遍。
利明表示自己尚未见过这类案例,但他认为这种模式暗藏风险,因为雇主提供的免费 OpenAI 或微软 Token,本质是一种间接的厂商锁定。“员工习惯了某款 AI 工具,就会越来越依赖它,企业后续很难更换供应商。”
同时,免费 Token 也降低了前沿 AI 技术的试错门槛。不少企业高管会自费测试 OpenClaw,即那项被视为突破性但暂不适合企业正式使用的高风险 AI 技术。ARM AI 与开发者平台高级副总裁亚历克斯・斯皮内利就有过这样的经历:“我测试 OpenClaw 时,一次配置错误,一个周末就产生了 500 美元账单。这世上没有免费午餐,Token 真的很贵。”
赛斯将免费 Token 策略,比作印度一家烟草公司曾给员工发放香烟的做法:“员工领了香烟就会抽,慢慢养成习惯。免费 Token 也是如此,一旦用上,就离不开了,因为它已经成了 AI 世界的硬通货。”





