Claude 的中文语言分词成本比英文高 65%,OpenAI 仅高 15%

yuying2026-04-29 16:31:53t

4 月 29 日,AI 研究员 Aran Komatsuzaki 通过将 Rich Sutton 的奠基性论文《The Bitter Lesson》翻译成九种语言,并将其交由 OpenAI、Gemini、Qwen、DeepSeek、Kimi 和 Claude 的分词器进行处理,对六个主要 AI 模型的分词效率进行了对比分析。研究以在 OpenAI 上使用英文版本的分词数量作为基准 (1x),结果显示出显著差异:在 Claude 上处理相同内容需要的代币(tokens)为 1.65 倍,而在 OpenAI 上仅为 1.15 倍。印地语在 Claude 上的结果更为极端,较基准高出超过 3 倍。在所测试的六个模型中,Anthropic 的表现最低。

关键在于,当相同的中文文本在不同模型中进行处理——且都以同一个英文基准来衡量——结果出现了惊人的分歧:Kimi 消耗的代币仅为 0.81 倍 (,甚至比英文还少);Qwen 为 0.85 倍;而 Claude 需要 1.65 倍。这个差距揭示的是纯粹的分词效率问题,而非语言本身的问题。中文模型在处理中文时展现出更高的效率,这表明差异源于分词器的优化,而不是语言属性。

对用户而言,其实际影响相当可观:代币消耗的增加会直接推高 API 成本,延长模型响应延迟,并更快耗尽上下文窗口。分词效率取决于模型训练数据的语言构成——如果模型主要在英文数据上训练,那么对英文文本的压缩会更高效;而数据代表性较低的语言,则会被分割成更小、效率更低的片段。

Komatsuzaki 的结论强调了一个基础原则:市场规模决定分词效率。更大的市场往往带来更好的优化;而在市场中代表性不足的语言,将面临显著更高的代币成本。

Multicoin Capital 从交易所提取 21 万枚 AAVE 代币,价值 5132 万美元

据@EmberCN监测,21万枚AAVE(价值5132万美元)在过去11个小时内从Binance、OKX、Bybit提取至GalaxyDigitalOTC钱包,随后在半小时前转入0x73AC地址。据Nansen标注,该地址属于MulticoinCapital。...

区块链视频游戏 MetalCore 背后开发商完成 500 万美元新一轮融资,Delphi Digital 参投

区块链视频游戏MetalCore背后开发商Studio369宣布完成了500万美元新一轮融资,投资方包括DelphiDigital和SpartanGroup等。新资金将用于持续开发和即将推出的与AI有关的功能。此外,Studio369表示将与ImmutablezkEVM...

Metaplanet 调整其比特币看跌期权行权价至 6.6 万美元,以获得更多的溢价收入

日本投资公司MetaplanetInc.调整了其比特币看跌期权,将执行价格从之前披露的10月3日的62,000美元上调至66,000美元,同时保持到期日为12月27日不变。MetaplanetCEOSimonGerovich表示,这提高了我们期权销售的名义收...

郑志刚成为英国伦敦多资产经纪商 CBCX Group 的战略股东

据《南华早报》报道,香港富商郑志刚(AdrianCheng)已成为英国伦敦多资产经纪商CBCXGroup的战略股东。该笔投资旨在推动CBCX在亚太区及全球市场的增长,并着重拓展黄金、外汇、商品交易以及数字资产的融合发展。...

META :正探索一个独立的代号为 P92 的新去中心化社交网络

Facebook母公司META表示,正在探索一个独立的代号为P92的新去中心化社交网络,该项目将由Instagram负责人AdamMosseri监督,这一举动被视为试图建立Twitter的替代品或Mastodon的竞争对手。目前未确定是否与区块链、加...

上一篇:美联储今日举行 FOMC 会议;鲍威尔任期于5月15日到期,沃什的确认进程继续推进
下一篇:Hedera Africa Hackathon 被评为全球最大,titleM 奖金池分配给 13,000+ 名开发者