2025上半年谁是 AI API 服务王者

2025年已经过去了一半, 文本生成大模型是否已经进入下半场? OpenAI 完全不重视 API市场? Grok3根本没人用? 未来会怎样走向?

来看我花费4小时精心为大家整理的大模型 API 市场解读(使用 OpenRouter 数据) —— 2025上半年谁是 AI API 服务王者

首先来看最受欢迎模型变化趋势, 目前最新的数据是, Gemini-2.0-Flash 是榜首, 第二名是 Claude-Sonnet-4, 第三名是 Gemini-2.5-Flash-Preview-0520. 不过这里 OpenRouter 的数据需要整合, 因为他们的 DeepSeek 分免费版和付费版 (免费版繁忙时需要排队且输出速度低), 如果把这两个合并到一起的话, DeepSeek-V3可以达到第二名的水平.

另外我们可以从趋势图中获得一些特别有用的信息:

今年的第一季度是AI的绝对爆发, 第一季度 OpenRouter 的总体 Token 用量增长了4倍, 然后维持在了每周 2T Token 的水平. 然后就没有大的增长了.
其他模型的用量从今年第一季度爆发后, 稳定在 600-700B Token 的用量, 体现了市场的多样性, 长尾量大证明市场活跃, 需求细分
DeepSeek-V3 自从发布后, 一直占有 Top 10 的一席之地, 用户粘性非常高
Gemini-2.0-Flash 由于定价便宜 (百万 Token 输出只要 $0.40), 量大管饱, 速度又快, 所以到目前用量都非常稳定, 一直在前三的位置
Gemini-2.5-Flash 后劲很足, 考虑到这是一个未来只要降价就会取代 Gemini-2.0-Flash 的模型, Google 的模型布局非常好
Gemini-2.5-Pro 替代了之前的 Experimental 版本, 但也没有大幅增长用量
Claude-3.5-Sonnet 在今年的3月底彻底完成了历史使命, Claude-3.7-Sonnet 也快完成它的生命周期了
Claude-Sonnet-4 目前接替了之前Claude系列模型的市场地位, 但用量一直很稳定, 没有持续大幅增长
OpenAI 的模型并不能保证每周都有一款模型保持在 Top 10 的调用量
GPT-4o-mini 用量波动很大, 五月份用量非常突出, 这可能反映了一部分市场营销结果

接下来我们关注市场份额数据, 目前最新的数据是, Google 占比高达 43.1% 位居第一, DeepSeek 和 Anthropic 以 19.6% 和 18.4% 分列二三名

从数据中能得到的信息有:

Google 目前强烈挤压了 Anthropic 的市场份额
DeepSeek 自从 DeepSeek-V3 发布后, 一直占有了一定的份额并不断扩大
OpenAI 波动特别剧烈, 虽然位列第四, 但是差距特别大
Llama 的份额持续缩小至最高点的 1/5 左右
其他的份额加起来不超过 10%
Gryphe 已经无了, 这是一个专注微调的组织, 他们微调的 llama2 模型 MythoMax13B 曾经在角色扮演场景特别受欢迎

我们继续关注领域细分模型数据:

编程领域, Claude-Sonnet-4 是绝对王者, 占比 44.5%, 其次是 Gemini-2.5-Pro
文本翻译领域, Gemini-2.0-Flash 则是第一名, 毕竟量大便宜速度快, 这个榜单恐怖的是, 除了第二名占比 20% 的其他模型, 榜单里 7 个都是 Google 的模型. 怀疑某些翻译软件可能默认就提供了 Google 这些模型的配置选项.
角色扮演领域, 呈现了极度细分的市场趋势, 毕竟角色扮演游戏萝卜白菜各有所爱, 各种尾部模型占比高达 26.6%. 然后就是我们的幻觉大师 DeepSeek, 不得不说幻觉高在角色扮演这个领域通常会发挥出无与伦比的创意, 所以特别适合. 第三名则是便宜大碗的 Gemini-2.0-Flash.
市场营销领域, GPT-4o 是绝对王者, 占比达到了 32.5%, 这也可能揭示了 OpenAI 在非编程的专业领域的训练还是有一套的. 大家很喜欢 GPT-4o 的输出

最后我们来看在 OpenRouter 上大家都用接口来干什么了:

前两名是 Cline 和 RooCode, 都是用来写代码的
第三名是 liteLLM, 这是个路由库, 用于构建各种应用
第四名 KiloCode 也是写代码的
第五名 SillyTavern 则是类似 Ollama 的本地LLM界面, 接上接口就能跟大模型对话

总结时间:

目前 Google 在大模型 API 市场上几乎占据了半壁江山, 而且各个领域均有解决方案模型, 甚至还有便宜大碗 Gemini-2.0-Flash (比 DeepSeek 都便宜)
Anthropic 则专注写代码, Claude-3.5, Claude-3.7, Claude-4 算是完成了平稳过渡
OpenAI 从大模型 API 市场这个数据表现并不好, 可能是由多方面因素限制的, 比如最先进模型需要取官网申请 AccessKey, 又或者定价问题等等
DeepSeek 模型粘性非常强, 令我吃惊的是, DeepSeek-V3 反而是最受欢迎的, 这里推测原因是 DeepSeek-R1 可能需要思考半天, 第一个有效 token 输出太慢了, 导致用户没有 V3 多
Meta 的 Llama 系列再作就要死了
MistralAI 意外的有 3% 左右的市场份额, 不过我对这部分用户的触达仅限于一些欧洲老哥喜欢微调他们的开源模型
X-AI 的 Grok 系列模型有起色, 但目前市场定位看不到, 如果自己的定位真的是 SOTA, 那可真的任重道远了
Qwen 有 1.6% 的市场份额, 继续加油

2025-07-10

Keys	Action
`?`	Open this help
`n`	Next page
`p`	Previous page
`s`	Search