国内大模型 API 价格全对比 2026
覆盖 16 家国内厂商、141 个模型的完整横评。 价格、智能指数、编码能力、Arena Elo 一站对比,帮你选出最适合的方案。
一、国内大模型格局
2026 年 Q1,中国大模型市场竞争已全面进入深水区。 从格局上看,阿里云通义千问以 71 个模型的庞大阵容领跑生态广度,DeepSeek 凭借极致性价比和开源策略建立了牢固的开发者心智,智谱 GLM-5 和 MiniMax M2.7 在智能指数上突破了 49 分大关,小米 MiMo-V2 异军突起,端侧与云端并进。
二、各厂商一览
按模型数量排序,展示各厂商的代表模型与起步价格。
| 厂商 | 模型数 | 旗舰模型 | 旗舰智能指数 | 最低输出价 |
|---|---|---|---|---|
| 阿里云 | 71 | Qwen3.5 397B A17B (Reasoning) | 45.0 | $0.150 |
| DeepSeek | 25 | DeepSeek V3.2 (Reasoning) | 41.7 | $0.270 |
| Z AI (智谱 AI) | 14 | GLM-5 (Reasoning) | 49.8 | $0.400 |
| 月之暗面 | 6 | Kimi K2.5 (Reasoning) | 46.8 | $2.250 |
| MiniMax | 6 | MiniMax-M2.7 | 49.6 | $1.200 |
| 小米 | 5 | MiMo-V2-Pro | 49.2 | $0.300 |
| 蚂蚁 InclusionAI | 5 | Ring-1T | 22.8 | $0.570 |
| 字节跳动 | 2 | Doubao Seed Code | 33.5 | $0.570 |
| 百度智能云 | 2 | ERNIE 5.0 Thinking Preview | 29.1 | $1.100 |
| 阶跃星辰 | 2 | Step 3.5 Flash | 37.8 | $0.300 |
| 快手 KwaiKAT | 1 | KAT-Coder-Pro V1 | 36.0 | $1.200 |
| 南北阁 | 1 | Nanbeige4.1-3B | 16.1 | - |
| 美团 LongCat | 1 | LongCat Flash Lite | 23.9 | - |
| 腾讯云 | 0 | - | - | - |
| 百川智能 | 0 | - | - | - |
| 零一万物 | 0 | - | - | - |
三、智能指数 Top 10
Artificial Analysis 智能指数(Intelligence Index)是综合 MMLU、GPQA、HumanEval 等多维基准的标准化评分。 以下是国内厂商中智能指数最高的 10 个模型。
四、最便宜的 5 个模型
国内厂商中输出 token 价格最低的模型。适合大批量处理、简单分类/摘要等成本敏感场景。
| 模型 | 厂商 | 输入/1M | 输出/1M | 智能指数 |
|---|---|---|---|---|
| Qwen3.5 9B (Reasoning) | 阿里云 | $0.100 | $0.150 | 32.4 |
| QwQ 32B-Preview | 阿里云 | $0.120 | $0.180 | 15.2 |
| Qwen2.5 Turbo | 阿里云 | $0.050 | $0.200 | 12.0 |
| DeepSeek R1 Distill Qwen 32B | DeepSeek | $0.270 | $0.270 | 17.2 |
| Step 3.5 Flash | StepFun | $0.100 | $0.300 | 37.8 |
五、性价比 Top 10
TrakToken 性价比指数综合三大核心指标(智能指数 35% + 编码指数 30% + Arena Elo 35%)与价格权重(输出 70% + 输入 30%), 给出百分制排名。以下是国内厂商中性价比最高的 10 个模型。
六、场景选型指南
需求:大量短对话、低延迟、中文理解准确。推荐 DeepSeek V3、Qwen Plus、GLM-4 Flash、豆包 Pro。 月均百万次对话场景下,DeepSeek V3 的成本优势最为明显。 使用 成本计算器 估算月度费用。
需求:高编码能力、支持长上下文。推荐 DeepSeek V3、Qwen2.5-Coder-32B、豆包 Seed Code、KAT-Coder-Pro。 开源方案可本地部署 Qwen2.5-Coder 或 DeepSeek Coder V2。
需求:链式推理、数学证明、复杂逻辑。推荐 GLM-5、Kimi K2.5 Thinking、DeepSeek R1、MiniMax M2.7。 推理类模型价格高于常规模型 3-5x,但在高难度任务上准确率差距显著。
需求:超长上下文窗口、文档解析。推荐 Kimi K2.5(原生长上下文支持)、Qwen Max、MiniMax-01(1M tokens)。 对于 PDF / 网页等复杂格式,Kimi 的文档解析能力领先。
需求:能跑就行,成本压到最低。推荐腾讯混元 Lite(免费)、阿里 Qwen Turbo、百度 ERNIE Lite。 免费模型在简单分类、情感分析等任务上表现足够。
七、趋势与展望
价格战持续深化 -- 国内厂商之间的价格战在 2026 年进一步加剧。DeepSeek V3 以极低定价倒逼全行业跟进降价, 阿里、百度、字节、腾讯纷纷推出免费版或大幅降价。对开发者而言,API 成本正快速接近边际。
推理能力成为新战场 -- GLM-5、Kimi K2.5 Thinking、DeepSeek R1 等推理模型的密集发布表明,厂商正从"通用智能"转向"深度推理"。 这类模型虽然单价更高,但在复杂任务上的 ROI 远超普通模型。
新势力冲击格局 -- 小米 MiMo-V2 系列智能指数突破 49 分,MiniMax M2.7 紧随其后。 蚂蚁 InclusionAI、美团 LongCat、快手 KAT-Coder 等大厂 AI 团队也在垂直领域建立差异化优势。
多模态加速落地 -- 小米 MiMo-V2-Omni、阶跃 Step VL、MiniMax 视频/音频模型等表明, 纯文本之外的多模态能力正在成为国内厂商的下一个竞争焦点。
本文数据通过自动化管道从 Artificial Analysis、LMSYS Arena、OpenRouter 等源持续采集, 价格与评测指标每日自动更新。更完整的全球模型对比请参见 LLM API Pricing Guide 2026。 如发现数据有误,欢迎在 GitHub 提交 Issue 或 PR。