TrakTokenBeta
中文市场

国内大模型 API 价格全对比 2026

覆盖 16 家国内厂商、141 个模型的完整横评。 价格、智能指数、编码能力、Arena Elo 一站对比,帮你选出最适合的方案。

一、国内大模型格局

2026 年 Q1,中国大模型市场竞争已全面进入深水区。 从格局上看,阿里云通义千问71 个模型的庞大阵容领跑生态广度,DeepSeek 凭借极致性价比和开源策略建立了牢固的开发者心智,智谱 GLM-5MiniMax M2.7 在智能指数上突破了 49 分大关,小米 MiMo-V2 异军突起,端侧与云端并进。

16
国内厂商
141
可用模型
99
有定价模型
42
免费/已退役

二、各厂商一览

按模型数量排序,展示各厂商的代表模型与起步价格。

三、智能指数 Top 10

Artificial Analysis 智能指数(Intelligence Index)是综合 MMLU、GPQA、HumanEval 等多维基准的标准化评分。 以下是国内厂商中智能指数最高的 10 个模型。

四、最便宜的 5 个模型

国内厂商中输出 token 价格最低的模型。适合大批量处理、简单分类/摘要等成本敏感场景。

模型厂商输入/1M输出/1M智能指数
Qwen3.5 9B (Reasoning)阿里云$0.100$0.15032.4
QwQ 32B-Preview阿里云$0.120$0.18015.2
Qwen2.5 Turbo阿里云$0.050$0.20012.0
DeepSeek R1 Distill Qwen 32BDeepSeek$0.270$0.27017.2
Step 3.5 FlashStepFun$0.100$0.30037.8

五、性价比 Top 10

TrakToken 性价比指数综合三大核心指标(智能指数 35% + 编码指数 30% + Arena Elo 35%)与价格权重(输出 70% + 输入 30%), 给出百分制排名。以下是国内厂商中性价比最高的 10 个模型。

六、场景选型指南

场景一:企业客服 / 智能问答

需求:大量短对话、低延迟、中文理解准确。推荐 DeepSeek V3、Qwen Plus、GLM-4 Flash、豆包 Pro。 月均百万次对话场景下,DeepSeek V3 的成本优势最为明显。 使用 成本计算器 估算月度费用。

场景二:代码生成 / 编程助手

需求:高编码能力、支持长上下文。推荐 DeepSeek V3、Qwen2.5-Coder-32B、豆包 Seed Code、KAT-Coder-Pro。 开源方案可本地部署 Qwen2.5-Coder 或 DeepSeek Coder V2。

场景三:深度推理 / 数学

需求:链式推理、数学证明、复杂逻辑。推荐 GLM-5、Kimi K2.5 Thinking、DeepSeek R1、MiniMax M2.7。 推理类模型价格高于常规模型 3-5x,但在高难度任务上准确率差距显著。

场景四:长文档处理 / RAG

需求:超长上下文窗口、文档解析。推荐 Kimi K2.5(原生长上下文支持)、Qwen Max、MiniMax-01(1M tokens)。 对于 PDF / 网页等复杂格式,Kimi 的文档解析能力领先。

场景五:预算极度敏感

需求:能跑就行,成本压到最低。推荐腾讯混元 Lite(免费)、阿里 Qwen Turbo、百度 ERNIE Lite。 免费模型在简单分类、情感分析等任务上表现足够。

本文数据通过自动化管道从 Artificial Analysis、LMSYS Arena、OpenRouter 等源持续采集, 价格与评测指标每日自动更新。更完整的全球模型对比请参见 LLM API Pricing Guide 2026。 如发现数据有误,欢迎在 GitHub 提交 Issue 或 PR。