中文市场2026-03-22

国内大模型 API 价格全对比 2026

覆盖 16 家国内厂商、171 个模型的完整横评。价格、智能指数、编码能力、Arena Elo 一站对比，帮你选出最适合的方案。

一、国内大模型格局

2026 年 Q1，中国大模型市场竞争已全面进入深水区。从格局上看，阿里云通义千问以 79 个模型的庞大阵容领跑生态广度，DeepSeek 凭借极致性价比和开源策略建立了牢固的开发者心智，智谱 GLM-5 和 MiniMax M2.7 在智能指数上突破了 49 分大关，小米 MiMo-V2 异军突起，端侧与云端并进。

国内厂商

171

可用模型

132

有定价模型

免费/已退役

二、各厂商一览

按模型数量排序，展示各厂商的代表模型与起步价格。

厂商	模型数	旗舰模型	旗舰智能指数	最低输出价
阿里云	79	Qwen3.6 Max Preview	51.8	$0.050
DeepSeek	31	DeepSeek V4 Pro (Reasoning, Max Effort)	51.5	$0.280
Z AI (智谱 AI)	18	GLM-5.1 (Reasoning)	51.4	$0.400
小米	9	MiMo-V2.5-Pro	53.8	$0.300
月之暗面	8	Kimi K2.6	53.9	$2.400
蚂蚁 InclusionAI	7	Ling-2.6-1T	33.6	$0.300
MiniMax	6	MiniMax-M2.7	49.6	$1.200
阶跃星辰	3	Step 3.5 Flash 2603	38.5	$0.300
字节跳动	2	Doubao Seed Code	33.5	$0.570
百度智能云	2	ERNIE 5.0 Thinking Preview	29.1	$1.100
腾讯云	2	Hy3-preview (Reasoning)	41.9	$0.300
快手 KwaiKAT	2	KAT Coder Pro V2	43.8	$1.200
南北阁	1	Nanbeige4.1-3B	16.1	-
美团 LongCat	1	LongCat Flash Lite	23.9	-
百川智能	0	-	-	-
零一万物	0	-	-	-

三、智能指数 Top 10

Artificial Analysis 智能指数（Intelligence Index）是综合 MMLU、GPQA、HumanEval 等多维基准的标准化评分。以下是国内厂商中智能指数最高的 10 个模型。

DeepSeek V4 Pro (Reasoning, Max Effort)

Z AI (智谱 AI) · 203K 上下文

DeepSeek V4 Pro (Reasoning, High Effort)

Z AI (智谱 AI) · 203K 上下文

四、最便宜的 5 个模型

国内厂商中输出 token 价格最低的模型。适合大批量处理、简单分类/摘要等成本敏感场景。

模型	厂商	输入/1M	输出/1M	智能指数
Qwen3.5 0.8B (Non-reasoning)	阿里云	$0.010	$0.050	9.9
Qwen3.5 0.8B (Reasoning)	阿里云	$0.010	$0.050	10.5
Qwen3.5 2B (Non-reasoning)	阿里云	$0.020	$0.100	14.7
Qwen3.5 2B (Reasoning)	阿里云	$0.020	$0.100	16.3
Qwen3.5 4B (Non-reasoning)	阿里云	$0.030	$0.150	22.6

五、性价比 Top 10

TrakToken 性价比指数综合三大核心指标（智能指数 35% + 编码指数 30% + Arena Elo 35%）与价格权重（输出 70% + 输入 30%），给出百分制排名。以下是国内厂商中性价比最高的 10 个模型。

Qwen3.5 0.8B (Reasoning)

阿里云

$0.050/1M output

DeepSeek V4 Flash (Reasoning, High Effort)

DeepSeek · 1M 上下文

$0.280/1M output

DeepSeek V4 Flash (Reasoning, Max Effort)

DeepSeek · 1M 上下文

$0.280/1M output

Hy3-preview (Reasoning)

腾讯云 · 262K 上下文

$0.300/1M output

Qwen3.5 9B (Reasoning)

阿里云 · 262K 上下文

$0.150/1M output

DeepSeek V4 Flash (Non-reasoning)

DeepSeek · 1M 上下文

$0.280/1M output

Qwen3.5 4B (Reasoning)

MiMo-V2-Flash (Non-reasoning)

小米 · 262K 上下文

$0.300/1M output

Qwen3.5 4B (Non-reasoning)

阿里云

$0.150/1M output

六、场景选型指南

场景一：企业客服 / 智能问答

需求：大量短对话、低延迟、中文理解准确。推荐 DeepSeek V3、Qwen Plus、GLM-4 Flash、豆包 Pro。月均百万次对话场景下，DeepSeek V3 的成本优势最为明显。使用成本计算器估算月度费用。

场景二：代码生成 / 编程助手

需求：高编码能力、支持长上下文。推荐 DeepSeek V3、Qwen2.5-Coder-32B、豆包 Seed Code、KAT-Coder-Pro。开源方案可本地部署 Qwen2.5-Coder 或 DeepSeek Coder V2。

场景三：深度推理 / 数学

需求：链式推理、数学证明、复杂逻辑。推荐 GLM-5、Kimi K2.5 Thinking、DeepSeek R1、MiniMax M2.7。推理类模型价格高于常规模型 3-5x，但在高难度任务上准确率差距显著。

场景四：长文档处理 / RAG

需求：超长上下文窗口、文档解析。推荐 Kimi K2.5（原生长上下文支持）、Qwen Max、MiniMax-01（1M tokens）。对于 PDF / 网页等复杂格式，Kimi 的文档解析能力领先。

场景五：预算极度敏感

需求：能跑就行，成本压到最低。推荐腾讯混元 Lite（免费）、阿里 Qwen Turbo、百度 ERNIE Lite。免费模型在简单分类、情感分析等任务上表现足够。

七、趋势与展望

价格战持续深化 -- 国内厂商之间的价格战在 2026 年进一步加剧。DeepSeek V3 以极低定价倒逼全行业跟进降价，阿里、百度、字节、腾讯纷纷推出免费版或大幅降价。对开发者而言，API 成本正快速接近边际。

推理能力成为新战场 -- GLM-5、Kimi K2.5 Thinking、DeepSeek R1 等推理模型的密集发布表明，厂商正从"通用智能"转向"深度推理"。这类模型虽然单价更高，但在复杂任务上的 ROI 远超普通模型。

新势力冲击格局 -- 小米 MiMo-V2 系列智能指数突破 49 分，MiniMax M2.7 紧随其后。蚂蚁 InclusionAI、美团 LongCat、快手 KAT-Coder 等大厂 AI 团队也在垂直领域建立差异化优势。

多模态加速落地 -- 小米 MiMo-V2-Omni、阶跃 Step VL、MiniMax 视频/音频模型等表明，纯文本之外的多模态能力正在成为国内厂商的下一个竞争焦点。

本文数据通过自动化管道从 Artificial Analysis、LMSYS Arena、OpenRouter 等源持续采集，价格与评测指标每日自动更新。更完整的全球模型对比请参见 LLM API Pricing Guide 2026。如发现数据有误，欢迎在 GitHub 提交 Issue 或 PR。