Guide2026-03-17

LLM API Pricing Guide 2026: Complete Comparison of 517+ Models

覆盖 517 个模型、54 个厂商、16 个中国厂商的完整定价指南。数据自动更新，帮你找到最划算的 LLM API。

一、市场概览

2026 年的 LLM 市场格局已经高度成熟。全球和中国市场共有 54 个主要厂商、517 个可用模型。价格区间从免费到 $600/1M tokens 不等（o1-pro），跨度达万倍级别。 GPT-5.4、Claude 4 Opus、Grok 4.20、Gemini 2.5 Pro 等新模型持续涌现，竞争白热化。

517

模型数量

厂商数量

中国厂商

171

中文模型

二、最便宜的 5 个模型

纯看价格，以下是输出 token 价格最低的模型。适合对成本敏感、对能力要求不极端的场景。

模型	输入/1M	输出/1M	智能指数
Llama 3.1 Tulu3 405B(Allen Institute for AI)	Free	Free	14.1
Molmo 7B-D(Allen Institute for AI)	Free	Free	9.2
Molmo2-8B(Allen Institute for AI)	Free	Free	7.3
OLMo 2 32B(Allen Institute for AI)	Free	Free	10.6
OLMo 2 7B(Allen Institute for AI)	Free	Free	9.3

三、性价比 Top 5

TrakToken 的性价比指数综合考量三大核心指标（智能指数 35% + 编码指数 30% + Arena Elo 35%）与价格权重（输出 70% + 输入 30%），给出百分制排名。

Gemma 3n E4B Instruct

Google · 33K 上下文

100

$0.040/1M output

Qwen3.5 0.8B (Reasoning)

阿里云 · — 上下文

$0.050/1M output

DeepSeek V4 Flash (Reasoning, High Effort)

DeepSeek · 1M 上下文

$0.280/1M output

DeepSeek V4 Flash (Reasoning, Max Effort)

DeepSeek · 1M 上下文

$0.280/1M output

Hy3-preview (Reasoning)

腾讯云 · 262K 上下文

$0.300/1M output

四、分档详解

前沿能力 (Frontier) -- 150 个模型

MMLU 90+、编码和推理能力顶尖的旗舰模型。适合复杂推理、数学证明、高级编码等场景。

Gemma 3n E4B Instruct ($0.040)Qwen3.5 0.8B (Reasoning) ($0.050)DeepSeek V4 Flash (Reasoning, High Effort) ($0.280)DeepSeek V4 Flash (Reasoning, Max Effort) ($0.280)Hy3-preview (Reasoning) ($0.300)Qwen3.5 9B (Reasoning) ($0.150)DeepSeek V4 Flash (Non-reasoning) ($0.280)gpt-oss-20B (high) ($0.200)

主力生产 (Mainstream) -- 356 个模型

性能与价格的平衡点。适合客服、内容生成、文档分析等日常业务场景。

Qwen3 235B A22B 2507 (Reasoning) ($2.150)Qwen3.5 35B A3B (Non-reasoning) ($2.000)Gemini 2.5 Pro Preview (Mar' 25) (Free)Gemini 3 Deep Think (Free)Gemini 3 Flash Preview (Reasoning) ($3.000)EXAONE 4.5 33B (Non-reasoning) (Free)Llama 3.2 Instruct 11B (Vision) ($0.245)Kimi K2.5 (Reasoning) ($2.925)

经济实惠 (Economy) -- 11 个模型

极致性价比，适合大批量处理、简单分类/摘要等成本敏感场景。

Claude 4.1 Opus (Non-reasoning) ($75.000)Claude 4 Opus (Non-reasoning) ($75.000)Claude 4.1 Opus (Reasoning) ($75.000)Claude 4 Opus (Reasoning) ($75.000)o1 ($60.000)o1-preview ($66.000)o3-pro ($80.000)Claude 3 Opus ($75.000)

五、中文市场专区

中国市场有 16 家主要模型厂商，共提供 171 个模型。多数支持人民币定价，部分提供免费版本。

厂商	模型数	代表模型	起步价/1M (CNY)
DeepSeek	31	DeepSeek Coder V2 Lite Instruct	-
阿里云	79	Qwen Chat 14B	-
字节跳动	2	Doubao Seed Code	-
月之暗面	8	Kimi Linear 48B A3B Instruct	-
Z AI (智谱 AI)	18	GLM 5V Turbo (Reasoning)	-
百度智能云	2	ERNIE 5.0 Thinking Preview	-
MiniMax	6	MiniMax M1 40k	-
腾讯云	2	Hy3-preview (Non-reasoning)	-
百川智能	0	-	-
零一万物	0	-	-
阶跃星辰	3	Step 3.5 Flash 2603	-
快手 KwaiKAT	2	KAT Coder Pro V2	-
小米	9	MiMo-V2-Omni	-
南北阁	1	Nanbeige4.1-3B	-
蚂蚁 InclusionAI	7	Ling-1T	-
美团 LongCat	1	LongCat Flash Lite	-

六、2026 Q1 最新动态

OpenAI GPT-5.4 系列发布

GPT-5.4 Pro / Mini / Nano 三档齐发，其中 Nano 定位极致性价比，Mini 支持 medium / xhigh 多档推理强度。 Pro（xhigh）输出价 $180/1M，是 GPT-4o 的数倍，面向高端推理场景。

xAI Grok 4.20 Beta

Elon Musk 旗下 xAI 推出 Grok 4.20 Beta 0309，同时提供推理与非推理版本，深度整合 X 平台实时数据，在推理基准上表现强劲。

Mistral Small 4 双版本

巴黎 AI 厂商 Mistral 推出 Small 4 的推理与非推理双版本，持续巩固欧洲开源 AI 领先地位。

国产新势力持续发力

小米 MiMo-V2 系列、MiniMax M2.7、蚂蚁 InclusionAI Ring 推理模型等密集发布。国内厂商在多模态和推理赛道上的投入明显加速。详见国内大模型 API 全对比。

七、如何选择

场景一：客服机器人

需求：大量简短对话，低延迟。推荐 GPT-4o mini、GPT-5.4 nano、DeepSeek V3、Qwen Plus、Gemini 2.0 Flash Lite。使用成本计算器估算月度费用。

场景二：代码辅助

需求：高编码能力、长上下文。推荐 Claude 4 Opus、Gemini 2.5 Pro、Codestral、DeepSeek V3。编码评分 90+ 的模型通常值得多花 2-3x 的价格。

场景三：复杂推理与数学

需求：链式推理、数学证明、竞赛级别任务。推荐 o3、GPT-5.4 Pro、Grok 4.20、Gemini 2.5 Pro。推理类模型价格较高，但在高难度任务上 ROI 明显优于普通模型。

场景四：有 GPU，犹豫要不要本地部署

使用本地 ROI 计算器输入你的硬件配置和使用量，直接看回本周期。24GB 显存可跑 Qwen2.5-7B / DeepSeek R1 Distill 7B / Llama 3.2 3B 等模型。

本文数据通过自动化管道从 Artificial Analysis、LMSYS Arena、OpenRouter 等源持续采集，价格与评测指标每日自动更新。如发现数据有误，欢迎在 GitHub 提交 Issue 或 PR。