LLM API Pricing Guide 2026: Complete Comparison of 449+ Models
覆盖 449 个模型、50 个厂商、16 个中国厂商的完整定价指南。 数据自动更新,帮你找到最划算的 LLM API。
一、市场概览
2026 年的 LLM 市场格局已经高度成熟。全球和中国市场共有 50 个主要厂商、449 个可用模型。 价格区间从免费到 $600/1M tokens 不等(o1-pro),跨度达万倍级别。 GPT-5.4、Claude 4 Opus、Grok 4.20、Gemini 2.5 Pro 等新模型持续涌现,竞争白热化。
二、最便宜的 5 个模型
纯看价格,以下是输出 token 价格最低的模型。 适合对成本敏感、对能力要求不极端的场景。
| 模型 | 输入/1M | 输出/1M | 智能指数 |
|---|---|---|---|
| Llama 3.1 Tulu3 405B(Allen Institute for AI) | Free | Free | 14.1 |
| Molmo 7B-D(Allen Institute for AI) | Free | Free | 9.2 |
| Molmo2-8B(Allen Institute for AI) | Free | Free | 7.3 |
| OLMo 2 32B(Allen Institute for AI) | Free | Free | 10.6 |
| OLMo 2 7B(Allen Institute for AI) | Free | Free | 9.3 |
三、性价比 Top 5
TrakToken 的性价比指数综合考量三大核心指标(智能指数 35% + 编码指数 30% + Arena Elo 35%)与价格权重(输出 70% + 输入 30%), 给出百分制排名。
四、分档详解
前沿能力 (Frontier) -- 118 个模型
MMLU 90+、编码和推理能力顶尖的旗舰模型。适合复杂推理、数学证明、高级编码等场景。
主力生产 (Mainstream) -- 320 个模型
性能与价格的平衡点。适合客服、内容生成、文档分析等日常业务场景。
经济实惠 (Economy) -- 11 个模型
极致性价比,适合大批量处理、简单分类/摘要等成本敏感场景。
五、中文市场专区
中国市场有 16 家主要模型厂商,共提供 126 个模型。 多数支持人民币定价,部分提供免费版本。
| 厂商 | 模型数 | 代表模型 | 起步价/1M (CNY) |
|---|---|---|---|
| DeepSeek | 25 | DeepSeek Coder V2 Lite Instruct | - |
| 阿里云 | 71 | Qwen Chat 14B | - |
| 字节跳动 | 2 | Doubao Seed Code | - |
| 月之暗面 | 6 | Kimi Linear 48B A3B Instruct | - |
| Z AI (智谱 AI) | 14 | GLM-4.7-Flash (Non-reasoning) | - |
| 百度智能云 | 2 | ERNIE 5.0 Thinking Preview | - |
| MiniMax | 6 | MiniMax M1 40k | - |
| 腾讯云 | 0 | - | - |
| 百川智能 | 0 | - | - |
| 零一万物 | 0 | - | - |
| 阶跃星辰 | 0 | - | - |
| 快手 KwaiKAT | 0 | - | - |
| 小米 | 0 | - | - |
| 南北阁 | 0 | - | - |
| 蚂蚁 InclusionAI | 0 | - | - |
| 美团 LongCat | 0 | - | - |
六、2026 Q1 最新动态
GPT-5.4 Pro / Mini / Nano 三档齐发,其中 Nano 定位极致性价比,Mini 支持 medium / xhigh 多档推理强度。 Pro(xhigh)输出价 $180/1M,是 GPT-4o 的数倍,面向高端推理场景。
Elon Musk 旗下 xAI 推出 Grok 4.20 Beta 0309,同时提供推理与非推理版本, 深度整合 X 平台实时数据,在推理基准上表现强劲。
巴黎 AI 厂商 Mistral 推出 Small 4 的推理与非推理双版本,持续巩固欧洲开源 AI 领先地位。
小米 MiMo-V2 系列、MiniMax M2.7、蚂蚁 InclusionAI Ring 推理模型等密集发布。 国内厂商在多模态和推理赛道上的投入明显加速。 详见 国内大模型 API 全对比。
七、如何选择
需求:大量简短对话,低延迟。推荐 GPT-4o mini、GPT-5.4 nano、DeepSeek V3、Qwen Plus、Gemini 2.0 Flash Lite。 使用 成本计算器 估算月度费用。
需求:高编码能力、长上下文。推荐 Claude 4 Opus、Gemini 2.5 Pro、Codestral、DeepSeek V3。 编码评分 90+ 的模型通常值得多花 2-3x 的价格。
需求:链式推理、数学证明、竞赛级别任务。推荐 o3、GPT-5.4 Pro、Grok 4.20、Gemini 2.5 Pro。 推理类模型价格较高,但在高难度任务上 ROI 明显优于普通模型。
使用 本地 ROI 计算器 输入你的硬件配置和使用量, 直接看回本周期。24GB 显存可跑 Qwen2.5-7B / DeepSeek R1 Distill 7B / Llama 3.2 3B 等模型。
本文数据通过自动化管道从 Artificial Analysis、LMSYS Arena、OpenRouter 等源持续采集, 价格与评测指标每日自动更新。如发现数据有误,欢迎在 GitHub 提交 Issue 或 PR。