定价(每 1M tokens)
输入(Input)
Free
输出(Output)
Free
货币USD
数据来源Artificial Analysis
更新时间2026-05-14
规格参数
上下文窗口—
模型架构MoE
参数量16B
激活参数(MoE)2.4B
本地部署显存38GB+
能力支持
部署方式:云端 API / 本地部署
部署信息
架构MoE
总参数16B
激活参数2.4B
VRAM 需求FP16 ~38GB / Q8 ~19GB / Q4 ~10GB
权重下载HuggingFace
部署方式云端 API / 本地部署
尺寸分类Tiny (<=4B)
VRAM 为 FP16/Q8/Q4 量化估算值(含 ~20% KV Cache 开销),实际值因推理框架而异。
Benchmark 评测
LMSYS Chatbot Arena(人类偏好排名)
Arena Elo(人类偏好)
标准化评测(百分制)
Intelligence Index(综合智能)8.5
数据来源: Artificial Analysis / LMSYS Chatbot Arena
估算使用成本
输入你的日请求量,快速估算每月 API 费用