TrakTokenBeta
首页/Nous Research/Hermes 4 - Llama-3.1 405B (Reasoning)

Hermes 4 - Llama-3.1 405B (Reasoning)

Nous Research开源·2025-08-27

定价(每 1M tokens)

输入(Input)
$1.00/1M
输出(Output)
$3.00/1M
货币USD
数据来源Artificial Analysis
更新时间2026-05-14

规格参数

上下文窗口
模型架构Dense
参数量406B
本地部署显存974GB+

能力支持

部署方式:云端 API / 本地部署

部署信息

架构Dense
总参数406B
VRAM 需求FP16 ~974GB / Q8 ~487GB / Q4 ~244GB
权重下载HuggingFace
部署方式云端 API / 本地部署
尺寸分类Large (>150B)

VRAM 为 FP16/Q8/Q4 量化估算值(含 ~20% KV Cache 开销),实际值因推理框架而异。

Benchmark 评测

LMSYS Chatbot Arena(人类偏好排名)

Arena Elo(人类偏好)

标准化评测(百分制)

Intelligence Index(综合智能)18.6
Coding Index(编码能力)16%
Math Index(数学推理)69.7%

数据来源: Artificial Analysis / LMSYS Chatbot Arena

估算使用成本
输入你的日请求量,快速估算每月 API 费用
打开计算器