TrakTokenBeta

开源模型选型指南

313 个开源模型,覆盖主流厂商。按参数规模、架构类型、VRAM 需求筛选, 找到最适合你硬件条件的开源模型。

Large
6
Medium
47
Small
187
Tiny
73
共 313 个开源模型
排序:

Kimi K2.6

月之暗面CN
3 周前
IQ53.9
|1T / 32BMoE
fp162.4TB
q81.2TB
q4600GB
HF

MiMo-V2.5-Pro

小米CN
3 周前
IQ53.8
|1T / 42BMoE
fp162.4TB
q81.2TB
q4600GB
上下文 1M
HF

DeepSeek V4 Pro (Reasoning, Max Effort)

DeepSeekCN
2 周前
IQ51.5
|1.6T / 49BMoE
fp163.8TB
q81.9TB
q4960GB
上下文 1M
HF

GLM-5.1 (Reasoning)

Z AI (智谱 AI)CN
1 个月前
IQ51.4
|744B / 40BMoE
fp161.8TB
q8893GB
q4446GB
上下文 203K
HF

DeepSeek V4 Pro (Reasoning, High Effort)

DeepSeekCN
2 周前
IQ49.8
|1.6T / 49BMoE
fp163.8TB
q81.9TB
q4960GB
上下文 1M
HF

GLM-5 (Reasoning)

Z AI (智谱 AI)CN
3 个月前
IQ49.8
|744B / 40BMoE
fp161.8TB
q8893GB
q4446GB
上下文 203K
HF

MiniMax-M2.7

MiniMaxCN
1 个月前
IQ49.6
|230B / 10BMoE
fp16552GB
q8276GB
q4138GB
上下文 197K
HF

MiMo-V2.5

小米CN
3 周前
IQ49.0
|310B / 15BMoE
fp16744GB
q8372GB
q4186GB
上下文 1M
HF

Kimi K2.5 (Reasoning)

月之暗面CN
3 个月前
IQ46.8
|1T / 32BMoE
fp162.4TB
q81.2TB
q4600GB
HF

DeepSeek V4 Flash (Reasoning, Max Effort)

DeepSeekCN
2 周前
IQ46.5
|284B / 13BMoE
fp16682GB
q8341GB
q4170GB
上下文 1M
HF

DeepSeek V4 Flash (Reasoning, High Effort)

DeepSeekCN
2 周前
IQ46.0
|284B / 13BMoE
fp16682GB
q8341GB
q4170GB
上下文 1M
HF

Qwen3.6 27B (Reasoning)

阿里云CN
3 周前
IQ45.8
|27.8BDense
fp1667GB
q833GB
q417GB
上下文 262K
HF

Qwen3.5 397B A17B (Reasoning)

阿里云CN
2 个月前
IQ45.0
|397B / 17BMoE
fp16953GB
q8476GB
q4238GB
上下文 262K
HF

GLM-5.1 (Non-reasoning)

Z AI (智谱 AI)CN
1 个月前
IQ43.8
|744B / 40BMoE
fp161.8TB
q8893GB
q4446GB
上下文 203K
HF

Qwen3.6 35B A3B (Reasoning)

阿里云CN
4 周前
IQ43.5
|36B / 3BMoE
fp1686GB
q843GB
q422GB
上下文 262K
HF

Kimi K2.6 (Non-reasoning)

月之暗面CN
3 周前
IQ42.9
|1T / 32BMoE
fp162.4TB
q81.2TB
q4600GB
HF

Qwen3.5 27B (Reasoning)

阿里云CN
2 个月前
IQ42.1
|27.8BDense
fp1667GB
q833GB
q417GB
上下文 262K
HF

GLM-4.7 (Reasoning)

Z AI (智谱 AI)CN
4 个月前
IQ42.1
|357B / 32BMoE
fp16857GB
q8428GB
q4214GB
上下文 203K
HF

MiniMax-M2.5

MiniMaxCN
3 个月前
IQ41.9
|230B / 10BMoE
fp16552GB
q8276GB
q4138GB
上下文 197K
HF

Hy3-preview (Reasoning)

腾讯云CN
3 周前
IQ41.9
|295B / 21BMoE
fp16708GB
q8354GB
q4177GB
上下文 262K
HF

DeepSeek V3.2 (Reasoning)

DeepSeekCN
5 个月前
IQ41.7
|685B / 37BMoE
fp161.6TB
q8822GB
q4411GB
上下文 164K
HF

Qwen3.5 122B A10B (Reasoning)

阿里云CN
2 个月前
IQ41.6
|125B / 10BMoE
fp16300GB
q8150GB
q475GB
上下文 262K
HF

MiMo-V2-Flash (Feb 2026)

小米CN
4 个月前
IQ41.5
|309B / 15BMoE
fp16742GB
q8371GB
q4185GB
HF

Kimi K2 Thinking

月之暗面CN
6 个月前
IQ40.9
|1T / 32BMoE
fp162.4TB
q81.2TB
q4600GB
HF

VRAM 兼容性检查器

选择你的显卡和量化级别,查看可运行的开源模型列表

x
NVIDIA RTX 4090x 1 =24GB总显存(Q4 量化)
可运行 162 个开源模型
IQ 45.817GB
IQ 43.522GB
IQ 42.117GB
IQ 39.218GB
IQ 37.217GB
IQ 37.122GB
IQ 37.117GB
IQ 32.46GB
IQ 31.522GB
IQ 31.215GB
IQ 30.722GB
EXAONE 4.5 33B
IQ 30.221GB
GLM-4.7-Flash (Reasoning)MoE
IQ 30.119GB
IQ 28.419GB
IQ 28.39GB
IQ 27.69GB
IQ 27.36GB
IQ 27.13GB
IQ 25.222GB
IQ 24.720GB
IQ 24.513GB
IQ 22.63GB
IQ 22.418GB
IQ 22.119GB
IQ 20.813GB
IQ 20.018GB
IQ 20.013GB
IQ 19.718GB
QwQ 32B
IQ 19.720GB
IQ 19.514GB
IQ 18.85GB
Tri-21B-Think
IQ 18.613GB
IQ 18.22GB
IQ 18.214GB
IQ 18.014GB
IQ 17.220GB
IQ 17.219GB
IQ 16.814GB
IQ 16.75GB
IQ 16.719GB
IQ 16.520GB
IQ 16.45GB
IQ 16.31GB
IQ 16.29GB
IQ 16.12GB
IQ 16.018GB
Ministral 3 14B
IQ 16.08GB
IQ 15.84GB
IQ 15.621GB
Step3 VL 10B
IQ 15.56GB
IQ 15.318GB
IQ 15.220GB
IQ 15.23GB
IQ 15.214GB
IQ 15.114GB
IQ 15.018GB
IQ 14.85GB
Ministral 3 8B
IQ 14.85GB
IQ 14.71GB
IQ 14.718GB
IQ 14.520GB
IQ 14.514GB
IQ 14.35GB
IQ 14.22GB
ZAYA1-8BMoE
IQ 14.15GB
Olmo 3.1 32B Think
IQ 13.919GB
IQ 13.73GB
IQ 13.219GB
IQ 13.25GB
IQ 12.919GB
IQ 12.92GB
IQ 12.89GB
Mistral Small 3
IQ 12.714GB
IQ 12.71GB
IQ 12.518GB
IQ 12.52GB
IQ 12.45GB
IQ 12.319GB
Olmo 3.1 32B Instruct
IQ 12.219GB
Olmo 3 32B Think
IQ 12.119GB
IQ 12.13GB
Solar Mini
IQ 11.96GB
IQ 11.85GB
IQ 11.719GB
Ministral 3 3B
IQ 11.22GB
IQ 10.819GB
IQ 10.721GB
OLMo 2 32B
IQ 10.619GB
IQ 10.65GB
IQ 10.51GB
LFM2 24B A2BMoE
IQ 10.514GB
Phi-4
IQ 10.48GB
IQ 10.316GB
IQ 10.213GB
IQ 10.12GB
IQ 10.05GB
IQ 10.03GB
IQ 9.74GB
IQ 9.62GB
IQ 9.63GB
IQ 9.513GB
Olmo 3 7B Think
IQ 9.44GB
OLMo 2 7B
IQ 9.34GB
Molmo 7B-D
IQ 9.25GB
Ling-mini-2.0MoE
IQ 9.210GB
IQ 8.87GB
IQ 8.510GB
IQ 8.52GB
Phi-4 Mini Instruct
IQ 8.42GB
IQ 8.48GB
IQ 8.414GB
IQ 8.31GB
IQ 8.34GB
Olmo 3 7B Instruct
IQ 8.14GB
IQ 8.11GB
IQ 8.11GB
IQ 8.01GB
IQ 8.01GB
LFM2 2.6B
IQ 8.02GB
IQ 8.01GB
IQ 7.72GB
Qwen Chat 14B
IQ 7.48GB
IQ 7.421GB
IQ 7.44GB
Molmo2-8B
IQ 7.35GB
IQ 7.31GB
LFM2 8B A1BMoE
IQ 7.05GB
IQ 6.81GB
IQ 6.45GB
IQ 6.45GB
IQ 6.33GB
LFM2 1.2B
IQ 6.31GB
IQ 6.21GB
Apertus 8B Instruct
IQ 5.95GB
IQ 5.61GB
IQ 4.84GB
IQ 4.72GB

VRAM 需求为估算值(含 ~20% KV Cache 开销),实际值因推理框架(vLLM / llama.cpp / TGI)而异。 MoE 模型需全量加载权重,推理时仅激活部分参数。