开源模型选型指南
313 个开源模型,覆盖主流厂商。按参数规模、架构类型、VRAM 需求筛选, 找到最适合你硬件条件的开源模型。
Large
6
Medium
47
Small
187
Tiny
73
共 313 个开源模型
排序:
Kimi K2.6
月之暗面CN
3 周前
IQ53.9
|1T / 32BMoEfp162.4TB
q81.2TB
q4600GB
HF
MiMo-V2.5-Pro
小米CN
3 周前
IQ53.8
|1T / 42BMoEfp162.4TB
q81.2TB
q4600GB
上下文 1M
HFDeepSeek V4 Pro (Reasoning, Max Effort)
DeepSeekCN
2 周前
IQ51.5
|1.6T / 49BMoEfp163.8TB
q81.9TB
q4960GB
上下文 1M
HFGLM-5.1 (Reasoning)
Z AI (智谱 AI)CN
1 个月前
IQ51.4
|744B / 40BMoEfp161.8TB
q8893GB
q4446GB
上下文 203K
HFDeepSeek V4 Pro (Reasoning, High Effort)
DeepSeekCN
2 周前
IQ49.8
|1.6T / 49BMoEfp163.8TB
q81.9TB
q4960GB
上下文 1M
HFGLM-5 (Reasoning)
Z AI (智谱 AI)CN
3 个月前
IQ49.8
|744B / 40BMoEfp161.8TB
q8893GB
q4446GB
上下文 203K
HFMiniMax-M2.7
MiniMaxCN
1 个月前
IQ49.6
|230B / 10BMoEfp16552GB
q8276GB
q4138GB
上下文 197K
HFMiMo-V2.5
小米CN
3 周前
IQ49.0
|310B / 15BMoEfp16744GB
q8372GB
q4186GB
上下文 1M
HFKimi K2.5 (Reasoning)
月之暗面CN
3 个月前
IQ46.8
|1T / 32BMoEfp162.4TB
q81.2TB
q4600GB
HF
DeepSeek V4 Flash (Reasoning, Max Effort)
DeepSeekCN
2 周前
IQ46.5
|284B / 13BMoEfp16682GB
q8341GB
q4170GB
上下文 1M
HFDeepSeek V4 Flash (Reasoning, High Effort)
DeepSeekCN
2 周前
IQ46.0
|284B / 13BMoEfp16682GB
q8341GB
q4170GB
上下文 1M
HFQwen3.6 27B (Reasoning)
阿里云CN
3 周前
IQ45.8
|27.8BDensefp1667GB
q833GB
q417GB
上下文 262K
HFQwen3.5 397B A17B (Reasoning)
阿里云CN
2 个月前
IQ45.0
|397B / 17BMoEfp16953GB
q8476GB
q4238GB
上下文 262K
HFGLM-5.1 (Non-reasoning)
Z AI (智谱 AI)CN
1 个月前
IQ43.8
|744B / 40BMoEfp161.8TB
q8893GB
q4446GB
上下文 203K
HFQwen3.6 35B A3B (Reasoning)
阿里云CN
4 周前
IQ43.5
|36B / 3BMoEfp1686GB
q843GB
q422GB
上下文 262K
HFKimi K2.6 (Non-reasoning)
月之暗面CN
3 周前
IQ42.9
|1T / 32BMoEfp162.4TB
q81.2TB
q4600GB
HF
Qwen3.5 27B (Reasoning)
阿里云CN
2 个月前
IQ42.1
|27.8BDensefp1667GB
q833GB
q417GB
上下文 262K
HFGLM-4.7 (Reasoning)
Z AI (智谱 AI)CN
4 个月前
IQ42.1
|357B / 32BMoEfp16857GB
q8428GB
q4214GB
上下文 203K
HFMiniMax-M2.5
MiniMaxCN
3 个月前
IQ41.9
|230B / 10BMoEfp16552GB
q8276GB
q4138GB
上下文 197K
HFHy3-preview (Reasoning)
腾讯云CN
3 周前
IQ41.9
|295B / 21BMoEfp16708GB
q8354GB
q4177GB
上下文 262K
HFDeepSeek V3.2 (Reasoning)
DeepSeekCN
5 个月前
IQ41.7
|685B / 37BMoEfp161.6TB
q8822GB
q4411GB
上下文 164K
HFQwen3.5 122B A10B (Reasoning)
阿里云CN
2 个月前
IQ41.6
|125B / 10BMoEfp16300GB
q8150GB
q475GB
上下文 262K
HFMiMo-V2-Flash (Feb 2026)
小米CN
4 个月前
IQ41.5
|309B / 15BMoEfp16742GB
q8371GB
q4185GB
HF
Kimi K2 Thinking
月之暗面CN
6 个月前
IQ40.9
|1T / 32BMoEfp162.4TB
q81.2TB
q4600GB
HF
VRAM 兼容性检查器
选择你的显卡和量化级别,查看可运行的开源模型列表
x
NVIDIA RTX 4090x 1 =24GB总显存(Q4 量化)
可运行 162 个开源模型
IQ 45.817GB
IQ 43.522GB
IQ 42.117GB
IQ 39.218GB
IQ 37.217GB
IQ 37.122GB
IQ 37.117GB
IQ 32.46GB
IQ 32.318GB
IQ 31.522GB
IQ 31.215GB
IQ 30.722GB
IQ 30.221GB
IQ 30.119GB
IQ 28.419GB
IQ 28.39GB
IQ 27.69GB
IQ 27.36GB
IQ 27.13GB
IQ 27.115GB
IQ 25.222GB
IQ 24.720GB
IQ 24.513GB
IQ 24.319GB
IQ 23.719GB
IQ 22.63GB
IQ 22.418GB
IQ 22.119GB
IQ 21.418GB
IQ 20.813GB
IQ 20.018GB
IQ 20.013GB
IQ 19.718GB
IQ 19.720GB
IQ 19.514GB
IQ 18.85GB
IQ 18.613GB
IQ 18.22GB
IQ 18.214GB
IQ 18.014GB
IQ 17.220GB
IQ 17.219GB
IQ 16.814GB
IQ 16.75GB
IQ 16.719GB
IQ 16.520GB
IQ 16.45GB
IQ 16.31GB
IQ 16.29GB
IQ 16.12GB
IQ 16.018GB
IQ 16.08GB
IQ 15.88GB
IQ 15.84GB
IQ 15.621GB
IQ 15.56GB
IQ 15.318GB
IQ 15.220GB
IQ 15.23GB
IQ 15.214GB
IQ 15.114GB
IQ 15.018GB
IQ 14.85GB
IQ 14.85GB
IQ 14.85GB
IQ 14.71GB
IQ 14.718GB
IQ 14.72GB
IQ 14.520GB
IQ 14.514GB
IQ 14.35GB
IQ 14.22GB
ZAYA1-8BMoE
IQ 14.15GB
IQ 13.919GB
IQ 13.73GB
IQ 13.219GB
IQ 13.25GB
IQ 13.219GB
IQ 12.919GB
IQ 12.92GB
IQ 12.89GB
IQ 12.714GB
IQ 12.71GB
IQ 12.518GB
IQ 12.52GB
IQ 12.45GB
IQ 12.319GB
IQ 12.219GB
IQ 12.119GB
IQ 12.15GB
IQ 12.13GB
IQ 11.96GB
IQ 11.85GB
IQ 11.719GB
IQ 11.22GB
IQ 10.819GB
IQ 10.721GB
IQ 10.619GB
IQ 10.65GB
IQ 10.51GB
LFM2 24B A2BMoE
IQ 10.514GB
IQ 10.48GB
IQ 10.316GB
IQ 10.213GB
IQ 10.12GB
IQ 10.15GB
IQ 10.05GB
IQ 10.03GB
IQ 9.91GB
IQ 9.74GB
IQ 9.72GB
IQ 9.62GB
IQ 9.63GB
IQ 9.513GB
IQ 9.44GB
IQ 9.34GB
IQ 9.25GB
IQ 9.210GB
IQ 9.11GB
IQ 8.87GB
IQ 8.77GB
IQ 8.510GB
IQ 8.52GB
IQ 8.42GB
IQ 8.44GB
IQ 8.48GB
IQ 8.414GB
IQ 8.31GB
IQ 8.34GB
IQ 8.14GB
IQ 8.11GB
IQ 8.11GB
IQ 8.01GB
IQ 8.01GB
IQ 8.02GB
IQ 8.01GB
IQ 7.72GB
IQ 7.48GB
IQ 7.421GB
IQ 7.44GB
IQ 7.35GB
IQ 7.31GB
IQ 7.05GB
LFM2 8B A1BMoE
IQ 7.05GB
IQ 6.81GB
IQ 6.45GB
IQ 6.45GB
IQ 6.33GB
IQ 6.31GB
IQ 6.31GB
IQ 6.21GB
IQ 5.95GB
IQ 5.61GB
IQ 4.84GB
IQ 4.72GB
VRAM 需求为估算值(含 ~20% KV Cache 开销),实际值因推理框架(vLLM / llama.cpp / TGI)而异。 MoE 模型需全量加载权重,推理时仅激活部分参数。