RTX 3090 跑Qwen3.6-27B-Q5_K_M居然能到20 token/s?

回答: 本地 AI 部署心得pichawxc2026-05-05 12:20:26

我4090 都跑不到10 t/s? 用Q4的勉强到15 t/s, 有什么诀窍吗?我是用ollama + claude code

请您先登陆,再发跟帖!