RTX 3090 跑Qwen3.6-27B-Q5_K_M居然能到20 token/s？

jasonshane · 2026-05-16 00:02:02Z

RTX 3090 跑Qwen3.6-27B-Q5_K_M居然能到20 token/s？简介

来源: jasonshane 于 2026-05-16 00:02:02 [档案] [博客] [旧帖] [给我悄悄话] 阅读数 : (114 bytes)

回答: 本地 AI 部署心得由 pichawxc 于 2026-05-05 12:20:26

我4090 都跑不到10 t/s？用Q4的勉强到15 t/s, 有什么诀窍吗？我是用ollama + claude code

您的位置：文学城 » 论坛 » 实用电脑 » RTX 3090 跑Qwen3.6-27B-Q5_K_M居然能到20 token/s？

• 下载地址网上查，文学城不让发 -pichawxc- ♂ (396 bytes) () 05/17/2026 postreply 17:40:36