Article
本地跑模型,我会先看 Gemma 4,也会拿 Qwen3.6-Plus 做参照
如果目标是本地部署,我先看的不是榜单,而是机器条件:显存多少、要不要离线、中文是不是主场景。这三个问题先定,选型就不会跑偏。
Gemma 4 现在很值得看。Google 在 2026 年 4 月 2 日正式发布 Gemma 4,路线很清楚:开源、能本地跑,还把推理、函数调用、代码和多模态一起补强。对想做本地知识库、离线助理、桌面端 AI 工具的人来说,这条线很实在,尤其适合先把流程跑通。
Qwen 这边,我会把之前提到的 Qwen3 换成 Qwen3.6-Plus。它也是 2026 年 4 月 2 日更新的一代,代码、Agent、OCR 和多模态都更强。但要说清楚一点,Qwen3.6-Plus 更像高能力的 Plus 线主力,不是那种拿到权重就能随手本地跑的开源版本。所以我的做法是:本地侧先用 Gemma 4 这类开放权重把系统搭起来,再拿 Qwen3.6-Plus 做效果对照,看哪些任务必须上云,哪些任务留在本地。这样更稳,也更省。