Back to writing

Article

本地跑模型,我会先看 Gemma 4,也会拿 Qwen3.6-Plus 做参照

如果目标是本地部署,我先看的不是榜单,而是机器条件:显存多少、要不要离线、中文是不是主场景。这三个问题先定,选型就不会跑偏。

Gemma 4 现在很值得看。Google 在 2026 年 4 月 2 日正式发布 Gemma 4,路线很清楚:开源、能本地跑,还把推理、函数调用、代码和多模态一起补强。对想做本地知识库、离线助理、桌面端 AI 工具的人来说,这条线很实在,尤其适合先把流程跑通。

Qwen 这边,我会把之前提到的 Qwen3 换成 Qwen3.6-Plus。它也是 2026 年 4 月 2 日更新的一代,代码、Agent、OCR 和多模态都更强。但要说清楚一点,Qwen3.6-Plus 更像高能力的 Plus 线主力,不是那种拿到权重就能随手本地跑的开源版本。所以我的做法是:本地侧先用 Gemma 4 这类开放权重把系统搭起来,再拿 Qwen3.6-Plus 做效果对照,看哪些任务必须上云,哪些任务留在本地。这样更稳,也更省。

Continue reading

Browse the full archive.

The blog section keeps recent notes, software ideas, and build updates together in one clean place.

Profile

Kair Wang

Passionate software developer with expertise in full-stack development, IoT systems, and modern web technologies. Currently pursuing Computer Science with a focus on creating innovative solutions.