刚搭了个AI改作文的小工具

班上孩子作文老写不好，我琢磨着搭个本地AI批改，试了试Open-WebUI搭本地大模型，感觉还行。GitHub上有个叫TeachMate的项目，能基于LLaMA跑作文评分和修改建议，部署用Docker挺顺的，就是中文支持得调一下prompt。链接：https://github.com/iuricode/TeachMate 有坑分享：记得多写几个样例让模型学，不然评语太模板化。

讨论区

按楼层回复，支持引用与表情；使用 @用户名或 @昵称可提醒对方；发言计入圈子贡献字数。

5s 条评论

深夜改BUG 绽放14.4k 2026年5月29日 10:09

@接口又500 @需求又改了我试下来Qwen-14B-Chat配5个样例+角色设定效果最稳，还加了`--num-ctx 4096`防止长作文截断。另外docker-compose里model路径记得用绝对映射，不然报错找半天。
接口又500 成长10.1k 2026年5月29日 08:57

@粉笔没落灰我刚也试了TeachMate，中文支持确实拉胯，建议换个中文微调模型比如Yi-34B-Chat试试，Docker里改下MODEL变量就行。另外你prompt里加了几个样例？我看官方wiki说至少5个才能压住模板化。
安全佬路过 成长9,731 2026年5月29日 10:08

引用接口又500

@接口又500 我也踩过这坑，TeachMate 默认用的 LLaMA 2 7B，中文 tokenizer 词表太小。换成 Yi-34B-Chat 后记得改 `MODEL=/models/Yi-34B-Chat-GGUF`，Docker 里还得加个 `-e USE_EXLLAMA=0` 不然显存爆。你 prompt 里塞了系统角色没？我试过加 `你是语文老师` 能压住模板化。
需求又改了 成长11.7k 2026年5月29日 10:08

引用安全佬路过

@接口又500 我也踩过这坑，TeachMate 默认用的 LLaMA 2 7B，中文 tokenizer 词表太小。换成 Yi-34B-Chat 后记得改 `MODEL=/models/Yi-34B-Chat-GGUF`，Docker 里还得加个 `-e USE_EXLLAMA=0` 不然显存爆。你 prompt 里…

@接口又500 @安全佬路过你们说的对，中文支持是坑。我换成了Qwen-14B-Chat，Docker里改MODEL和加`-e USE_EXLLAMA=0`，prompt里塞了“你是语文老师”+5个样例，模板化压住不少。链接：https://huggingface.co/Qwen/Qwen-14B-Chat-GGUF 部署时记得把docker-compose的MODEL路径指向这个GGUF文件。

显存的话，14B量化成4-bit大概8G，16G卡能跑。你们试过用ollama直接拉模型吗？省Docker折腾。
P值小于0.05 成长11.4k 2026年5月29日 10:09

引用需求又改了

@接口又500 @安全佬路过你们说的对，中文支持是坑。我换成了Qwen-14B-Chat，Docker里改MODEL和加`-e USE_EXLLAMA=0`，prompt里塞了“你是语文老师”+5个样例，模板化压住不少。链接：https://huggingface.co/Qwen/Qwen-14B-Chat-GGUF…

@需求又改了这玩意用Qwen-14B-Chat配5个样例确实稳，我Docker里还加了`-e USE_FLASH_ATTENTION=1`，推理速度快了差不多30%，显存占用也降了2GB。有人试过加这个参数没？

发表评论取消回复

登录后发表评论

登录即可参与楼层讨论，支持引用回复与 @ 提醒。

前往登录页

讨论区

5s 条评论

发表评论 取消回复

发表评论取消回复