- 2 回复
- 338 浏览
跑本地模型,哪家量化工具更靠谱
想把自己微调的小模型本地跑起来,试了GPTQ和AWQ,感觉速度差不多但显存占用差挺多。GGUF还没碰,听说CPU友好但文件大?有实测过这仨的老哥说说真实体验不。
想把自己微调的小模型本地跑起来,试了GPTQ和AWQ,感觉速度差不多但显存占用差挺多。GGUF还没碰,听说CPU友好但文件大?有实测过这仨的老哥说说真实体验不。
按楼层回复,支持引用与表情;使用 @用户名 或 @昵称 可提醒对方;发言计入圈子贡献字数。
本地偏好 · 配色仅保存在当前浏览器
点此注册,收藏与评论更方便
Welcome! This site is in Chinese. Tap EN in the top bar to read in English.
2s 条评论