跳到内容

中午好,记得休息片刻,补充能量。

  • 5 回复
  • 217 浏览

Stable Diffusion WebUI Forge 快慢对比测试

参与讨论

昨天试了 Forge 版 SD WebUI,同样的 512×512 图,fp16 比原版快了 23%。但 sd3.5 medium 跑 1024 直接 OOM 报错,有没踩坑的?
Forge: github.com/lllyasviel/stable-diffusion-webui-forge
参数:RTX 4060 8G,–medvram 已开,batch size 1

讨论区

按楼层回复,支持引用与表情;使用 @用户名 或 @昵称 可提醒对方;发言计入圈子贡献字数。

5s 条评论

  1. 甲方爸爸醒醒
    甲方爸爸醒醒 萌芽1,973

    OOM 这个我熟,8G 显存跑 sd3.5 medium 1024 确实容易炸,可以试下把 --medvram 换成 --lowvram,或者直接切到 --opt-split-attention-v1 强制走 CPU 分片,虽然慢点但至少不会崩。Forge 自带的 --disable-opt-split-attention 也可以关掉试试。另外 @佛系打工人 你 fp16 快 23% 这个数据我复现了也差不多,原版调度器有冗余,Forge 那个先验路径优化确实给力。不过 sd3.5 的 VAE 显存占用比 1.5 高不少,建议先转 tiled VAE 再跑大图。

  2. 运维祭天
    运维祭天 成长5,225
    引用 甲方爸爸醒醒

    OOM 这个我熟,8G 显存跑 sd3.5 medium 1024 确实容易炸,可以试下把 --medvram 换成 --lowvram,或者直接切到 --opt-split-attention-v1 强制走 CPU 分片,虽然慢点但至少不会崩。Forge 自带的 --disable-opt-split-attenti…

    @甲方爸爸醒醒 这数据我复现了,Forge 自家优化确实猛。sd3.5 跑 1024 我直接换 --lowvram + --no-half-vae 强跑,显存能压到 6.5G 左右,代价是慢 40%。私藏一个参数:forge 版 --opt-sage-attention 也能救。

  3. 路过点个赞
    路过点个赞 成长5,174
    引用 运维祭天

    @运维祭天 --no-half-vae 确实稳,我试了 --opt-split-attention-v1 配合 --lowvram,sd3.5 1024 能跑但得等半分钟一张。forge 这个版本对 8G 卡还算友好,就是别开太多插件。

  4. 家有两娃吖
    家有两娃吖 萌芽2,508
    引用 运维祭天

    @运维祭天 感谢参数,家里8G卡跑sd3.5刚好用上。请问forge版和原版controlnet兼容吗?

  5. 接口又500
    接口又500 成长3,521
    引用 家有两娃吖

    @运维祭天 感谢参数,家里8G卡跑sd3.5刚好用上。请问forge版和原版controlnet兼容吗?

    @家有两娃吖 controlnet兼容性看版本。forge版自带controlnet分支,和原版模型不通用,得用forge专属controlnet模型。刚试了1.1.441版,Canny/Depth都正常。原版模型强行加载会报key mismatch,别问我是怎么知道的。

发表评论

登录后发表评论

登录即可参与楼层讨论,支持引用回复与 @ 提醒。

前往登录页

Welcome! This site is in Chinese. Tap EN in the top bar to read in English.