小猪佩奇 大佬有话说 :
挑战sdwebui最低配置
本帖最后由 小猪佩奇 于 2023-5-13 19:46 编辑
sdwebui需要至少4g以上显存的英伟达甜品卡,天花板自然是卡皇4090。
过高的配置要求让不少mjj望而却步,虽然有colab、dsw这种资源可白piao,不过线上的自然没有本地用的舒坦用的安心。
事实上sdwebui早就可以使用低显存显卡,甚至直接拿CPU跑,只不过效率很低。
那么低配置的机器到底该如何运行,出图效率到底如何。
这里拿两台机器作为参考,一台是i7 4710mq+950m,另一台i5 4200h+940m,都是七八年前的老爷机。
我们拿940m跑cuda,4710mq跑cpu(就不要难为4200h)
安装很简单
https://img.722227.xyz/file/a2c5235de54dde704bf06.png
要求python3.10.6+git
克隆代码→双击webui-user.bat即可
这是官方的安装流程
唯一的难度在于网络,要么全局梯子/软路由,要么改安装文件使用反代,亦或者直接用集成环境的安装包
https://www.123pan.com/s/DhC8Vv-vcNad.html提取码:1234
安装之前,务必将显卡驱动更新至最新,让cuda能够支持stable diffusion。
https://img.722227.xyz/file/e2bcae11b8f38164b98b6.jpg
安装完之后,webui启动程序会自动检测当前环境是否满足程序运行要求,为了能使用低配机器,需要额外设置启动命令。
这里没有使用一键包
set PYTHON=
set GIT=
set VENV_DIR=
set COMMANDLINE_ARGS=–lowvram –always-batch-cond-uncond –deepdanbooru –xformers –no-half-vae –theme dark
如果已经成功安装了python和git,并且设置好环境变量,就无需再填写到webui启动脚本内,VENV在安装过程中会自动创建,也可以不填。
–lowvram:启用低显存模式
–always-batch-cond-uncond:禁用批量生成,同样为了减少显存使用
–deepdanbooru:为了让某些动漫模型运行的更好
–xformers:优化显存,尝试开启
–no-half-vae:不使用半精度(fp16)模型
–theme dark:暗黑模式(更不那么刺眼)
配置完之后双击启动即可,由于调用的文件很多,启动过程比较漫长,建议安装在固态硬盘内。
https://img.722227.xyz/file/9c07ee9e778e395a38c46.jpg
我们使用默认的512×512,步数20,采样方式为dpm++ sde karras
模型使用chilloutmix,vae选择通用的840000,
挂载三个Lora,分别为20d、fashiongirl与koreanDollLikeness来模拟日常出图需求。
https://img.722227.xyz/file/2a8f1e39893a7730c6bb8.jpg
出图过程比较顺利,速度确实有点慢,高达20s/it,总耗时7m40s
https://img.722227.xyz/file/9d9a436ee5f29b315b0a6.jpg
通过调用nvidia-smi,我们看到,940m的显存使用开始上升,最终稳定在1500M。
顺便一提的是,cpu几乎没有什么波动,倒是8g内存所剩无几,看来一部分内存被当作虚拟显存划走了。
https://img.722227.xyz/file/a5324cf34cdac006b244d.jpg
之后使用图生图,将刚生成的图片使用ESRGAN插件放大2倍,可怜的2g显存终于被全部吃完。
图生图放大总耗时37m32s
https://img.722227.xyz/file/016d81dfd282ee60a3984.jpg
高清修复(hires)和mutidiffusion都以爆显存告终。
不使用显卡,纯CPU跑sdwebui如何?
程序不需要额外的设置,通过更改启动命令即可实现。
set COMMANDLINE_ARGS=–use-cpu all –no-half –precision full –skip-torch-cuda-test –theme dark
set CUDA_VISIBLE_DEVICES=-1
set CUDA_VISIBLE_DEVICES=-1:禁用掉cuda设备,让程序找不到显卡
–use-cpu all:使用全部的cpu核心
–no-half –precision full:仅使用单精度(fp32)运行
–skip-torch-cuda-test:跳过torch-cuda检测
和上一个测试一样,我们准备了相同的参数来控制变量,只不过这个结果属于——我和CPU比命长系列
总耗时22m35s完成
https://img.722227.xyz/file/5ab31e9fd14d74d884183.jpg
一开始会非常慢,几乎200s/it,最终平稳在70s/it,作为对比4090高达30it/s,诠释了什么叫时间就是金钱。
WZ-Software 大佬有话说 :
我只能说,6,
zsbd
清蒸三文鱼 大佬有话说 :
这配置是11年前的吧,我记得12年买的I5 4590.12G内存等之后蹲P100显卡。
小猪佩奇 大佬有话说 :
清蒸三文鱼 大佬有话说 : 2023-5-13 20:08
这配置是11年前的吧,我记得12年买的I5 4590.12G内存等之后蹲P100显卡。
4代这种的确是10年前的,不过看了下显卡,严谨点还是七八年前的好
繁星若尘 大佬有话说 :
图片分辨率调低点 4G显存也能跑