Stable Diffusion是由StabilityAI启动公司于2022年发布的一种深度学习的文本到图像模型。
它主要用于生成以文本描述为条件的详细图像,但也可以应用于其他任务,如补漆、补漆和生成由文本提示引导的图像到图像转换。
稳定扩散是一种潜在扩散模型,是慕尼黑LMU研究人员开发的多种生成性神经网络。
它由Stability AI与LMU和Runway合作开发,并得到EleutherAI和LAION的支持。
截至2022年9月,Stability AI正在谈判筹集估值高达10亿美元的资金。
StableDiffusion的代码和模型权重已经公开发布,它可以在大多数配备普通GPU的消费硬件上运行。
这标志着从以前的专有文本到图像模型的转变,如DALL-E和Midtrivel,它们只能通过云服务访问。
在音乐可能的应用场景:比如说你不会画画,但是又想要一个很牛逼的封面。
它不仅能模仿很多艺术家的风格,还能合成真实的图像,也能根据你提供的图片模仿它的构图和光影、色彩。
GUI版好像是个日本人打包的,本身作者没有强制收费,点击Download Now后,再点价格上面的下载就行。
最新版
笔记:
低内存模式对我来说优先级较低,因为它是一个单独的代码库,所以很难添加功能。
此外,常规模式现在可以轻松运行在6GB显存上,如果关闭所有其他GPU应用程序,甚至可以运行在4GB的显卡上。
除此之外,现在可以在CPU上运行常规模式,虽然速度很慢,但可以正常工作。
玩了一段时间,之前用了学习的一些网页都保存放到网盘了。
新版本的GUI版比之前生成图像的速度提升了很多。
安装方法:
第一次解压打开软件会提示下载安装,耐心等待下载完成,可能需要科学上网。
因显卡的显存要求,你可能只能设置低尺寸的图片生成,但是软件自带了一个无损放大功能。
同样的关键词和参数,每次生成的图像都是不一样的,这就代表2个人很难生成重叠的图像。
本帖最后由 martjay 于 22-10-10 21:56 编辑
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?注册
x