
稳定扩散 AI 是一种开源的深度学习文本到图像生成模型,由 CompVis 团队与 Runway ML 联合开发,并获得 Stability AI 的运算支持。它可以根据文本描述生成高质量图片,也可以进行图像补全、外推以及文本指导下的图像到图像转换。稳定扩散 AI 开源了其代码、预训练模型和许可证,允许用户在单个 GPU 上运行。这使其成为第一个可以在用户本地设备上运行的开源深度文本到图像模型。
需求人群:
["艺术创作","平面设计","网站视觉设计","3D 建模","教育","游戏制作","社交媒体创作","广告创意"]
使用场景示例:
用户可以输入类似'一只黄色的狗在草地上玩耍'的文字描述,稳定扩散 AI 会生成匹配描述的图片。
用户可以输入'给这张猫的图片添加一顶皇冠'这样的提示,稳定扩散 AI 会在原图上为猫添加皇冠。
用户可以使用稳定扩散 AI 对图像进行补全,例如自动填充图片中遮挡的区域。
产品特色:
根据文本提示生成新图像
根据文本对现有图像进行重绘并添加新元素
通过补全和外推修改现有图像
支持使用 ControlNet 改变图像风格和色调而保留几何结构
支持面部替换
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...