发布说明
概述
我们很高兴地宣布发布Stable Diffusion v1.6 API!该 API 旨在成为质量更高、更具成本效益的替代方案,stable-diffusion-v1-5
对于希望在工作流程中替换它的用户来说是理想的选择。与 相比,stable-diffusion-v1-6
已经过优化以提供更高质量的生成。512px``stable-diffusion-v1-5
迅速的:A wolf in Yosemite National Park, chilly nature documentary film photography
方面:512x512
脚步:50
种子:1
CFG 规模:7
采样器:DDIM
但请注意,目前不支持通过stable-diffusion-v1-6
.
什么是新的
应用程序编程接口
stable-diffusion-v1-6
引入了对 REST API 引擎的支持。
弃用
- 我们的许多旧模型将于11 月 15 日之前弃用。请访问API 参数页面以获取更多信息。
SDXL v1.0 发布
2023 年 7 月 26 日
概述
我们很高兴地宣布发布Stable Diffusion XL v1.0,这是 SDXL 系列的第一个主要版本!
什么是新的
基于SDXL v0.9版本的成功,SDXL v1.0带来了许多图像细节改进。具体来说,SDXL v1.0提供增强的活力和整体色调准确性,包括更深的黑色和更明亮的白色色调。
迅速的:A wolf in Yosemite National Park, chilly nature documentary film photography
否定提示:3d render, smooth, plastic, blurry, grainy, low-resolution, anime, deep-fried, oversaturated
脚步:50
种子:992446758
CFG 规模:8
左型号: stable-diffusion-xl-1024-v0-9
AKASDXL v0.9
右型号: stable-diffusion-xl-1024-v1-0
AKASDXL v1.0
应用程序编程接口
stable-diffusion-xl-1024-v1-0
向 API (gRPC SDK + REST)引入了对模型引擎的支持,这带来了新的定价考虑因素。请查看定价页面以获取更多信息。stable-diffusion-xl-1024-v1-0
现在是 API 的默认引擎。如果您希望使用不同的引擎,则必须在请求中指定。stable-diffusion-xl-1024-v1-0
支持多种宽高比。请查看API 参数页面以获取更多信息。
SDXL v0.9 发布
2023 年 6 月 27 日
概述
我们很高兴地宣布发布Stable Diffusion XL v0.9,这是 SDXL 系列的最新型号!在成功发布 Stable Diffusion XL beta 的基础上,SDXL v0.9在图像质量和构图细节方面带来了显着改进。请务必查看我们的博客文章,了解有关SDXL v0.9版本的更全面的详细信息。
什么是新的
SDXL v0.9在基本分辨率为 的情况下进行训练1024 x 1024
,与前身相比,图像和构图细节得到了大幅改进。
迅速的:A wolf in Yosemite National Park, chilly nature documentary film photography
否定提示:3d render, smooth, plastic, blurry, grainy, low-resolution, anime, deep-fried, oversaturated
左型号: stable-diffusion-xl-beta-v2-2-2
AKASDXL v0.8
右型号: stable-diffusion-xl-1024-v0-9
AKASDXL v0.9
SDXL v0.9还经过训练可以处理多种宽高比,这比以前的模型有了明显的改进,以前的模型经常会在宽或高宽高比的一代中看到重复的主题/概念。
迅速的:A wolf in Yosemite National Park, chilly nature documentary film photography
否定提示:3d render, smooth, plastic, blurry, grainy, low-resolution, anime, deep-fried, oversaturated
方面: 1344x768
型号: stable-diffusion-xl-1024-v0-9
AKASDXL v0.9
应用程序编程接口
stable-diffusion-xl-1024-v0-9
向 API (gRPC SDK + REST)引入了对模型引擎的支持,这带来了新的定价考虑因素。请查看SDXL v0.9 定价表以了解更多信息。stable-diffusion-xl-1024-v0-9
现在是 API 的默认引擎。如果您希望使用不同的引擎,则必须在请求中指定。stable-diffusion-xl-1024-v0-9
支持多种宽高比。请查看API 参数页面以获取更多信息。
稳定的动画SDK发布
2023 年 5 月 11 日
概述
我们很高兴地宣布发布稳定动画 SDK,这是一个强大的工具,旨在帮助艺术家和开发人员利用稳定扩散来创建令人惊叹的动画!
通过使用各种输入生成动画来探索可能性:文本提示(无图像)、源图像或源视频。使用我们所有的稳定扩散模型(包括稳定扩散 XL)制作动画,触手可及。
查看创建动画的三种方法:
- 文本转动画:输入文本提示并调整各种参数以生成动画。
- 文本输入+初始图像输入:提供初始图像作为动画的起点,结合文本提示生成最终的输出动画。
- 输入视频+文本输入:使用初始视频作为动画的基础,微调参数以创建由文本提示引导的最终输出动画。
什么是新的
应用程序编程接口
- 在 API 中添加了对稳定动画 SDK 的支持(仅限 gRPC SDK)。查看文档以了解更多信息。
重大变化
我们在此版本中引入了一个小的重大更改。实用程序函数image_to_prompt
已从 移至stability_sdk.client
,stability_sdk.utils
并且其参数已更新:
- 老的:
image_to_prompt(im, init: bool = False, mask: bool = False)
- 新的:
image_to_prompt(image: Image.Image, type: generation.ArtifactType=generation.ARTIFACT_IMAGE)
此函数有助于将 init 映像打包为 gRPC Prompt 消息中的工件。
风格预设/客户端 ID 支持
2023 年 4 月 17 日
概述
我们很高兴地宣布,我们已经向 API 发布了对样式预设的支持!
样式预设是一种将预定义样式应用于图像的方法。这些与DreamStudio中提供的样式预设相同。样式预设目前仅在我们的 REST API 中可用,Blender 和 gRPC 的稳定性支持即将推出。
我们很高兴看到您在自己的集成中使用它们创建了什么!
Dog in a forest
,使用 SDXL 预设样式生成digital-art
。
Dog in a forest
,使用 SDXL 预设样式生成cinematic
。
如果您使用我们的 REST API,您现在可以通过将style_preset
参数传递到text-to-image
、image-to-image
和image-to-image/masking
端点来使用样式预设。查看REST API 文档以获取更多信息。
什么是新的
应用程序编程接口
- 添加了通过 REST API 对样式预设的支持。查看文档以了解更多信息。
- 添加了对 REST 中字段的支持
Extras
。此字段允许您将附加信息传递给某些 Beta 功能的生成服务。 Stability-Client-ID
添加了对将标头传递给 REST API 的支持。这使得 Stability 能够跟踪每个客户端的 API 使用情况,并在一些内部工具中使用。这对于正常使用 API 来说不是必需的。
SDXL 版本
2023 年 4 月 14 日
概述
我们很高兴地宣布,我们的 API 已发布对 SDXL 的支持!请务必查看我们关于 SDXL 发布的博客文章以了解更多信息。
什么是新的
应用程序编程接口
stable-diffusion-xl-beta-v2-2-2
在 API 中添加了对模型引擎的支持(gRPC SDK + REST)。该引擎具有特殊的定价考虑因素,请访问API 参数页面以了解更多信息。
以下是 SDXL 一些功能的简短摘要,摘自我们关于 SDXL 版本的博客文章:
- 更高水平的照片级写实能力。
- 增强的图像合成和面部生成。
- 丰富的视觉效果和令人惊叹的美学。
- 使用较短的提示来创建描述性图像。
- 生成清晰文本的能力更强。
注意:stable-diffusion-xl-beta-v2-2-2
对于它可以生成图像的尺寸有一些特殊的考虑:
stable-diffusion-xl-beta-v2-2-2
最多可以生成 或 的512x896
图像896x512
。64px
与往常一样,在考虑图像生成请求的大小时,尺寸必须可整除。- 如果图像生成请求的宽度或高度(但不能同时)大于
512px
,则另一边(分别为宽度或高度)的512px
尺寸不能超出。
SDXL 生成的一些令人惊叹的结果的示例:
图像放大 API 和集成发布
2023 年 3 月 21 日
概述
我们很高兴地宣布我们的 API 中添加了对图像放大的支持!Image Upscaler 是一款允许您使用我们基于 ESRGAN 的升级器来升级图像和动画帧的工具。目前,它可在我们的 Stability for Blender 和 Stability for Photoshop 插件以及 gRPC 和 REST API 中使用。此更新还在每个集成中带来了许多其他修复和改进。
查看文档,了解如何在Photoshop、Blender 中以及通过我们的API使用 Upscaler 。
Upscale
如果您使用我们的 gRPC SDK,您现在可以通过调用服务上的方法来使用 Upscaler Stability
。查看gRPC 文档以获取更多信息。此处还提供了对升级程序的 REST 支持。
什么是新的
应用程序编程接口
- 添加了通过 API 进行图像升级的支持。查看文档以了解更多信息。
Photoshop
- 添加了稳定性升级器 - 这是一项新功能,可让您使用稳定性 SDK 升级 Photoshop 中的图层和文档。单击“Upscaler”选项卡进行尝试。
- 修复了与 DALL-E 2 修复相关的一些问题。
- 将稳定性SDK版本更新至最新。
- 更新了插件图标以反映其作为稳定性产品的状态。
- 修复了一些与滚动和加载新扩散结果相关的布局错误。
搅拌机
- 添加了稳定性升级器 - 这是一项新功能,可让您使用稳定性 SDK 在 Photoshop 中升级渲染结果和纹理。单击插件面板顶部的“Upscaler”功能进行尝试。
- 针对 REST API 请求失败添加了更广泛的错误处理。
- 添加了超时以避免底层生成服务超时时挂起。
- 修复了用户报告的一些错误。
休息 API v1
2023 年 3 月 21 日
概述
我们很高兴地宣布 REST API v1 正式上线!该文档已直接集成到此站点中,可以在此处查看。
如果您遇到任何问题或对我们有任何反馈,请访问我们社区 Discord中的#official-rest-api频道和/或打开GitHub 问题。
如果您正在使用/v1alpha
或/v1beta
请查看下面的“弃用”部分。
什么是新的
现在可以升级了!
现在可以使用 REST API 升级图像。查看升级文档以获取更多信息。
改进的错误处理
我们添加了更多错误处理,改进了错误消息,所有错误现在都应包含一个id
用于故障排除的字段。 如果您遇到问题,请在我们社区 Discord 的#official-rest-api频道中留言,并包含响应中的字段。id
重大变化
height
从和端点width
中删除image-to-image``image-to-image/masking
这些端点始终使用所提供的尺寸init_image
来确定结果图像的尺寸,因此接受height
是width
令人困惑且不必要的。
null
不再允许传递显式值
以前,可以null
为可选参数传递显式值。这不再被允许。如果您想使用可选参数的默认值,只需从请求中省略它即可。
弃用
v1beta
现已弃用,计划于2023 年 5 月 1 日删除v1alpha
已弃用,现计划于2023 年 5 月 1 日删除
下一步是什么
REST API 接下来会发生什么:
- 添加
image-to-depth
端点到v1
- 添加
depth-to-image
端点到v1
REST API v1beta 候选版本
2023 年 2 月 2 日
概述
我们很高兴地宣布 REST API 的 v1beta 候选版本已正式上线!请在此处查看新的和改进的文档。
在此版本中,我们考虑了您的反馈,并根据通过社区 Discord和GitHub issues中的#api频道与我们分享的建议实施了一些更改。
大多数更改与标准化输入参数和对输入验证的调整有关,但此版本是朝着我们使 API 尽可能简单易用的目标迈出的一大步。
我们正在寻求社区的反馈,以帮助我们在发布最终版本之前改进 API,因此请访问我们社区 Discord中的#api频道和/或打开GitHub 问题。
什么是新的
高度和宽度验证( v1alpha
, v1beta
)
高度和宽度验证现在允许更广泛的分辨率,这是由GitHub 上的这个问题产生的。
高度或宽度的最小值已降低至
128
现在,我们不再强加最大值,而是根据所使用的发动机类型要求
height
和 的
width
乘积落在某个范围内:
- 对于 768 发动机:
589,824 ≤ (height * width) ≤ 1,048,576
- 所有其他引擎:
262,144 ≤ (height * width) ≤ 1,048,576
- 对于 768 发动机:
192x3072
这是赛博朋克城市景观图像的示例,由以下命令生成v1beta
:
单击显示提示
更好的错误处理( v1alpha
, v1beta
)
- 现在,向 768 引擎发出小于
768x768
像素的请求将导致错误,而不是生成扭曲的图像。 - 一些以前可能的无效请求现在不可能了
- 例如,使用文本提示(空字符串)发出请求
""
现在将导致错误
- 例如,使用文本提示(空字符串)发出请求
- 大多数错误现在应该更清晰并且包含更少的噪音
- 错误现在包含一个
id
字段,我们可以使用它来帮助调试您遇到的问题。如果您遇到错误,请记下并在稳定扩散不和谐id
中告知我们,以便我们可以帮助您!
新的图像到图像参数( v1beta
)
现在,我们提供了一个参数,image_strength
您可以使用该参数来step_schedule_start
代替step_schedule_end
图像到图像的生成,该参数模仿 DreamStudio 中“图像强度”滑块的行为。step_schedule_start
如果您愿意,您可以继续传入,step_schedule_end
只要init_image_mode
设置为STEP_SCHEDULE
。
有关更多信息,请查看图像到图像端点的image_strength
和参数。init_image_mode
更好的图像到图像默认值( v1beta
)
- 对于图像到图像的生成,我们现在默认为
image_strength
overstep_schedule_start
和step_schedule_end
image_strength
默认值为0.35
step_schedule_start
默认值为0.65
重大变化
唯一有意的破坏性更改v1alpha
是添加了更多输入验证检查。这些更改不应影响大多数用户,而受影响的用户可能无论如何也得不到他们预期的结果。如果引入了任何其他重大更改,它们都是无意的,因此请通过 我们社区 Discord中的#api频道或通过打开GitHub 问题来通知我们。
弃用
在此候选版本中,我们将弃用该v1alpha
API。
该v1alpha
API 目前将继续可用,但将在未来版本中删除。
下一步是什么
v1
尽可能快地继续前进- 将 REST API 文档移至此站点(当前托管在此处)
- 添加对升级的支持
- 添加对图像深度的支持
REST API v1alpha 候选版本
2022 年 12 月 14 日
概述
过去几周我们一直在努力开发 REST API,并很高兴地宣布 v1 候选版本正式上线!
我们正在寻求社区的反馈,以帮助我们在发布最终版本之前改进 API,因此请访问Stable Diffusion Discord中的 API 频道,让我们知道您的想法!
什么是新的
/image-to-image/masking
端点有两个用于指定掩码的选项:
mask_image
其中较亮或较暗的像素会影响扩散过程。init_image
其中透明像素影响扩散过程。
改进的 HTTP 错误代码:
400
s 表示不良请求。401
s 用于未经授权的请求。403
s 权限不足。404
s 用于诸如尝试使用不存在的引擎之类的事情。- 降级
500
回内部服务器错误(它们所属的地方!)
改进了所有端点的错误消息:
- 不再需要魔法解码环。
修复了当标头设置为时导致
null
值显示在响应中的小错误。Accept``application/json
解决了一些与 CORS 相关的问题
有关屏蔽端点的更多信息,包括 Go、TypeScript、Python 和 cURL 中的工作示例,请查看REST API 文档。
稳定扩散 2.1 - API 发布
2022 年 12 月 7 日
概述
在此版本的 Stability API 中,我们引入了 Stable Diffusion 2.1 (512px + 768px),包括带有提示权重的多重提示。
什么是新的
新型号
- 稳定扩散 2.1 - 512px
- 稳定扩散 2.1 - 768px
随着 Stable Diffusion 2.1 版本的发布,我们更新了训练策略,并重新引入了用户认为在 2.0 中丢失的大部分艺术天赋。查看Stability AI 博客上的官方公告以了解更多信息。
我们现有的文档已更新,以反映添加了稳定扩散 2.1 作为可通过 API 访问的可选模型。
多重提示
在此版本中,现在可以将多个加权提示传递到 API。
多重提示允许用户组合概念来创建新的、独特的结果。当将负值分配给附加提示(俗称“负面提示”)时,该模型还将尝试消除或避免生成图像中的概念。
有关功能示例,请参阅我们关于多重提示的新文档。
开源版本
Stable Diffusion 2.1 模型检查点现在可以通过我们Hugging Face上的开源存储库获得。
稳定扩散 2.0 - API 发布
2022 年 11 月 25 日
概述
在此版本的 Stability API 中,我们引入了 Stable Diffusion 2.0 (512px + 768px),包括两个新的采样器和改进的修复模型(Stable Inpainting 2.0)。
什么是新的
新型号
- 稳定扩散 2.0 - 512px
- 稳定扩散 2.0 - 768px
- 稳定修复 2.0 - 512px
Stable Diffusion 2.0 是全新的,从头开始训练,牢记安全。
2.0 模型在 LAION-5B 的美学子集上进行训练,并通过 LAION 的 NSFW 过滤器进一步过滤,这意味着可以使用侵入性少得多的安全过滤来获得高质量图像。
Stable Diffusion 2.0 模型包括由 LAION 在 Stability AI 的支持下训练的新文本编码器,与 Stable Diffusion 1.x 模型相比,它提高了生成图像的质量。
新的 768px 模型在更大尺寸下提供了更高的一致性,因为它是在更高分辨率的样本 (768 x 768) 上进行训练的。这有助于缓解 512px 模型生成的较大尺寸图像中的重影和马赛克效应等常见问题。
新采样器
经过优化并向后兼容 1.4、1.5 和 2.0,我们引入了两个新的采样器:k_dpmpp_2m 和 k_dpmpp_2s_ancestral。
这些新采样器的优点是能够以较低的所需步骤数解析高质量图像,使您的用户能够以更少的步骤获得更好的结果。
Inpainting 2.0 与 Stable Diffusion 2.0 一起推出,与 Inpainting 1.0 相比,一致性显着提高。
智能采样器默认设置
为了您的方便,采样器选择是可选的。如果省略,我们的 API 将为所选模型和使用模式选择最佳采样器。
除非您有特定的用例要求,否则我们建议您允许我们的 API 选择首选采样器。
提示不一样
Stable Diffusion 2.0 使用新的 OpenCLIP ViT-H 模型,该模型已在新数据集上进行训练,这意味着它与我们之前模型中使用的 OpenAI ViT-L 模型不同。因此,与先前模型的提示技术在稳定扩散 2.0 中可能会有所不同。
值得注意的是,名人和艺术家名字的影响力比以前的模型要小。
这是新型号的特点,不被视为缺陷。
以前的稳定扩散模型版本(1.5、1.4、Inpainting 1.0)仍然可供 API 使用。
开源版本
秉承我们开源协作和创新的传统,Stable Diffusion 2.0 也作为开源项目发布。该开源版本包括上述模型和几个附加模型,包括 4 倍放大器和新的深度到图像模型,该模型能够推断输入图像的深度并根据文本提示生成新图像并合并深度信息。
这些深度到图像和放大模型将在不久的将来实现到 DreamStudio API 中。