Stable Diffusion完整操作手册:本地部署与高级控制

Stable Diffusion完整操作手册:本地部署与高级控制
最后更新:2026年06月25日 适用版本:Stable Diffusion 最新版 预计阅读时间:30分钟
第一章:快速入门(注册登录、界面介绍、第一个任务)
第一章:快速入门
欢迎来到 Stable Diffusion 的世界!本章将引导您从零开始,完成账号注册、熟悉核心界面,并生成您的第一张 AI 图像。请按照以下步骤操作,只需几分钟,您将亲眼见证人工智能的创造力。
1. 注册与登录
Stable Diffusion 提供了多种运行方式,本手册以官方推荐的 WebUI(Automatic1111)或云端服务为例。若使用云端平台,流程如下:
- 访问官网:在浏览器中输入 Stable Diffusion 官方合作伙伴或托管平台的网址。
- 创建账号:点击页面右上角的 “Sign Up”(注册)按钮。
- 输入有效的电子邮箱地址。
- 设置一个包含字母和数字的安全密码。
- 勾选“我已阅读并同意服务条款”,点击 “Register”。
- 验证邮箱:登录您的邮箱,找到来自平台的验证邮件,点击其中的 “Verify Email” 链接。
- 登录系统:返回平台首页,输入邮箱和密码,点击 “Log In” 进入控制台。
注意:首次登录时,系统可能会引导您完善个人资料,建议上传头像以便识别账户。
2. 界面介绍
登录后,您将看到主工作台。对于新手而言,只需关注以下四个核心区域:
### 提示词输入区(Prompt)
这是您与 AI 沟通的主要渠道。位于界面左侧或顶部,分为两个主要文本框: - 正向提示词(Positive Prompt):描述您希望画面中出现的内容,如“一只可爱的猫咪”、“阳光”、“高清细节”。 - 反向提示词(Negative Prompt):描述您不希望出现的内容,如“模糊”、“低分辨率”、“多余的手指”。
### 参数设置区
位于界面右侧,包含关键控制选项:
- 模型选择(Checkpoint):下拉菜单,用于选择不同的预训练模型(如 SD 1.5, SDXL 等)。
- 采样器(Sampler):决定图像生成的算法,新手推荐选择 DPM++ 2M Karras 或 Euler a。
- 步数(Steps):生成迭代次数,通常设置为 20-30 步即可达到较好效果。
- 种子(Seed):随机数种子。设为 -1 表示每次生成随机种子;固定种子可复现相同图像。
### 预览与操作区
位于界面底部或中央,显示当前任务的进度条、生成按钮以及历史结果预览图。
### 工具栏
包含保存图像、放大查看、批量生成等功能按钮。
3. 生成第一个任务
现在,让我们尝试生成一张简单的图像。请严格遵循以下操作步骤:
-
输入提示词:
- 在 正向提示词 框中输入:
a cute robot sitting on a cloud, sunset background, digital art, high detail(一朵云上的可爱机器人,日落背景,数字艺术,高细节)。 - 在 反向提示词 框中输入:
blurry, bad anatomy, low quality(模糊,解剖结构错误,低质量)。
- 在 正向提示词 框中输入:
-
调整参数:
- 确保 模型 已选择默认的
v1-5-pruned-emaonly.safetensors(或当前首选模型)。 - 将 采样器 设置为
DPM++ 2M Karras。 - 将 步数 设置为
20。 - 保持 宽高比例 为默认的
512x512或768x768。
- 确保 模型 已选择默认的
-
执行生成:
- 点击蓝色的 “Generate”(生成)按钮。
- 等待进度条加载完毕。通常在 5-15 秒后,下方将显示生成的图像。
-
查看结果:
- 如果图像符合预期,点击右下角的 “Save” 图标将其保存至本地。
- 如果不满意,修改提示词中的形容词(如将
cute改为cool),再次点击 Generate。
4. 注意事项与最佳实践
- 硬件资源:若您本地部署,请确保显卡显存至少为 4GB(推荐 8GB+)。云端用户无需担心此问题。
- 提示词简洁性:新手应避免堆砌过多关键词。先使用 3-5 个核心名词和形容词,逐步增加复杂度。
- 负向提示词的重要性:始终使用反向提示词剔除常见瑕疵,能显著提升出图质量。
- 耐心等待:生成过程受网络或算力影响,可能出现延迟,请勿重复点击生成按钮,以免产生冗余任务。
通过以上步骤,您已成功迈出 AI 绘画的第一步。接下来,请尝试更换不同的模型和提示词,探索无限可能!
第二章:基础功能详解(核心功能逐个讲解,带截图说明)
第二章:基础功能详解
欢迎来到 Stable Diffusion 的核心操作世界。本章将带你逐一拆解界面中的关键功能模块,通过具体的步骤演示,帮助你从零开始生成高质量的 AI 图像。虽然不同前端界面(如 WebUI 或 ComfyUI)布局略有差异,但核心逻辑一致。
1. 文本提示词(Prompt):给 AI 的“指令”
文本提示词是生成图像的灵魂。你需要用自然语言描述你希望看到的画面。
-
操作步骤:
- 在界面顶部找到 “Positive Prompt”(正向提示词) 输入框。
- 输入描述性语句,例如:
a cute cat wearing sunglasses, cyberpunk city background, 8k resolution(一只戴墨镜的可爱猫咪,赛博朋克城市背景,8k分辨率)。 - 点击下方的 “Generate”(生成) 按钮。
- 等待进度条走完,右侧预览区将显示生成的图像。
-
注意事项与最佳实践:
- 逗号分隔:使用英文逗号
,分隔不同的特征,避免使用中文标点。 - 权重调整:若某元素过于突出,可使用
(keyword:1.2)增加权重,或[keyword]降低权重。 - 负面提示词(Negative Prompt):务必在下方输入框填写不想出现的元素,如
low quality, blurry, bad anatomy(低质量、模糊、人体结构错误),这能显著提升出图成功率。
- 逗号分隔:使用英文逗号
2. 采样器(Sampler)与步数(Steps):控制生成过程
采样器决定了 AI 如何将噪声转化为图像,步数则影响细节丰富度。
-
操作步骤:
- 在设置面板中找到 “Sampling Method”,推荐新手选择
Euler a或DPM++ 2M Karras。 - 调整 “Sampling Steps” 滑块,通常设置在 20-30 步之间。
- 保持其他参数默认,再次点击 “Generate”。
- 在设置面板中找到 “Sampling Method”,推荐新手选择
-
注意事项与最佳实践:
- 步数并非越多越好:超过 30-40 步后,图像质量提升微乎其微,但耗时显著增加。建议从 20 步开始测试。
- 采样器选择:
Euler a速度快且变化随机性强;DPM++系列更稳定,适合需要精确控制的场景。
3. 随机种子(Seed):锁定或变化图像
Seed 是图像生成的初始噪声值。相同的 Seed + 相同的 Prompt = 几乎相同的图像。
-
操作步骤:
- 生成满意图片后,查看输出区域显示的 Seed 数值(如
123456789)。 - 若想微调细节,将该数值填入 Seed 输入框,取消勾选旁边的 “Randomize” 复选框。
- 修改 Prompt 中的少量词汇(如将
cat改为dog),重新生成。
- 生成满意图片后,查看输出区域显示的 Seed 数值(如
-
注意事项与最佳实践:
- 固定种子:当你对构图满意但想更换角色时,固定 Seed 可保留背景结构。
- 随机种子:若想尝试完全不同的创意,点击 “Randomize” 或手动输入
-1,让 AI 探索新可能。
4. 图像尺寸(Resolution)与批量生成
-
操作步骤:
- 在 “Width” 和 “Height” 栏中设置尺寸,推荐标准比例如
512x512或768x768。 - 若需一次生成多张图,调整 “Batch Count”(批次数量)为 4 或更多。
- 点击 “Generate”,系统将在同一网格中展示多张变体。
- 在 “Width” 和 “Height” 栏中设置尺寸,推荐标准比例如
-
注意事项与最佳实践:
- 显存限制:高分辨率(如 1024x1024)会占用大量显存,可能导致 OOM 错误。新手建议先从 512x512 开始。
- 宽高比:确保宽高均为 64 的倍数,否则部分模型可能报错或裁剪异常。
5. 高清修复(Hires. fix):提升画质细节
这是将模糊小图变清晰的关键功能。
-
操作步骤:
- 勾选 “Hires. fix” 选项。
- 设置 “Upscaler” 为
R-ESRGAN 4x+或Latent。 - 调整 “Denoising strength”(重绘幅度)至 0.3-0.5 之间。
- 生成图片,AI 将先以小尺寸生成草稿,再放大并补充细节。
-
注意事项与最佳实践:
- 重绘幅度控制:值过高会导致原意偏离,值过低则无法有效增强细节。
- 耗时警告:高清修复会显著增加生成时间,请耐心等待。
掌握以上五个核心模块,你已具备独立创作的能力。下一章我们将深入探讨 LoRA 模型的使用与高级后期处理技巧。

第三章:高级技巧(提示词工程、多轮对话、风格控制)
第三章:高级技巧
掌握基础操作后,我们将深入探索 Stable Diffusion 的核心魔力。本章将重点介绍如何通过精细的提示词工程、有效的多轮迭代以及严格的风格控制,让你的创意从“可用”升级为“惊艳”。
3.1 提示词工程:精准描述的艺术
提示词(Prompt)是与 AI 沟通的语言。优秀的提示词能让模型准确理解你的意图。
操作步骤
- 打开提示词输入框:在主界面找到
Positive Prompt(正向提示词)区域。 - 构建结构化语句:遵循“主体 + 细节 + 环境 + 质量”的逻辑顺序。例如,输入
A cyberpunk girl, neon lights, rain-soaked street, 8k resolution, highly detailed。 - 调整权重:若某个元素被忽略,可在其前后添加括号或数字。例如
(masterpiece:1.2)表示加强权重,[background]表示降低权重。 - 生成预览:点击
Generate按钮,观察生成的图像是否符合预期。 - 迭代优化:根据结果修改提示词,重复上述步骤,直到获得满意作品。
注意事项
- 避免冲突:不要在正向提示词中同时输入矛盾的概念(如“白天”和“黑夜”),这会导致画面混乱。
- 使用逗号分隔:不同元素之间务必用英文逗号
,隔开,不要使用中文标点。 - 负面提示词的重要性:在
Negative Prompt中输入常见的瑕疵词,如ugly, deformed, blurry, bad anatomy,能显著提升出图质量。
最佳实践
- 建立自己的“词库”,收集常用的形容词、光影效果和艺术家名字。
- 尝试使用预设的模板,如
photo of [subject], shot on [camera], [lighting], [style],快速构建高质量提示词。
3.2 多轮对话与迭代:从草稿到成品
AI 绘画不是一次性的过程,而是一个迭代的创作流程。通过多轮对话,你可以逐步完善细节。
操作步骤
- 初稿生成:使用基础提示词生成一张大致符合构图的图片。
- 局部重绘(Inpainting):
- 勾选
Inpaint模式。 - 使用画笔涂抹需要修改的区域(如手部、面部)。
- 在提示词中描述修改后的内容,例如
perfect hands, smiling face。 - 点击
Generate,AI 将仅重绘涂抹区域,保持其他部分不变。 - 高清修复(Hires. fix):
- 启用
Hires. fix选项。 - 设置放大算法(如
Latent或ESRGAN_4x)。 - 调整放大倍率(通常为 2x 或 4x)。
- 再次点击
Generate,AI 将在高分辨率下补充细节,消除模糊。
注意事项
- 重绘幅度(Denoising strength):在局部重绘时,此值控制变化程度。低值(0.3-0.5)保留原图较多细节,高值(0.7-0.9)允许更大范围的改变。
- 种子(Seed)的使用:记录满意的种子号,可以复现类似构图,便于微调而非完全重来。
最佳实践
- 采用“由粗到细”的策略:先确定构图和大致风格,再逐步细化五官、衣物纹理和背景光影。
- 利用 ControlNet 等插件固定姿态或线条,确保多轮迭代中主体一致性。
3.3 风格控制:赋予作品独特灵魂
通过调整采样器、步数以及引入 LoRA 模型,你可以精确控制图像的视觉风格。
操作步骤
- 选择采样器(Sampler):
- 在设置中找到
Sampler下拉菜单。 - 尝试
Euler a(速度快,细节一般)或DPM++ 2M Karras(平衡性好,推荐新手使用)。 - 调整步数(Steps):
- 设置
Steps值为 20-30。步数过低会导致画面不完整,过高则收益递减且耗时增加。 - 加载风格 LoRA:
- 点击
LoRA标签页。 - 浏览并选择一个你喜欢的风格模型(如
Anime Style或Photorealistic)。 - 调整 LoRA 权重(通常 0.7-1.0 为宜),过高的权重会扭曲原始提示词的含义。
- 应用风格:
- 点击
Generate,观察图像是否呈现出所选风格的特征。
注意事项
- CFG Scale(提示词相关性):通常设置在 7-12 之间。值过高会使画面颜色饱和度过高、对比度过强;值过低则画面可能偏离提示词。
- LoRA 兼容性:确保 LoRA 模型与你使用的 Checkpoint 大模型版本兼容,否则可能出现黑屏或严重失真。
最佳实践
- 多实验不同采样器和步数的组合,找到最适合当前提示词的配置。
- 建立个人风格档案,记录每次成功的参数组合,方便日后快速调用。
通过以上技巧,你将能够更自由地驾驭 Stable Diffusion,实现从概念到成品的无缝转化。记住,实践是唯一的捷径,大胆尝试,享受创作的乐趣。
第四章:实战案例(3个真实场景完整演示)
第四章:实战案例
本章将通过三个真实且高频的使用场景,手把手带你完成从创意构想到最终出图的完整流程。我们将分别演示电商产品图生成、社交媒体插画创作以及角色一致性设计。请确保你的 Stable Diffusion WebUI 已加载合适的模型(Checkpoint)及相应的 ControlNet 插件。
场景一:电商产品图——让普通商品焕然一新
假设你有一张普通的白色背景水杯照片,希望将其置于“清晨阳光下的木质餐桌”场景中,用于电商详情页。
- 准备素材:打开 WebUI 的 Img2Img(图生图) 标签页,上传你的水杯原始照片。
- 设置重绘幅度:在 Denoising strength(重绘幅度) 滑块中,将其设置为 0.4 - 0.6。这一步至关重要,数值过低会保留太多原图背景,过高则会改变物体形态。
- 编写提示词:
- Positive Prompt(正向提示词):输入
morning sunlight, wooden table, steam, cozy atmosphere, high resolution, photorealistic(晨光,木桌,热气,舒适氛围,高分辨率,照片级真实)。 - Negative Prompt(反向提示词):输入
blurry, dark, messy background, distorted cup(模糊,黑暗,杂乱背景,变形的水杯)。
- Positive Prompt(正向提示词):输入
- 执行生成:点击 Generate(生成) 按钮。
- 结果优化:如果水杯边缘与桌面融合不自然,可开启 Inpaint(局部重绘) 功能,涂抹水杯周围区域,单独调整光影提示词,再次生成直至完美。
注意:对于复杂背景替换,建议结合 ControlNet Canny 或 Depth 预处理器,以锁定水杯的轮廓结构,防止形状扭曲。
场景二:社交媒体插画——快速生成风格化头像
你需要为小红书或 Instagram 制作一组扁平化风格的极简主义插画,用于品牌宣传。
- 选择模型:在模型选择栏中,切换至专门针对二次元或插画优化的 Checkpoint(如
Anything V5或DreamShaper)。 - 配置参数:
- Sampling Method(采样器):选择
Euler a或DPM++ 2M Karras,它们能提供更平滑的线条。 - Steps(步数):设置为 20-30 步,足以保证细节而不浪费计算资源。
- Sampling Method(采样器):选择
- 编写提示词:
- Positive Prompt:
minimalist vector art, flat design, soft pastel colors, geometric shapes, white background, high quality, 2d illustration(极简矢量艺术,扁平设计,柔和粉彩,几何图形,白底,高质量,2D插画)。 - Negative Prompt:
3d, realistic, photo, complex details, shading, noise(3D,写实,照片,复杂细节,阴影,噪点)。
- Positive Prompt:
- 批量生成:点击 Generate。若不满意构图,可调整 Seed(种子值) 进行微调,或修改提示词中的颜色描述(如将
pastel pink改为mint green)。
最佳实践:使用 Highres. fix(高清修复) 功能,将缩放因子设为 1.5 或 2,并选择
Latent放大算法,可获得更清晰锐利的线条效果。
场景三:角色一致性设计——打造专属 IP 形象
设计师需要生成同一个卡通角色的不同姿势,用于系列海报。
- 定义角色特征:首先通过 Txt2Img(文生图) 确定一个理想的角色基础形象,记录其关键的提示词组合,例如
chibi style, blue hair, red ribbon, cute face, anime style。 - 固定种子:复制当前生成的最佳图片的 Seed 值。
- 变换姿势:
- 在提示词中保留核心角色描述,但增加姿势指令,如
standing pose, waving hand(站立姿势,挥手)或sitting on chair, reading book(坐在椅子上看书)。 - 粘贴之前记录的 Seed 值 到 Seed 输入框,并勾选 Fixed Seed(固定种子)。
- 在提示词中保留核心角色描述,但增加姿势指令,如
- 使用参考图:若需要严格一致,可使用 IP-Adapter 插件,上传一张已确定的角色正面照作为参考,设置权重为 0.8 左右。
- 生成与对比:点击 Generate,系统将基于相同的随机种子和角色特征,生成不同姿势但形象高度一致的图片。
注意事项:固定种子并非万能,若提示词差异过大,角色特征仍可能漂移。建议每次只微调姿势或表情相关的关键词,并保持主体描述不变。
通过以上三个案例,你可以发现 Stable Diffusion 的核心逻辑在于:精准的提示词 + 合理的参数控制 + 有效的后期处理。多练习、多记录成功的 Seed 值和提示词组合,是成为 AI 绘图高手的必经之路。
第五章:效率提升(快捷键、模板库、批量处理)
第五章:效率提升——快捷键、模板库与批量处理
在掌握了 Stable Diffusion 的基础生成原理后,许多用户会发现手动调整参数和逐个生成图片的过程既耗时又枯燥。为了帮助你从“尝试者”进阶为“高效创作者”,本章将详细介绍如何利用快捷键、模板库以及批量处理功能,大幅提升你的工作流效率。
5.1 掌握核心快捷键
熟练运用键盘快捷键是减少鼠标点击、保持创作心流的关键。以下是 WebUI 中最常用且必须掌握的快捷方式:
- Ctrl + Enter / Command + Enter:生成图片。这是最核心的操作,无需寻找屏幕上的按钮,随时准备开始创作。
- Ctrl + C / Command + C:复制设置。当你找到一个完美的提示词或参数组合时,按下此键将其复制到剪贴板。
- Ctrl + V / Command + V:粘贴设置。在新界面中按下此键,即可一键恢复之前的参数,方便进行微调对比。
- Ctrl + Shift + Z / Command + Shift + Z:撤销上一步。如果生成的图片不满意,快速回退到上一次状态,避免重复劳动。
- Ctrl + S / Command + S:保存当前配置。将当前的 Prompt、Negative Prompt 及所有参数保存为本地文件,便于日后调用。
最佳实践建议:建议在桌面上创建一个文本备忘录,记录下你常用的快捷键组合,直到形成肌肉记忆。不要频繁使用鼠标去点击“Generate”按钮,这会打断你的灵感连贯性。
5.2 构建你的专属模板库
每次从零开始输入提示词不仅效率低下,还容易导致风格不统一。利用“预设(Presets)”和“工作流保存”功能,你可以建立个人化的模板库。
操作步骤:
-
创建风格模板:
- 在“Stable Diffusion checkpoint”下拉菜单中选择你偏好的模型(如
v1-5-pruned-emaonly)。 - 输入一段基础提示词,例如
masterpiece, best quality, 1girl, solo。 - 点击右侧菜单栏中的 "Save Preset" 按钮。
- 在弹窗中输入名称,如
基础人像_高质量_v1,点击确认。 - 结果:下次只需在下拉菜单中选择该预设,所有参数将自动填充,无需重新输入。
- 在“Stable Diffusion checkpoint”下拉菜单中选择你偏好的模型(如
-
保存复杂工作流:
- 对于涉及 ControlNet、LoRA 等高级功能的复杂任务,不要依赖简单的预设。
- 配置好所有节点和参数后,点击主界面右上角的 "Save Workflow"。
- 选择保存位置并命名,例如
赛博朋克城市_CNet控制。 - 结果:下次打开 WebUI 时,通过 "Load Workflow" 即可瞬间还原整个复杂的生成环境。
注意事项:定期整理你的预设文件夹,删除过时或效果不佳的模板。建议按风格(如“写实”、“二次元”、“3D渲染”)进行分类管理,以便快速检索。
5.3 批量处理:让机器为你工作
当需要生成同一主题的不同变体,或处理大量素材时,手动一张张生成是不现实的。Stable Diffusion 提供了强大的批量处理功能。
操作步骤:
-
准备提示词文件:
- 在文本编辑器中新建一个
.txt文件。 - 每行输入一条完整的提示词(包括正反向提示词),例如:
text cat, sitting on a mat, masterpiece, best quality dog, running in park, masterpiece, best quality bird, flying in sky, masterpiece, best quality - 保存文件,命名为
batch_prompts.txt。
- 在文本编辑器中新建一个
-
配置批量生成:
- 切换到 WebUI 顶部的 "Batch Prompt File" 选项卡。
- 点击 "Choose file",上传刚才创建的
batch_prompts.txt文件。 - 在 "Output directory" 中指定图片保存的路径。
- 设置 "Number of runs" 为 1(表示每条提示词生成一张图)或更高数值以测试不同种子。
-
执行与查看:
- 点击 "Generate" 按钮。
- 结果:系统将自动读取每一行提示词,依次生成图片,并将所有结果按顺序保存到指定文件夹中。
最佳实践与技巧: * 使用随机种子:在批量处理中,勾选 "Use random seed",确保每张生成的图片都有独特的细节变化,而不是完全相同的复制品。 * 监控显存:批量处理会占用较多显存。如果显存不足,请在设置中将 "Batch count" 调小,或启用 "--medvram" 启动参数。 * 后期筛选:批量生成后,建议使用专门的图片管理软件(如 Honeyview 或 Adobe Bridge)进行快速浏览和筛选,而非直接在 WebUI 中查看,这样速度更快且不易卡顿。
通过以上三个维度的优化,你将能够显著缩短从创意构思到成品输出的时间,让 Stable Diffusion 真正成为你得力的创作助手。
第六章:常见问题与解决方案(FAQ,10个高频问题)
第六章:常见问题与解决方案(FAQ)
在使用 Stable Diffusion 进行创作的过程中,新手用户往往会遇到各种技术或审美上的困惑。本章精选了 10 个最高频的问题,并提供详细的解决步骤与最佳实践,帮助您快速排除故障,提升出图质量。
1. 生成的图片为什么模糊不清?
原因分析:通常是因为分辨率设置过低,或者采样步数不足导致细节丢失。 解决方案: - 在设置面板中,将分辨率调整为标准尺寸,如 512x512 或 768x768。 - 增加采样步数(Sampling Steps),建议设置为 20-30 步。 - 勾选“高清修复”(Hires. fix)选项,并在放大算法中选择“R-ESRGAN 4x+”以获得更清晰的细节。 最佳实践:对于人像摄影,优先使用高清修复功能,避免直接生成超高分辨率大图导致显存溢出。
2. 手指数量错误或结构畸形怎么办?
原因分析:这是扩散模型的经典难题,尤其是手部关节复杂,模型难以精准理解解剖结构。 解决方案: - 使用“局部重绘”(Inpainting)功能。用画笔涂抹出错的手指区域。 - 输入提示词如 “perfect hands, 5 fingers”(完美双手,五指)。 - 提高局部重绘的“重绘幅度”(Denoising strength)至 0.4-0.6 之间,重新生成该区域。 注意事项:不要过度依赖单次生成,多尝试几次不同的种子值(Seed)往往能意外获得完美结果。
3. 提示词写了但没效果,图片还是老样子?
原因分析:可能是权重设置不当,或者提示词被负面提示词(Negative Prompt)抵消。
解决方案:
- 检查负面提示词栏,确保没有误写与主体相关的词汇(如未写“blurry”,却写了“sharp”)。
- 使用括号增加权重,例如 (masterpiece:1.2) 表示提升该标签的重要性。
- 使用在线提示词增强工具(如 Prompt Generator)优化关键词组合。
最佳实践:保持正面提示词简洁有力,负面提示词则应涵盖所有你不想要的元素(如低质量、变形等)。
4. 生成速度太慢,如何加速?
原因分析:硬件限制或模型过大导致推理时间过长。
解决方案:
- 在启动参数中添加 --lowvram 或 --medvram 以优化显存使用。
- 切换到更快的采样器,如 Euler a 或 DPM++ 2M Karras,它们通常在较少步数下也能获得良好效果。
- 如果显卡支持,启用 Xformers 加速库。
注意事项:降低图像分辨率是提升速度最直接的方法,但需平衡画质需求。
5. 图片色调灰暗,色彩不鲜艳?
原因分析:默认模型可能偏向写实风格,或采样器参数导致对比度不足。 解决方案: - 在提示词中加入 “vivid colors”(鲜艳色彩)、“high contrast”(高对比度)。 - 调整 CFG Scale(引导系数),适当降低至 7-9,过高会导致色彩过饱和且画面僵硬。 - 后期处理:使用内置的 Img2Img 功能,轻微调整对比度和饱和度参数。 最佳实践:对于动漫风格,可适当提高 CFG Scale 至 10-12 以增强风格化特征。
6. 如何固定生成的图片风格,保持一致性?
原因分析:每次随机种子不同,导致角色或场景变化巨大。 解决方案: - 复制当前图片的 Seed 值,将其锁定并填入下次生成的 Seed 输入框。 - 使用 LoRA 模型训练特定角色或风格,加载固定的 LoRA 权重。 注意事项:仅固定 Seed 不足以保证完全一致,还需保持提示词顺序和参数基本不变。
7. 显存不足报错(Out of Memory)怎么办?
原因分析:当前模型或分辨率超出了 GPU 显存承载能力。
解决方案:
- 切换至轻量级模型(如 SD 1.5 而非 SDXL)。
- 降低分辨率,例如从 1024 降至 512。
- 在启动命令中加入 --xformers 或 --opt-split-attention。
最佳实践:定期关闭其他占用显存的软件(如浏览器、游戏),确保 Stable Diffusion 独享资源。
8. 生成的文字乱码,无法显示清晰字符?
原因分析:基础扩散模型对文字渲染能力极弱。 解决方案: - 避免在提示词中直接要求生成具体文字。 - 先生成不含文字的干净背景图,然后使用 Photoshop 或其他设计软件后期添加文字。 - 若必须生成,尝试使用专门针对文字优化的模型(如 ControlNet 辅助)。 注意事项:目前大多数通用模型仍无法完美处理长句文字,后期合成是行业主流做法。
9. 如何去除图片中的水印或多余物体?
原因分析:需要修改局部构图。 解决方案: - 进入“图生图”(Img2Img)模式。 - 使用蒙版工具涂抹需要去除的区域。 - 在提示词中描述你希望该区域出现的内容,或留空以让模型自动填充。 - 调整重绘幅度,小幅度修改可保留原图结构,大幅度修改可彻底重构。 最佳实践:利用 ControlNet 的 Inpaint 预处理器可以更精准地控制局部修改的范围。
10. 如何选择最适合我的模型(Checkpoint)?
原因分析:模型众多,风格各异,新手容易选择困难。 解决方案: - 明确需求:写实照片选 Realistic Vision 系列;二次元动漫选 Anything V5 或 Counterfeit;艺术插画选 DreamShaper。 - 访问 Civitai 等模型社区,查看模型的预览图和评论。 - 从小参数量(SD 1.5)开始尝试,熟悉后再进阶到 SDXL 或 3D 模型。 注意事项:不同模型对应不同的提示词语法,下载时请仔细阅读作者提供的使用说明(README)。