Stable Diffusion完整操作手册:本地部署与高级控制

Stable Diffusion完整操作手册:本地部署与高级控制
最后更新:2026年06月28日 适用版本:Stable Diffusion 最新版 预计阅读时间:30分钟
第一章:快速入门(注册登录、界面介绍、第一个任务)
第一章:快速入门
欢迎进入 Stable Diffusion 的世界!本章将引导你完成从账号注册到生成第一张 AI 图像的全过程。无论你是否拥有强大的显卡,通过云端平台,你都可以轻松体验人工智能带来的创作乐趣。
1. 注册与登录
Stable Diffusion 通常依托于特定的在线服务平台或本地部署软件。以下以主流云端平台为例,展示如何开始你的旅程。
- 访问官网:打开浏览器,输入 Stable Diffusion 官方或授权服务商的网站地址。
- 创建账号:
- 点击右上角的 “Sign Up”(注册)按钮。
- 选择注册方式,推荐使用 邮箱注册 或 Google/微信一键登录。
- 设置一个安全的密码,并填写必要的个人信息。
- 完成邮箱验证或手机短信验证,以确保账号安全。
- 登录平台:
- 返回登录页面,输入你的账号和密码。
- 勾选 “记住我” 以便下次快速访问。
- 点击 “Login” 进入控制台。
注意事项:请务必保管好你的登录凭证。如果是付费服务,建议及时绑定支付方式以解锁更多高级功能(如更高并发、更高分辨率生成等)。
2. 界面介绍
登录后,你将看到简洁直观的操作界面。主要区域包括:
- 提示词输入区 (Prompt Box):位于屏幕中央或上方,是核心工作区。你需要在这里用文字描述你想要生成的图像内容。
- 负面提示词区 (Negative Prompt):紧邻提示词输入区下方。用于告诉 AI 你不想要什么元素,例如模糊、畸形的手、低质量水印等。
- 参数设置面板:
- 模型选择 (Model Checkpoint):下拉菜单中提供不同的基础模型,如 SD 1.5、SDXL 等,不同模型擅长风格不同。
- 采样器 (Sampler):推荐初学者选择 Euler a 或 DPM++ 2M Karras,它们在速度与画质间取得了良好平衡。
- 迭代步数 (Steps):数值越高,细节越丰富,但耗时越长。默认值通常为 20-30。
- 分辨率 (Resolution):常见比例为 512x512 或 1024x1024,需根据所选模型支持的最大尺寸调整。
- 生成按钮 (Generate):通常是一个醒目的绿色或蓝色按钮,点击后开始计算。
- 结果展示区:生成完成后,图像将显示在此区域,并提供下载、放大查看或作为参考图继续创作的功能。
3. 第一个任务:生成一张猫咪肖像
现在,让我们动手生成你的第一张 AI 艺术作品。请严格按照以下步骤操作:
- 选择模型:在“模型选择”下拉菜单中,选择一个经典的写实或动漫风格模型(例如
v1-5-pruned.ckpt或anything-v5)。 - 输入正向提示词:在提示词输入框中键入以下内容(建议使用英文以获得更精准的结果):
a cute fluffy cat sitting on a windowsill, sunlight streaming through, realistic photography, 8k resolution, highly detailed中文释义:一只可爱的毛茸茸的猫坐在窗台上,阳光透过窗户照射进来,写实摄影,8k分辨率,高度细节。 - 输入负面提示词:在负面提示词框中输入:
ugly, deformed, noisy, blurry, low contrast, text, watermark中文释义:丑陋,变形,噪点,模糊,低对比度,文字,水印。 - 调整参数:
- 将 Steps 设置为 20。
- 将 CFG Scale(提示词相关性)设置为 7。
- 保持 Resolution 为 512x512 或 768x768。
- 执行生成:
- 点击 “Generate” 按钮。
- 等待约 10-30 秒(取决于服务器负载)。
- 查看结果:
- 界面下方将出现生成的猫咪图像。
- 如果满意,点击右下角的 “Download” 保存至本地。
- 如果不满意,可以尝试修改提示词中的形容词(如改变光线、背景或猫的颜色),再次点击生成。
最佳实践建议: * 描述要具体:AI 对细节非常敏感,尽量包含主体、动作、环境、光照、艺术风格和画质关键词。 * 善用负面提示词:这是提升出图质量的关键,能有效避免常见的 AI 绘画缺陷(如多指、面部崩坏)。 * 批量生成:如果不确定哪个种子(Seed)效果最好,可以一次生成 4 张不同随机性的图片,从中挑选最佳者进行微调。
恭喜你!你已经成功完成了 Stable Diffusion 的第一个任务。接下来,你可以探索更多复杂的提示技巧或尝试不同的艺术风格。
第二章:基础功能详解(核心功能逐个讲解,带截图说明)
第二章:基础功能详解
欢迎来到 Stable Diffusion 的核心功能世界。本章将带你逐一拆解界面中的关键模块,通过具体的操作步骤,让你从零开始掌握图像生成的奥秘。我们将重点介绍提示词、负向提示词、采样器选择以及参数设置这四个核心板块。
2.1 正向提示词:给 AI 下指令
正向提示词(Prompt)是你与 AI 沟通的主要方式。你需要用英文或中文详细描述你想要的画面内容。
操作步骤: 1. 找到界面顶部的 txt2img(文生图)标签页。 2. 在 Prompt(提示词)大文本框中输入描述。例如:“a cute cat sitting on a windowsill, sunlight, realistic style”(一只可爱的猫坐在窗台上,阳光,写实风格)。 3. 点击底部的 Generate(生成)按钮。 4. 等待几秒钟,右侧预览区将出现生成的图像。
最佳实践:
- 使用逗号分隔不同的元素,如“cat, blue eyes, red collar”。
- 权重调整很重要,使用括号 () 可以增加权重,如 (cat:1.2) 会让猫的形象更突出。
[截图说明:此处应展示 Prompt 输入框的特写,高亮显示输入的英文句子及下方的 Generate 按钮]
2.2 负向提示词:排除不想要的内容
负向提示词(Negative Prompt)用于告诉 AI 你不希望出现在画面中的元素。这是提升出图质量的关键。
操作步骤: 1. 在 Prompt 输入框下方,点击 Show negative prompt(显示负向提示词)展开折叠区域。 2. 在弹出的文本框中输入需要排除的特征。例如:“ugly, deformed, noisy, blurry, distorted, grainy”(丑陋、变形、噪点、模糊、扭曲、颗粒感)。 3. 再次点击 Generate。
注意事项: - 不要过度堆砌负面词汇,保持简洁即可。 - 对于初学者,系统通常自带默认负向提示词,建议先保留默认值,再根据需求微调。
[截图说明:此处应展示 Negative Prompt 展开后的界面,列举常见的负面词汇示例]
2.3 采样方法与步数:控制生成的精度
采样器(Sampler)决定了 AI 如何将噪声转化为图像,而步数(Steps)则影响生成的精细度。
操作步骤: 1. 找到 Sampling method(采样方法)下拉菜单。 2. 推荐新手选择 Euler a 或 DPM++ 2M Karras,它们平衡了速度与质量。 3. 调整 Sampling steps(采样步数)。一般设置为 20-30 步即可满足大多数需求。步数越高,细节越丰富,但耗时也越长。 4. 观察生成速度变化,尝试不同组合。
最佳实践: - 如果图像出现伪影或结构混乱,尝试增加步数至 50 步以上,或更换采样器为 DDIM。 - 对于快速草稿构思,可使用 DPM++ SDE 并降低步数至 15 左右。
[截图说明:此处应展示 Sampling method 和 Sampling steps 的参数设置面板,标注推荐数值]
2.4 分辨率与批量生成:确定画布大小
在生成前,必须设定图像的宽高。不合理的比例可能导致人物肢体变形。
操作步骤: 1. 在 Width(宽度)和 Height(高度)输入框中设置数值。 2. 常用比例参考:正方形 512x512,人像 512x768,风景 768x512。 3. 若需同时生成多张图,调整 Batch count(批次数量)和 Batch size(每批数量)。 4. 点击 Generate 查看多张结果。
注意事项: - 确保分辨率是 64 的倍数,否则可能报错或导致显存溢出。 - 高分辨率会显著增加显存占用,若显存不足,请先优化提示词或降低步数。
[截图说明:此处应展示尺寸设置区域,并用箭头指示推荐的常见分辨率组合]
通过以上四个核心功能的组合操作,你已经能够生成基本的 AI 图像。记住,生成艺术是一个不断试错的过程,多尝试不同的参数组合,你将逐渐找到属于自己的创作风格。

第三章:高级技巧(提示词工程、多轮对话、风格控制)
第三章:高级技巧
掌握基础操作后,本章将深入探讨如何通过精细的提示词工程、有效的多轮迭代以及精准的风格控制,来激发 Stable Diffusion 的最大潜力。这些技巧能帮助你从“随机生成”转向“精准创作”,大幅减少试错成本,提升出图质量。
3.1 提示词工程:与 AI 高效沟通的艺术
提示词(Prompt)是引导 AI 理解你意图的核心钥匙。优秀的提示词不仅包含主体描述,还涵盖构图、光照、艺术风格等细节。
操作步骤:
- 构建正向提示词:在界面顶部的“Positive Prompt”输入框中,按照
[主体] + [细节描述] + [环境/背景] + [光照/氛围] + [艺术风格]的逻辑顺序输入。例如:“一只穿着宇航服的猫,坐在火星表面,背景是地球,电影级光照,超写实主义,8k分辨率”。 - 设置负面提示词:在下方的“Negative Prompt”输入框中,填入你希望避免的元素。推荐使用预设模板或输入:“low quality, blurry, bad anatomy, extra limbs, watermark, text”。这能有效修正人体结构错误和低劣画质。
- 调整权重:若某元素权重过高或过低,可使用
(keyword:1.5)或[keyword]语法进行微调。括号内数字越大,AI 越重视该元素;方括号则相反。 - 执行生成:点击“Generate”按钮,观察结果并根据偏差反向优化提示词。
注意事项与最佳实践: - 简洁有力:避免堆砌过多无关词汇,AI 可能无法解析冲突信息。 - 使用英文:虽然部分模型支持中文,但英文提示词的兼容性和准确性依然最高。 - 参考社区库:利用 Civitai 等网站查看高分作品的提示词结构,学习大神的用词习惯。
3.2 多轮对话与迭代优化
AI 创作很少一次完美成功,通过多轮迭代微调参数和提示词,是获得理想作品的关键路径。
操作步骤:
- 初稿生成:基于初始提示词生成第一批图像(Batch Size 设为 4 或更高以获取多样性)。
- 选择与放大:点击你满意的那张缩略图,进入“Hires. fix”(高清修复)模式,或在局部重绘(Inpainting)区域选中需要修改的部分。
- 局部修正:涂抹需要修改的区域(如手部、背景杂物),在提示词中针对性地加入修正指令(如“perfect hands”),保持原提示词其余部分不变。
- 参数微调:若画面构图不佳,可尝试调整“CFG Scale”(提示词引导系数)。值越高,AI 越严格遵循提示词,但过高可能导致画面失真;值越低则更具创造性但可能偏离主题。
- 循环验证:重复上述步骤,直到图像完全符合预期。
注意事项与最佳实践: - 保持种子固定:若仅想微调细节,请锁定“Seed”数值,确保基础构图不变,仅改变局部特征。 - 逐步细化:不要试图在一个步骤中解决所有问题,分阶段优化更易掌控。
3.3 风格控制:赋予作品独特灵魂
通过切换底模(Checkpoint)和使用 LoRA 插件,你可以轻松在不同艺术风格间自由切换,从照片写实到二次元动漫,再到油画水彩,应有尽有。
操作步骤:
- 选择底模:在模型下拉菜单中选择对应的 Checkpoint 文件。例如,选择
RealisticVision用于写实摄影,选择AnythingV5用于日系动漫风格。 - 加载 LoRA:点击“LoRA”标签页,搜索并添加所需的风格插件(如
watercolor水彩风格或cyberpunk赛博朋克风格)。 - 设置权重:在 LoRA 权重栏中输入数值(通常为 0.6 - 0.8)。权重过高可能破坏原图逻辑,过低则风格不明显。
- 应用风格提示:在主提示词中加入对应风格的关键词,如“oil painting style”(油画风格)或“anime key visual”(动漫关键视觉)。
- 生成对比:点击生成,观察风格变化。若不理想,可尝试更换不同的 LoRA 组合或调整采样器(Sampler)。
注意事项与最佳实践:
- 匹配性原则:确保 LoRA 与底模版本兼容,否则可能出现色彩异常或结构崩坏。
- 采样器选择:写实风格推荐 DPM++ 2M Karras,动漫风格推荐 Euler a,不同采样器对风格表现力有影响。
- 保存预设:将常用的风格组合保存为“Preset”,方便日后快速调用,提高工作流效率。
通过以上高级技巧的训练,你将不再仅仅是 AI 的使用者,而是成为能够精准驾驭其创造力的艺术家。
第四章:实战案例(3个真实场景完整演示)
第四章:实战案例——从灵感到成品的完整演示
在本章中,我们将通过三个真实且高频的使用场景,带你从零开始掌握 Stable Diffusion 的核心工作流。无需复杂的代码基础,只需跟随以下步骤,即可生成令人惊艳的作品。
案例一:电商产品图生成——“无背景白底商品展示”
此场景适用于需要快速制作电商主图,但缺乏专业摄影棚或模特的情况。
操作步骤:
1. 选择模型:在模型下拉菜单中选择 Realistic Vision V5.1 或类似的高写实度 Checkpoint 模型。
2. 设置参数:将采样器(Sampler)设为 Euler a,迭代步数(Steps)设为 30,CFG Scale 设为 7。
3. 输入提示词:
* 正向提示词:输入 a professional product photo of a sleek white ceramic coffee mug on a pure white background, soft studio lighting, high resolution, 8k, minimal shadows(白色陶瓷马克杯的专业产品照,纯白背景,柔和影棚光,高分辨率,极简阴影)。
* 负向提示词:输入 blurry, text, watermark, dark background, messy, low quality(模糊,文字,水印,深色背景,杂乱,低质量)。
4. 执行生成:点击 “Generate” 按钮。
5. 后期处理:若背景不够纯净,可使用内置的“Inpainting”功能,涂抹杯子边缘以外的区域,重新填充为白色背景。
注意事项与最佳实践:
* 光影一致性:务必在提示词中强调光源方向(如 "left side lighting"),否则生成的产品可能看起来像贴在纸片上。
* 避免文字:Stable Diffusion 对文字渲染能力较弱,若不需要Logo,请在负向提示词中严格添加 text, letters, logo。
案例二:社交媒体插画——“二次元风格头像定制”
此场景适用于游戏玩家或动漫爱好者,希望生成具有个人特色的二次元头像用于社交平台。
操作步骤:
1. 切换模型:切换到专攻二次元风格的模型,如 Anything V5 或 Counterfeit V3。
2. 启用 ControlNet:这是关键步骤。打开 ControlNet 面板,添加一个 Canny 或 OpenPose 预处理器。
3. 参考图片上传:上传一张你喜欢的动漫角色线稿或姿态照片作为参考。
4. 输入提示词:
* 正向提示词:输入 masterpiece, best quality, anime style, girl with long blue hair, wearing cyberpunk jacket, looking at viewer, detailed eyes, neon lights background(杰作,最佳质量,动漫风格,蓝发女孩,穿着赛博朋克夹克,直视观众,细节丰富的眼睛,霓虹灯背景)。
* 负向提示词:输入 lowres, bad anatomy, extra limbs, ugly(低分辨率,解剖结构错误,多余肢体,丑陋)。
5. 调整权重:在 ControlNet 单元中,将 Control Weight 设为 0.8,确保姿态被严格锁定,同时保留一定的创意空间。
6. 执行生成:点击 “Generate”。系统会基于你的参考图生成符合指定风格的图像。
注意事项与最佳实践: * 姿态控制:若使用 OpenPose,确保参考图的骨骼关键点清晰可见,否则会导致生成的人物肢体扭曲。 * 风格融合:通过修改提示词中的服装和发型描述,可以无限变换同一姿态下的角色形象,非常适合批量生产系列头像。
案例三:概念设计辅助——“建筑室内效果图快速迭代”
此场景适用于设计师,希望在客户沟通前快速呈现多种室内设计方案的氛围感。
操作步骤:
1. 选择模型:使用支持高清输出的模型,如 DreamShaper XL 或 Juggernaut XL。
2. 启用 img2img(图生图):切换到 Img2Img 标签页。
3. 上传草图:导入一张简单的室内手绘草图或CAD截图。
4. 设置重绘幅度:将 Denoising strength(去噪强度)调整为 0.4 到 0.5 之间。这个区间既能保留原始构图,又能大幅丰富细节。
5. 输入提示词:
* 正向提示词:输入 modern living room, minimalist interior, large windows, sunlight streaming in, wooden floor, cozy atmosphere, photorealistic, architectural visualization(现代客厅,极简内饰,大窗户,阳光射入,木地板,舒适氛围,照片级真实,建筑可视化)。
* 负向提示词:输入 cluttered, dark, cartoonish, sketch lines(杂乱,黑暗,卡通风格,素描线条)。
6. 批量生成:设置 Batch count 为 4,点击 “Generate”。你将获得四张基于同一构图但细节不同的效果图。
注意事项与最佳实践:
* 去噪强度是关键:数值过高(>0.6)会完全改变原图结构,失去设计初衷;数值过低(<0.3)则变化不明显。建议从 0.5 开始微调。
* 细节补充:在提示词中加入具体的材质描述(如 marble texture, velvet sofa),能显著提升成图的质感,帮助客户更直观地理解设计方案。
通过以上三个案例,你可以发现 Stable Diffusion 的强大之处在于灵活组合模型、提示词与控制技术。多尝试、多观察,你将能创造出无限可能。
第五章:效率提升(快捷键、模板库、批量处理)
第五章:效率提升——快捷键、模板库与批量处理
在掌握了 Stable Diffusion 的基础生成流程后,许多用户会发现重复性的操作耗时且枯燥。本章将深入介绍如何通过快捷键、模板库以及批量处理功能,将你的创作效率提升数倍,让你从繁琐的操作中解放出来,专注于创意本身。
5.1 掌握核心快捷键
熟练使用键盘快捷键是进阶用户的必经之路。虽然不同界面插件(如 WebUI 或 ComfyUI)的默认设置略有差异,但以下通用逻辑能帮助你快速上手。
常用快捷键指南:
- Ctrl + Enter:这是最常用的组合键,用于直接触发“生成”按钮。当你调整好参数后,无需移动鼠标点击按钮,直接按下即可出图。
- Ctrl + Shift + S:保存当前设置的提示词(Prompt)和参数配置到剪贴板。这在尝试不同模型或采样器时非常有用,你可以随时粘贴回之前的优秀配置。
- Ctrl + Z:撤销上一步操作。如果你在调整滑块或修改提示词时误操作,立即按下此键可恢复原状。
- 左右箭头键:在图像生成历史中快速切换上一张或下一张图片,方便对比筛选。
- 空格键:暂停或继续正在进行的生成任务。当发现参数有误时,迅速按空格暂停,避免浪费算力。
最佳实践:建议将最常用的快捷键固定在屏幕侧边或制作成小卡片贴在显示器旁,直到形成肌肉记忆。
5.2 构建个性化模板库
每次从零开始输入提示词和参数不仅低效,还容易导致风格不统一。建立自己的“模板库”是保持输出质量稳定的关键。
操作步骤:
- 点击“保存预设”按钮:在参数面板底部,找到并点击标有
Save Preset或保存预设的图标。 - 输入模板名称:在弹出的对话框中,为当前配置命名,例如“写实人像_v1”或“赛博朋克风景”。
- 选择应用范围:勾选需要保存的参数项(如提示词、负向提示词、采样器、步数等),点击
确认。 - 调用模板:下次使用时,点击参数面板右上角的
Load Preset(加载预设),在下拉菜单中选择你之前保存的名称,所有参数将自动填充完毕。
注意事项:
- 定期整理:随着使用频率增加,模板会越来越多。建议每月进行一次分类整理,删除不再使用的旧模板,避免列表过长难以查找。
- 版本控制:对于同一风格的模板,建议加上版本号(如 v1, v2),以便追踪优化过程。
5.3 高效利用批量处理
当需要生成大量相似风格或系列图片时,手动一张张生成显然不可行。Stable Diffusion 提供了强大的批量处理功能。
操作步骤:
- 准备提示词列表:在一个文本文件中,每行写入一个不同的提示词(Prompt)。确保每行只包含一个完整的提示词,不要有多余的空行。
- 进入批量模式:切换到“批量处理”标签页(通常位于主生成界面的右侧或下方选项卡中)。
- 上传或粘贴提示词:将准备好的文本内容粘贴到“提示词”输入框中,或者点击
Browse按钮上传.txt文件。 - 设置固定参数:在右侧参数栏中,设定好采样器、步数、分辨率等所有图片共用的基础参数。
- 启动生成:点击
Generate(生成)按钮。系统会自动读取每一行提示词,依次生成对应图片,并将结果按顺序保存在输出文件夹中。
进阶技巧:使用 LoRA 批量混合
如果你希望测试不同 LoRA 权重对同一提示词的影响,可以在批量处理的“参数覆盖”功能中,设置不同的 LoRA 权重值列表。系统将自动遍历这些权重,生成一系列对比图,极大简化了模型调优过程。
5.4 注意事项与最佳实践
- 显存管理:批量处理时,如果一次性生成图片数量过多,可能会导致显存溢出(Out of Memory)。建议将批次大小(Batch Size)设置为 1 或 4,通过循环生成来减轻压力。
- 命名规范:在批量处理前,务必在输出文件名模板中加入
%batch_number%或%prompt_hash%,这样生成的图片会有清晰的编号,便于后续管理和检索。 - 硬件监控:长时间批量运行可能会使 GPU 温度升高。请确保电脑通风良好,并监控温度,必要时暂停任务让设备冷却。
通过以上技巧的运用,你将能够以更高的效率和质量完成创作任务。记住,工具只是手段,熟练驾驭它们,才能让你的想象力自由飞翔。
第六章:常见问题与解决方案(FAQ,10个高频问题)
第六章:常见问题与解决方案 (FAQ)
在使用 Stable Diffusion 进行创作的过程中,初学者往往会遇到各种技术瓶颈或效果不达预期的情况。本章精选了10个最高频的问题及其详细的解决步骤,帮助您快速排除故障,提升出图质量。
Q1: 为什么生成的图片非常模糊?
原因分析:通常是因为采样步数(Sampling Steps)过少,或者分辨率设置过低导致模型无法识别细节。 解决方案: - 打开设置面板,将 Sampling Steps 调整为 20-30 步。 - 勾选 Hires. fix(高清修复),并在下方设置 Upscale by 为 1.5 或 2。 - 确保最终输出分辨率至少为 512x512 或 768x768。 最佳实践:对于人像,建议结合 ControlNet 使用,以锁定姿态和面部特征,避免模糊。
Q2: 生成的手指数量不对或形状怪异?
原因分析:这是扩散模型的固有缺陷,尤其在早期版本中更为常见。
解决方案:
- 在提示词中加入负面提示词:extra fingers, mutated hands, poor anatomy。
- 如果使用的是 WebUI,进入 Settings → Face restoration,启用 CodeFormer 或 GFPGAN 进行后期修复。
- 尝试增加分辨率,因为高分辨率下模型对局部细节的关注度更高。
Q3: 如何更换不同的模型(Checkpoint)?
操作步骤:
- 点击左侧菜单中的 Checkpoint selector(模型选择器)。
- 在下拉列表中浏览已下载的 .safetensors 或 .ckpt 文件。
- 点击目标模型名称,等待加载条完成,界面刷新后即应用了新模型风格。
注意事项:切换模型后,原有的 Prompt 可能不再适用,建议重新调整关键词。
Q4: 生成速度太慢怎么办?
优化建议: - 降低 Resolution(分辨率),例如从 1024x1024 降至 512x512。 - 减少 Batch count(批次数量)和 Batch size(每张图的生成次数)。 - 在 Settings → Interface 中,将 Script 标签页下的 X/Y plot 关闭,除非您正在进行网格测试。 - 若硬件支持,启用 Optimized attention 或切换到 SDXL Turbo 等加速模式。
Q5: 颜色过于饱和或失真?
解决方法:
- 检查提示词中是否包含了过多的色彩形容词。
- 在 Negative prompt(负面提示词)中添加 low contrast, dull colors 的反向描述,或者调整 CFG Scale。
- 操作步骤:将 CFG Scale 从默认的 7 降低至 5-6,这会让模型更自由地发挥,减少强制带来的色彩异常。
Q6: 为什么我输入了提示词,但生成的图片毫无关联?
排查步骤:
- 确认提示词语法正确,单词之间用逗号分隔。
- 检查 Seed(随机种子)是否固定。如果每次 Seed 不同,结果会有巨大差异。
- 操作步骤:点击 Seed 输入框旁边的 固定图标 📌,保持 Seed 不变,仅微调提示词权重 (keyword:1.2) 来观察变化。
Q7: 如何处理“Out of Memory (OOM)”错误?
紧急措施:
- 立即减小 Resolution 和 Batch size。
- 在 Settings → Installation 中,勾选 Use CPU offload(如果显存不足但内存充足)。
- 添加启动参数 --medvram 或 --lowvram 以优化显存占用。
Q8: 如何批量生成不同风格的图片?
操作流程:
- 切换到 img2img 或 Extras 标签页。
- 使用 X/Y Plot 脚本,设置 X 类型为 Prompt S/R。
- 在输入框中列出多个关键词(如 cyberpunk, steampunk, victorian),系统会自动遍历并生成多张对比图。
Q9: 生成的图片带有水印或签名?
解决方案:
- 检查使用的模型是否为官方原版,第三方修改版可能嵌入了水印。
- 使用 Inpainting(局部重绘)功能,涂抹掉水印区域,重新生成该部分。
- 确保负面提示词中包含 watermark, signature, text。
Q10: 如何保存和分享我的作品?
保存步骤:
- 生成满意图片后,点击底部的 Save 按钮。
- 选择保存格式为 PNG 以保留元数据(Metadata),方便后续复现。
- 点击 Copy to clipboard 可直接分享链接或嵌入网页。
最佳实践:建立专门的文件夹管理不同主题的 Prompt 和模型,定期备份 .safetensors 文件以防丢失。
通过掌握以上 FAQ 中的技巧,您将能够更高效地驾驭 Stable Diffusion,从新手迅速成长为熟练的数字艺术家。记住,实验是探索 AI 潜力的最佳途径,不妨大胆尝试不同的参数组合!