怎么使用文生图
“怎么使用文生图”这个问题,意味着你已经对文生图有了初步的了解,并且准备开始实际操作了。使用文生图的核心就是编写有效的Prompt,并结合工具进行生成和优化。
下面我将从通用流程、Prompt编写指南和优化迭代三个主要方面来讲解如何使用文生图。
一、 通用使用流程
无论你使用的是在线服务(如Midjourney, DALL-E 3, Leonardo.Ai)还是本地部署的软件(如Stable Diffusion Web UI),基本的使用流程是相似的:
选择一个文生图工具:
在线服务: 适合新手,无需安装,即开即用。例如:Bing Image Creator (免费DALL-E 3), ChatGPT Plus (DALL-E 3), Leonardo.Ai, Midjourney (需Discord)。
本地部署: 适合有一定技术基础和较好显卡的用户,提供更多自由度和控制。例如:AUTOMATIC1111 Stable Diffusion Web UI, ComfyUI, Fooocus。
(参考上一回答,此处不详述如何“打开”)
找到Prompt输入区域:
在所选工具的界面上,找到一个文本框,用于输入你对图像的描述。这通常被称为“Prompt”或“提示词”。
有些工具还会提供“负面Prompt”(Negative Prompt)的输入框,用于排除不想要的元素。
编写你的Prompt(核心步骤):
这是最关键的一步。你需要用文字清晰地描述你想要生成的图像。
Prompt的构成要素: 主体、细节、环境、光照、风格、视角、质量词等。
Prompt的撰写技巧: 使用逗号分隔,从简到繁,具体形象,考虑顺序等。
(详细内容请参考我之前的“文生图怎么写”回答)
配置生成参数(如果可用):
图像比例 (Aspect Ratio): 选择你想要的图像尺寸比例(如1:1, 16:9, 9:16)。
模型选择 (Model Selection): 有些工具允许你选择不同的基础模型或风格模型。
采样方法 (Sampler): 影响生成速度和图像风格(如Euler a, DPM++ 2M Karras)。
采样步数 (Sampling Steps): 通常20-50步,步数越多细节可能越多,但生成时间也越长。
CFG Scale (Classifier-Free Guidance Scale): 控制Prompt的遵循程度,一般7-11。数值越高,越贴近Prompt,但可能失去创造性;数值越低,AI越自由,可能偏离Prompt。
种子 (Seed): 一个数字,用于固定生成结果。相同的Prompt和Seed会生成相同的图像,方便复现。
数量 (Number of Images): 一次生成几张图像。
开始生成:
输入Prompt并配置好参数后,点击“生成”(Generate)、“创建”(Create)或类似的按钮。
等待AI处理。
查看和评估结果:
AI会一次生成几张图像(根据你的设置)。
仔细查看每张图像,与你的Prompt进行对比,评估其质量、细节、风格、准确性等。
优化和迭代:
很少有第一次就能生成完美图像的情况。你需要根据生成的结果,不断调整Prompt和参数。
如果图像不符合预期:
修改Prompt: 增加细节,更换关键词,调整重点,明确风格。
调整负面Prompt: 排除不想要的元素。
调整参数: 尝试不同的CFG Scale、采样步数,或更换采样器。
更换模型: 如果是本地部署,尝试使用不同的模型。
如果图像质量不高:
添加更多“质量词”(如highly detailed, masterpiece, 8k)。
尝试更高的采样步数。
确保Prompt足够具体。
保存或进一步处理:
找到满意的图像后,进行保存。
有些工具还提供放大(Upscale)、局部重绘(Inpainting)、图像编辑等功能,可以对生成的图像进行二次创作。
二、 Prompt编写指南(简要回顾)
使用文生图,Prompt是你与AI沟通的桥梁。以下是编写Prompt的关键点:
具体性: 越具体越好。例如,“一只狗”不如“一只金毛猎犬,正在公园里追逐一个红色的飞盘”。
要素完整: 尝试包含主体、细节、环境、光照、风格等要素。
风格明确: 使用 photorealistic, oil painting, concept art, anime style 等词语指定风格。
质量增强: 加入 highly detailed, masterpiece, best quality 等词语。
负面Prompt: 使用 ugly, blurry, deformed, bad anatomy 等排除不良结果。
示例Prompt结构:
[主体描述], [细节描述], [环境/背景], [光照/氛围], [视角/构图], [艺术风格], [质量词]
例如:
A majestic dragon, with iridescent scales, perched on a snowy mountain peak, under a starry night sky, dramatic moonlight, fantasy illustration, highly detailed, sharp focus, masterpiece
三、 优化迭代
这是使用文生图最重要也最有趣的部分。
分析生成结果:
哪些地方符合Prompt?
哪些地方不符合?
图像的整体感觉如何?
针对性地调整:
如果主体不对: 确保Prompt开头的描述是清晰的主体,并考虑使用负面Prompt排除其他可能的主体。
如果细节不到位: 在Prompt中增加更具体的细节描述,或使用更强的质量词。
如果风格错误: 明确指定你想要的风格,或者使用负面Prompt排除不想要的风格(如cartoon, sketch)。
如果构图不理想: 尝试添加视角或构图相关的词语(如close-up, wide shot, rule of thirds)。
如果出现奇怪的瑕疵(如扭曲的手): 重点使用负面Prompt来排除这些问题。
记录和学习:
记录下你认为有效的Prompt和参数组合,这对你以后的创作非常有帮助。
多看别人是怎么写Prompt的,学习他们的技巧。
总结:
使用文生图是一个创意探索的过程。你需要:
选择合适的工具。
用清晰、具体的语言(Prompt)描述你的想法。
配置必要的参数。
生成图像,并仔细评估。
根据结果,不断调整Prompt和参数,进行迭代优化。
多加练习,你就会越来越熟练地驾驭文生图工具,创造出令人惊叹的图像。