AI EngineeringSeptember 10, 202516 min read
    SC
    Sarah Chen

    神经网络提示 - 制定有效提示的实用技巧

    神经网络提示 - 制定有效提示的实用技巧

    神经网络提示:制作有效提示的实用技巧

    从一个具体目标开始:定义目标输出以及您将用来判断成功的指标。这能保持用户对齐,并使评估进度变得容易。最终,一个明确定义的目标会照亮您的工作,并帮助您将不同变体与单一标准进行比较。

    将提示框架化为简洁的指令集:定义角色,提供上下文,直接描述任务,并添加明确约束。使用通过提示的帮助来锚定对象并强制执行一致的风格。在扩散任务中,清晰的提示会使输出与您想要采样的分布对齐。

    使用不同约束和几个变体测试提示,以识别哪些在任务中保持有效。使用简单评分表来比较正确性、一致性和与请求语气的一致性。保持记录以告知未来的提示并构建可重用模板库。

    关注重要的特征:清晰度、具体性、语气和基于事实的 grounding。提供一小组特征来为用户固定并指导模型的选择。将提示与您预期的文本类型绑定(技术性、促销性或指导性)。对于基于扩散的工作,将提示与您想要采样的分布对齐并避免漂移。

    保持迭代紧凑:从粗略开始,然后通过反馈收紧。想象一个想法火山爆发并用您的手指指向您想要强调的基本术语。当受众包括女性时,运行包容性语言检查并测试能浮现多样声音的提示以防止偏见。

    维护持续的提示审计:跟踪变化,记录哪些提示优于其他,并携带最可靠的模板向前。建立一个简短的术语词汇表及其预期效果,以确保在扩散工作流中的任务和模型之间一致性

    神经网络提示:制作提示的实用技巧;如何为稳定扩散编写提示

    首先定义确切输出:着陆页的城市景观、视频的电影帧,或帖子的照片。指定主题、心情、纵横比和媒介(静态图像、视频帧或文章缩略图),以便模型能与您的目标对齐并立即交付高质量。

    • 定义可重复的提示骨干:主题、场景、风格、光照、颜色、构图、媒介/输出。包括清晰的名词,如城市、废弃的、对象的、帖子、视频、照片、文章,以指导方向并减少歧义。
    • 使用精确的形容词和约束:电影般的、高度详细的、佳能级颜色、温暖和凉爽平衡,以及定义的调色板(颜色)。将这些与最终格式(着陆页视觉或帖子)绑定,以保持资产的一致性。
    • 利用可用的稳定性旋钮:考虑 k_euler 作为采样器选项,以获得更平滑的边缘和连贯的纹理;与强调纹理、边缘和光照的提示配对。将有助于在文本、生成和视觉中重现重访主题。
    • 为多个交付物制作提示:帖子、文章、信件、着陆视觉和视频帧。对齐措辞,以便在每个示例中存在核心提示,确保连贯的活动流程。
    • 迭代测试:生成几个变体,根据精确细节比较,并选择改善对象、光照和风格匹配的词语。使用反馈来完善提示而不丢失语气。

    稳定扩散的提示解剖

    将请求收集成逻辑序列:[主题]、[场景]、[细节]、[风格]、[光照]、[颜色]、[构图]、[媒介]。在它们添加精确性的地方包括俄语单词:令人印象深刻的城市场景、废弃的对象、古代细节、颜色、精确光照。使用单一、简洁的方向加上少量修饰语来防止含义分裂。

    • 主题与场景:关注主要对象或人物,加上上下文如城市及其周边。示例提示:城市,在雾中,废弃的帖子,走着的英雄。
    • 风格与颜色:电影般的、高度详细的、佳能颜色分级、调色板从冷色到温暖强调;固定心情,例如平静的黎明或戏剧性的日落。
    • 光照与纹理:指定光的方向和质量、反射和表面纹理,以指导真实感(湿润的人行道、玻璃眩光、阳光中的尘埃)。
    • 媒介与输出:定义您想要稳定的帧、着陆帧,或社交媒体帖子;澄清纵横比和文件格式。

    即用模板

    1. 高度电影般的、照片真实的废弃城市黄昏图像,雨水湿滑的街道,霓虹灯在湿润人行道上反射,孤独的身影穿着风衣;主题:孤独身影,环境:城市夜晚;风格:佳能颜色分级;光照:阴郁的带边缘光;颜色:凉爽的蓝色带温暖的琥珀强调;构图:三分法;媒介:静态图像;相机:50mm 视角;采样:k_euler;输出:着陆页视觉或帖子。
    2. 古代寺庙的内部镜头,尘埃光束、石质纹理和复杂雕刻;风格:电影般的、超详细;调色板:金色和蓝绿色;光照:从上方射入的光柱;构图:引导线指向中央雕像;媒介:静态图像或海报;相机:85mm;质量:高。
    3. 黎明时的城市天际线、柔和云朵、地平线上柔和的粉红和紫色渐变,城市灯光渐淡;主题:城市景观;场景:空中/无人机般的视角;风格:电影般的、真实的;颜色:从凉爽到温暖的渐变;光照:清晨辉光;构图:宽阔、扩展的框架;媒介:视频帧或文章图像;相机:24-70mm 范围;输出:视频静态或文章缩略图。

    定义清晰目标和输出规格

    定义清晰目标和输出规格

    首先起草单一目标和明确输出规格。这会锚定每个提示并防止漂移到模糊。遵循精确原则:用具体术语陈述目标、预期格式和成功标准。

    定义主题和受众:对于第一次迭代,识别神经网络应该创建什么、设置和语气。例如:描绘伦敦附近黄昏火山的图片,用照片真实光照渲染。包括心情、规模和边界以避免假设过多而出错。计划应说明谁观察结果以及如何使用它。

    输出规格涵盖格式、元数据和约束。如果目标是图片,指定:分辨率(例如 2048x1152 或 3840x2160)、纵横比(16:9 或 4:3)、颜色空间(sRGB),以及所需的光照方向和材料反射。如果需要文本,定义标题、段落长度和项目符号样式。包括一个简短的标题,与预期受众对齐。

    为了保持高质量,将规则绑定到输出:k_euler 种子、允许的技术,以及人工创建与手动编辑之间所需的风格方法。陈述需要什么:对细节的热爱、对和谐的关注,以及与所选风格的一致性。本节列出不应从所谓来源中取材的内容以及如何验证原创性,帮助避免错误和将口号与真实内容混淆。

    模板:目标和输出检查清单

    1. 目标清晰度:定义具体主题和上下文(例如,伦敦附近黄昏火山的图片)。
    2. 输出格式:指定文件类型、分辨率、纵横比、颜色空间,以及任何标题或元数据(如果需要)。
    3. 约束:设置光照、技术和风格边界;注明任何不得出现的元素以防止出错。
    4. 评估:定义质量如何测量(视觉保真度、与计划的对齐,以及不存在从未授权来源取材的内容)。
    5. 参考和种子:包括 k_euler 和任何指导生成的提示或参考,同时保留版权和原创性。

    使用描述性、具体关键词

    选择一个明确定义的主题,并用精确关键词描述它,以锁定外观、材料和设置。对于您寻求的结果,指定最重要的属性,如大小、颜色、纹理和姿势。包括将对象与其环境绑定的细节。例如,用祖母绿羽毛、蓝色尾巴和 25 厘米高度描述鹦鹉;将其定位在沙漠光照下的温暖日落光束中的树枝上。为了指导用户并保持焦点,包括英文单词和清晰的风格标签(style),以信号语气——无论是照片真实的、绘画般的还是卡通的。这样模型会优先考虑正确的提示,同时避免模糊语言。

    精确的结构化提示

    采用 6 字段模板:主题、环境、材料(材料)、光照(光束)、风格(style)和受众(用户)。设置规则,以便每个字段贡献可衡量的细节:厘米大小、确切颜色代码或调色板、纹理笔记和具体设置。使用这些细节来收紧指导,并插入俄语术语如信件和注意,以提醒自己强调落在何处。这样提示保持可操作,并且输出匹配预期受众——用户,提示为其服务。

    示例和模板有助于强化一致性。例如,一个提示可以读:"用祖母绿羽毛、钴蓝色尾巴、25 厘米高度描述鹦鹉,栖息在沙漠黎明场景中的树枝上;光照:温暖光束,45 度角度;材料:羽毛、角蛋白;风格:照片真实;语言:英文;受众:需要鸟类清晰特征的用户。" 另一个提示:"创建一封简短信件给用户(信件),解释如何描述主题,强调哪些特征和材料;包括哪些背景、哪些光照和哪些风格,并确保输出对学习提示制作有用。"

    使用这些实用步骤来收紧提示:精确指定主题、锁定材料(材料)、用数字方向或色温设置光照(光束)、选择风格,并定义观看受众(用户)。为了保持结果专注,避免模糊形容词,并将每个提示包裹在具体数据中,如大小、颜色十六进制代码和精确光照角度,同时保持友好、自信的语气,指导用户获得可重复的结果。

    指导角色和风格提示:设置模型视角

    角色定义和视角

    将模型设置为此主题的指导导师。在开头清楚陈述角色:我是您此主题的提示教练,指导您构建有效的神经网络提示。这种方法与文章中的指导对齐,并保持会话专注。对于每次互动,包括一封简短信件,概述目标、受众和预期输出,用两三句话,以便用户知道路径(知道)目的。

    提供简洁模板:目标、约束、上下文和示例提示。强调清晰元素并使用设置来调整语气从正式到友好。给定的框架帮助模型保持轨道并通过预定义预期回答减少错误。我们给出两个具体步骤来实施这种方法。在提示中,也包括西里尔标记“体育场”来测试多语言处理。实用提示可以引用沙漠位置和火山来锚定想象,包括手指指向地平线和强化颜色和主要形状的颜色调色板。

    作为实用练习,我们将从 YouTube 拉取示例来说明结构并将单词连接到视觉。包括两个强调图片和主要颜色的示例提示;确保用户可以比较输出并学习措辞如何改变结果。

    风格提示和提示制作

    风格提示:保持简洁、友好的语气,用粗体突出关键术语,用强调指导注意力。使用主动语态和短句以提高可读性。记住输出的规模:从紧凑提示开始,逐步扩展到更详细的提示(scale)。包括对图片和颜色(颜色)的引用,以便模型将视觉与语言对齐。模型在其操作中使用这种方法并遵循设置以保持对齐。提示应最小化错误并改善回答。给定的方法保持模型在对话的正确点,并确保它能根据需要调整设置。提示:如果用户要求指导,包括简短提示,但避免用额外细节超载提示。主要原则:清晰、对齐和可操作步骤。

    风格示例提示:1) "描述沙漠体育场在火山爆发的时刻;包括废弃的心情、手指指向地平线,以及突出主要图形颜色的颜色调色板。" 2) "生成 2–3 张图片显示相同场景的光照和颜色规模变化,以比较观众体验。"

    迭代细化工作流:测试、评估、调整

    定义一个紧凑、可重复的测试计划:保持核心指令完整,并运行 3–5 个请求变体。使用固定输入集和代表性内部数据集,然后记录结果、周转时间和定性笔记。隔离输出特征哪些满足基线,哪些在提示、风格或格式中漂移。如果一个变体持续优于其他,将其作为未来迭代的锚点;否则丢弃并转向。然后将这些发现转化为专注的修订策略,您可以在下一个周期应用。

    测试和数据策略

    为每个变体设置一个目标:正确性、清晰度和可操作性。用固定评分表测量:与黄金标准的准确性、指令遵守和面向用户的可读性。每个变体收集至少 20 个样本以减少噪声。跟踪哪些提示产生最稳定的内部特征,并使用这些信号来优先改变请求结构和示例。如果一个变体产生 15% 更高的完成率,将其提升为核心提示家族。

    调整和迭代计划

    评估后,一次只修改一个参数:温度、提示长度或提供的示例。重新运行相同输入集,与先前结果比较,并记录结果质量的变化。记录简洁理由和预期趋势,然后继续。如果结果趋于平稳,重写指令以澄清操作步骤并强调您针对的关键特征,保持焦点在用户任务上。重复直到结果满足预定义目标。

    稳定扩散参数:CFG 规模、步骤和种子管理

    CFG 规模控制对提示的遵守。在实践中,范围 6–9 提供忠实度和多样性的平衡权衡;4–5 松散对齐,10+ 锐化特征但提高重复风险。始终包括带有清晰名词和动词的描述,并跟踪您用于塑造结果的单词。单词描述出现在您的提示中以指导生成。

    步骤决定细节和稳定性。典型范围是大多数场景的 20–60 步;80–100 步提供更精细纹理但增加时间和过度锐化的机会。当您看到噪声或过度平滑时,适度调整步骤并保持单一 CFG 种子组合以比较。这有助于避免错误并精确测量结果图片或图像的变化。

    种子管理策略。使用固定种子来重现给定输出,仅在探索变体时改变种子。保持种子和它们产生的提示日志;该日志成为从种子到结果的地图。如果您想要一批图像,一次设置种子并用不同提示生成 N 个图像;或为每个图像改变种子如果您需要多样样本。程序必须存储种子值,这简化了故障排除和比较。

    提示优化工作流。构建程序可以解释的简洁描述。包括解构元素和约束,如纵横比、光照和心情,并使用如“画”这样的指令来引导意图。当您生成图像时,将输入喂给神经网络,然后审查图片并选择最佳示例。对于此类任务,您需要的图像数量应提前定义以防止不必要的计算;每个提示设置 3–5 个图像的目标通常足够判断质量。保持单词使用日志(words)以查看描述变化如何影响结果。

    创意提示技巧:构图、光照和颜色指导

    立即定义主题:指定人物和主题,然后用清晰提示扩展请求的构图、光照和颜色。对于扩散模型,用斯堪的纳维亚风格锚定氛围并使用 ddim 采样来控制噪声。当在 YouTube 上分享进度作为帖子时,因此从早期迭代收集评估和回答来指导细化。

    构图原则

    构图原则

    使用三分法框架场景,确保人物位于网格线上,并放置主题以引导眼睛指向焦点点。使用编织线引导视线,并保留空旷空间以创建呼吸室。为了避免早期提示中的错误,锁定重要关系:人物与背景之间的距离、通过前景元素的前景深度,以及光影平衡。对于心情构建,描述细节、纹理和背景细节以传达所需心情。使用符号或图案来强化含义,如植物、时钟或工具。

    光照和颜色指导

    指定光方向(侧面、背面、顶部)、质量(柔和、硬)和色温。对于温暖,推动黄橙色调;对于更凉爽的场景,倾向于蓝色和灰色。通过将柔和背景与生动焦点色配对创建对比;用两个调色板测试以查看哪个产生更强的图像。通过改变扩散步骤与扩散变体,如 ddim,来测试不同设置。对于序列的一致性,在提示中锁定相同光照设置并重用单一帧参考。使用如请求和使用关键词的笔记来指导模型向一致输出和更快迭代。计划一个简短帖子来分享示例帧并从观众收集回答以改善下一次通过。

    方面 提示模板 笔记
    构图 创建人物和主题,沿三分线放置;背景带细微编织以引导视线 保持空旷空间;测试两个布局
    光照 柔和、漫射的左侧日光,肩部边缘光,5500K,低对比 根据心情调整方向和温度
    颜色 调色板:去饱和中性色带一个强调;通过颜色配对对比;包括扩散步骤:ddim 60-100 使用两个变体比较结果

    使用负面提示和消歧技巧处理歧义

    从具体负面约束开始:包括短语如“无超现实主义”、“无无关符号”和“无温柔风格”来强制精确、客观的结果。这会锐化响应焦点对于模糊任务并最小化来自神经网络的模糊回答。

    然后添加明确消歧提示,将意图与内容分离。指定您想要的元素、动作和风格,例如:“画一个带有伦敦氛围的城市场景”,和“风格:真实,无抽象象征”。清楚陈述输出由什么组成有助于神经网络避免重复和错误。如果您为神经网络制作提示,考虑包括属性短列表(主题、心情、背景和符号)以简化解释。

    构建可重用的负面提示工具包。包括限制如“无卡通阴影”、“无夸张手指”和“无可读文本除非请求”,以便您控制响应结构和符号分布。考虑此类限制降低错误风险并保持提示专注于任务。

    当歧义涉及手势或构图时,指定精确细节:哪只手、哪个手指、何种姿势——例如,“手可见,食指伸展”,而非“手”。如果您需要中性语气,声明它:“语气:中性,缺乏情感或爱隐喻”。如果您瞄准特定城市氛围,注明:“在伦敦时代,建筑元素、柔和调色板、无霓虹”。这些消歧器帮助直接定义输出,防止次要含义或多余元素。

    测试和迭代锚定质量。创建配对提示:一个带正面焦点和匹配负面约束,另一个探测单独解释。跨变体比较回答并调整负面提示以关闭差距。跟踪哪些提示产生最可靠结果,然后通过添加或移除约束细化。现在您可以将这种方法扩展到任意复杂任务而不丢失对输出的控制。

    实用提示

    示例 1:“画一个温柔工作室场景”带负面:“无卡通风格”、“无与建筑细节无关的符号”、“无过度绽放”。然后添加:“风格:照片真实,标题:伦敦天际线,焦点:建筑元素,准确渲染符号和纹理”,并指定构图由清晰地平线和单一前景元素组成以最小化噪声。

    示例 2:“描述一个平静表情的人场景”加负面:“无夸张特征”、“无风格化手写”、“无明显情感”。添加:“姿势:放松,手势:中性,手指可见(手指未扭曲),背景:柔和,缺乏竞争图案。” 这种方法帮助您引出与预期心情和格式对齐的简洁回答。

    在工作中,保持提示紧凑和可量化:指定标题、心情、风格和焦点元素。如果某事似乎不对,首先调整消歧线,然后再重做核心提示。用这种方法,您最小化误解并指导神经网络产生可预测、可靠的结果,即使任务复杂或风格细微。

    📚 更多关于 AI 生成和提示

    相关文章

    Ready to leverage AI for your business?

    Book a free strategy call — no strings attached.

    Get a Free Consultation