AI EngineeringSeptember 10, 202515 min read
    SC
    Sarah Chen

    神经网络视频生成提示词 - 如何制作示例和模板

    神经网络视频生成提示词 - 如何制作示例和模板

    Prompts for Video Generation in Neural Networks: How to Craft Examples and Templates

    推荐: 制作一个清晰描述场景、动作和相机设置的提示,然后附加具体的标记来指导视觉结果。使用 (описания)、(тени) 和 (глянцевый) 照明笔记来塑造氛围,并用透视线索和 (юных) 角色丰富 взгляд 以固定框架。如果您有可靠的 (источник) 参考来源,请链接它;这种 (этой) 方法帮助模型自行与您的目标对齐并 (рисовать) 一致的帧,避免在简单迭代中漂移。

    模板应具有模块化。每个示例都应构建为单个主体、最小背景、光源和运动提示。这种结构 (сгенерирует) 在不同上下文中产生可预测的结果,使您能够在 (одном) 主题和数据设置中重复使用 (простых) 提示模式。包含一个使用简单角度的版本,以及另一个添加微妙倾斜 (наклон) 以创建深度的版本。模型 (поможет) 保持输出连贯,并 (создает) 跨镜头的一致叙事。引用可靠的 (источник) 资产来源,并参考 hedraai 作为测试基准。

    在实践中,专注于 важно 元素:保持提示可读性,清晰描述动作 (рисовать) 运动,并保持语气与目标受众一致。如果设计师 (покупала) 类似资产,请在提示中镜像该风格,以便系统 (создает) 连贯的集合。依赖可信的 источник 参考来源,并应用这种 (этой) 方法来确保提示很好地转化为视频帧。

    定义具体提示:目标动作、相机移动、照明和场景上下文

    Defining concrete prompts: target actions, camera moves, lighting, and scene context

    使用紧凑的 промта 模板,将目标动作、相机移动、照明和场景上下文编码到一行中,以便 нейросеть 生成逼真的结果。这种方法保持跨镜头的提示一致,并帮助团队使用 chatgpt 或 bing 工作流程,而单行有助于 внедрение 到 текстовым 管道中。包含氛围和 наклон,并在户外时指定 ветер 以将 фон 固定在可信的大气中;目标是逼真的 фона,使 лица 和一般动作感觉触觉化,而在稍后审查 промта 时不会丢失可读性。

    从四个可重用模块块开始:动作、相机、照明、场景。对于动作,使用描述可测量运动或手势的具体动词,例如:角色检查手表并点头,然后签署合同。对于相机,指定带有持续时间和轴的移动,例如:dolly in 1.5s、tilt up 12° 或 pan left 20° 跨桌子。对于照明,详细说明主光、填充光和背光水平,加上色温(例如:主光 75%、填充光 40%、背光 20%、5200K)。对于场景,命名设置、道具和背景纹理(例如:现代厨房、玻璃表面、黎明光)。这四行形成连贯结构,持续指导网络生成并减少迭代中的 труд,同时您可以独立调整每个块作为单个单元 (промта) 来测试变体。这种方法在使用 chatgpt 起草变体和 bing 参考时特别有用,并支持频繁使用队友反馈更新的 промтами 工作流程。

    为确保真实性,嵌入关于脸部 (лица) 和表情的细节,而不仅仅是动作。描述微手势:微妙微笑、目光转移或手部重新定位,以便氛围 (mood) 即使在压缩后也能清晰阅读。包含特定环境提示,如风 (ветер) 纹理、窗户上的雨或百叶窗透过的阳光,这些将场景固定在有形的 фонa 中。您使这些提示越具体,模型渲染脸部、纹理和织物褶皱的真实性就越好,并且越有可能避免后期强迫猜测的空白。

    将提示记录为直接的、基于文本的块 (текстовым),这些块组合成每个镜头的单行。如果您与队友分享提示,每个文件 (одном формате) 中应出现相同的结构(动作、相机、照明、场景),以实现快速比较和更快迭代。当您需要探索风格变体时,可以仅交换动作块,同时保持相机、照明和场景不变,这保持整体语气一致,并帮助保持 первых результатов 在测试中可识别 (отлично)。如果草稿感觉不对,请用 вопросом 标记以收集反馈并相应调整氛围、наклон 或 фон,然后重新运行 промта–这保持您的工作流程响应并不断改进。

    对于实际使用,导出少量现成可运行的 промтам (промта caret) 并将其与示例资产一起存储。您可以 скачать эти примеры 并包含笔记,说明每个块如何影响最终渲染 (поможет понять связь между действиями, moves, светом и контекстом)。在验证输出时,与参考心情板比较并调整照明以强调逼真的肤色和织物纹理 (лица 和 фона 应自然阅读)。如果遇到空白,使用带有小调整的集成提示,如 наклон 或 ветер,以测试细微差异;随着您构建 свох промтов 和 промтовами 变体库,该过程会更快,队友提供 поддержка 和反馈,同时您使用清晰、可重复的模板快速迭代 (пока)。如果镜头需要更柔和的外观,您可以调整 стилe 为更近的、电影语气并重新运行相同的四个块以保持跨帧一致性。最终结果是生成连贯场景的提示,反映预期氛围,并扩展到整个项目。

    模板原语:构建可重用块以实现可重复视频提示

    创建一个模板原语库,并在提示中重用块。定义像 Intro、Action、Transition 和 Outro 这样的块,每个块带有紧凑的参数集:主体、设置、camera_angle、照明、持续时间。保持默认值和小示例值以确保生成多个帧时的一致性。包含占位符如 что-то 和 erid 以标记可变内容,并在批量提示期间启用快速替换。

    块设计专注于自包含单元:风格笔记 (style)、框架规则 (квадратные)、背景选项 (фон/фона) 和 закадровый 文本字段。对于动作块,指定单个 действие 和目标对象。维护简单照明预设和快速相机角度以保持 съёмка 可预测。这种方法减少 вариацию,指导跨场景的 стиль 对齐。

    模板使用工作流程:通过组合 2-4 个块组装场景,使用小种子变化设置以保持输出稳定。使用 запрос 到生成器 API 并在 регистрации 中存储每个运行的元数据。记录 сбои 并将结果反馈到原语的细化中,以随着时间提高重复性。

    元数据和约束:使用字段 id、name、tag、defaults、constraints 存储块。附加具体示例:带有主体 что-то 的 Intro;带有主体 персонаж 和 действие 的 Action;带有 5 秒 кадр 的 End。保持示例紧凑以指导贡献者。在讨论效率时提及 деньги 以提醒可重用块在迭代中节省金钱。

    实用提示:从 3-5 个块的 набор 开始;通过运行快速变体快速测试;跨 промпты 维护 единый стиль;监控 сбои 并调整参数以减少漂移。为每个原语偏好清晰命名,以便 модель 与队友顺利合作,并确保 конструктору 产生可预测 результат。

    示例提示蓝图:Intro 使用 квадратные 框架和 закадровый фон 设置氛围;Action 显示 персонаж держит подарок,покупала набор;Transition 移动到特写;Outro 揭示品牌。包含一个小 закадровый 文本:что-то 和一个指示细节,如桌上的 usb-коммутатор 以引导光水平。这说明紧凑原语集如何启用 повторяемые сцены,同时通过 erid 和 что-то 留出内容替换的空间。

    从概念到序列:创建映射到提示步骤的镜头列表

    从六个镜头序列开始,该序列映射到六个提示步骤。定义提示的清晰 язык (язык) 并为每个步骤附加 баллов 以测量对齐。保持提示 простых 结构:以简洁术语陈述动作、主体和设置。

    构建一个镜头列表模板,将想法转化为具体指令:每个条目包含镜头编号、目的、相机移动 (zoom)、框架、照明和 тени、大气 (атмосферу)、主体或 персонажи、材料,以及描述场景的 текстовым 提示。这种链接确保模型一致解析场景,并且您可以跟踪跨 уроков 的进度,同时迭代。

    例如,Shot 1 设置概念和语气:текстовым 提示应像语言驱动的草图一样阅读,引导 персонажи 和道具带有色温的细微 flux。包含 съёмка 笔记(相机焦点、角度)并指定 тени 以避免平坦结果。Shot 2 在关键元素上增加细节,使用更明显的 освещение 和更紧的 zoom 来揭示纹理,同时保留 общую атмосферу。如果某事看起来不对,您可以切换到 иначе 框架以保持序列连贯。

    后期制作使用 фотошопа 和 Photoshop 风格工作流程来实现预期效果 (эффекты)。导出后,应用深化 атмосферу 的层,微调 тени,并通过 flux 推动颜色,而不破坏真实性。提示的语言受益于明确指令:在提示中描述照明变化、阴影和材料纹理,以便 фотошопа 一致再现它们。

    通过将提示固定到在 ютубе 和 уроков 中找到的有形参考来保持过程易接近:研究创作者如何描述 Съёмка 序列,绘制心情板,并将这些想法转化为文本提示。练习通过 рисовать 简要为 персонажи 绘制,即使它们是 иллюзорно 风格化,以测试模型如何解析抽象并返回感觉像统一故事的连贯帧。如果需要调整节奏,向后缩放或扩展 zoom 并移动角度以保持跨镜头的节奏,确保从概念到序列的无缝流动。这种方法帮助您合成材料、准备 текстовым 提示,并制作感觉故意设计而非偶然的视觉效果。

    风格和运动描述符:为一致性选择形容词、动词和修饰符

    从视觉和运动的一个连贯基线开始。这个基线固定每个帧并保持视觉语言跨 сценами 和 персонажей 稳定,无论 источник материалов 如何。基于 нейросетях 工作流程构建它,并将其转化为形成 лицо вашей сайте 的提示。尽管照明或角度变化,所选描述符应 подкупает 观众并保持可识别。当您对齐形容词、动词和修饰符时,您将在 ютубе 和演示中实现更平滑的过渡,其中 registrations 是考虑因素。

    1. 定义固定形容词池 (5–7 术语)
      • glossy (глянцевый) 表面设置光泽;跨场景保持此作为主导提示。
      • beautiful (красивые) 形状或纹理以强化美学一致性。
      • square (квадратные) 几何用于结构清晰;在框架或轮廓中一致使用。
      • tilted (наклона) 提示传达细微动态,而不背叛基线。
      • compelling (подкупает) 语气在照明、颜色和构图中回响。
      • face-forward (лицо) 强调以保持主体跨帧可识别。
      • your site branding terms (вашей, сайt) 在适当位置集成以强化身份。

      提示:将这些组装为单个描述符向量 (для примера: glossy, beautiful, square, tilted, compelling) 并在每个提示中重用。这使 스타일 在 OpenAI 支持的管道中一致,并帮助实现 своём лицо на сайте,即使 источник материалов 变化。

    2. 选择固定运动动词集 (4–6 术语)
      • glide, drift, and flow 用于描述感觉故意的平滑过渡。
      • shift, rotate, and tilt 用于在信号变化时保留结构。
      • emerge, move, and exit 用于管理场景进展,而不破坏基线。
      • 将动词与形容词对齐(例如:光泽的、gliding 角色)以保持连贯。
      • 每个场景序列使用一个动词家族,以便变体保持可读;выходят 相同方向,而非随机。

      注意:包含至少一个镜像平台约束的动词(例如,视频 в ютубе)和一个与您的来源数据集(источник персонажей)绑定的动词。这确保运动语言跨 нейросетях 和内容 piezas 保持可预测。

    3. 应用纪律性修饰符策略
      • 附加强化基线的环境修饰符:照明(柔和、高对比)、纹理(gloss, matte)和色温(凉到暖)应在每个帧中遵循相同规则。
      • 将修饰符放置限制在一致区域:始终在句子中先行主体或跟随它,以避免含义漂移。
      • 使用跨场景映射到相同视觉结果的环境短语(例如:на основе материалов you used)。
      • 将修饰符与主动词组合以保持运动可读:“glossy character glides through a tilted, soft-lit corridor.”

      Несмотря на смену сцены,修饰符必须保持在狭窄解释范围内以保留 визуальный стиль。在您的提示中保持修饰符词汇表,以便团队跨 проекций 和 OpenAI 工作流程对齐使用。

    4. 模板提示和示例短语
      • 提示骨架:[Adjectives] [Character/Subject] [Motion Verb] through [Scene Context] with [Modifiers], based on [Source Materials] from [Источник], openai, illustrating a single visual identity.
      • Template A (scene progression):“A glossy (глянцевый) character glides through a dim gallery, tilted (наклона) lighting, square edges, и красивый atmosphere, без резких смен。”
      • Template B (character consistency):“The face (лицо) remains steady as the same 5–7 adjective set drives the motion verbs in every frame, выходят in a controlled rhythm。”
      • Template C (source-driven):“Based on источники материалов and источник characters, render a sequence that preserves the visual language even when у вас different scenes。”
    5. 一致性和验证的实用提示
      • 每个场景序列坚持一个主导形容词和一个主导运动动词以避免漂移。
      • 运行仅交换一个形容词或一个动词的 A/B 测试;测量观众保留率和视觉提示的清晰度。
      • 在提示注册表 (регистрации) 中记录每个变化,以跟踪形容词如何随时间影响感知一致性。
      • 在与 OpenAI 管道合作时,参考来源 (источник) 材料和角色 (персонаж) 定义以防止生成帧中的错位。
      • 保持提示简洁和明确:一个形容词家族、一个运动家族和每个镜头的单个修饰符集。
      • 确保视觉身份在 YouTube (ютубе) 缩略图和剧集页面上感觉连贯,以便观众立即识别风格。

    应用于短序列的示例集:“A glossy (глянцевый) персонаж (персонаж) glides through a square, tilted corridor, with soft lighting (глаженный свет), based on openai source materials (источник материалов) and the脸 of your site (лицо вашей сайt)。相同的描述符跨 сценами 和变体携带,因此节奏保持完整,无论来源变化如何。这种方法简化反馈循环和 трудоподобные коррекции,以及 справляется 与资产中的细微变体,同时保持输出足够一致以用于 registrations 和平台标准。

    质量和约束参数:指定分辨率、持续时间、帧率和输出格式

    推荐:设置动作默认值:1920x1080、30fps、MP4 使用 H.264 8–12 Mbps 以获取稳定输出。这种 действие 固定 понимание 并帮助您描述跨 всего 运行的结果。将 всего 运行时限制在初始测试的 60 秒;对于带有 животными 的 сцена,指定 точное движение 和 подача 以防止 иллюзорно 帧爬行。概述 детали:前景主体、сзади 背景和围绕主要动作以引导 взгляд。在 нейросетях 中,将 настроек 锁定到实用集;过度 труд 会减慢进度,因此在 программированию 中使用 программное 以强制限制。如果需要慢动作,在提示中添加 slow 并验证 veo3 如何在受控 случай 中处理帧插值。在业务需求的情况下,定义最终输出意图并跨交付使用一致 подача;这使使用可预测结果为客户更容易。对于带有 микроконтроллере 的嵌入或边缘演示,保持 720p 和短持续时间以确保 справляется 与有限计算和内存。

    分辨率、持续时间和纵横比

    默认 1920x1080 作为基线;为快速迭代提供 1280x720,为优质输出提供 3840x2160。除非针对垂直馈送,否则保持 16:9 纵横比;持续时间:循环 5–10 秒,场景 15–45 秒,复杂情况高达 60 秒。默认将总颜色深度保持在 8 位;如果您的管道支持,则切换到 10 位。整个运行时应与硬件能力对齐,并确保细节在渲染时保持清晰。在框架时,确保 сцена 包含清晰焦点点,并且 движение 在主体 сзади 保持可读。глаз 应在主要动作周围自然阅读以避免干扰。

    帧率和输出格式

    帧率选择:24、30、60;24 用于电影外观,30 用于一般交付,60 用于快速动作测试。输出格式:MP4 (.mp4) 使用 H.264 或 HEVC 以实现广泛兼容性,WebM (.webm) 使用 VP9/AV1 用于 web 交付,以及 MOV (.mov) 用于受控工作室。比特率目标:720p 4–6 Mbps,1080p 8–12 Mbps,4K 25–50 Mbps;默认颜色深度 8 位,如果支持则升级到 10 位。对于跨平台的 подачи,确保 в нейросетях 和部署 rigs 中的 описываем 一致性;在带有实时流或全球观看的 случаи 中,偏好最小化缓冲的同时保留 качество 的格式。如果在 микроконтроллере 上测试,调整格式和比特率以适应设备吞吐量,并 сделайте 确保无丢帧的平滑播放。

    迭代测试和评估:快速检查、示例渲染和提示细化

    快速检查

    运行快速 15 分钟循环:从基线提示生成五个低分辨率渲染以建立基线,同时您收集 данные 并记录变体。验证 лица 自然出现并且 освещении 保持连贯;如果任何 кадр 显示看起来不对的 движений,快速识别并调整。确保提示包含引导语气的 слов 和描述符,并且您可以快速 настраивать 它。нейродизайнеров 社区 делает 学习快速并帮助 сообщество 更容易找到模式;注意哪些提示产生导致 артефактам 的输出。运行 шесть 个种子以探测敏感性并记录哪些 вариации 提供更多电影 и глянцевый 外观,同时保留 лицо 保真度。使用您可以 легко 运行的短检查列表以跨会话保持一致性。

    示例渲染和提示细化

    Sample renders and prompt refinement

    在示例渲染和提示细化阶段,生成 шесть 个变体和 3–5 个带有变化相机角度的镜头级渲染,以强调 лица 和周围 освещении;目标是 красивые、电影镜头,强调运动和表情。使用 видеоуроки 记录工作流程并通过 сообщество 分享;跨迭代保持 подача 提示明确和一致。记录 данные 并维护 инструментов 日志;如果您注意到漂移,调整 параметры 提示并通过 flux 推送变化以保持管道连贯。在基于 микроконтроллере 的测试中,验证实时应用提示的延迟和可靠性,并确保确定性结果的 обеспечение。避免在标题或默认提示中使用 реклама 语言;如果 клиент покупала 活动,请调整提示以反映现实世界约束而非炒作,并继续细化 подача 和 инструментов 以获得更好结果。在可能的情况下,邀请 сообщество 反馈并发布过程的 видеоуроки 示例。

    📚 更多关于 AI 生成和提示

    相关文章

    Ready to leverage AI for your business?

    Book a free strategy call — no strings attached.

    Get a Free Consultation