AI EngineeringApril 27, 202316 min read
    SC
    Sarah Chen

    Google Veo 3 提示指南 - 从零开始创建惊艳的 AI 视频

    Google Veo 3 提示指南 - 从零开始创建惊艳的 AI 视频

    Prompt Guide for Google Veo 3: Create Stunning AI Videos from Scratch

    从一个具体的、可重用的 Veo 3 提示模板开始:在一行中定义长度、目标和视觉风格。 在应用程序中,设置一个精确的目标:受众、格式和语气。从这里开始,流程以快速的三步检查清单开始,以锁定细节然后渲染。

    在三个层面定义您的策略:创意概念、输出约束和 QA 检查。策略应映射到视频摄影特征,如节奏、颜色分级和排版。捕捉细节,如屏幕文本长度、演讲者节奏和场景过渡。通过为每个提示设置渲染上限来跟踪支出,并保持一个备份活动计划来测试变体,而不超出预算。

    使用快速刷新循环防止停滞:每 2–3 个提示旋转关键场景,测试颜色分级的特征,并引入轻微运动以避免过时外观。使用提升技术如视差或裁剪移位来添加深度,而不使提示过于复杂。构建 2–3 个变体集并比较结果,以过滤掉表现不佳的概念。

    使用清晰通知自动化反馈和活动。启用渲染后通知,以警报渲染成功、错误或失败的提示。保持一个简单的细节术语表和每个视频简报的问题(вопросы)检查清单。对于每个视频,规划一个带有 A/B 测试的活动,以验证受众响应并相应调整提示。

    业务设置中,将视频提示与您的产品目标和销售漏斗指标对齐,以确保 ROI。使用简单提示来扩展并保持输出在活动中的一致性,并始终为未来参考编目细节。如果您有问题,保持一个运行列表并将其附加到提示模板,以保持团队对齐。

    为 Veo 3 提示定义核心镜头类型

    从三种核心镜头类型开始:建立宽景、以主体为中心的中间镜头和动态跟随。这种基础方法可扩展到更大的企业项目,并在上下文中生成连贯的感觉。

    使用一个框架,将智能和属性翻译成针对镜头目标的指定提示。将属性映射到构图、运动和照明,以保持清晰。从团队指南的路径保持提示对齐和可重复。主要模板涵盖常见场景和示例(примеры)来训练新作家。

    1. 建立宽景

      目的:锚定位置、设置规模并建立氛围。提示:“黎明时分的企业总部外部,广角镜头,低运动。” 属性:规模:更大,深度:高,照明:自然。注意稳定、不显眼的相机行为;保持诡异平静的背景,支持基础叙事。包括关于适当构图的词,以确保镜头感觉锚定。

    2. 带主体的中间镜头

      目的:在保留环境的同时介绍主角或主要物体。提示:“办公室大厅,主体在桌前,中间镜头。” 属性:平衡主体/上下文,镜头:50-70mm,构图:腰到胸。用于通过主体行动展示智能;确保可观看的上下文。与策略对齐,以保持适合企业讲故事的感觉。

    3. 特写细节

      目的:揭示纹理、情感或产品特征。提示:“双手打字,产品纹理,微观细节。” 属性:运动:微妙,深度:浅,灯光:定向。生成对质量属性的强调;示例(примеры)演示特征如何一目了然。这为基础叙事添加清晰度。

    4. 肩后 / 主观视角

      目的:让观众沉浸在过程中。提示:“肩后视角,屏幕在帧中,反应。” 属性:视线,焦距,帧覆盖。用于将观众视角与团队工作流程对齐;注意连续性并避免打破沉浸的震动。这支持上下文和更强的参与度。

    5. 跟踪 / 跟随

      目的:传达动力。提示:“团队穿过走廊,光滑跟随。” 属性:速度,稳定,地平线。确保平滑过渡到下一个镜头;短暂移动相机以改变角度,同时保持连贯性。这保持讲故事节奏完整,并创造更大、更动态的感觉。

    6. 空中 / 大规模

      目的:揭示范围或布局。提示:“无人机镜头掠过校园,日出,宽视野。” 属性:高度,倾斜,风摇摆。保持企业感觉而不牺牲主体存在。用于以支持框架的方式传达规模,并瞄准规模(注意宏伟与焦点之间的平衡)。

    7. 宏观 / 细节

      目的:突出微小特征。提示:“产品纹理,缝合,微型 LED。” 属性:宏观镜头,深度,反光表面。为基础叙事添加精确性;包括使用案例的示例,以显示小细节何时在故事情节中重要。

    8. 插入 / 反应

      目的:用反应或切入镜头强调时刻。提示:“面板讨论切入,观众反应,插入镜头。” 属性:构图比例,切割时机,照明连续性。这个元素澄清意图并支持上下文,保持观众知情而不打破节奏。

    应用三分法:Veo 3 提示中的构图目标

    将主体定位,使眼睛位于三分法网格的上右或上左交点;这立即提升存在感和可信度。如果角色有头发,让发丝沿边缘框住脸部,以添加活力而不遮挡目光,创造更自然的感觉。(更好:更自然的帧感觉)。

    制作 Veo 3 提示,将构图锁定到选定交点的目标,同时允许自然运动。包括提示:眼睛在上交点,头发框住脸部,以及相机向中心的微妙倾斜。使用两种语气选项:用于柔和场景的对话式风格和用于正式更新的企业语气。目标角度范围在眼睛水平 10–20 度左右,以保持连接稳定和可信。

    将视觉与音频配对以强化存在:将声音与唇部运动对齐,确保干净的音频,并描述手势的物理,使运动感觉接地。保持一致的相机角度和轻微倾斜,以保留可信度,同时为高级提示留出空间。这种方法有助于更快、更平滑的过渡和更沉浸的感觉,而不打破构图规则。

    提示 A:眼睛在上右交点;头发框住脸部;运动更慢且受控;语气:对话式带有企业光泽;角度约 15 度从眼睛水平;相机中心;音频和声音同步;merlin。

    提示 B:眼睛在左交点;角色向左;运动有节制;复杂表情(сложные)带有平静微笑;照明保持均匀;相机中心;音频与手势对齐;高级节奏;merlin。

    角度和镜头提示:宽景、中景和紧景

    推荐:使用三镜头节奏–宽景、中景和紧景–以紧凑、可读的方式讲述场景。在全画幅上将宽景设置为 16-24mm(或 APS-C 上 10-15mm)以显示空间;移动到 35-50mm 的中景以获得自然上下文;以 85-105mm 的紧景结束以捕捉表情和头发细节。对于社交和 vlog 格式,将每个切割保持在宽景的 60-70% 帧中,并在中景和紧景中更紧构图。这种路径为屏幕上的人和您的受众返回清晰参考。包括像 yoop8 这样的快速标签来在审查期间跟踪此要求。

    规划从设置到互动的路径:概述您想回答的问题和在每个镜头设置中要实现的任务。使用宽景建立位置,中景显示行动,紧景阅读情感。将主体略微偏离中心以创建深度,同时保持焦点在屏幕上的人。

    手持拍摄受益于受控运动和自然光。使用两点姿势,将快门保持在 1/60–1/125 左右,并调整 ISO 以保留锐度。在热闹环境中,向背景倾斜以框住主体,而不将注意力从头发和脸部拉走;通过选择干净空间和简单颜色调色板来避免糟糕背景,支持屏幕上的人。

    搜索和参考有助于减少偏差并加速决策。将您的拍摄与一小套经过验证的帧比较,并注意哪些角度在社交内容和 vlog 节奏中表现最佳。为宽景、中景和紧景构建两个或三个首选设置并重用它们,以保持场景一致性。

    拍摄前任务(задачи):验证中心对齐,测试照明对比,检查背景杂乱,并确认每个镜头的帧百分比。要回答的问题(вопросы)包括:紧景下的人可读吗?上下文支持故事吗?在有风的日子头发会保持在边缘外吗?更好的结果来自纪律性规划和稳定的节奏,这是通往掌握而不放慢生产的路径。

    运动提示:平移、倾斜、缩放和静态过渡

    从森林场景的 1.5–2.0 秒水平平移开始,然后倾斜 10–15 度以添加深度,接着是 1.5–2.5 秒向主体的缩放,最好是温暖光中的女人。使用 veo3,将每个动作设置为独立提示,并保持序列紧凑以减少模糊的视听问题,同时保留清晰度。这种方法适用于上下文重要的森林镜头,数小时的细化值得。尽可能无水印导出。

    在移动之间使用静态过渡以保持对表情和构图的焦点。每个提示后的短暂 1–2 秒暂停有助于观众处理变化。Reels 观众观看很快,所以保持每个提示可读并避免重叠运动。然后根据需要调整时机;ai-工具帮助习惯创建顺序、简单结果并给予控制。对于每个观众的每个观众,节奏转化为更好的回忆。如果需要极端强调,尝试更长的平移与快速缩放,但仅限于品牌安全。搜索示例表明此方法改善保留。包括关于照明和时机的提示,以最小化模糊视听问题和修订时间浪费。

    平移和倾斜提示

    应用 15–30° 平移超过 1.5–2.5 秒,然后 10–18° 倾斜超过 1–2 秒。在森林设置中,沿树干扫掠以揭示深度,然后向上倾斜捕捉主体,因为温暖光揭示表情。专注于帧中的女人以最大化影响,保持调色板温暖。每个运动应与视听提示对齐;这有助于观看,场景感觉自然。然后以干净导出最终编辑,确保无水印残留。

    缩放和静态过渡

    使用 1.2–2.0x 范围内的缩放在 1–2 秒内强调细节,然后切换到静态帧,在下一个移动前暂停 0–1 秒。选择像切割或淡入这样的静态过渡以保持可读性。包括直截了当的节奏,使每个镜头感觉有目的,对于每个观众成员;каз 转化为每个观众的清晰度。对于指导,行业实践表明,这保留温暖并减少漂移。包括照明、时机和避免过度运动的考虑,以保持序列干净。

    移动类型建议设置笔记
    平移1.5–2.0s, 15–30° 水平扫掠森林上下文;地平线保持水平;避免水印导出;veo3 优化。
    倾斜1–2s, 10–18° 垂直移位揭示深度;保持表情清晰;温暖照明有助于氛围。
    缩放1.2–2.0x 超过 1–2s细节焦点;后期处理模糊声音;传达意图。
    静态过渡切割或淡入,0–1s 暂停保持可读性;支持观众保留。

    照明和颜色提示:一天中的时间、氛围和对比

    使用这个基础提示:“金色时段光线下毛茸茸的角色特写,温暖色温,高对比阴影,清晰毛发纹理,浅景深”。这个基础指导照明和颜色决策;极其精确的语言帮助 ai-助手生成一致结果。对于业务适当的输出,将提示与指标和品牌指南配对,并跟踪点击、搜索和花费的美元来判断影响。调整变体数量以平衡场景覆盖;这些提示极其精确,用于控制颜色、氛围和对比。我们有一个清晰的基线来比较,头部和眼睛细节保持锐利,并缓慢引入光以避免突然变化。只需依赖设计师和公司认可的语言来交付可预测效果和一致的品牌外观。

    一天中的时间提示

    黎明或暮光:目标约 5500K–6000K,带有凉爽蓝色阴影和柔和温暖高光;保持对比在柔和到中等水平,使毛发纹理突出而不产生 harsh 边缘;使用微妙背光在特写帧中将头部与背景分离。

    中午:推向 6500K 带有中性白,高动态范围,并最小化阴影;增加毛发细节和眼睛的局部对比以保留精确性,同时保持干净、设计导向的感觉,与品牌指南融合。

    金色时段:3200K–3800K,丰富的琥珀和橙色强调,长边缘光,以及发音但受控的阴影;略微饱和次要颜色以回响品牌氛围而不过度饱和;确保头部在帧中保持焦点。

    夜晚:2700–3200K 带有深蓝色环境色调和实际光源;谨慎引入霓虹或温暖强调,以在眼睛上创建焦点辉光并在毛发纹理上高光,同时保留语言和品牌提示的可读性。

    颜色、氛围和对比细节

    平静氛围:去饱和 15–25%,软化阴影,并使用粉彩到柔和的调色板;提示示例:“黎明光线下毛茸茸的角色特写,柔和粉彩色调,低对比,柔和边缘辉光,焦点在头部”以强调品牌中的温暖和亲和力。

    活力氛围:增加饱和 10–20%,提升眼睛和嘴部的局部对比,并应用清晰镜面高光;提示示例:“中午光下毛茸茸的角色特写,高饱和,强对比,眼睛中生动的品牌颜色”以驱动点击和记忆性。

    戏剧性氛围:配对互补颜色(蓝-橙)带有强背光和深阴影;通过使用窄曝光窗口和高对比主光保持毛发纹理清晰;提示示例:“戏剧性照明下的头部和肩部特写,蓝色阴影,橙色边缘光,高细节”以创建优质、电影般的视觉。

    品牌对齐提示:将您的调色板与确切 hex 值和色调映射编织;确保基础保持在业务适当的空间,与您的受众使用的语言共鸣;这种方法改善结果的精确性和对参与度的影响,如点击和搜索等指标所衡量。在为预算受限的公司设计时,优化最新设计语言,同时保持视频一致性;我们有坚实测试策略的基本元素:视觉清晰度、品牌连贯性和可衡量结果。我们有一个实用的框架来评估视觉是否提升品牌而不超支美元。

    视听同步提示:对话、SFX 和音乐时机

    推荐:锁定对话以落在角色表情的峰值,对齐唇同步与可见嘴部运动,并放置 SFX 以强化提示,同时音乐击中主要节拍。使用版本 yoop8 作为基础提示标签,并通过场景保持稳定的节奏,以维持柔和却独特的节奏,感觉有意。这种设置有助于自动化更快、热闹的工作流程,同时保持产品视觉连贯且易于审计。

    1. 对话时机提示
      • 提示 1:对话行:“那是计划,让我们前进。” 说话者:女人,氛围:自信,语气:柔和,表情:温暖,指定唇同步准确性,锚定在 00:01:12,持续时间 2.2s,对齐到可见表情(expressions)。包括:versiоn yoop8,通过构图,更快节奏,以及清晰的产品就绪交付。
      • 提示 2:对话行:“我可以更快完成这个。” 说话者:女人,氛围:坚定,语气:清晰,表情:扬眉,长度 1.8s,锚定在 00:01:25,确保行落在嘴部顶点发生的帧上,通过场景保持节奏,并对关键词使用柔和强调(through)。
      • 提示 3:对话行:“那是努力的产品。” 说话者:女人,氛围:自豪,语气:独特,表情:点头,长度 2.0s,锚定在 00:01:40,用音高小提升强调“产品”一词,保持可见唇同步和短语之间平滑过渡。
      • 提示 4:对话行:“我们自动化过程以保持领先。” 说话者:女人,氛围:平静,语气:有节制,表情:轻微笑,长度 2.5s,锚定在 00:02:00,确保节奏匹配场景的站立设计和眼睛的表情,以保持交付感觉真实。
    2. SFX 时机提示
      • 提示 1:SFX:厨房时刻的 whisk 声音,在对话开始前 2 帧开始,柔和音量,持续时间 0.25–0.3s,屏幕上可见提示与女人的手势和表情合作。将“whisk”与快速、through 运动绑定,并保持其与对话区别。
      • 提示 2:SFX:角色进入时的柔和门点击声,精确在对话开始减 2 帧开始,保持微妙以保留节奏,水平:柔和,持续时间 0.15–0.2s。
      • 提示 3:SFX:科技场景中的按钮抬起(点击 + whoosh),在行后锚定节拍开始,速度:更快,保持声音设计干净和可闻,而不掩盖对话。
      • 提示 4:SFX:纸张沙沙声以提示快速过渡,与行的尾部对齐,持续时间 0.18–0.25s,确保效果可见并与表演者的表情(выражения)紧密同步。
    3. 音乐时机提示
      • 提示 1:音乐轨道:柔和钢琴垫,节奏 108–112 BPM,建立稳定的 throughline;重拍在对话第一帧,保持氛围与场景的站立设计对齐,入口点在 00:00:50,持续时间通过情感峰值,确保节奏支持表情(тонa)而不是压倒它。
      • 提示 2:音乐提示:在关键行上更亮的主题,使用更快层用于行动时刻(速度提升),确保主题与“Thats the plan”行一起落地,并在行之间渐弱到环境。
      • 提示 3:音乐混音:当女人交付关键行时桥接到更激烈的主题,增加存在而不掩盖发音,保持高级动态曲线(сложные),揭示情感同时保持可懂。
      • 提示 4:版本控制:为场景应用柔和、独特的结束标签(在最终帧可见),使用自动化提示保持切割连贯的结束;用信号成品和干净淡出的关键词标签。

    迭代测试:镜头构图的快速修订和 QA

    Iterative Testing: Quick Revisions and QA for Shot Composition

    每个迭代从具体的、时间限制的 QA 通过开始,针对构图。运行三个快速测试跨越三个角度:正面、肩后和低角度以揭示通道和深度。使用 ai-助手标记明显的构图问题,并锁定三个核心运动与选定镜头和主体距离。

    在拍摄前设置指标捆绑:指标包括构图准确性(目标 ±2%)、地平线对齐、主体居中和运动平滑。捕捉细节,如曝光、白平衡和背景纹理。为每个通过应用轻量检查清单:确认照明一致性,确保通道的干净通过,并验证三个角度满足纵横比要求。

    过程修订期间,用字段上下文和信息标记每个变化,注意哪些特征移位以及为什么。对于每个镜头,维护一小捆绑提示–镜头、距离和演员运动–绑定回故事板。包括通过细节并确保通道保持清晰;跟踪镜头是否与三个运动优先级对齐,以及粉末化妆是否在主光下引起眩光。

    QA 循环:修订后,对快速基线验证。检查三个角度的运动一致性,并确保字段和背景细节保持连贯。使用 ai-助手和先前通过的信息来驱动下一个修订;这些洞见帮助您保持语气一致,同时细化构图。方法应原则上原则上与镜头的描述对齐;通过垫片光图和相机运动测试轻量 einstein 级模型来预测结果。

    通过后,编译简洁报告带有信息细节和清晰的指标增量。包括三个最具影响力的修订以及它们如何改善镜头可读性;为未来不同字段团队的活动创建可重用捆绑模板。这些结果帮助 ai-助手随着时间细化他们的建议,提升未来活动的效率;确保这些笔记覆盖通道和三个运动,以在每个切割中保留一致性。

    📚 更多关于 AI 生成和提示

    相关文章

    Ready to leverage AI for your business?

    Book a free strategy call — no strings attached.

    Get a Free Consultation