AI EngineeringDecember 10, 202513 min read
    SC
    Sarah Chen

    Sora 2 提示指南 - 如何为 AI 视频生成编写更好的提示词

    Sora 2 提示指南 - 如何为 AI 视频生成编写更好的提示词

    Sora 2 提示指南:如何为 AI 视频生成编写更好的提示

    从一个精确的场景提示和 AI 的明确目标开始。用一句话定义核心冲突,然后添加约束来指导视觉效果和节奏,以实现视频结果而非文本描述。保持可操作性:指定设置、角色,以及系统应在最终渲染中产生的可衡量结果。

    将设置指定为厨房,以固定纹理和照明。添加触觉提示,如蒸汽、盘子叮当声和霓虹反射,以引导外观。用稳定推轨紧凑特写描述相机语言,并将氛围设置为情感充沛且紧张,适合惊悚类型。命名主角反派,并赋予他们个人赌注,让观众能够感受到。

    清晰概述动作参与者:谁做什么、何时做以及为什么。使用无过滤语言来捕捉尖锐的手势、果断的台词和清晰的视觉节拍。通过指定是否需要超现实效果或接地气的纹理,将视觉效果与幻想或现实主义联系起来,并注明场景应遵循单一线索而非在想法之间跳跃。强调通过感官提示让观众进入时刻,从热量和气味到电影氛围的节奏和稀疏但有分量的对话。

    围绕简短序列构建提示:主角行动,反派反击,紧张局势向选择升级。保持约束严格:帧尺寸、照明比例,以及叙述限制,以便视觉效果承载故事。相机应在关键动作后继续拍摄,以捕捉反应并推动情节向后果发展。

    作为示例,组装一个紧凑的提示框架然后扩展:“黎明时分的紧张厨房内部,主角面对反派,情感充沛,稀疏对话,个人赌注,动作无过滤术语描述,惊悚节奏。”然后添加具体的相机提示:“在这里滚动相机,切到反应,再滚动以捕捉后果,”并用灵感调整来适应您的项目和目标观众。

    Sora 2 提示指南:AI 视频生成中的脱口秀

    为脱口秀设置一个严格的目标:用平实语言在 60 秒内解释核心想法,并使用可衡量的提示。定义目标观众并选择一个清晰的要点。将此附加到您的 Sora 2 提示中,以便模型从一开始生成专注且易解码的表演。

    将场景结构化为三个节拍:设置、核心要点和结束行动号召。使用叙事提示和具体视觉效果。对于晨间简报氛围,选择轻松、稳定的节奏和温暖的面部提示。使用提示帮助观众快速消化信息。

    使用受控剪辑和手势。通过强调短语落地时仅突出嘴唇来保持口型同步准确;轻微点头和眉毛抬起可以表示强调,而不造成混乱。如果场景需要冲击力,在返回脱口秀前引入一秒钟的图形剪辑。

    要制作感觉真实的脱口秀,将时机秘密与机器驱动提示结合:微表情、呼吸节奏和视线。利用融入背景运动和生成一致照明来固定头部。设计应旨在将复杂主题转化为易懂语言,将抽象现实重构为简单示例,并将叙事编织到每个时刻。

    讨论制作现实:使用轻量级场景和最小资产来减少混乱,并保持呈现节拍清晰。一个出色的脱口秀在限制噪音、保持稳定节奏并规划支持叙事的剪辑时出现。对于简单提示,使用单一相机角度;仅在强调时切换到两个角度,以避免薄弱视觉效果。

    在您的提示中,突出模型应优先生成的词汇叙事、清晰度和具体示例。对于每个脱口秀场景,指定观众、领域和晨间氛围;然后调整结合视觉和语音提示,以实现清晰的要点。

    定义角色、声音和说话节奏

    定义角色、声音和说话节奏

    为角色定义一个单一、具体的语音特征,并将其应用于整个剧集。创建一个捕捉语气、节奏和世界观的单行主干,然后将提示锚定到该特征,以便 AI 在整个剧集的这些房间和走廊中检索一致的提示。

    构建语音调色板:选择 5–7 个特征,设置句子长度,并为动作与反思定义节奏。这些选择使用时代合适的措辞,并混合简洁从句与抒情表达以适应世界。保持节奏视觉上引人注目,以便预告片和屏幕对话感觉连贯。在剧集弧线中规划演变,同时保持清晰度和色彩的平衡;来自 deakins 的灵感应指导词语背后的照明和语气。

    设置节奏规则:在动作时刻,用短从句加速;在魔法或内省节拍时,拉长句子并插入感官细节。当节奏需要转变时,使用如黄昏、门打开或安静相遇的提示。当房间安静下来时,转变节奏。当角色进入房间或面对道德决定时,让节奏反映焦点和能量。在高潮时刻,夸张节拍可以提示表演以实现冲击力,而不失控。

    表达提示:用标点和换行标记呼吸、强调和语气;保持全剧集一致的投射;将声音与镜头背后的愿景对齐;确保它在动作背后和每个帧中感觉真实。

    示例提示片段:“角色:Mira,独自一人,务实的调查员;声音:平静、干涩的机智;节奏:有节制,在线索上夸张强调;设置:黄昏照明的庄园;视觉提示:deakins 风格照明,深影;氛围:魔法、惊悚;目标:检索隐藏真相。”

    设置视觉框架:相机角度、镜头尺寸和构图

    紧凑的特写开始,聚焦于主角以固定情感,然后用分层深度揭示上下文,引导眼睛视觉地穿越场景。通过从亲密框架过渡到更广视野构建结构,让光线从日出转变到下一个节拍。在提示中,精确指定相机角度和镜头尺寸,以为 AI 生成帧创建清晰的进展。

    将角度映射到意图:使用眼平角度建立连接,角度赋予力量,角度表示克制。与匹配节拍的镜头尺寸配对:紧凑用于情感,中景用于互动,长景用于上下文。包括飞越镜头用于地理,并为秘密时刻保留禁忌角度以避免。用保持视觉干净和无缝的移动序列引导眼睛,并调整镜头选择以保持深度在各层清晰。只在故事需要时提及监视主题,以避免陈词滥调。

    构图以深度和分层结构为中心:将主角置于左侧三分之一,建筑或街道的引导线指向主体。使用前景元素创建深度;带有前景、中景和背景的分层框架添加纹理。让光线塑造形状:日出或小时特定的照明创建温暖方向;使用阴影分离主体并暗示时间流逝。使用飞越镜头为史诗景观提供上下文,并确保主体在框架内移动时框架保持可读。通过在每个小时调整光线来维持一致性。

    避免杂乱:保持负空间有意义并对齐地平线。不要在一个框架中混合太多动作,以防止深度混乱。维持明显的深度提示,以便前景、中景和背景清晰阅读。通过匹配颜色温度和光线方向来确保过渡无缝。对于跨越一小时的序列,描述渐变照明变化以保留连续性。

    在提示中锁定视觉语言:“角度:眼平”或“低角度”;“尺寸:紧凑特写”或“长镜头”;“构图:主角在左侧三分之一,带有分层前景和深度。”添加设置提示如社交现代,以将动作置于当代世界。包括飞越无人机镜头用于地理,并请求日出照明以建立氛围。命令无缝流动过渡和高能量节奏用于动作节拍。如果场景对话与其他角色,提示反应镜头以交替视角。保持提示简洁和具体以最小化误解,并用单一史诗视觉主线锚定序列,该主线忠实于设计和结构。

    控制口型同步和对话时机

    控制口型同步和对话时机

    从将口型同步锚定到提示的对话时机开始:构建详细的音素映射并将视觉音素锁定到帧网格。这个构建框架提供信息来同步主角动作和照明的对话,使视图更清晰聚焦。包括每行台词的起始和结束时间,并整合微暂停以避免打破沉浸的突然或空洞时刻。使用针对漂移的提示,强调每个句子的精确时机以保持节奏一致。

    在提示中实施时机的提示:为每行分配目标帧数,将音素序列对齐到对话,并为角色的嘴、眼睛和手势分配视图特定提示。对于带有新古典照明的现代场景,将对话时机与动作节拍配对,以产生即使在如舞蹈或微手势的细微运动中也自然的唇部运动。增强包括跟踪呼吸、节奏和标点的次要层,这有助于避免突然转变。

    将对话时机与场景动作整合:协调嘴形与角色手势,以便当主角举手时,音节在手势时刻达到峰值,而非更早。构建提示以突出重读音节并强调情感语气。使用关于语气和节奏的详细笔记来指导模型。

    工作流程和测试:快速通过查看结果,然后迭代。使用单独的照明提示验证唇部位置;运行多个拍摄,比较音频和视频帧,调整提示并重新运行。为每个场景提供结构化数据的清晰提示,并保持提示模块化以在未来场景中重用。强调跨场景一致性,特别是对于多个主角说话的合奏作品,以确保连贯性。

    指定照明、颜色调色板和背景上下文

    使用三点照明设置,带有 5600K 主光、3200K 补光和细微背光来分离主体与背景。将白平衡锁定到 5600K,并在 Rec.709 中工作以处理肤色。将主光置于 45°,补光置于对面 30–40%,背光刚好足够揭示头发和肩膀而无热晕。对于多相机设置,在所有设备中保持相同的主光和补光位置以避免角度间转变。确保足够的扩散和灯架准备,以便在拍摄间滚动而无需重新 rigging,保留跨角度的干净移动。

    定义支持概念的 3–5 种颜色调色板。示例:海军蓝 #0A1F44,石板灰 #5A7D9A,沙色 #D8CAB3,苔藓绿 #5F8B5A,强调珊瑚 #FF6F61。将主色应用于主照明,次色应用于背景,中性色应用于服装,并稀疏使用强调色。温暖的涌动可以来自实际灯上的琥珀凝胶或温暖补光以传达乐观。当结合实际灯与 LED 时,运行白平衡测试以保持生成的肤色真实。记录调色板并在照明、服装和布景中跨使用以维持视觉连贯性。

    背景上下文驱动场景。描述支持概念的设置、一天中的时间、天气和环境纹理。对于社交内容和预告片风格剪辑,制作在移动主体背后保持可读的背景。获取位置和设备的许可,以便无延迟拍摄。在提示中,提及远处鸟类、街道轮廓或宁静公园以赋予深度。如果涉及访谈,将相机置于主体背后以捕捉真实反应,并准备可跟随预告片和社交剪辑的预告片风格序列。像灯架空间、电源插座和安全电缆管理这样的前提条件应在滚动前确保。

    要有效构建提示,将照明、颜色和背景上下文融合,使概念闪耀。描述与光线互动的相机移动和滚动镜头(滚动)。探索鸟类在背景漂浮的氛围,以及颜色涌动支持氛围。使用多相机设置并规划支持访谈和真实对话的预告片或幕后感觉。关于许可和前提条件的常见问题应在提示中直接回答,确保足够空间和安全。生成的素材应感觉连贯,受观众喜爱,并与预告片的语气对齐,同时在社交叙事中感觉真实和人性化。这种方法支持整个过程的电影制作质量。

    创建提示变体和一致性评估检查

    从锁定语气、主体和输出风格的基线提示开始,然后生成五个变体,这些变体保持核心意图,同时转变动态因素如设置、能量和相机方法。公园设置固定视觉效果,而电影构图和高品质图像维持跨剧集及其转折的一致性。

    使用以下检查来确保跨提示、剧集节奏和最终渲染的连贯性。描绘稳定方法,并标记任何破坏连续性的假提示或混合。

    • 基线和变体策略:定义核心目标、观众、输出长度和所需前提条件(作为起点)。附加类似脚本的描述用于主持声音和视觉方法,然后构建五个变体,这些变体保留主要弧线,同时切换环境、能量水平和相机语言。
    • 变体杠杆:调整设置(公园 vs. 内部)、照明(黎明、正午、黄昏)、能量水平(高能量 vs. 克制)和视觉语言(地面级、电影跟踪或头顶)。对于每个变体,指定转折和悬念时刻以固定节奏和观众参与。
    • 叙事和描绘:确保角色、语气和服装的一致描绘。使用描绘一词来指导主体如何与空间互动,并应用来自多个拍摄的故事结合来丰富剧集而不失连续性。
    • 技术和图像:概述相机移动、构图和颜色键。包括图像和示例引用以标准化外观,然后标记与叠加或 VFX 混合的位置以保持期望清晰。
    • 前提条件和质量控制:列出所需资产(脚本、镜头列表、情绪板、参考图像),并设置颜色分级、音频提示和字幕时机的检查表。主动注明您希望跨变体携带的新古典主题或悬崖边主题以强化风格。
    • 一致性检查:构建跟踪场景长度、照明、物体连续性和道具放置的量表跨变体。包括地面级连续性和下方视角一致性的通过,以避免镜头间突兀跳跃。
    • 评估方法:运行并行渲染并并排比较帧,验证转折在预期节拍落地且整体抛光保持高质量。将任何偏差标记为修订的可操作笔记,然后发布 vlog。
    1. 示例 1 – 基线变体:

      提示:动态、高能量、电影 vlog 剧集设置在黄金时段的公园。描绘主持人在雕像下方探索隐藏的新古典悬崖,带有地面级构图和平滑跟踪镜头。技术包括稳定相机移动、特写和细微叠加。前提条件:清晰目标、镜头列表、颜色键和声音设计指南。从单一时间线结合故事,视觉效果应保持连贯,同时在中点呈现转折。

    2. 示例 2 – 夜晚公园转折:

      提示:动态、高品质公园环境在黄昏拍摄,带有接地气的电影方法。剧集以下方照明和反射为中心,描绘主持人在阴影中悬崖般特征附近揭示次要叙事,该叙事混合现实世界提示与风格化新古典主题。转折出现在阴影中的悬崖般特征附近。前提条件:照明计划、曝光目标和图像参考。提供图像示例和简短故事板以保持跨镜头的连续性。

    3. 示例 3 – 结合故事和测试假元素:

      提示:在单一公园剧集中使用地面级视角和电影节奏结合两个平行故事。描绘主持人在逐渐揭示由图像和叠加支持的转折场景中作为引导。技术包括交叉溶解、分屏提示和匹配到新古典美学的颜色。前提条件:无风险测试提示、标记混合区域和专用部分以识别假叠加。悬念时刻作为锚点以维持整个剧集的节奏。

    📚 更多关于 AI 生成和提示

    相关文章

    Ready to leverage AI for your business?

    Book a free strategy call — no strings attached.

    Get a Free Consultation