Guía de Prompts de Sora 2 - Cómo Escribir Mejores Prompts para la Generación de Video con IA


Comience con una indicación de escena precisa y un objetivo claro para la IA. Defina el conflicto central en una sola oración, luego agregue restricciones que guíen las visuales y el ritmo para un resultado de video en lugar de una descripción de texto. Manténgalo accionable: especifique un escenario, personajes y un resultado medible que el sistema deba producir en el renderizado final.
Especifique el escenario como una cocina para anclar la textura y la iluminación. Agregue pistas táctiles como vapor, platos tintineando y reflejos de neón para dirigir el aspecto. Describa el lenguaje de la cámara con dolly estable o primeros planos cerrados, y establezca el estado de ánimo como emocionalmente cargado y tenso, adecuado para un thriller. Nombre al protagonista y al antagonista, y déles apuestas personales que el público pueda sentir.
Esboce acciones y participantes claramente: quién hace qué, cuándo y por qué. Use un lenguaje sin filtros para capturar gestos agudos, líneas decisivas y beats visuales nítidos. Vincule las visuales a fantasía o realismo fundamentado especificando si desea efectos surrealistas o textura fundamentada, y note cómo la escena debe seguir un solo hilo en lugar de saltar entre ideas. Enfatice sumergir al público en el momento con pistas sensoriales, desde el calor y los olores hasta el ritmo de la vibra de película y diálogo escaso que lleva peso.
Estructure el prompt alrededor de una secuencia breve: el protagonista actúa, el antagonista contraataca y la tensión escala hacia una elección. Mantenga las restricciones ajustadas: tamaños de cuadro, ratios de iluminación y un límite en la narración para que las visuales lleven la historia. La cámara debe rodar después de acciones clave para capturar reacciones y empujar la trama hacia el aftermath.
Para ilustrar, arme un esqueleto de prompt compacto y luego expanda: "Un interior de cocina tenso al amanecer, el protagonista enfrenta al antagonista, emocionalmente cargado, diálogo escaso, apuestas personales, acciones descritas en términos sin filtros, un ritmo de thriller." Luego agregue notas concretas de cámara: "rode la cámara aquí, corte a una reacción, rode de nuevo para el aftermath," e itere con ajustes inspirados para adaptarse a su proyecto y audiencia objetivo.
Guía de Prompts de Sora 2: Talking Heads en la Generación de Video con IA
Establezca un objetivo ajustado para el talking head: explique la idea central en menos de 60 segundos usando lenguaje plano y pistas medibles. Defina la audiencia objetivo y elija un takeaway claro. Adjúntelo a su prompt de Sora 2 para que el modelo genere un rendimiento enfocado y decodificable desde el principio.
pistas de storytelling y visuales concretas. Para vibes de briefing matutino, seleccione un ritmo ligero y estable y una pista facial cálida. Use consejos que ayuden a un espectador a digerir la información rápidamente.
Use cortes controlados y gestos. Mantenga la sincronización de boca precisa enfatizando los labios solo cuando las frases aterrizan; suaves asentimientos de cabeza y elevaciones de cejas pueden señalar énfasis sin caos. Si la escena necesita impacto, introduzca un corte de un segundo a un gráfico antes de regresar al talking head.
Para crear un talking head que se sienta real, combine secretos de timing con pistas impulsadas por máquina: micro-expresiones, ritmo de respiración y línea de ojos. Aprovechando la incorporación de movimiento de fondo y la generación de iluminación consistente mantiene la cabeza anclada. El diseño debe estar diseñado para traducir temas complejos en lenguaje accesible, reformulando realidades abstractas en ejemplos planos y tejiendo storytelling en cada momento.
Discuta realidades de producción: use escenas livianas y activos mínimos para reducir el caos y mantener el beat de presentación nítido. Un gran talking head emerge cuando limita el ruido, mantiene un ritmo estable y planea cortes que apoyen la narrativa. Use un solo ángulo de cámara para prompts directos; cambie a dos ángulos solo para énfasis para evitar visuales débiles.
En sus prompts, priorice palabras que el modelo debe priorizar: storytelling, claridad y ejemplos concretos. Para cada escenario de talking head, especifique la audiencia, el dominio y la vibra matutina; luego ajuste combinando visuales y pistas de voz hacia un takeaway claro.
Definir personaje, voz y cadencia de habla

Defina una firma de voz única y concreta para el personaje y aplíquela a lo largo del episodio completo. Cree un tallo de una línea que capture tono, ritmo y visión del mundo, luego ancre los prompts a esa firma para que la IA recupere pistas consistentes en estas habitaciones y corredores a lo largo del episodio.
Construya una paleta de voz: elija 5–7 rasgos, establezca la longitud de oración y defina el ritmo para acción versus reflexión. Estas elecciones usan dicción apropiada al período y una mezcla de cláusulas concisas con frases líricas para adaptarse al mundo. Mantenga la cadencia visualmente impactante, para que los tráilers y el diálogo en pantalla se sientan cohesivos. Planee la evolución a lo largo de los arcos de episodio mientras mantiene un equilibrio entre claridad y color; la inspiración de Deakins debe informar la iluminación y el tono detrás de las palabras.
Establezca reglas de cadencia: en momentos de acción, acelere con cláusulas cortas; en beats mágicos o introspectivos, elongue oraciones e inserte detalles sensoriales. Use pistas como el atardecer, puertas abriéndose o un encuentro silencioso cuando el ritmo necesite cambiar. Cuando la habitación se vuelva silenciosa, cambie la cadencia. Cuando un personaje entra en habitaciones o enfrenta una decisión moral, deje que la cadencia refleje enfoque y energía. Beats exagerados pueden indicar rendimiento durante momentos climáticos para aterrizar el impacto sin perder el control.
Pistas de entrega: marque respiración, énfasis y tono con puntuación y saltos de línea; mantenga una proyección consistente a lo largo de episodios completos; alinee la voz con la visión detrás del shot; asegúrese de que se sienta real detrás de la acción y en cada frame.
Pieza de prompt de ejemplo: "Personaje: Mira, sola, una investigadora pragmática; Voz: calmada, ingenio seco; Cadencia: medida, con énfasis exagerado en pistas; Escenario: mansión iluminada al atardecer; Pista visual: iluminación inspirada en Deakins, sombras profundas; Estado de ánimo: mágico, emocionante; Objetivo: recuperar una verdad oculta."
Establecer encuadre visual: ángulos de cámara, tamaño de shot y composición
Comience con un primer plano ajustado en el protagonista para anclar la emoción, luego revele el contexto con profundidad en capas que guíe el ojo visualmente a lo largo de la escena. Construya estructura transitando de un frame íntimo a una vista más amplia, dejando que la luz cambie de amanecer al siguiente beat. En prompts, especifique ángulos de cámara y tamaños de shot con precisión para crear una progresión clara para la IA generando frames.
Mapee ángulos a la intención: use nivel de ojos para conexión, un ángulo bajo para empoderar y un ángulo alto para señalar restricción. Empareje con tamaños de shot que coincidan con el beat: ajustado para emoción, medio para interacción, largo para contexto. Incluya un shot flyover para geografía, y reserve ángulos prohibidos para momentos de secreto que desee evitar. Lidere el ojo con una secuencia en movimiento que se mantenga visualmente limpia y sin problemas, y ajuste la elección de lente para mantener la profundidad nítida a lo largo de las capas. Mencione motivos de vigilancia solo cuando la historia lo requiera, para evitar clichés.
La composición se centra en profundidad y estructura en capas: coloque al protagonista en el tercio izquierdo, con líneas líderes de arquitectura o calles apuntando hacia el sujeto. Use elementos de primer plano para crear profundidad; un frame en capas con primer plano, medio plano y fondo agrega textura. Deje que la luz esculpa formas: amanecer o iluminación específica de la hora crea dirección cálida; use sombras para separar sujetos e insinuar el paso del tiempo. Use un flyover para contexto de paisaje épico, y asegúrese de que el frame permanezca legible cuando el sujeto se mueva dentro del frame. Mantenga la consistencia ajustando la luz en cada hora.
Evite el desorden: mantenga el espacio negativo significativo y los horizontes alineados. No mezcle demasiadas acciones en un solo frame para prevenir confusión de profundidad. Mantenga pistas de profundidad distintas para que el primer plano, medio plano y fondo se lean limpiamente. Asegúrese de que las transiciones sean sin problemas coincidiendo la temperatura de color y la dirección de la luz a lo largo de los shots. Para secuencias que abarcan una hora, describa cambios graduales de iluminación para preservar la continuidad.
En prompts, bloquee el lenguaje visual: "ángulo: nivel de ojos" o "ángulo bajo"; "tamaño: primer plano ajustado" o "shot largo"; "composición: protagonista en el tercio izquierdo, con primer plano en capas y profundidad." Agregue pistas de escenario como social y moderno para colocar la acción en un mundo contemporáneo. Incluya un shot de dron flyover para geografía, y solicite iluminación de amanecer para establecer el estado de ánimo. Ordene transiciones que fluyan sin problemas y un ritmo de alta energía para beats de acción. Si la escena habla con otro personaje, indique shots de reacción para alternar perspectivas. Mantenga los prompts concisos y concretos para minimizar la mala interpretación, y ancre la secuencia con una sola línea visual épica que se mantenga fiel al diseño y la estructura.
Controlar sincronización de labios y timing de diálogo

Comience anclando la sincronización de labios al timing de diálogo del prompt: construya un mapa detallado de fonemas y bloquee visemas a la cuadrícula de frames. Este marco construido proporciona información para sincronizar el diálogo con las acciones de los protagonistas y la iluminación, trayendo la vista a un enfoque más nítido. Incluya tiempos de inicio y fin para cada línea, e integre micro-pausas para evitar momentos abruptos o vacíos que rompan la inmersión. Use consejos contra la deriva, enfatizando el timing preciso para cada oración para mantener la cadencia consistente.
Consejos para implementar timing dentro de prompts: asigne a cada línea un conteo de frames objetivo, alinee la secuencia de fonemas al diálogo y asigne una pista específica de vista para la boca, ojos y gestos del personaje. Para escenas modernas con iluminación neoclásica, empareje el timing de diálogo con beats de acción para producir movimientos de labios naturales incluso durante movimientos sutiles como un baile o micro-gestos. Las mejoras incluyen una capa secundaria que rastrea respiración, cadencia y puntuación, lo que ayuda a evitar cambios abruptos.
Integre el timing de diálogo con acciones de escena: coordine formas de boca con gestos del personaje, para que cuando un protagonista levante una mano, las sílabas alcancen el pico en el momento del gesto, no antes. Construya el prompt para incluir un destaque en sílabas acentuadas y enfatizando el tono emocional. Use notas detalladas sobre tono y ritmo para guiar al modelo.
Flujo de trabajo y pruebas: vea resultados en un pase rápido, luego itere. Use una pista de iluminación separada para verificar la posición de labios; ejecute múltiples tomas, compare frames de audio y video, ajuste prompts y vuelva a ejecutar. Proporcione prompts claros con datos estructurados para cada escena, y mantenga los prompts modulares para reutilizar en escenas futuras. Enfatizando la consistencia a lo largo de las escenas, especialmente para piezas de ensemble donde varios protagonistas hablan, asegura cohesión.
Especificar iluminación, paleta de colores y contexto de fondo
Use un setup de iluminación de tres puntos con una luz clave de 5600K, un relleno de 3200K y un backlight sutil para separar sujetos del fondo. Bloquee el balance de blancos en 5600K y trabaje en Rec.709 para tonos de piel. Coloque la clave a 45°, el relleno al 30–40% opuesto y el backlight lo suficientemente brillante para revelar cabello y hombros sin halos calientes. Para setups de múltiples cámaras, mantenga las mismas posiciones de clave y relleno a lo largo de los rigs para evitar cambios entre ángulos. Asegúrese de tener suficiente difusión y soportes de luz listos para que pueda rodar entre shots sin re-armar, preservando movimientos limpios a lo largo de ángulos.
Defina una paleta de 3–5 colores que apoye el concepto. Ejemplo: navy #0A1F44, slate #5A7D9A, sand #D8CAB3, moss #5F8B5A, acento coral #FF6F61. Aplique el color primario a la iluminación clave, secundario a fondos, neutros a vestuario y el acento con moderación. Un swell de calidez puede venir de geles ámbar en prácticos o relleno cálido para transmitir optimismo. Cuando combine luces prácticas con LEDs, ejecute pruebas de balance de blancos para mantener tonos de piel generados honestos. Documente la paleta y úsela a lo largo de iluminación, vestuario y decoración de set para mantener coherencia visual.
El contexto de fondo impulsa la escena. Describa el escenario, hora del día, clima y texturas ambientales que apoyen el concepto. Para contenido social y cortes estilo tráiler, cree un fondo que se mantenga legible detrás de sujetos en movimiento. Obtenga permisos para ubicaciones y equipo para que pueda filmar sin demoras. En prompts, mencione pájaros a la distancia, siluetas de calles o un parque calmado para dar profundidad. Si hay entrevistas involucradas, coloque la cámara detrás del sujeto para capturar reacciones honestas y prepare una secuencia estilo tráiler que pueda ser seguida por tráilers y un corte social. Prerrequisitos como espacio para soportes de luz, tomas de corriente y manejo seguro de cables deben asegurarse antes de rodar.
Para estructurar prompts efectivamente, mezcle iluminación, color y contexto de fondo para que el concepto brille. Describa movimientos de cámara y shots rodantes (roll) que interactúen con la luz. Explore atmósferas donde pájaros se desplazan en el fondo y un swell de color apoya el estado de ánimo. Use un setup de múltiples cámaras y planee un feel de tráiler o detrás de escenas que apoye entrevistas y diálogo honesto. Preguntas frecuentemente preguntadas alrededor de permisos y prerrequisitos deben responderse directamente en el prompt, asegurando suficiente espacio y seguridad. La footage generada debe sentirse cohesiva, amada por audiencias y alineada con el tono del tráiler mientras se siente auténtica y humana en su storytelling social. Este enfoque apoya la calidad de filmmaking a lo largo del proceso.
Crear variaciones de prompts y verificaciones de evaluación para consistencia
Comience con un prompt base que bloquee tono, sujeto y estilo de salida, luego genere cinco variaciones que mantengan la intención central mientras cambian factores dinámicos como escenario, energía y enfoque de cámara. Un escenario de parque fundamenta las visuales, mientras que el encuadre cinematográfico e imágenes de alta calidad sostienen la consistencia a lo largo del episodio y sus giros.
Use las verificaciones a continuación para asegurar cohesión a lo largo de prompts, ritmo de episodio y renders finales. Retrate un enfoque estable, y marque cualquier pista falsa o mezcla que rompa la continuidad.
- Estrategia de base y variación: defina el objetivo central, audiencia, longitud de salida y prerrequisitos requeridos (como punto de partida). Adjunte una descripción estilo script para la voz del host y el enfoque visual, luego cree cinco variaciones que preserven el arco principal mientras cambian entorno, nivel de energía y lenguaje de cámara.
- Palancas de variación: ajuste escenario (parque versus interior), iluminación (amanecer, mediodía, atardecer), nivel de energía (alta energía versus restringida) y lenguaje visual (nivel del suelo, tracking cinematográfico o overhead). Para cada variante, especifique un giro y un momento cliff para anclar ritmo y engagement del espectador.
- Narrativa y retrato: asegúrese de un retrato consistente de personajes, tono y vestuario. Use el término portraying para guiar cómo los sujetos interactúan con el espacio, y aplique combinación de historias de múltiples tomas para enriquecer el episodio sin perder continuidad.
- Técnicas e imágenes: esboce movimientos de cámara, encuadre y claves de color. Incluya referencias a imágenes y ejemplos para estandarizar el look, luego marque dónde ocurre la mezcla con overlays o VFX para mantener expectativas claras.
- Prerrequisitos y controles de calidad: liste activos requeridos (scripts, listas de shots, mood boards, imágenes de referencia), y establezca una checklist para gradación de color, pistas de audio y timing de subtítulos. Note proactivamente cualquier motivo neoclásico o motivo de acantilado que desee llevar a lo largo de variaciones para reforzar el estilo.
- Verificaciones de consistencia: construya una rúbrica que rastree longitud de escena, iluminación, continuidad de objetos y colocación de props a lo largo de variaciones. Incluya un pase para continuidad a nivel del suelo y consistencia de vantage beneath para evitar saltos bruscos entre shots.
- Método de evaluación: ejecute renders paralelos y compare frames lado a lado, verificando que los giros aterricen en el beat previsto y que el pulido general permanezca de alta calidad. Marque cualquier desviación como notas accionables para revisión antes de publicar el vlog.
Ejemplo 1 – Variación Base:
Prompt: dinámico, de alta energía, episodio de vlog cinematográfico ambientado en un parque durante la hora dorada. Portraying a un host explorando un acantilado neoclásico oculto beneath una estatua, con encuadre a nivel del suelo y shots de tracking suaves. Técnicas incluyen movimientos de steady cam, primeros planos y overlays sutiles. Prerrequisitos: objetivo claro, lista de shots, claves de color y una guía de diseño de sonido. Combinando historias de una sola línea de tiempo, las visuales deben permanecer cohesivas mientras presentan un giro en el punto medio.
Ejemplo 2 – Giro de Parque Nocturno:
Prompt: dinámico, entorno de parque de alta calidad filmado al atardecer con un enfoque cinematográfico fundamentado. El episodio se centra en iluminación beneath y reflejos, portraying al host descubriendo una narrativa secundaria que mezcla pistas del mundo real con un motivo neoclásico estilizado. El giro aparece cerca de una característica tipo acantilado en sombras. Prerrequisitos: plan de iluminación, objetivos de exposición e imágenes de referencia. Ejemplos de imágenes y un storyboard corto se proporcionan para mantener consistencia a lo largo de shots.
Ejemplo 3 – Mezclando Historias y Probando Elementos Falsos:
Prompt: combinando dos historias paralelas en un solo episodio de parque usando un vantage a nivel del suelo y una cadencia cinematográfica. Portraying al host como guía a través de una escena que gradualmente revela un giro apoyado por imágenes y overlays. Técnicas incluyen cross-dissolves, pistas de split-screen y matching de color a una estética neoclásica. Prerrequisitos: prompts de prueba sin riesgo, regiones de mezcla marcadas y una sección dedicada para identificar overlays falsos. Momentos cliff sirven como puntos de anclaje para mantener el ritmo a lo largo del episodio.
📚 Más sobre Generación con IA y Prompts
- Prompts de Generación de Video Veo 3 - La Guía Completa a la Estructura de Prompts
- Guía de Prompts VEO 3 - Creando Prompts Excepcionales para Videos con IA Impresionantes
- Domina la Generación de Video Veo 3 con Prompts Profesionales
- Google Veo 3 – Una Guía para la Generación de Video con IA Ilimitada
- Cómo Crear Prompts Efectivos para el Video AI de Google Veo 3 - Una Guía Práctica
Ready to leverage AI for your business?
Book a free strategy call — no strings attached.
Related Articles

The Golden Specialist Era: How AI Platforms Like Claude Code Are Creating a New Class of Unstoppable Professionals
March 25, 2026
AI Is Replacing IT Professionals Faster Than Anyone Expected — Here Is What Is Actually Happening in 2026
March 25, 2026