AI EngineeringSeptember 10, 202515 min read
    SC
    Sarah Chen

    Veo 3: Prompts para Generación de Video - La Guía Completa sobre la Estructura de Prompts

    Veo 3: Prompts para Generación de Video - La Guía Completa sobre la Estructura de Prompts

    Prompts de Generación de Video Veo 3: La Guía Completa de la Estructura de Prompts

    Comienza con tres prompts ahora: uno para visuales (apariencia y escenario), uno para narrativa y uno para resultado. Esto te mantiene enfocado en las capacidades y la realidad, aprovechando la tecnología de Veo 3. Para una audiencia de Facebook, define quiénes son, qué ven y la acción (acción) que quieres que tomen, transmitida a través de cada prompt. Cada prompt debe apuntar a un resultado específico e incluir una pista visual clara que señale valor inmediatamente. Deben saber qué ver y qué hacer a continuación.

    Construye cada prompt con tres capas: contexto (escena), acción (acción) y resultado (ingresos, CTA). Este enfoque requiere detalles concisos y específicos para visuales, movimiento y sonido. Piensa en cómo responderá el espectador y qué necesidad estás satisfaciendo para las audiencias en Facebook y más allá. Define dónde aparecerá el video: feeds, historias y anuncios cortos; especifica cómo capturas la atención en los primeros 3 segundos, establece el tono y asegura que la apariencia de los personajes se alinee con la marca. Luego, mapea el prompt a los objetivos de ingresos describiendo el resultado deseado y la audiencia objetivo para que puedas medir el éxito mediante vistas, capturas, interacciones y clics.

    Prompt visual de Veo 3: Una cocina cálida al amanecer, apariencia del anfitrión con un delantal limpio, cámara deslizándose a lo largo del mostrador, acción: vertiendo café y mostrando un producto, la iluminación resalta texturas, a través de los primeros 3 segundos la escena atrae la atención, luego gira hacia manos demostrando el producto.

    Prompt narrativo: Una voz en off guionizada comunica una solución en un tono amigable, como un tutorial rápido, con beneficios específicos vinculados a las necesidades del usuario; mantenlo conciso y asegura que la historia permanezca clara y accionable para ellos y sus pares.

    Prompt de resultado: El fotograma final muestra el CTA y el impacto potencial en ingresos; especifica texto en pantalla: "Compra ahora" o "Aprende más", incluye un distintivo de producto y agrega un gancho de retención corto que se alinee con las expectativas de las audiencias.

    Pruebas e iteración: publica tres variantes para diferentes audiencias en Facebook, rastrea capturas, interacciones y conversiones; compara el tiempo de visualización y el compromiso; itera semanalmente cambiando un solo elemento (color, texto o encuadre) para aumentar el compromiso en un margen práctico y aprender qué prefieren.

    Consejos prácticos para resultados inmediatos: mantén los prompts concisos (dos oraciones por capa), usa verbos de acción fuertes y ancla los visuales a productos o escenas reales. Asegura que cada prompt se alinee con una acción tangible que los espectadores puedan tomar, como visitar una página de aterrizaje, unirse a una lista de correo o ver un video más largo para profundizar la comprensión.

    Plantillas de prompts de una línea: capturando la intención en una sola línea

    Redacta cada prompt de una línea con una estructura fija: escena, objetivo y restricciones, luego agrega detalles de diseño y salida para alinear con las capacidades del software. Esta estructura aclara la intención y acelera las iteraciones a través de flujos y plataformas.

    Hazlo real especificando un entorno real y, cuando sea necesario, un plano de acercamiento. Mantén la línea concisa para que tu equipo pueda obtener aprobaciones más rápidas y todos entiendan qué se creará.

    Ancla los visuales alrededor de una marca y sus productos, incluye los elementos a capturar y establece un objetivo claro (por ejemplo, resaltar textura o escala). Usa inclusiones y algo para guiar qué debe aparecer en pantalla.

    escena: sala de exposiciones corporativa, objetivo: maximizar la visibilidad del producto real, plano: acercamiento, diseño: detallado, marca: BrandX, incluye: logo y empaque, productos: auriculares, flujos: 4K60fps, aplicaciones: videos de lanzamiento de productos.

    escena: piso de fábrica, objetivo: capturar la eficiencia del flujo de trabajo para entrenamiento, plano: amplio luego acercamiento, diseño: práctico, detallado, marca: BrandY, incluye: máquinas y operadores, productos: componentes de automatización, flujos: 1080p, 30fps, aplicaciones: guías internas y demostraciones para clientes.

    escena: vitrina digital, objetivo: maximizar conversiones, plano: héroe, diseño: activee, detallado, marca: BrandZ, incluye: llamadas y etiquetas de precios, productos: dispositivos wearables, flujos: 4K, HDR, aplicaciones: anuncios y páginas de aterrizaje.

    Sintaxis y estructura de la plantilla

    Sintaxis y estructura de la plantilla

    La sintaxis se enfoca en escena, escenario, sujeto, acción, diseño, plano, incluye, productos, marca, flujos y aplicaciones. Cada elemento guía al software para capturar la apariencia, sensación y entregables previstos, mientras maximiza la consistencia a través de equipos y campañas.

    Consejos prácticos por aplicación

    Personaliza los prompts para industrias como tecnología, moda y manufactura. Enfatiza texturas reales para la creación de productos, aprovecha detalles de acercamiento para características y alinea diseños con las directrices de la marca para apoyar guías, flujos y usos downstream.

    Sujeto, entorno y acción: mapeando prompts a visuales

    Define la tríada primero: sujeto, entorno y acción, luego mapea los prompts a visuales para que cada fotograma comunique la idea central de manera clara y eficiente.

    Sujeto: elige un solo elemento focal y dale una silueta fuerte. Usa azul como la pista dominante para mantener el reconocimiento a través de escenas. Incluye pistas táctiles como texturas de plástico para señalar material, y vincula el sujeto a temas de emprendimiento para guiar la relevancia de la audiencia. Mantén la escala consistente para que el sujeto permanezca identificable en cada plano; varia la pose o el ángulo en lugar de cambiar la identidad central, maximizando la claridad a través de fotogramas.

    Entorno: coloca el sujeto en un entorno que refuerce la acción y el estado de ánimo. Opciones incluyen estaciones espaciales, una sala de control o un banco de taller. Agrega detalles como polvo en las superficies y reflejos en paneles de plástico para profundizar la textura. La iluminación debe sincronizarse con el sujeto para que las sombras y los resaltados permanezcan coherentes en cada escena; esta alineación acelera las visualizaciones y reduce el ruido en el resultado final.

    Acción: define un movimiento simple y narrable para cada fotograma, como alcanzar, ajustar o gesticular. Cada paso debe avanzar la narrativa; mantén el movimiento suave y predecible usando un ritmo consistente. Combina el movimiento con pistas de sonido para guiar la percepción, y usa seguimiento para mantener la continuidad de posición e iluminación a través de planos. Cuando la acción está sincronizada, los espectadores captan la intención sin explicación extra, especialmente en secuencias rápidas.

    Enfoque de mapeo de prompts: para cada escena crea un conjunto de prompts compacto con Sujeto, Entorno y Acción, más pistas de Estado de ánimo, Sonido y Textura. Incluye azul como pista de color, texturas de plástico y motas de polvo donde sea apropiado. Usa un fondo espacial cuando sea relevante. Agrega una pista de sonido suave para guiar la percepción y unas pocas visualizaciones de métricas. Asegura prompts personalizados para adaptarse a cada micro-historia, y aplica optimización para mantener el wording lean. Lo que sigue puede ser señalado por un indicador de progreso en los visuales, vinculándose a elementos orientados al futuro. El seguimiento, la sincronización y las pistas claras maximizan la consistencia a través de fotogramas.

    Ejemplos: Sujeto: fundador en una chaqueta azul; Entorno: interior de estación espacial con paneles de plástico y polvo en una superficie de vidrio; Acción: gesticula hacia un gráfico holográfico; Estado de ánimo: enfocado; Sonido: zumbido suave; Visualizaciones: gráficos que se elevan con el gesto. Esto muestra cómo el mapeo soporta una secuencia coherente.

    Ejemplos: Sujeto: diseñador de productos; Entorno: banco de laboratorio con iluminación azul; Acción: rota un pequeño dispositivo; Estado de ánimo: confiado; Sonido: pitidos; Visualizaciones: métricas en tiempo real flotando alrededor; Esto demuestra cómo personalizar prompts para diferentes personas mientras se mantienen visuales consistentes.

    Prueba y refina: ejecuta iteraciones rápidas, verifica la alineación, ajusta prompts para mejorar el emparejamiento; rastrea resultados para asegurar optimización y repetición de pistas; mantén el estado de ánimo a través de escenas para una experiencia de espectador suave.

    Ángulos de cámara, encuadre y prompts de movimiento

    Prompts de ángulos de cámara, encuadre y movimiento

    Adopta una tríada: acercamiento, plano medio y amplio de espacio profundo para maximizar salidas y compromiso duradero del espectador. Hay muchas formas de estructurar prompts; la proposición central es alinear cada fotograma con la línea de la historia y los eventos. Además, mantén la automatización y el control impulsado por software para iluminación, enfoque y estabilidad de fondo, para que los datos de cada toma apoyen la optimización y la distribución de salidas. Cada fotograma sirve a la narrativa y al espacio alrededor del sujeto.

    Plantillas de prompts para ángulos y encuadre

    Usa plantillas concisas y repetibles que especifiquen ángulo, distancia, espacio para la cabeza, tratamiento de fondo y una pista de movimiento simple. Cada plantilla mantiene la alineación con la narrativa central y los datos que recolectas. Por ejemplo: "Genera un acercamiento a nivel de ojos, 60% de espacio para la cabeza, fondo suavemente borroso, habla clara y microexpresiones legibles." Incluye sus y sus puntos de datos para construir consistencia a través de escenas; cada fotograma debe reflejar cambios en la iluminación mientras preserva una línea base estable.

    Prompts de movimiento y optimización impulsada por datos

    Los prompts de movimiento impulsan cómo se desarrollan los eventos en pantalla y ayudan a mantener la continuidad a través de tomas. Combina fotogramas estáticos con paneos controlados, movimientos de dolly y seguimiento para crear ritmo sin sorprender al espectador. Vincula prompts a verificaciones impulsadas por software: ajusta la velocidad basada en la longitud del habla, aumenta el paneo sutilmente durante momentos de gesto y optimiza la iluminación para preservar la precisión del color a través de salidas. Este enfoque apoya la optimización respaldada por datos y la generación de salidas valiosas, mientras mantiene la narrativa ajustada y atractiva.

    Ángulo / Encuadre Movimiento Ejemplo de prompt Notas
    Acercamiento, a nivel de ojos Estático con micro-movimientos Genera un acercamiento del rostro del hablante a nivel de ojos, fondo suavemente borroso, espacio alrededor del sujeto, captura habla y microexpresiones. Enfócate en sus ojos y respiración; usa 2–3 segundos de micro-movimiento natural para transmitir intención.
    Plano medio, dos tercios Paneo ligero para seguir gestos Genera un plano medio de entrevistador e invitado en conversación, encuadre de dos tercios, paneo ligero para seguir gestos, distribuye accesorios uniformemente, mantén ritmo con el habla. Mantén composición equilibrada; distribuye el peso visual a través del fotograma.
    Amplio / establecedor de espacio profundo Dolly lento o grúa Genera un plano amplio de espacio profundo mostrando el diseño de la habitación y la audiencia; asegura que los elementos de fondo apoyen lo que está sucediendo, mantén iluminación equilibrada. Usa profundidad para transmitir contexto; evita desorden de fondo que interrumpa el habla.
    Sobre el hombro Sigue el enfoque con rotación Genera sobre el hombro desde detrás del hablante, enmarca a la otra persona en el primer plano, mantén la línea de visión clara y el fondo legible. Resalta relaciones sin recortes pesados en bocas.
    Seguimiento a través del espacio Toma larga con movimiento estabilizado Genera un plano de seguimiento mientras el sujeto se mueve a través del espacio; mantén un núcleo estable e iluminación consistente para producir salidas valiosas. Velocidad 0.25–0.4 m/s; rotación limitada a 15–20 grados por segundo; soporta optimización y consistencia de datos.

    Prompts de estilo y estado de ánimo: pistas de color, textura e iluminación

    Elige un color dominante y dirección de iluminación para anclar el plano, luego capa textura para definir el estado de ánimo. Comienza con azul como base para un aspecto calmado y confiable, o usa un neutro profundo para transmitir poder. Este enfoque produce una apariencia real en tu salida y se alinea con lo que las audiencias esperan, especialmente cuando personalizas cada salida con descripciones y una proposición personalizada.

    Prompts de color

    • Paleta dominante en azul: fondo azul, luz clave suave desde la izquierda, relleno suave desde la derecha, sombras profundas en azul marino; textura: superficie mate con micro-grano; fondo permanece neutral; plano: acercamiento; salida: 4K, 16:9; apariencia: real; declaración: nítido y claro.
    • Neutro-moderno: base en gris pizarra con un acento cian sutil; iluminación: borde de alto contraste a lo largo del borde; textura: metal cepillado o lino; fondo: gradiente suave de carbón a azul-gris; estado de ánimo: limpio, profesional.
    • Variante de energía cálida: tonos ámbar y melocotón con relleno fresco; fondo: madera cálida o tela; textura: plástico brillante con micro-rayones para realismo; salida: 60fps; las audiencias esperan vitalidad.
    • Tocado por marca: el color de tu marca como ancla; fondo: gradiente suave en tonos de marca; iluminación: direccional desde arriba; textura: materiales mixtos para revelar textura; nota: proposición personalizada para el proyecto.

    Pistas de textura e iluminación

    • Sombras profundas y poderosas: usa una clave fuerte desde el lado y un relleno estrecho para empujar profundidad; el fondo permanece subdued para mantener el enfoque en el sujeto.
    • Estado de ánimo suave y amigable: luz difusa desde una fuente grande, reduce el contraste, enfatiza superficies suaves; el fondo permanece limpio para resaltar el sujeto.
    • Borde y separación: agrega una luz de borde o contraluz para tallar el sujeto del fondo; para textura, combina telas mates con bordes especulares sutiles.
    • Detalles sucediendo: monitorea micro-textura en materiales; una prueba rápida de mono en tu generador ayuda a revelar cambios de color; esto requiere especialización y es especialmente útil para tomas futuras.
    • Consistencia a través de planos: usa la misma relación de iluminación y pistas de textura por escena; esta consistencia de salida mantiene la proposición fuerte para las audiencias.
    • Giros y fondos: mantén el fondo simple; usa un gradiente suave o un bloque de color único para evitar distracciones de la apariencia del sujeto; asegura términos de compra y licenciamiento claros para cualquier LUT o accesorios que agregues; un gracias final.

    Secuenciación de prompts: guiando el flujo narrativo a través de escenas

    Comienza con un roadmap de página conciso que defina el propósito de la escena y el ángulo de cada transición. Mapea el arco en dos a cuatro beats y mantén el ritmo ajustado para evitar segundos desperdiciados.

    Para cada escena, especifica la fórmula de prompt y el espacio entre beats. Usa una estructura consistente: establece la meta, describe la pista visual principal y proporciona una sola acción para el generador.

    En notas bilingües, describe visuales y pistas abstractas para guiar estado de ánimo y textura. Vincula prompts a la experiencia y servicios del cliente; estos flujos muestran el flujo narrativo, generando la mayor emoción. No omitas retroalimentación de sesiones asistidas; agradece a los equipos.

    Establece una fórmula de ritmo que combine prompts de acción ajustados con líneas amplias y reflexivas. Especifica contexto actual y visuales envejecidos para señalar tiempo, manteniendo el espacio para transiciones.

    Cierra con una verificación práctica: revisa la página contra el roadmap, confirma el ángulo entre escenas y captura aprendizajes para prompts futuros que mejorarán shows y servicios.

    Pruebas de prompts: ejecutando variantes y registrando resultados

    Ejecuta tres variantes de prompt para cada concepto y registra resultados en una hoja centralizada. Esto mantiene la iteración rápida y produce comparaciones claras para visuales de booth, marketing personalizado y experiencias de visitantes.

    Son pasos esenciales para mantener la producción eficiente: define metas, prueba variantes, mide impacto y mantén un registro limpio para cada ejecución. El proceso te ayuda a crear un flujo de trabajo repetible que se alinee con modelos y materiales mientras evitas fricciones más adelante en la producción. Verías que pequeños cambios en el wording pueden tener efectos desproporcionados hacia la claridad y el compromiso.

    1. Establece objetivos claros y señales de éxito. Debe especificar elementos objetivo (por ejemplo, configuración de booth, banners y CTA) y una puntuación medible: claridad, fidelidad de marca y accionabilidad. Usa una rúbrica simple: 1–5 para relevancia, 1–5 para equilibrio visual y 1–5 para compromiso. Incluye la persona a la que te diriges en el brief para que el modelo mantenga el objetivo en mente.
    2. Diseña tres variantes de prompt. La Variante A enfatiza mensajería centrada en la persona, la Variante B enfatiza creación y materiales, la Variante C empuja contexto y tensión. Incluye frases que dirijan hacia la meta de impulsar visitantes calificados al booth y hacia marketing personalizado. Asegura que cada variante preserve el mismo esqueleto para que puedas comparar diferencias. Incluye referencias de plataforma como Facebook donde sea apropiado.
    3. Bloquea el esqueleto, varia solo la palanca elegida. Usa la misma escena, sujeto e iluminación; cambia adjetivos, verbos o líneas de contexto. Esto mantiene comparaciones justas y facilita atribuir cambios a la variante misma. Están listos para comparar lado a lado.
    4. Ejecuta pruebas y captura métricas. Para cada variante, registra: tiempo de generación (s), longitud de prompts (tokens), elementos clave presentes (booth, banner, modelo, materiales), puntuación de alineación y cualquier modo de falla (no genera un elemento necesario o produce un detalle equivocado). Después de generar, inspecciona elementos faltantes y nota elementos que necesitan ajuste.
    5. Registra resultados consistentemente. Usa una hoja compartida con columnas para nombre de variante, objetivo, tiempo, puntuación de calidad, alineación, notas. Incluye un enlace corto de muestra visual o embed si tu plataforma lo permite. Son útiles al revisitar los datos para explicar qué cambió y por qué. También agrega un campo para dónde se usará el resultado (p.ej., anuncios de Facebook, páginas de aterrizaje).
    6. Analiza y actúa. Compara puntuaciones, identifica qué variante hacia el objetivo entregó la señal más fuerte para visitantes y compromiso. Si una variante puntúa consistentemente más bajo, descártala o modifícala con nuevas palabras clave y prueba un piloto antes del rollout completo.
    7. Mantén un bucle lean. Después de generar, archiva versiones antiguas, etiqueta por fecha y concepto, y crea un resumen rápido para que el equipo revise. Esto mantiene el proceso eficiente y protege contra deriva en estilo o tono.

    Mantén cada paso documentado para que puedas auditar decisiones y reproducir resultados más adelante. Usa una plantilla simple: notas de campo, enlaces y un thumbnail para referencia rápida. Para acelerar rondas futuras, construye una pequeña biblioteca de plantillas de variantes y reutilízalas para cada nuevo concepto. Más iteraciones producen señales más confiables y escalado más suave a visitantes y clientes potenciales.

    Al probar para una campaña de Facebook, rastrea resultados prácticos como tasas de clics, tiempo en página después de la generación y conversiones subsiguientes. Cada piloto debe comenzar con una fase de piloto para validar suposiciones antes de comprometerse a un despliegue más amplio. Este enfoque mantiene la eficiencia, te ayuda a crear branding consistente y hace que el proceso de prueba sea repetible a través de modelos y materiales.

    Exportación, reutilización y documentación: preservando prompts para renders futuros

    Exporta prompts con metadatos versionados y un esquema de cápsula que vincule cada prompt a un modelo específico, configuración de iluminación y salidas. Esto mantiene el contexto intacto y da renders futuros consistentes a medida que la tecnología evoluciona.

    Define un paquete de prompt basado en cápsula que incluya: prompt_text, modelo, versión y una referencia a la visión objetivo o proyecto. Agrega secciones para preajustes de iluminación, ángulos de cámara y notas de entorno actual. Adjunta campos para polvo y contexto de tomas para que operadores futuros puedan reproducir la misma apariencia. Incluye una descripción corta de la audiencia prevista (cliente) y la meta educativa, para que cualquiera que revise el archivo entienda el propósito.

    Los formatos de exportación deben cubrir legibles por humanos más datos amigables para máquinas. Usa JSON o YAML para análisis de máquina, y una exportación amigable con texto como plantilla para reutilización rápida. Cada entrada debe llevar outputs_specs, que describan resolución, tasa de fotogramas, canales audio-visuales y si el render usa una configuración estéreo o multi-canal. Por lo tanto, puedes generar resultados consistentes a través de sesiones diferentes e incluso a través de equipos en entornos de emprendimiento donde dependes de diferentes especialistas.

    La documentación actúa como referencia viva. Mantén una sección de información concisa que registre la estrategia, los pasos tomados para configurar el render y cualquier desviación en una campaña dada. Un campo de notas separado captura detalles como cambios en iluminación, la versión actual del modelo o ajustes a las capturas de la escena. Usa un sistema de etiquetado claro para diferenciar experimentos educativos, promocionales e internos, para que detectives y compañeros de equipo puedan localizar prompts relevantes rápidamente.

    Reutilización y gobernanza. Al reutilizar un prompt, comienza desde el núcleo de la cápsula: prompt_text más metadatos. Ajusta solo los elementos que importan para la nueva ejecución–iluminación, posición de cámara o notas de entorno–luego re-exporta con un nuevo número de versión. Este enfoque evita deriva y preserva un linaje traceable de salidas, mientras aún permite experimentación. Mantén una pequeña sección de biblioteca dedicada para los prompts de ejemplo de mono para ilustrar cómo cambios menores en contexto producen renders diferentes sin perder el hilo de la intención original.

    Plantillas y metadatos para reutilización confiable

    Adopta una estructura de plantilla que los equipos llenen consistentemente: id, título, propósito, modelo, versión, iluminación, cámara, entorno (polvo, tomas), prompts y salidas. Incluye una lista de verificación paso a paso: valida consistencia de iluminación, confirma resolución objetivo, verifica alineación audio-visual y prueba contra un conjunto representativo de salidas. Usa descripciones fuertes, actuales y accionables para asegurar que cualquiera pueda reproducir el resultado y juzgar su alineación con la visión y las necesidades del cliente.

    📚 Más sobre Generación de IA y Prompts

    Artículos Relacionados

    Ready to leverage AI for your business?

    Book a free strategy call — no strings attached.

    Get a Free Consultation