AI EngineeringDecember 10, 202513 min read
    SC
    Sarah Chen

    Guia de Prompts do Sora 2 - Como Escrever Prompts Melhores para Geração de Vídeo por IA

    Guia de Prompts do Sora 2 - Como Escrever Prompts Melhores para Geração de Vídeo por IA

    Guia de Prompts do Sora 2: Como Escrever Melhores Prompts para Geração de Vídeo com IA

    Comece com uma indicação de cena precisa e um objetivo claro para a IA. Defina o conflito central em uma única frase, em seguida, adicione restrições que guiem os visuais e o ritmo para um resultado de vídeo em vez de uma descrição de texto. Mantenha-o acionável: especifique um cenário, personagens e um resultado mensurável que o sistema deve produzir no render final.

    Especifique o cenário como uma cozinha para ancorar textura e iluminação. Adicione dicas táteis como vapor, pratos tilintando e reflexos de neon para direcionar a aparência. Descreva a linguagem da câmera com dolly estável ou closes apertados, e defina o humor como emocionalmente carregado e tenso, adequado para um suspense. Nomeie o protagonista e o antagonista, e dê a eles apostas pessoais que o público possa sentir.

    Descreva ações e participantes de forma clara: quem faz o quê, quando e por quê. Use linguagem sem filtros para capturar gestos afiados, linhas decisivas e batidas visuais nítidas. Ligue os visuais a fantasia ou realismo fundamentado especificando se você quer efeitos surreais ou textura fundamentada, e note como a cena deve seguir uma única linha em vez de pular entre ideias. Enfatize mergulhar o público no momento com pistas sensoriais, do calor e odores ao ritmo da vibe do filme e diálogo escasso que carrega peso.

    Estruture o prompt em torno de uma sequência breve: o protagonista age, o antagonista contra-ataca, e a tensão aumenta em direção a uma escolha. Mantenha as restrições apertadas: tamanhos de quadro, proporções de iluminação e um limite na narração para que os visuais carreguem a história. A câmera deve rolar após ações chave para capturar reações e impulsionar a trama em direção ao aftermath.

    Para ilustrar, monte um esqueleto de prompt compacto e depois expanda: "Um interior de cozinha tenso ao amanhecer, o protagonista enfrenta o antagonista, emocionalmente carregado, diálogo escasso, apostas pessoais, ações descritas em termos sem filtros, ritmo de suspense." Em seguida, adicione notas concretas de câmera: "role a câmera aqui, corte para uma reação, role novamente para o aftermath," e itere com ajustes inspirados para se adequar ao seu projeto e público-alvo.

    Guia de Prompts do Sora 2: Cabeças Falantes na Geração de Vídeo com IA

    Defina um objetivo apertado para a cabeça falante: explique a ideia central em menos de 60 segundos usando linguagem simples e pistas mensuráveis. Defina o público-alvo e escolha um takeaway claro. Anexe isso ao seu prompt do Sora 2 para que o modelo gere uma performance focada e decodificável desde o início.

    Estruture a cena em três batidas: setup, ponto central e chamada para ação de fechamento. Use pistas de contação de histórias e visuais concretos. Para vibes de briefing matinal, selecione um ritmo leve e estável e uma pista facial quente. Use dicas que ajudem o espectador a digerir a informação rapidamente.

    Use cortes controlados e gestos. Mantenha a sincronia da boca precisa enfatizando os lábios apenas quando as frases caem; acenos de cabeça leves e elevações de sobrancelha podem sinalizar ênfase sem caos. Se a cena precisar de impacto, introduza um corte de um segundo para um gráfico antes de retornar à cabeça falante.

    Para criar uma cabeça falante que pareça real, combine segredos de timing com pistas impulsionadas por máquina: micro-expressões, ritmo de respiração e linha de visão. Aproveitando a incorporação de movimento de fundo e a geração de iluminação consistente mantém a cabeça ancorada. O design deve ser projetado para traduzir tópicos complexos em linguagem acessível, redefinindo realidades abstratas em exemplos simples, e tecendo contação de histórias em cada momento.

    Discuta realidades de produção: use cenas leves e ativos mínimos para reduzir o caos e manter a batida de apresentação nítida. Uma cabeça falante ótima surge quando você limita o ruído, mantém um ritmo estável e planeja cortes que suportem a narrativa. Use um único ângulo de câmera para prompts diretos; mude para dois ângulos apenas para ênfase para evitar visuais fracos.

    Em seus prompts, destaque palavras que o modelo deve priorizar: contação de histórias, clareza e exemplos concretos. Para cada cenário de cabeça falante, especifique o público, o domínio e a vibe matinal; em seguida, ajuste a combinação de visuais e pistas de voz em direção a um takeaway claro.

    Defina personagem, voz e cadência de fala

    Defina personagem, voz e cadência de fala

    Defina uma assinatura de voz única e concreta para o personagem e aplique-a em todo o episódio. Crie um caule de uma linha que capture tom, ritmo e visão de mundo, em seguida, ancorar prompts a essa assinatura para que a IA recupere pistas consistentes nesses quartos e corredores ao longo do episódio.

    Construa uma paleta de voz: escolha 5–7 traços, defina o comprimento da frase e defina o ritmo para ação versus reflexão. Essas escolhas usam dicção apropriada ao período e uma mistura de cláusulas concisas com frases líricas para se adequar ao mundo. Mantenha a cadência visualmente marcante, para que trailers e diálogo na tela se sintam coesos. Planeje a evolução através dos arcos de episódio enquanto mantém um equilíbrio entre clareza e cor; inspiração de deakins deve informar iluminação e tom por trás das palavras.

    Defina regras de cadência: em momentos de ação, acelere com cláusulas curtas; em batidas mágicas ou introspectivas, alongue frases e insira detalhes sensoriais. Use pistas como crepúsculo, portas se abrindo ou um encontro quieto quando o ritmo precisar mudar. Quando o quarto fica quieto, mude a cadência. Quando um personagem entra em quartos ou enfrenta uma decisão moral, deixe a cadência refletir foco e energia. Batidas exageradas podem sinalizar performance durante momentos climáticos para acertar o impacto sem perder o controle.

    Pistas de entrega: marque respiração, ênfase e tom com pontuação e quebras de linha; mantenha uma projeção consistente em episódios completos; alinhe a voz com a visão por trás do tiro; garanta que pareça real por trás da ação e em cada quadro.

    Exemplo de peça de prompt: "Personagem: Mira, sozinha, uma investigadora pragmática; Voz: calma, humor seco; Cadência: medida, com ênfase exagerada em pistas; Cenário: mansão iluminada pelo crepúsculo; Pista visual: iluminação inspirada em deakins, sombras profundas; Humor: mágico, empolgante; Objetivo: recuperar uma verdade oculta."

    Defina enquadramento visual: ângulos de câmera, tamanho do tiro e composição

    Comece com um apertado close-up no protagonista para ancorar emoção, em seguida, revele contexto com camadas de profundidade que guiam o olho visualmente pela cena. Construa estrutura transitando de um quadro íntimo para uma visão mais ampla, deixando a luz mudar de nascer do sol para a próxima batida. Em prompts, especifique ângulos de câmera e tamanhos de tiro precisamente para criar uma progressão clara para a IA gerando quadros.

    Mapeie ângulos para intenção: use nível dos olhos para conexão, um ângulo baixo para empoderar e um ângulo alto para sinalizar restrição. Combine com tamanhos de tiro que combinem com a batida: apertado para emoção, médio para interação, longo para contexto. Inclua um tiro de sobrevoo para geografia, e reserve ângulos proibidos para momentos de segredo que você quer evitar. Lidere o olho com uma sequência em movimento que permaneça visualmente limpa e sem costuras, e ajuste a escolha de lente para manter a profundidade nítida através das camadas. Mencione motivos de vigilância apenas quando a história chamar por isso, para evitar clichê.

    A composição centra-se em profundidade e estrutura em camadas: coloque o protagonista no terço esquerdo, com linhas líderes de arquitetura ou ruas apontando para o sujeito. Use elementos de primeiro plano para criar profundidade; um quadro em camadas com primeiro plano, meio plano e fundo adiciona textura. Deixe a luz esculpir formas: nascer do sol ou iluminação específica da hora cria direção quente; use sombras para separar sujeitos e sugerir o tempo passando. Use um sobrevoo para contexto de paisagem épica, e garanta que o quadro permaneça legível quando o sujeito se move dentro do quadro. Mantenha a consistência ajustando a luz em cada hora.

    Evite bagunça: mantenha o espaço negativo significativo e horizontes alinhados. Não misture muitas ações em um quadro para prevenir confusão de profundidade. Mantenha pistas de profundidade distintas para que primeiro plano, meio plano e fundo leiam de forma limpa. Garanta transições sem costuras combinando temperatura de cor e direção da luz através dos tiros. Para sequências que abrangem uma hora, descreva mudanças graduais de iluminação para preservar a continuidade.

    Em prompts, fixe a linguagem visual: "ângulo: nível dos olhos" ou "ângulo baixo"; "tamanho: close-up apertado" ou "tiro longo"; "composição: protagonista no terço esquerdo, com camadas de primeiro plano e profundidade." Adicione pistas de cenário como social e moderno para colocar a ação em um mundo contemporâneo. Inclua um tiro de drone de sobrevoo para geografia, e solicite iluminação de nascer do sol para estabelecer humor. Comande transições fluindo sem costuras e um ritmo de alta energia para batidas de ação. Se a cena fala com outro personagem, sinalize tiros de reação para alternar perspectivas. Mantenha prompts concisos e concretos para minimizar interpretações erradas, e ancorar a sequência com uma única linha visual épica que permaneça fiel ao design e estrutura.

    Controle a sincronia labial e o timing do diálogo

    Comece ancorando a sincronia labial ao timing do diálogo do prompt: construa um mapa detalhado de fonemas e fixe visemas à grade do quadro. Essa estrutura construída fornece informações para sincronizar o diálogo com ações dos protagonistas e iluminação, trazendo a visão para um foco mais nítido. Inclua tempos de início e fim para cada linha, e integre micro-pausas para evitar momentos abruptos ou vazios que quebrem a imersão. Use dicas contra deriva, enfatizando timing preciso para cada frase para manter a cadência consistente.

    Dicas para implementar timing dentro de prompts: atribua a cada linha uma contagem de quadros alvo, alinhe a sequência de fonemas ao diálogo, e atribua uma pista específica da visão para a boca, olhos e gestos do personagem. Para cenas modernas com iluminação neoclássica, combine timing do diálogo com batidas de ação para produzir movimentos labiais naturais mesmo durante movimentos sutis como uma dança ou micro-gestos. Melhorias incluem uma camada secundária que rastreia respiração, cadência e pontuação, o que ajuda a evitar mudanças abruptas.

    Integre timing do diálogo com ações da cena: coordene formas da boca com gestos do personagem, para que quando um protagonista levanta a mão, as sílabas atinjam o pico no momento do gesto, não antes. Construa o prompt para incluir um destaque em sílabas estressadas e enfatizando tom emocional. Use notas detalhadas sobre tom e ritmo para guiar o modelo.

    Fluxo de trabalho e teste: visualize resultados em uma passada rápida, em seguida, itere. Use uma pista de iluminação separada para verificar a posição labial; execute múltiplas tomadas, compare quadros de áudio e vídeo, ajuste prompts e reexecute. Forneça prompts claros com dados estruturados para cada cena, e mantenha prompts modulares para reutilizar em cenas futuras. Enfatizando consistência através das cenas, especialmente para peças de conjunto onde vários protagonistas falam, garante coesão.

    Especifique iluminação, paleta de cores e contexto de fundo

    Use uma configuração de iluminação de três pontos com uma luz principal de 5600K, um preenchimento de 3200K e uma luz de fundo sutil para separar sujeitos do fundo. Fixe o balanço de branco em 5600K e trabalhe em Rec.709 para tons de pele. Coloque a principal em 45°, o preenchimento em 30–40% oposto, e a luz de fundo apenas brilhante o suficiente para revelar cabelo e ombros sem halos quentes. Para configurações de múltiplas câmeras, mantenha as mesmas posições de principal e preenchimento através dos rigs para evitar mudanças entre ângulos. Garanta difusão suficiente e suportes de luz prontos para que você possa rolar entre tiros sem reconfiguração, preservando movimentos limpos através dos ângulos.

    Defina uma paleta de 3–5 cores que suporte o conceito. Exemplo: marinho #0A1F44, ardósia #5A7D9A, areia #D8CAB3, musgo #5F8B5A, acento coral #FF6F61. Aplique a cor primária à iluminação principal, secundária a fundos, neutras ao figurino, e o acento de forma escassa. Um inchaço de calor pode vir de géis âmbar em práticos ou preenchimento quente para transmitir otimismo. Ao combinar luzes práticas com LEDs, execute testes de balanço de branco para manter tons de pele gerados honestos. Documente a paleta e use-a através de iluminação, figurino e decoração de set para manter coesão visual.

    O contexto de fundo impulsiona a cena. Descreva o cenário, horário do dia, clima e texturas ambiente que suportem o conceito. Para conteúdo social e cortes no estilo de trailer, crie um fundo que permaneça legível atrás de sujeitos em movimento. Obtenha permissões para locais e equipamentos para que você possa filmar sem atrasos. Em prompts, mencione pássaros ao longe, silhuetas de rua ou um parque calmo para dar profundidade. Se entrevistas estiverem envolvidas, coloque a câmera atrás do sujeito para capturar reações honestas e prepare uma sequência no estilo de trailer que possa ser seguida por trailers e um corte social. Pré-requisitos como espaço para suportes de luz, tomadas de energia e gerenciamento seguro de cabos devem ser garantidos antes de você rolar.

    Para estruturar prompts de forma eficaz, misture iluminação, cor e contexto de fundo para que o conceito brilhe. Descreva movimentos de câmera e tiros rolando (roll) que interajam com a luz. Explore atmosferas onde pássaros derivam no fundo e um inchaço de cor suporta o humor. Use uma configuração de múltiplas câmeras e planeje um sentimento de trailer ou bastidores que suporte entrevistas e diálogo honesto. Perguntas frequentemente feitas sobre permissões e pré-requisitos devem ser respondidas diretamente no prompt, garantindo espaço suficiente e segurança. A filmagem gerada deve se sentir coesa, amada pelo público e alinhada com o tom do trailer enquanto ainda se sente autêntica e humana em sua contação de histórias social. Essa abordagem suporta qualidade de filmmaking ao longo do processo.

    Crie variações de prompt e verificações de avaliação para consistência

    Comece com um prompt base que fixa tom, sujeito e estilo de saída, em seguida, gere cinco variações que mantenham a intenção central enquanto mudam fatores dinâmicos como cenário, energia e abordagem de câmera. Um cenário de parque fundamenta os visuais, enquanto enquadramento cinematográfico e imagens de alta qualidade sustentam consistência através do episódio e suas reviravoltas.

    Use as verificações abaixo para garantir coesão através de prompts, ritmo de episódio e renders finais. Retrate uma abordagem estável, e sinalize quaisquer pistas falsas ou misturas que quebrem a continuidade.

    • Estratégia de base e variação: defina o objetivo central, público, comprimento de saída e pré-requisitos necessários (como ponto de partida). Anexe uma descrição semelhante a um script para a voz do host e a abordagem visual, em seguida, crie cinco variações que preservem o arco principal enquanto mudam ambiente, nível de energia e linguagem de câmera.
    • Alavancas de variação: ajuste cenário (parque versus interior), iluminação (amanhecer, meio-dia, crepúsculo), nível de energia (alta energia versus contido), e linguagem visual (nível do chão, rastreamento cinematográfico ou superior). Para cada variante, especifique uma reviravolta e um momento de suspense para ancorar ritmo e engajamento do espectador.
    • Narrativa e representação: garanta representação consistente de personagens, tom e figurino. Use o termo representando para guiar como sujeitos interagem com o espaço, e aplique combinação de histórias de múltiplas tomadas para enriquecer o episódio sem perder continuidade.
    • Técnicas e imagens: delineie movimentos de câmera, enquadramento e chaves de cor. Inclua referências a imagens e exemplos para padronizar a aparência, em seguida, marque onde misturas com sobreposições ou VFX ocorrem para manter expectativas claras.
    • Pré-requisitos e controles de qualidade: liste ativos necessários (scripts, listas de tiros, mood boards, imagens de referência), e defina uma checklist para correção de cor, pistas de áudio e timing de legendas. Note proativamente quaisquer motivos neoclássicos ou motivos de penhasco que você queira carregar através das variações para reforçar o estilo.
    • Verificações de consistência: construa uma rubrica que rastreie comprimento da cena, iluminação, continuidade de objetos e colocação de adereços através das variações. Inclua uma passada para continuidade de nível do chão e consistência de vantage abaixo para evitar saltos bruscos entre tiros.
    • Método de avaliação: execute renders paralelos e compare quadros lado a lado, verificando que reviravoltas caiam na batida pretendida e que o polimento geral permaneça de alta qualidade. Marque quaisquer desvios como notas acionáveis para revisão antes de publicar o vlog.
    1. Exemplo 1 – Variação Base:

      Prompt: dinâmico, alta energia, episódio de vlog cinematográfico definido em um parque durante a hora dourada. Representando um host explorando um penhasco neoclássico escondido abaixo de uma estátua, com enquadramento de nível do chão e tiros de rastreamento suaves. Técnicas incluem movimentos de steady cam, close-ups e sobreposições sutis. Pré-requisitos: objetivo claro, lista de tiros, chaves de cor e um guia de design de som. Combinando histórias de uma única linha do tempo, os visuais devem permanecer coesos enquanto apresentam uma reviravolta no ponto médio.

    2. Exemplo 2 – Reviravolta no Parque Noturno:

      Prompt: dinâmico, ambiente de parque de alta qualidade filmado ao crepúsculo com uma abordagem fundamentada e cinematográfica. O episódio centra-se em iluminação abaixo e reflexos, representando o host descobrindo uma narrativa secundária que mistura pistas do mundo real com um motivo neoclássico estilizado. Reviravolta aparece perto de uma característica semelhante a um penhasco nas sombras. Pré-requisitos: plano de iluminação, alvos de exposição e referências de imagem. Exemplos de imagens e um storyboard curto são fornecidos para manter consistência através dos tiros.

    3. Exemplo 3 – Misturando Histórias e Testando Elementos Falsos:

      Prompt: combinando duas histórias paralelas em um único episódio de parque usando um vantage de nível do chão e uma cadência cinematográfica. Representando o host como um guia através de uma cena que gradualmente revela uma reviravolta suportada por imagens e sobreposições. Técnicas incluem dissoluções cruzadas, pistas de tela dividida e correspondência de cor a uma estética neoclássica. Pré-requisitos: prompts de teste sem risco, regiões de mistura sinalizadas e uma seção dedicada para identificar sobreposições falsas. Momentos de suspense servem como pontos de ancoragem para manter o ritmo ao longo do episódio.

    📚 Mais sobre Geração de IA & Prompts

    Artigos Relacionados

    Ready to leverage AI for your business?

    Book a free strategy call — no strings attached.

    Get a Free Consultation