Przewodnik po promptach Sora 2 – Jak pisać lepsze prompt do generowania filmów AI


Zacznij od precyzyjnej wskazówki sceny i jasnego celu dla SI. Zdefiniuj główny konflikt w jednym zdaniu, a następnie dodaj ograniczenia, które kierują efektami wizualnymi i tempem, aby uzyskać wynik wideo, a nie opis tekstowy. Utrzymuj to w działaniu: określ scenerię, postacie i wymierny wynik, który system powinien wygenerować w finalnym renderze.
Określ scenerię jako kuchnię, aby zakotwiczyć teksturę i oświetlenie. Dodaj dotykowe wskazówki, takie jak para, brzęk naczyń i neonowe odbicia, aby sterować wyglądem. Opisz język kamery za pomocą stabilnego najazdu kamery lub ciasnych zbliżeń i ustaw nastrój jako emocjonalnie naładowany i napięty, odpowiedni dla thrillera. Nazwij protagonistę i antagonistę i nadaj im osobiste stawki, które publiczność może odczuć.
Wyraźnie nakreśl czynności i uczestników: kto, co robi, kiedy i dlaczego. Użyj niefiltrowanego języka, aby uchwycić ostre gesty, zdecydowane linie i wyraźne wizualne uderzenia. Połącz efekty wizualne z fantazją lub ugruntowanym realizmem, określając, czy chcesz surrealistyczne efekty, czy ugruntowaną teksturę, i zauważ, jak scena powinna podążać za jednym wątkiem, zamiast przeskakiwać między pomysłami. Podkreśl wprowadzenie publiczności w moment za pomocą bodźców sensorycznych, od ciepła i zapachów po rytm klimatu filmu i skąpe dialogi, które mają wagę.
Ustrukturyzuj podpowiedź wokół krótkiej sekwencji: protagonista działa, antagonista kontruje, a napięcie wzrasta w kierunku wyboru. Utrzymuj ścisłe ograniczenia: rozmiary ujęć, współczynniki oświetlenia i ograniczenie narracji, aby efekty wizualne prowadziły historię. Kamera powinna uruchomić się po kluczowych czynnościach, aby uchwycić reakcje i popchnąć fabułę w kierunku następstw.
Aby to zilustrować, zmontuj zwarty szkielet podpowiedzi, a następnie rozwiń: „Napięte wnętrze kuchni o świcie, protagonista staje twarzą w twarz z antagonistą, naładowany emocjonalnie, skąpe dialogi, osobiste stawki, czynności opisane w niefiltrowanych słowach, tempo thrillera”. Następnie dodaj konkretne notatki dotyczące kamery: „uruchom kamerę tutaj, przejdź do reakcji, uruchom ponownie, aby zobaczyć następstwa” i powtarzaj z natchnionymi ulepszeniami, aby dopasować się do twojego projektu i docelowych odbiorców.
Sora 2 Prompt Guide: Mówiące głowy w generowaniu wideo AI
Ustal konkretny cel dla mówiącej głowy: wyjaśnij główną ideę w mniej niż 60 sekund, używając prostego języka i mierzalnych wskazówek. Zdefiniuj grupę docelową i wybierz jedno jasne przesłanie. Dołącz to do podpowiedzi Sora 2, aby model od samego początku generował skoncentrowany i zrozumiały przekaz.
opowiadania historii i konkretnych efektów wizualnych. Aby uzyskać klimat porannej odprawy, wybierz lekkie, stabilne tempo i ciepłą mimikę twarzy. Używaj wskazówek, które pomagają widzowi szybko przyswoić informacje.
Używaj kontrolowanych cięć i gestów. Utrzymuj dokładną synchronizację ust, podkreślając usta tylko wtedy, gdy frazy się kończą; delikatne skinienia głową i uniesienia brwi mogą sygnalizować nacisk bez chaosu. Jeśli scena wymaga uderzenia, wprowadź jednosekundowe cięcie do grafiki przed powrotem do mówiącej głowy.
Aby stworzyć mówiącą głowę, która wydaje się prawdziwa, połącz tajemnice wyczucia czasu ze wskazówkami sterowanymi maszynowo: mikroekspresje, rytm oddechu i linia wzroku. Wykorzystanie włączenia ruchu tła i generowanie spójnego oświetlenia utrzymuje głowę zakotwiczoną. Projekt powinien być zaprojektowany tak, aby tłumaczyć złożone tematy na przystępny język, przekształcając abstrakcyjne realia w proste przykłady i wplatając opowiadanie historii w każdą chwilę.
Omów realia produkcji: używaj lekkich scen i minimalnej ilości zasobów, aby zmniejszyć chaos i utrzymać ostry rytm prezentacji. Świetna mówiąca głowa pojawia się, gdy ograniczasz hałas, utrzymujesz stałe tempo i planujesz cięcia, które wspierają narrację. Użyj jednego kąta kamery dla prostych podpowiedzi; przełącz się na dwa kąty tylko dla podkreślenia, aby uniknąć słabych efektów wizualnych.
W swoich podpowiedziach przesuwaj na pierwszy plan słowa, które model powinien traktować priorytetowo: opowiadanie historii, jasność i konkretne przykłady. Dla każdego scenariusza mówiącej głowy określ odbiorców, domenę i klimat poranka; następnie dostosuj łączenie efektów wizualnych i wskazówek głosowych w kierunku jasnego przekazu.
Zdefiniuj postać, głos i kadencję mówienia

Zdefiniuj jeden konkretny podpis głosowy dla postaci i zastosuj go w całym odcinku. Stwórz jednozdaniowy rdzeń, który uchwyci ton, tempo i światopogląd, a następnie zakotwicz podpowiedzi do tego podpisu, aby SI pobierała spójne wskazówki w tych pomieszczeniach i korytarzach w całym odcinku.
Zbuduj paletę głosów: wybierz 5–7 cech, ustal długość zdania i zdefiniuj rytm dla akcji i refleksji. Te wybory wykorzystują odpowiednią dla epoki dykcję i mieszankę zwięzłych klauzul z liryczną frazeologią, aby pasować do świata. Utrzymuj kadencję uderzającą wizualnie, aby zwiastuny i dialog na ekranie były spójne. Zaplanuj ewolucję w łukach odcinków, zachowując równowagę między jasnością a kolorem; inspiracja od deakinsa powinna wpływać na oświetlenie i ton za słowami.
Ustal reguły kadencji: w momentach akcji przyspieszaj krótkimi klauzulami; w magicznych lub introspekcyjnych rytmach wydłużaj zdania i wstawiaj szczegóły sensoryczne. Używaj wskazówek, takich jak zmierzch, otwieranie drzwi lub ciche spotkanie, gdy trzeba zmienić tempo. Kiedy w pokoju robi się cicho, zmień kadencję. Kiedy postać wchodzi do pokoju lub stoi w obliczu decyzji moralnej, pozwól kadencji odzwierciedlać skupienie i energię. Przesadne rytmy mogą sygnalizować występ podczas kulminacyjnych momentów, aby wylądować impetem bez utraty kontroli.
Wskazówki dotyczące dostarczania: zaznacz oddech, nacisk i ton za pomocą interpunkcji i podziałów wierszy; utrzymuj spójną projekcję w całych odcinkach; dopasuj głos do wizji za ujęciem; upewnij się, że brzmi prawdziwie za akcją i w każdym kadrze.
Przykładowy fragment podpowiedzi: „Postać: Mira, samotna, pragmatyczna śledcza; Głos: spokojny, suchy dowcip; Kadencja: odmierzone, z przesadnym naciskiem na wskazówki; Sceneria: dwór oświetlony zmierzchem; Wskazówka wizualna: oświetlenie inspirowane deakinsem, głębokie cienie; Nastrój: magiczny, ekscytujący; Cel: odzyskanie ukrytej prawdy”.
Ustaw kadrowanie wizualne: kąty kamery, rozmiar ujęcia i kompozycja
Zacznij od ciasnego zbliżenia na protagoniście, aby zakotwiczyć emocje, a następnie ujawnij kontekst za pomocą warstwowej głębi, która prowadzi oko wizualnie po scenie. Zbuduj strukturę, przechodząc od intymnego kadru do szerszego widoku, pozwalając światłu przesuwać się od wschodu słońca do następnego uderzenia. W podpowiedziach określ precyzyjnie kąty kamery i rozmiary ujęć, aby stworzyć wyraźną progresję dla generowania kadrów przez SI.
Przypisz kąty do intencji: użyj poziomu oczu do połączenia, niskiego kąta, aby wzmocnić, i wysokiego kąta, aby zasygnalizować ograniczenie. Dopasuj rozmiary ujęć, które pasują do rytmu: ciasne dla emocji, średnie dla interakcji, długie dla kontekstu. Dołącz ujęcie z przelotu dla geografii i zarezerwuj zakazane kąty na chwile tajemnicy, których chcesz uniknąć. Poprowadź oko ruchomą sekwencją, która pozostaje wizualnie czysta i płynnie, i dostosuj wybór obiektywu, aby utrzymać wyrazistą głębię we wszystkich warstwach. Wspominaj o motywach nadzoru tylko wtedy, gdy fabuła tego wymaga, aby uniknąć banału.
Kompozycja koncentruje się na głębi i warstwowej strukturze: umieść protagonistę po lewej trzeciej, z wiodącymi liniami z architektury lub ulic, które kierują się w stronę obiektu. Użyj elementów pierwszego planu, aby stworzyć głębię; warstwowy kadr z pierwszym planem, planem środkowym i tłem dodaje tekstury. Pozwól, aby światło rzeźbiło kształty: wschód słońca lub oświetlenie specyficzne dla godziny tworzy ciepły kierunek; użyj cieni, aby oddzielić obiekty i zasugerować upływający czas. Użyj przelotu dla epickiego kontekstu krajobrazowego i upewnij się, że kadr pozostaje czytelny, gdy obiekt porusza się w kadrze. Zachowaj spójność, dostosowując światło o każdej godzinie.
Unikaj bałaganu: utrzymuj negatywną przestrzeń znaczącą i wyrównaj horyzonty. Nie mieszaj zbyt wielu akcji w jednym kadrze, aby zapobiec dezorientacji głębi. Utrzymuj wyraźne wskazówki dotyczące głębi, aby pierwszy plan, plan środkowy i tło były czytelne. Upewnij się, że przejścia są płynne, dopasowując temperaturę barwową i kierunek światła we wszystkich ujęciach. Dla sekwencji obejmujących godzinę opisz stopniowe zmiany oświetlenia, aby zachować ciągłość.
W podpowiedziach zablokuj język wizualny: „kąt: poziom oczu” lub „niski kąt”; „rozmiar: ciasne zbliżenie” lub „długie ujęcie”; „kompozycja: protagonista po lewej trzeciej, z warstwowym pierwszym planem i głębią”. Dodaj wskazówki dotyczące scenerii, takie jak społeczny i nowoczesny, aby umieścić akcję we współczesnym świecie. Dołącz ujęcie z drona przelotu dla geografii i poproś o oświetlenie wschodu słońca, aby ustalić nastrój. Nakazuj płynne płynne przejścia i energetyczne tempo dla uderzeń akcji. Jeśli scena rozmawia z inną postacią, podpowiedz ujęcia reakcji, aby alternatywne ujęcia perspektywiczne. Utrzymuj podpowiedzi zwięzłe i konkretne, aby zminimalizować błędne interpretacje, i zakotwicz sekwencję za pomocą jednego epickiego wizualnego wątku, który pozostaje wierny projektowi i strukturze.
Kontroluj synchronizację ust i moment dialogu

Zacznij od zakotwiczenia synchronizacji ust do momentu dialogu podpowiedzi: zbuduj szczegółową mapę fonemów i zablokuj wizemy do siatki obramowania. Ta wbudowana struktura zapewnia informację do synchronizacji dialogu z działaniami i oświetleniem protagonistów, wprowadzając widok w ostrzejsze skupienie. Dołącz czasy początku i końca dla każdej linii i zintegruj mikropauzy, aby uniknąć nagłych lub pustych momentów, które przerywają zanurzenie. Użyj wskazówek przeciw dryfowaniu, podkreślając precyzyjne wyczucie czasu dla każdego zdania, aby utrzymać spójną kadencję.
Wskazówki dotyczące implementacji wyczucia czasu wewnątrz podpowiedzi: przypisz każdej linii docelową liczbę klatek, dopasuj sekwencję fonemów do dialogu i przypisz wskazówkę specyficzną dla widoku dla ust, oczu i gestów postaci. Dla nowoczesnych scen z neoklasycznym oświetleniem, połącz moment dialogu z uderzeniami akcji, aby wytworzyć naturalne ruchy ust, nawet podczas subtelnych ruchów, takich jak taniec lub mikrogesty. Ulepszenia obejmują warstwę wtórną, która śledzi oddech, kadencję i interpunkcję, co pomaga uniknąć nagłych zmian.
Zintegruj moment dialogu z działaniami sceny: koordynuj kształty ust z gestami postaci, więc kiedy protagonista podnosi rękę, sylaby szczytują w momencie gestu, nie wcześniej. Zbuduj podpowiedź, aby dołączyć podświetlenie na podkreślonych sylabach i podkreślić emocjonalny ton. Użyj szczegółowych notatek dotyczących tonu i tempa, aby poprowadzić model.
Przepływ pracy i testowanie: oglądaj wyniki w szybkim przekazie, a następnie powtarzaj. Użyj oddzielnej wskazówki dotyczącej oświetlenia, aby zweryfikować pozycję ust; uruchom wiele ujęć, porównaj klatki audio i wideo, dostosuj podpowiedzi i uruchom ponownie. Zapewnij jasne podpowiedzi z ustrukturyzowanymi danymi dla każdej sceny i utrzymuj podpowiedzi modułowe do ponownego użycia w przyszłych scenach. Podkreślenie spójności we wszystkich scenach, szczególnie dla utworów zespołowych, gdzie mówi kilku protagonistów, zapewnia spójność.
Określ oświetlenie, paletę kolorów i kontekst tła
Użyj konfiguracji oświetlenia z trzema punktami ze światłem kluczowym 5600K, wypełniającym 3200K i subtelnym podświetleniem, aby oddzielić obiekty od tła. Zablokuj balans bieli na 5600K i pracuj w Rec.709 dla odcieni skóry. Umieść klucz na 45°, wypełnienie na 30–40% naprzeciwko i podświetlenie wystarczająco jasne, aby ujawnić włosy i ramiona bez gorących aureoli. Dla konfiguracji z wieloma kamerami, zachowaj te same pozycje klucza i wypełnienia na wszystkich platformach, aby uniknąć przesunięć między kątami. Upewnij się, że wystarczająco dużo dyfuzji i statywów oświetleniowych jest gotowe, abyś mógł przełączać się między ujęciami bez ponownego ustawiania, zachowując czyste ruchy we wszystkich kątach.
Zdefiniuj paletę 3–5 kolorów, która obsługuje koncepcję. Przykład: granatowy #0A1F44, łupek #5A7D9A, piasek #D8CAB3, mech #5F8B5A, akcent koralowy #FF6F61. Zastosuj kolor podstawowy do kluczowego oświetlenia, wtórny do tła, neutralne do garderoby, a akcent oszczędnie. Falę ciepła mogą wywoływać bursztynowe żele na praktycznych urządzeniach lub ciepłe wypełnienie, aby przekazać optymizm. Łącząc praktyczne światła z diodami LED, uruchom testy balansu bieli, aby utrzymać uczciwe wygenerowane odcienie skóry. Udokumentuj paletę i użyj jej w oświetleniu, garderobie i scenografii, aby zachować spójność wizualną.
Kontekst tła napędza scenę. Opisz scenerię, porę dnia, pogodę i tekstury otoczenia, które obsługują koncepcję. Dla treści społecznościowych i cięć w stylu zwiastunów, stwórz tło, które pozostaje czytelne za poruszającymi się obiektami. Uzyskaj pozwolenia na lokalizacje i sprzęt, abyś mógł kręcić bez opóźnień. W podpowiedziach wspomnij o ptakach w oddali, sylwetkach ulicznych lub spokojnym parku, aby dodać głębi. Jeśli odbywają się wywiady, umieść kamerę za obiektem, aby uchwycić uczciwe reakcje i przygotować sekwencję w stylu zwiastuna, która może być kontynuowana przez zwiastuny i cięcie społecznościowe. Warunki wstępne, takie jak miejsce na statywy oświetleniowe, gniazdka elektryczne i bezpieczne zarządzanie kablami, powinny być zabezpieczone przed rozpoczęciem kręcenia.
Aby skutecznie strukturyzować podpowiedzi, połącz oświetlenie, kolor i kontekst tła, aby koncepcja jaśniała. Opisz ruchy kamery i ujęcia toczenia (toczenie), które wchodzą w interakcje ze światłem. Eksploruj atmosfery, w których ptaki dryfują w tle, a fala koloru wspiera nastrój. Użyj konfiguracji z wieloma kamerami i zaplanuj zwiastun lub poczucie zza kulis, które wspiera wywiady i uczciwy dialog. Często zadawane pytania dotyczące pozwoleń i warunków wstępnych powinny być udzielane bezpośrednio w podpowiedzi, zapewniając wystarczającą przestrzeń i bezpieczeństwo. Wygenerowany materiał powinien być spójny, uwielbiany przez publiczność i zgodny z tonem zwiastuna, jednocześnie sprawiając wrażenie autentycznego i ludzkiego w swoim społecznym opowiadaniu historii. To podejście wspiera jakość tworzenia filmów przez cały proces.
Stwórz wariacje podpowiedzi i kontrole oceny dla spójności
Zacznij od wyjściowej podpowiedzi, która blokuje ton, obiekt i styl wyjściowy, a następnie wygeneruj pięć wariacji, które utrzymują podstawowy zamiar, jednocześnie zmieniając dynamiczne czynniki, takie jak sceneria, energia i podejście kamery. Ustawienie parku uziemia efekty wizualne, a filmowe kadrowanie i wysokiej jakości obrazy utrzymują spójność w całym odcinku i jego zwrotach akcji.
Użyj poniższych kontroli, aby zapewnić spójność we wszystkich podpowiedziach, tempie odcinka i renderach końcowych. Portretuj stałe podejście i oznacz wszelkie fałszywe wskazówki lub mieszanie, które przerywa ciągłość.
- Podstawa i strategia wariacji: zdefiniuj podstawowy cel, odbiorców, długość wyjściową i wymagane warunki wstępne (jako punkt wyjścia). Dołącz opis podobny do skryptu dla głosu prowadzącego i podejścia wizualnego, a następnie stwórz pięć wariacji, które zachowują główny łuk, jednocześnie zmieniając środowisko, poziom energii i język kamery.
- Dźwignie wariacji: dostosuj ustawienie (park kontra wnętrze), oświetlenie (świt, południe, zmierzch), poziom energii (wysokoenergetyczny kontra powściągliwy) i język wizualny (poziom gruntu, śledzenie kinematograficzne lub z góry). Dla każdego wariantu określ zwrot akcji i moment klifu, aby zakotwiczyć tempo i zaangażowanie widza.
- Narracja i portret: zapewnij spójne przedstawienie postaci, tonu i garderoby. Użyj terminu portretowanie, aby poprowadzić, jak obiekty wchodzą w interakcje z przestrzenią, i zastosuj łączenie historii z wielu ujęć, aby wzbogacić odcinek bez utraty ciągłości.
- Techniki i obrazy: nakreśl ruchy kamery, kadrowanie i klucze kolorów. Dołącz odniesienia do obrazów i przykładów, aby ustandaryzować wygląd, a następnie zaznacz, gdzie występuje mieszanie z nakładkami lub efektami wizualnymi, aby oczekiwania były jasne.
- Warunki wstępne i kontrole jakości: wymień wymagane zasoby (skrypty, listy ujęć, tablice nastrojów, obrazy referencyjne) i ustaw listę kontrolną dla stopniowania kolorów, wskazówek audio i momentu napisów. Proaktywnie zanotuj wszelkie neoklasyczne motywy lub motywy klifowe, które chcesz przenieść przez wariacje, aby wzmocnić styl.
- Kontrole spójności: zbuduj rubrykę, która śledzi długość sceny, oświetlenie, ciągłość obiektu i umieszczenie rekwizytów we wszystkich wariacjach. Dołącz przekaz dla ciągłości na poziomie gruntu i spójności pod punktem widokowym, aby uniknąć wstrząsających przeskoków między ujęciami.
- Metoda oceny: uruchom równoległe rendery i porównaj kadry obok siebie, weryfikując, czy zwroty akcji lądują w zamierzonym rytmie i czy ogólna polerka pozostaje wysokiej jakości. Oznacz wszelkie odchylenia jako wymierne notatki do poprawki przed opublikowaniem vloga.
Przykład 1 – Wariacja wyjściowa:
Podpowiedź: dynamiczny, wysokoenergetyczny vlogowy odcinek filmograficzny osadzony w parku podczas złotej godziny. Portretowanie prowadzącego eksplorującego ukryty neoklasyczny klif pod statuą, z kadrowaniem na poziomie gruntu i płynnymi ujęciami śledzącymi. Techniki obejmują ruchy stałej kamery, zbliżenia i subtelne nakładki. Warunki wstępne: jasny cel, lista ujęć, klucze kolorów i przewodnik po projektowaniu dźwięku. Łącząc historie z pojedynczej osi czasu, efekty wizualne powinny pozostać spójne, prezentując jednocześnie zwrot akcji w punkcie środkowym.
Przykład 2 – Zwrot nocny w parku:
Podpowiedź: dynamiczne, wysokiej jakości środowisko parkowe filmowane o zmierzchu z ugruntowanym, filmowym podejściem. Odcinek koncentruje się na oświetleniu i odbiciach z dołu, portretując prowadzącego odkrywającego drugą narrację, która łączy wskazówki ze świata rzeczywistego ze stylizowanym, neoklasycznym motywem. Zwrot akcji pojawia się w pobliżu klifowej cechy w cieniach. Warunki wstępne: plan oświetlenia, cele ekspozycji i odniesienia do obrazów. Przykłady obrazów i krótka plansza scenariuszy są dostarczane, aby zachować spójność we wszystkich ujęciach.
Przykład 3 – Mieszanie historii i testowanie fałszywych elementów:
Podpowiedź: łączenie dwóch równoległych historii w jednym odcinku parku przy użyciu punktu widokowego na poziomie gruntu i kadencji kinowej. Portretowanie prowadzącego jako przewodnika po scenie, która stopniowo ujawnia zwrot akcji wspierany przez obrazy i nakładki. Techniki obejmują przenikanie, wskazówki na podzielonym ekranie i dopasowywanie kolorów do neoklasycznej estetyki. Warunki wstępne: bez ryzyka testowe podpowiedzi, oflagowane regiony mieszania i dedykowana sekcja do identyfikacji fałszywych nakładek. Momenty klifowe służą jako punkty zaczepienia do utrzymania rytmu w całym odcinku.
Ready to leverage AI for your business?
Book a free strategy call — no strings attached.
Related Articles

The Golden Specialist Era: How AI Platforms Like Claude Code Are Creating a New Class of Unstoppable Professionals
March 25, 2026
AI Is Replacing IT Professionals Faster Than Anyone Expected — Here Is What Is Actually Happening in 2026
March 25, 2026