AI EngineeringSeptember 18, 202313 min read
    SC
    Sarah Chen

    VEO-3 – Jak Stworzyć Idealny Prompt, Aby Uzyskać Film, Który Chcesz

    VEO-3 – Jak Stworzyć Idealny Prompt, Aby Uzyskać Film, Który Chcesz

    VEO-3: How to Craft the Perfect Prompt to Get the Video You Want

    Zacznij od pojedynczego, dającego się przetestować celu dla swojego promptu VEO-3. Zalecanym podejściem jest zdefiniowanie dokładnego filmu, jaki chcesz uzyskać, w jednym zdaniu, w tym długości, stylu i kluczowego elementu, który musi być widoczny na ekranie, a następnie zablokowanie go jako kompletnego celu. W tym miejscu możesz wrzucić plan do briefu, aby szybko zacząć.

    Zbuduj szkielet promptu z konkretnymi atrybutami: scena, nastrój, tempo, ruch kamery i przejścia. Na przykład: 12-sekundowe ujęcie miejskiego zmierzchu, 1080p, 24fps, dramatyczne światło, ruchy przestrzenne, z królewską korekcją kolorów i pojedyncza, skoncentrowana akcja. Dodaj ograniczenia, takie jak zapewnienie płynności ścieżek i spójności kadrowania między cięciami. Przede wszystkim, taka precyzja pomaga zdefiniować ścieżkę i uniknąć wpadnięć w nieprzewidywalne wyniki.

    Formułuj swoje prompty tak, aby wydobyć pomysły, które można ponownie wykorzystać. Opisz wszechświat, który chcesz ożywić, paletę i tekstury, aby móc wrócić do tej bazy, gdy tylko potrzebujesz nowego klipu. Dołącz zdanie, które określa, co powinno być tutaj wygenerowane, plus notatkę na ich temat, która pomoże Ci zorganizować warianty.

    Zapytaj, jaki nastrój i tempo pasują do Twojej sceny, a następnie przełóż to na sterowanie numeryczne. Użyj skali 0–10 dla dramatyzmu i skali 0–100 dla natężenia światła, aby łatwo porównywać wyniki. Jeśli dwa prompty dają identyczne kadrowanie, dostosuj korekcję kolorów lub tempo, aby ujawnić subtelne różnice. Jeśli chcesz znaleźć spójność, dostosuj jedną zmienną na raz i porównaj wyniki.

    Niezależnie od gatunku, zakotwicz prompty w centralnej koncepcji, aby wyniki pozostały spójne. Zbuduj bibliotekę fraz, które okazały się skuteczne, w tym wskazówki dotyczące tonu i notatki ścieżek. Używaj ich w różnych projektach, aby utrzymać królewski, rozpoznawalny głos i kierować nimi nowe prompty.

    Zapisz swój zestaw promptów jako żywy dokument: kompaktowy szkielet, który można dostosować w kilka minut, z docelową długością, rozdzielczością i profilem kolorów zanotowanym dla szybkiej replikacji między sesjami. Ta metoda pozwala szybko odzyskać wygląd, wrzucić nowe odniesienia lub skalować do dłuższych formatów, pozostając w zgodzie z pierwotnym celem.

    Zdefiniuj dokładny wynik wideo w jednym prompcie

    Define the exact video outcome in a single prompt

    Rekomendacja: zdefiniuj dokładny wynik wideo w jednym prompcie, nazywając odbiorców, materiał do dostarczenia, długość i mierzalne kryterium sukcesu w jednym zdaniu, unikając dodatkowego planowania w tym miejscu.

    1. Formuła wyniku: Wyprodukuj 60-sekundowy pionowy explainer dla zapracowanych profesjonalistów, który dostarcza jedną podstawową korzyść, zawiera jedną kwestię dialogową, kończy się jasnym wezwaniem do działania i celuje w watch-through ≥ 60% i CTR ≥ 1,8%.
    2. Materiały do dostarczenia i format: określ pulę 6–8 ujęć w proporcji 9:16, płynny strumień scen i napięty łuk, który unika przechyleń. Jeśli produkt używa olejków, pokaż namacalną teksturę na wczesnym etapie. Umieść jedno miejsce na kwestię dialogową, aby wylądowała naturalnie, i końcowe wezwanie do działania na ekranie dla wpływu na przychody.
    3. Ograniczenia, aby uniknąć dryfu: wymagaj stabilnego wyglądu z minimalnym ruchem kamery, unikaj nudnych momentów i zdefiniuj wcześniej twarde cięcie na 60 sekundach. Jeśli jakikolwiek segment grozi anulowaniem, oznacz go w planowaniu tutaj i dąż do wyraźnej alternatywy w ramach tego samego promptu.
    4. Metryki sukcesu i walidacja: ustal konkretne cele dla czasu oglądania, średniego czasu oglądania i współczynnika konwersji, a także cel drugorzędny dla widoczności w wyszukiwarce poprzez metadane i podpisy. Martw się mniej o zbędne rzeczy, a bardziej o mierzalne zwycięstwo w zakresie przychodów i zaangażowania.
    5. Kotwice skryptu i zasoby: nakreśl ogólny ton, który wydaje się ekspercki, ale przystępny dla odbiorców, umieść jedną zapadającą w pamięć kwestię dialogową na wczesnym etapie i zarezerwuj ostatnie 5–7 sekund na jasne wezwanie do działania w tym miejscu. Wspomnij o wszelkich wymaganych zasobach (logo, tekstury, wizualizacje olejków) i o tym, gdzie pojawiają się w przepływie podczas sekwencji.
    6. Przykładowy prompt (jednoliniowy szablon): Stwórz 60-sekundowy pionowy explainer dla zapracowanych profesjonalistów, który podkreśla jedną podstawową korzyść, używa spokojnego, pewnego głosu, zawiera pulę 5 ujęć produktu, w tym tekstury olejków, zawiera jedną kwestię dialogową w 0:20, płynnie streamuje bez przechyleń i kończy się bezpośrednim wezwaniem do działania, aby odwiedzić stronę; zapewnij watch-through ≥ 60% i CTR ≥ 1,8%, napędzając wzrost przychodów w następnym kwartale.

    Użyj tego podejścia, aby zablokować wizję przed napisaniem szkicu. Precyzyjny wynik wspiera efektywne planowanie, szybsze zatwierdzanie i mniej poprawek podczas przepływów pracy, używając jednego promptu jako gwiazdy polarnej dla całej produkcji.

    Oto jak iterować bez obaw: najpierw poznaj dokładny wynik, a następnie dopasuj do tego wyniku elementy wizualne, wybierając sceny, które wzmacniają obietnicę, jednocześnie unikając luk, które nudzą odbiorców. Wtedy plan staje się wykonalny, a nie spekulatywny, a droga od planowania do przychodów wydaje się naturalna, a nie wymuszona.

    Opisuj obiekty, akcje i ruchy kamery z precyzją

    Oznacz każdą linię krótkim prefiksem: Obiekt:, Akcja:, Kamera:. Pomaga to zarządzać promptami startowymi, utrzymuje powtarzalność pętli i sprawia, że odtwarzanie jest płynniejsze. Używaj strony czynnej, konkretnych rzeczowników i zwięzłego słownictwa. Zajmij się kontrastem między światłem otoczenia a głębokimi cieniami; powiąż oświetlenie, nastrój i przestrzeń z obserwowalnymi detalami, takimi jak światło otoczenia, blask okna i głębokie cienie, aby ustawić moment. Prefiks kieruje strukturą i przyspiesza iterację.

    Szczegóły dotyczące obiektu oddają tożsamość i kontekst. Uwzględnij wygląd, strój, wiek lub etap życia, postawę, emocje i otoczenie. Przykład: Obiekt: dorianiński rzemieślnik wchodzący w kadr w znoszonej skórze, 1,8 m wzrostu, spokojny wyraz twarzy, pośrednie światło okna, drobne pyłki kurzu; życie widoczne w dłoniach; strefy narzędzi rozłożone na ławce; konfiguracja sygnalizuje intencję, tworząc praktyczną scenę.

    Szczegóły akcji określają, co się dzieje, jak i jak długo. Wymień dokładne gesty, tempo i kolejność. Przykład: Akcja: odwraca się twarzą do kamery, podnosi narzędzie i rozpoczyna czynność związaną z uprawą roli; zaczynając od sekwencji 3-bitowej; bonusy, takie jak mikro-gesty, pogłębiają realizm; dłonie odgrywają subtelny rytm nad pracą; prędkość pozostaje stała; z każdym ruchem unosi się kropla kurzu; jeśli jesteś nowy, uruchom krótką pętlę 3-bitową lub dwie, aby ćwiczyć; jeśli czujesz się dobrze w tym tempie, rozszerz na cztery bity podczas kolejnych uruchomień; budujesz przebiegi ruchu od podstawy.

    Ruch kamery definiuje ścieżkę, kadrowanie i odczucia. Opisz pozycję, rodzaj ruchu, prędkość i wszelkie obiektywy lub efekty. Przykład: Kamera: zaczyna się na poziomie kolan, podąża wzdłuż półki w kierunku obiektu, mija okno, a następnie przechyla się do poziomu oczu; czas trwania 6–8 sekund; obiektyw 35 mm; pośrednie cienie pogłębiają się w głębokie tony; ruch przeciwny utrzymuje obiekt wyśrodkowany w granicach, aby uzyskać ujęcia wyższego poziomu; Subtelne poprawki kolorów i efekty kwitnienia podnoszą wygląd; ujęcie z lotu ptaka ujawnia szczegóły w oczach.

    Konkretny szablon promptu

    Obiekt: [opis] Akcja: [sekwencja i zachowanie] Kamera: [ścieżka i ustawienia]. Przykład: Obiekt: dorianiński rzemieślnik wchodzący w kadr w znoszonej skórze, 1,8 m wzrostu, spokojny wyraz twarzy, pośrednie światło okna, życie w dłoniach; strefy narzędzi rozmieszczone; Akcja: odwraca się twarzą do kamery, podnosi narzędzie i rozpoczyna czynność związaną z uprawą roli; zaczynając od sekwencji 3-bitowej; bonusy, takie jak mikro-gesty, tworzą poczucie życia; dłonie odgrywają rytmiczny ruch; przy każdym ruchu pojawia się kropla kurzu; przebiegi ruchu można wydłużyć; Kamera: zaczyna się na poziomie kolan, podąża wzdłuż półki w kierunku obiektu, mija okno i przechyla się do poziomu oczu; czas trwania 6–8 sekund; obiektyw 35 mm; pośrednie cienie pogłębiają się w głębokie tony; ruch przeciwny utrzymuje obiekt wyśrodkowany w granicach; kadrowanie wyższego poziomu z bliskim okiem z lotu ptaka na twarz.

    Ustaw kontekst sceny, oświetlenie i wskazówki dźwiękowe dla promptów VEO-3

    Zdefiniuj scenę w jednym precyzyjnym zdaniu i zablokuj ją jako kotwicę dla promptów VEO-3. To zdanie powinno określać scenerię, nastrój i główną akcję, aby kierować każdym renderowaniem.

    Wybierz lokalizację i ramy czasowe, które pasują do Twoich celów materiałowych: publiczne lub prywatne, wewnątrz lub na zewnątrz oraz dzienne tempo. W kontekstach rolniczych odwołuj się do tekstur, takich jak zakurzone maszyny, wiatr na łodydze lub stragan na targu. Uchwyć fragment chwili: robotnik podnoszący wiadro, kamera w telefonie łapiąca światło. Użyj tych szczegółów, aby zachować wizualną spójność między ujęciami. Użyj pojedynczego opisu okresu, takiego jak światło świtu nad małą farmą, aby zakotwiczyć elementy wizualne.

    Zaprojektuj oświetlenie za pomocą elementów praktycznych i trójpunktowej konfiguracji. Ustaw światło kluczowe pod kątem 45 stopni, wypełnienie naprzeciwko i podświetlenie, aby oddzielić obiekty. Użyj wysokich statywów, aby utrzymać światła powyżej poziomu oczu i stworzyć odpowiednią wysokość nad głową. Skalibruj temperaturę barwową: 3200 K dla ciepłych scen lub 5600 K dla światła dziennego. Dodaj praktyczne źródło światła, aby podkreślić teksturę. Kontroluj światła, aby zachować szczegóły w jasnych obszarach, dążąc do doskonałej równowagi w scenach.

    Zaplanuj wskazówki dźwiękowe jako część promptu: dźwięk otoczenia, odległy ruch uliczny, wiatr; subtelne Foley dla ruchu; krótkie zdanie narracji, aby zakotwiczyć intencję. Określ, czy dźwięk jest pierwszoplanowy, czy tło, i jego znaczenie. Dołącz wskazówkę dotyczącą dziennego tempa, jeśli scena się powtarza, i zanotuj szczegóły mikrofonu dla przechwytywania telefonu, aby zminimalizować hałas. Te wskazówki pomagają w zapamiętywaniu, czyniąc sceny namacalnymi, nawet gdy elementy wizualne są lekkie.

    Używaj aktywnych czasowników na początku promptów i utrzymuj zwięzłość zdań. Strukturuj prompty zgodnie z jasnym wzorem podmiot-czynność-przedmiot: "Rolnik ogląda żniwa o świcie, światło słoneczne odbija się na metalu, telefon rejestruje ten moment." Używaj czasowników, aby napędzać ruch: zbliżać się, zaciskać, ujawniać, porównywać. Zachowaj intencję, wymieniając istotne szczegóły we fragmencie lub krótkim członie. Uwzględnij praktyczne ograniczenia, takie jak rozmiar kadru, proporcje i czas trwania, aby zmniejszyć zgadywanie.

    Testuj prompty w oparciu o renderowanie odniesienia i codziennie monitoruj zapamiętywanie. Zauważ, które wskazówki dotyczące oświetlenia lub wskazówki dźwiękowe napędzają zaangażowanie, a następnie dostosuj prompty. Iteruj ponownie z dopracowanymi wskazówkami, aby osiągnąć nowy poziom; to podejście wspiera gwarantowaną spójność między sesjami i osiągnąłeś okres, w którym wyniki wydają się wiarygodne i ogromne.

    Przykładowe prompty dla VEO-3:

    "Rolnik w publicznej scenerii rolniczej o świcie, telefon trzymany wysoko, aby oprawić twarz, ciepłe światło kluczowe pod kątem 45 stopni, miękkie wypełnienie, podświetlenie; wiatr otoczenia i odległe ptaki; fragment codziennej rutyny."

    "Robotnik układa skrzynie w pobliżu wysokiego stosu, deszcz na metalu, praktyczna lampa przy 3200 K zapewnia nastrój; zbliżenie na dłonie trzymające skrzynię; dźwięk z telefonu rejestruje oddech i kroki."

    Trzy gotowe do użycia prompty dla scenariuszy VEO-3

    ScenariuszPromptNotatki

    Premiera produktu dla tabletów

    Prompt 1: Dla VEO-3, wygeneruj 60-sekundowe demo produktu na tablet, które podkreśla główne funkcje w czystej konfiguracji biurka, takie jak jakość wyświetlania, żywotność baterii i wydajność aplikacji. Delikatnie poprowadź widzów przez te aspekty. Użyj inspirowanej narracji, z widocznymi na ekranie objaśnieniami i podstawami dla elementów interfejsu użytkownika. Pokaż dłonie wchodzące w interakcje z tabletem, subtelną wskazówkę brwi i lekki uśmieszek, aby przekazać pewność siebie. Zbuduj sekwencję drzewną: wprowadzenie, funkcje, scenariusze użycia i wezwanie do działania. Uwzględnij ruchy w dół i obroty między ujęciami i utrzymuj wysoką jakość generowania dzięki oczyszczonemu dźwiękowi i dołączonym nakładkom dla list specyfikacji. Ustal priorytet jasnego przekazu dla graczy i użytkowników ogólnych; użyj wysokiej jakości, łatwo przyswajalnych elementów wizualnych; uwzględnij ujęcia rozszerzeń, aby zilustrować ulepszenia. Nie zezwalaj na pominięte klatki; szanuj limity czasu trwania, utrzymując w ten sposób szybkie tempo, chociaż przekaz pozostaje zwięzły. Uwzględnij filmy i tablety w sposób naturalny.

    Wskazówka: Użyj czystej, o wysokim kontraście nakładki interfejsu użytkownika i utrzymuj stałe tempo, aby uniknąć przeciążenia.

    Samouczek wprowadzający

    Prompt 2: Dla VEO-3, stwórz 45-sekundowy samouczek wprowadzający, który poprowadzi nowych użytkowników przez logowanie, uprawnienia i pierwsze zadanie. Używaj wyraźnych, kontrastowych elementów wizualnych interfejsu użytkownika i zwięzłych objaśnień krok po kroku; priorytetem jest czytelność i ton o wysokiej jasności. Pokaż drzewo kroków z przejściami w dół i obrotami między ekranami; uwzględnij mały gest brwi i lekki uśmieszek, aby subtelnie zwiększyć zaufanie. Uwzględnij notatki generowania i dołączony panel z poradami; podkreśl możliwości dostosowania dla graczy i osób niebędących graczami, choć trzymaj się 45 sekund i unikaj zatłoczenia. Użyj oczyszczonego dźwięku i łatwo zrozumiałego języka; dzięki temu użytkownicy czują się pewnie, kończąc konfigurację.

    Uwaga: Utrzymuj ponumerowanie kroków i podawaj opcjonalne porady dla zaawansowanych użytkowników.

    UGC/promocja dla graczy

    Prompt 3: Dla VEO-3, wygeneruj 30-sekundowy, szybki film promocyjny skierowany do graczy z treściami generowanymi przez użytkowników. Użyj naturalnego środowiska na tablecie i podkreśl zyski wydajności poprzez rozszerzenia i wizualizacje wyższego poziomu. Pokaż trzy szybkie sceny: rozpakowywanie na tabletach, przechwytywanie w grze i reakcja. Użyj obrotów między scenami i przejść w dół, aby utrzymać tempo; uwzględnij zaczep o strukturze drzewa i lekki ruch brwi z uśmieszkiem, aby przekazać autentyczność. Uwzględnij dołączone nakładki i podkreśl możliwości udostępniania wyników przez twórców. Utrzymuj czysty dźwięk, inspirowany i przyjazny ton; łatwo udostępniany i nie pomijaj klatek; celuj w wysoką energię i rzeczywiste odczucia.

    Wskazówka: Zakończ mocnym wezwaniem do działania i podpisami społecznościowymi do szybkiego publikowania.

    Testuj prompty i iteruj na podstawie na bieżących informacji zwrotnych

    Zacznij od napiętego podstawowego promptu i opublikuj szybki klip testowy; zbieraj bieżące informacje zwrotne w czasie rzeczywistym i odpowiednio dostosuj następny prompt. Śledź sygnały, które napędzają zwrot: jasność opowiadania historii, tempo i to, czy zaangażowanie spada, czy utrzymuje się na stałym poziomie, głównie o tym, co widzowie faktycznie chcą zobaczyć. Te bieżące dane zapewniają namacalny sygnał, na który możesz działać w ciągu kilku godzin.

    Ustaw zasadę: zmieniaj jedną zmienną naraz – linię otwierającą, tempo, oświetlenie lub kompozycję ujęcia – a następnie ponownie przetestuj i porównaj wyniki, aby wyizolować wpływ. Zainspirowany wczesnymi reakcjami, utrzymuj resztę stałą, aby zobaczyć, co naprawdę porusza metrykami.

    Nie czekaj na doskonałe dane; zaplanuj osiem ukierunkowanych iteracji na scenę, aby mapować końce i to, co wydaje się podnosić metryki. Zapisz, który haczyk, jaki kąt głowy lub która linia spowodowały wzrost i prowadź prosty dziennik: która wersja wygrała, dlaczego i co ponownie wykorzystać.

    Nocne testy potwierdzają nastrój i kontrast; trzymaj się z dala od rozproszeń i upewnij się, że kadrowanie jest bezpieczne dla widowni dziecięcej, zmniejszając obawy. Jeśli linia wydaje się banalna, odrzuć ją i spróbuj ostrzejszej alternatywy. Dreszczyk emocji związany z reakcjami widzów prowadzi Cię do tego, co widzowie faktycznie chcą zobaczyć, czyniąc proces ostrzejszym i bardziej ludzkim. Prompt musi być jasny dla zespołu.

    Podejścia do skalowania: użyj podstawowego szkieletu promptu i dostosuj kontekst do każdego tematu; wybór trzech kątów i trzech zakończeń pozwala szybko porównać. Zapytaj zespół, który haczyk pasuje publiczności , jaka linia otwierająca prowadzi do końców, które chcesz, aby się pojawiły. Lepszy wariant pojawi się w danych w ciągu ośmiu serii badań i możesz zastosować zwycięski wzorzec w przyszłych filmach. Nie zwykłe zgadywanie, ta metoda wykorzystuje precyzyjny gradient metryk do kierowania zmianami. Jeśli zmiana niczego nie zmieniła, cofnij i spróbuj innego elementu; utrzymuj głowę skryptu w jednej linii z wybranym zakończeniem, aby zachować spójność.

    Unikaj typowych błędów podczas tworzenia promptów VEO-3

    Zdefiniuj pojedynczy wynik wizualny, jeden segment odbiorców i jedno środowisko na prompt, a następnie uruchom grupę trzech promptów, aby porównać wyniki. Śledź liczby, takie jak współczynnik ukończenia i średni czas oglądania, aby ocenić rentowność wygenerowanych filmów; testuj na tabletach i telefonach, aby upewnić się, że wygląd jest spójny. Przejrzyj wcześniej wygenerowane prompty, aby uniknąć powtarzania błędów.

    Unikaj mieszania celów w jednym prompcie. Jeśli chcesz uzyskać nastrój przyjazny dla dzieci i sekwencję o tematyce potworów, podziel je na odrębne prompty, aby system mógł zoptymalizować ton i kolor bez wzajemnego zanieczyszczenia. Pozostają na celu i zmniejszają dryf.

    Burza mózgów z myślą o odbiorcach wyostrza koncentrację. Zbierz 5–7 pomysłów, wybierając najsilniejsze, i dopasuj je do wyborów środowiska i elementów wizualnych. To utrzymuje odrębność twórczą i zgodność z najnowszymi trendami, jednocześnie redukując szumy. Pomagają również budować prompty, które zachowują intencję i wygląd.

    Dyscyplina promptingu dla wyraźnych wyników

    Strukturuj prompty z trzema blokami: podstawowy pomysł, ograniczenia i materiał do dostarczenia. Jasny podstawowy pomysł napędza spójność, ograniczenia blokują format w węzeł oczekiwań, a materiał do dostarczenia określa długość, proporcje i formę wyjściową. Na promptach nazywaj prompty tak, aby odzwierciedlały główny cel, a nie metodę.

    Bądź wyraźny co do ograniczeń, aby generator mógł zrealizować wizję. Na przykład określ 45-sekundowy czas działania, proporcje 16:9, ciepły głos lektora i paletę wizualną, która preferuje kolory o wysokim kontraście. Ta praktyka zmniejsza powtarzalne prompty i zbliża Cię do opłacalnego wyniku.

    Uczyń testowanie wykonalnym

    Ustaw cykl testowy od 2 do 3 promptów, a następnie porównaj wyniki z bazą. Wybierz dwóch najlepszych wykonawców i iteruj, dostosowując jedną zmienną na raz – ton, tempo, środowisko lub kąt odbiorców – aby wyizolować wpływ. To zdyscyplinowane podejście przekształca liczby w jasne wskazówki, jak dążyć do najnowszych pomysłów.

    Powiązane Artykuły

    Ready to leverage AI for your business?

    Book a free strategy call — no strings attached.

    Get a Free Consultation