AI EngineeringSeptember 10, 202513 min read
    SC
    Sarah Chen

    Veo 3 में परफेक्ट साउंड का रहस्य - सफल प्रॉम्प्ट्स और सामान्य त्रुटियाँ

    Veo 3 में परफेक्ट साउंड का रहस्य - सफल प्रॉम्प्ट्स और सामान्य त्रुटियाँ

    The Secret to Perfect Sound in Veo 3: Successful Prompts and Common Errors

    सिफारिश: प्रॉम्प्ट लिखें जो लक्ष्य ध्वनियों और दृश्य सेटअप को स्पष्ट रूप से नाम दें। कमरे के आकार, माइक्रोफोन की दूरी, और वांछित संतुलन को छोटे वाक्यों में बताएं। Veo 3 के लिए, प्रॉम्प्ट का हिस्सा होने के रूप में दृश्य संकेतों और ध्वनियों का अनुरोध करें, फिर एक छोटे दृश्य के साथ परीक्षण करें ताकि यह पुष्टि हो सके कि सिस्टम उन्हें सही ढंग से व्याख्या करता है। प्रॉम्प्ट को अंग्रेजी में उपयोग करें ताकि पार्सिंग सुसंगत रहे, और एक सरल निर्देश शामिल करें जैसे "जब आप प्ले दबाते हैं, तो दृश्य शुरू होता है" ताकि पुनरावृत्ति परीक्षण के दौरान उत्पन्न करने को पूर्वानुमानित परिणामों की ओर निर्देशित किया जा सके। उस लाइन पर काम करें ताकि परिणाम में विश्वसनीयता सुनिश्चित हो; प्रॉम्प्ट को मॉडल को निर्देशित करने और विचलन को रोकने के लिए पर्याप्त रखें।

    अस्पष्ट विशेषणों से बचें और ठोस लक्ष्यों पर निर्भर रहें। निर्दिष्ट करें: दूरी 0.5 मीटर, कमरे का आकार 4x5 मीटर, रिवर्ब 0.2 सेकंड, और गेन -12 डीबी। यदि आउटपुट विचलित होता है, तो प्रॉम्प्ट को समायोजित करें और एक त्वरित परीक्षण चलाएं, फिर दृश्य में होने वाली चीजों को सुनें। शांतिपूर्वक पैरामीटर्स को ट्वीक करें, और हार्डवेयर नोट्स जैसे जंग लगे कनेक्टर की जांच करें जो सिग्नल को रंग देते हैं। भाषा को संक्षिप्त, स्पष्ट और कार्यान्वयन योग्य रखें।

    आप अनुकूलित कर सकते हैं ठोस प्रॉम्प्ट बीज: "एक बच्चा छोटे कमरे में ब्लॉक्स के साथ खेल रहा है, कैमरा छाती की ऊंचाई पर, दृश्य फोकस बच्चे पर, लकड़ी के ब्लॉक्स की ध्वनियां, हवा में एक जादुई शांति, पृष्ठभूमि में गोरिल्ला की मूर्ति दिखाई दे रही है।" जॉन ने प्रॉम्प्ट को पुनरुत्पादनीय रखने का सुझाव दिया, इसलिए एक चल रहे नियम को शामिल करें कि दृश्य बच्चे के साथ शुरू होता है, फिर गोरिल्ला दिखाई देता है। प्रगति को संरचित करने के लिए उस और फिर का उपयोग करें।

    एक कॉम्पैक्ट प्रॉम्प्ट लाइब्रेरी बनाएं: बच्चे के साथ बेस परिदृश्य, फिर छोटे चरणों में विवरण जोड़ें जो दृश्य संकेत, ध्वनियां, और कमरे की एम्बिएंस जोड़ते हैं। जब आप एक स्थिर बेसलाइन तक पहुंच जाते हैं, तो विविधताएं जोड़ें (गोरिल्ला मौजूद, जंग लगा माइक स्टेटस) और परीक्षण करें जब तक आउटपुट आपके लक्ष्य से मेल नहीं खाता। अंग्रेजी संदर्भ में सुसंगतता बनाए रखें; विचलन को कम करने के लिए भाषा को अंग्रेजी में रखें।

    VEO3 प्रॉम्प्ट्स में ऑडियो पैरामीटर्स निर्दिष्ट करें (सैंपल रेट, बिटरेट, चैनल्स, फॉर्मेट)

    सिफारिश: सैंपल_रेट को 48000 Hz, बिटरेट को 256 kbps, चैनल्स को 2, और फॉर्मेट को AAC पर सेट करें; यह दृश्यों में स्पष्ट रूप से गाने वाली जीवंत ध्वनि उत्पन्न करता है और दोनों आवाज और संक्षिप्त संगीत संकेतों का समर्थन करता है।

    जरूरी यह है कि प्रॉम्प्ट में ऑडियो_पैरामीटर्स को सटीक मूल्यों के साथ निर्दिष्ट करें: सैंपल_रेट=48000, बिटरेट=256k, चैनल्स=2, फॉर्मेट=AAC। सरल शब्दों में, योजना इन चार लीवर्स को लॉक करने की है ताकि उत्पन्न ऑडियो दृश्य संदर्भ से मेल खाए। वे जल्दी और सुसंगत रूप से प्रतिक्रिया देते हैं, इसलिए आप बात करने और गाने के स्वरों को नियंत्रित कर सकते हैं; पृष्ठभूमि कम हस्तक्षेपपूर्ण हो जाती है और लंबे टेक साफ रहते हैं जबकि नर्सरी की आवाजें जीवंत महसूस होती हैं। आर्काइव गुणवत्ता के लिए, WAV 16-बिट 44.1k चुनें; स्ट्रीमिंग के लिए, MP3/AAC 128-256k गुणवत्ता और आकार को संतुलित करता है। देखें कि ध्वनि आपके मिक्स में ऑफिस डेस्क से लिविंग रूम तक कैसे बैठती है, और आप प्रभाव को तुरंत सुनेंगे।

    दूसरे स्तर की मार्गदर्शन अभ्यास को मजबूत करता है: जब आपको स्टीरियो इमेज की आवश्यकता हो तो चैनल्स को 2 पर सेट करें और एकल आवाज पर फोकस के लिए 1। यह महसूस को सरल लेकिन शक्तिशाली रखता है, विशेष रूप से जब बात करना या गाना लय या एम्बिएंस के साथ बैठता है। अक्सर, बिटरेट या सैंपल_रेट में छोटा ट्वीक कथित लाउडनेस और स्पष्टता को बदल देता है, इसलिए जल्दी परीक्षण करें और पुनरावृत्ति करें। मुख्य लक्ष्य (मुख्य) दृश्यों में पूर्वानुमानित व्यवहार है: सुसंगत स्वर, न्यूनतम पृष्ठभूमि शोर, और दृश्य और ऑडियो ट्रैक्स में स्थिर उत्पन्न करने की तलाश करें।

    व्यावहारिक प्रॉम्प्ट और त्वरित प्रीसेट

    मूल्यों को लॉक करने के लिए अपने प्रॉम्प्ट्स में संक्षिप्त स्ट्रिंग्स का उपयोग करें: ऑडियो_पैरामीटर्स: सैंपल_रेट=48000; बिटरेट=256k; चैनल्स=2; फॉर्मेट=AAC। यह सरल दृष्टिकोण आपको दृश्य योजना के साथ संरेखित रखता है, और प्रॉम्प्ट ऑफिस से नर्सरी टेक तक परिवर्तनों के लिए जल्दी प्रतिक्रिया देते हैं। वे एक जीवंत महसूस (जीवंत) देते हैं और अधिकांश प्लेयर्स के लिए तैयार संगतता, इसलिए आप कॉन्फ़िगरेशन का पीछा करने के बजाय दृश्यों में होने वाली चीजों पर फोकस कर सकते हैं। जो आप देखते हैं वही आप सुनते हैं–जोर से और स्पष्ट रूप से गाता है, क्रिया और ध्वनि की स्थिर सेकंड-दर-सेकंड संरेखण के साथ, और हर ऐसे दृश्य संकेत के मूड से मेल खाने वाला लुक।

    आप कॉपी कर सकते हैं कॉम्पैक्ट प्रॉम्प्ट्स के उदाहरण:

    - प्रॉम्प्ट: generate_audio content="dialogue and ambience"; ऑडियो_पैरामीटर्स: सैंपल_रेट=48000; बिटरेट=256k; चैनल्स=2; फॉर्मेट=AAC;

    - प्रॉम्प्ट: create_narration with_singing; ऑडियो_पैरामीटर्स: सैंपल_रेट=44100; बिटरेट=192k; चैनल्स=2; फॉर्मेट=MP3। ये सेटिंग्स यह सुनिश्चित करती हैं कि बातचीत और संगीत प्राकृतिक महसूस करें, पुनरुत्पादित करने में सरल, और भविष्य की पीढ़ियों (उत्पन्न करने) के लिए ट्वीक करने में आसान के लिए दृश्यों के, इसलिए आप एक ही संरचना को बार-बार पुन: उपयोग कर सकते हैं।

    प्रॉम्प्ट्स को संरचित करें ताकि नॉइज रिडक्शन, इको कैंसलेशन, और गेन सेट हो

    सिफारिश: एकल, संरचित प्रॉम्प्ट का उपयोग करें ताकि नॉइज रिडक्शन: हाई; इको कैंसलेशन: ऑन; गेन: +6dB लॉक हो। एक सेल्फी-स्टाइल सेटअप में "हैलो, ब्लॉगर" जैसे मैत्रीपूर्ण संकेत से शुरू करें ताकि स्वर और फ्रेमिंग को दृश्य के लिए निर्देशित किया जा सके।

    टेम्पलेट प्रॉम्प्ट संरचना: पहले तीन नियंत्रण प्रदान करें, फिर दृश्य संकेत जोड़ें। उदाहरण: "नॉइज रिडक्शन सेट करें: हाई; इको कैंसलेशन: ऑन; गेन: +6dB। शॉट: एकल; स्थिर; मंद; फ्रेम्ड; दिन; खिड़कियां; दर्शक भावनात्मक दृश्य बताते हैं; पुरुष।" लगातार प्रॉम्प्ट्स को अलग करने और संक्रमणों को सुचारू रखने के लिए बीच प्रॉम्प्ट्स का उपयोग करें।

    पर्यावरण नोट्स: लकड़ी की दीवारें प्रतिबिंबों को नरम करती हैं; धातु की सतहें मजबूत इको बनाती हैं। जब कमरा लकड़ी का हो, तो नॉइज रिडक्शन को मीडियम और गेन को +4dB पर सेट करें; जब स्थान धातु का हो, तो नॉइज रिडक्शन हाई रखें, इको कैंसलेशन ऑन, और उपस्थिति बनाए रखने के लिए गेन को +5dB तक बढ़ाएं।

    सुसंगतता सुनिश्चित करने के लिए, वाक्यों को संक्षिप्त और सक्रिय रखें। प्रॉम्प्ट लिखें जिसमें स्पष्ट विषय, वर्तमान काल की क्रियाएं, और ठोस लक्ष्य हों। क्षण को एंकर करने के लिए यहां शामिल करें, और जब दृश्य बीट्स के बीच शिफ्ट होता है तो प्रॉम्प्ट्स को अलग करने के लिए बीच शब्द का उपयोग करें।

    सामान्य त्रुटियां और सुधार: नियंत्रणों की गलत क्रमबद्धता, विरोधाभासी मूल्य, या गेन सेटिंग्स को छोड़ने से बचें। प्रत्येक शॉट के बाद, एक त्वरित जांच चलाएं ताकि ध्वनि दर्शक अपेक्षाओं से संरेखित हो; यदि स्वर धातु या लकड़ी के प्रतिबिंबों की ओर शिफ्ट होता है तो समायोजित करें, और प्रॉम्प्ट्स के प्रवाह को बीट्स के बीच सुचारू रखें।

    सामान्य प्रॉम्प्ट गड्ढों से बचें: अस्पष्टता, इकाइयां, मेटाडेटा

    सिफारिश: हर प्रॉम्प्ट को ठोस मेट्रिक्स से एंकर करें। Veo 3 प्रॉम्प्ट्स में, अवधि को ठीक 12 सेकंड लॉक करें, सैंपलरेट को 48000 Hz पर सेट करें, और चैनल्स को 2 (स्टीरियो) घोषित करें। एक संरचित मेटाडेटा ब्लॉक संलग्न करें: दृश्य="टोक्यो सवन", क्रिया="गाता है", भाषा="en", और -14 LUFS जैसा लाउडनेस लक्ष्य। यदि आवश्यक हो तो निर्दिष्ट करें कि सबटाइटल्स ऑडियो के साथ हों। यह काम को पूर्वानुमानित रखता है और संपादकों और कहानी के पाठकों के लिए सेकंड-दर-सेकंड संरेखण को आसान बनाता है।

    अस्पष्टता तब उभरती है जब क्रियाओं में संख्याएं या लक्ष्य न हों। मूल्य के बिना अस्पष्ट वाक्यों जैसे "बास को बूस्ट करें" या "स्पष्टता बढ़ाएं" से बचें। निर्दिष्ट करें कि क्या बदलता है और कितना: 1 kHz पर गेन को 3 dB बढ़ाएं, या 50 ms अटैक के साथ 2:1 अनुपात पर कंप्रेस करें। परिणाम को इच्छित मूड और गति से मेल खाने के लिए स्वर को संख्यात्मक लक्ष्य से बांधें (उदाहरण के लिए, "एकीकृत -14 LUFS प्राप्त करें") न कि किसी के अनुमान से। यदि आप एक दृश्य का संदर्भ देते हैं, तो संकेत को क्रिया शब्दों में वर्णन करें–आप क्या लक्ष्य कर रहे हैं, आप क्या सुनते हैं, और क्या छोड़ना है–ताकि दृश्य सुसंगत और विश्वसनीय रहें।

    इकाइयां मायने रखती हैं। हर माप के साथ इकाइयां संलग्न करें: सेकंड, Hz, dB, LUFS, और सैंपल। "लेवल को बूस्ट करें" कहने के बजाय, "2 kHz पर लेवल को 3 dB बढ़ाएं 60 ms रिलीज के साथ" कहें। समय के लिए, सेकंड या फ्रेम में अवधि निर्दिष्ट करें, अस्पष्ट लंबाई नहीं। जब आप लेयरिंग का उल्लेख करते हैं, तो निर्दिष्ट करें कि लेयर्स कैसे इंटरैक्ट करती हैं (जैसे, लेयर 1 = आवाज, लेयर 2 = ड्रम्स, लेयर 3 = एम्बिएंस) ताकि मिक्सर सटीक रूप से संतुलित कर सके। यह अनुशासन ट्रैक के विशाल टाइमलाइन में विचलन को रोकता है और इच्छित शैली को संरक्षित करता है।

    मेटाडेटा स्वचालित रूटिंग और सटीक सबटाइटल्स को सक्षम करने वाला संदर्भ प्रदान करता है। एक कॉम्पैक्ट पेलोड शामिल करें जो दृश्य, क्रिया, मौसम/आवाज स्थिति, और आउटपुट इच्छाओं का वर्णन करता हो। उदाहरण: दृश्य="टोक्यो डस्क", मौसमयुक्त="ट्रू", क्रिया="गाता है", भाषा="en", अवधि=12, सैंपलरेट=48000, चैनल्स=2, सबटाइटल्स=ट्रू, टैग्स=["ऑडियो","सबटाइटल्स","संगीत"])। एक लेयर दृष्टिकोण (लेयर संरचना) आपको प्रॉम्प्ट्स को जटिल बनाए बिना गहराई और गतिशीलता को नियंत्रित करने में मदद करता है। प्रत्येक फील्ड के लिए स्पष्ट लक्ष्य सेट करें ताकि डाउनस्ट्रीम इंजन इरादे को आपके तरीके से व्याख्या करें।

    टिप: प्रॉम्प्ट को संक्षिप्त लेकिन सटीक रखें, और स्केल करने से पहले छोटे स्लाइस के साथ परीक्षण करें। यदि एक प्रॉम्प्ट "विशाल" और अनिश्चित महसूस होता है, तो एकल दृश्य पर ट्रिम करें, आउटपुट सत्यापित करें, फिर विस्तार करें। यह सफलता को उच्च रखता है और प्रॉम्प्ट्स को आपकी सटीक आवश्यकताओं के अनुरूप बनाता है, सामान्य अपेक्षाओं के नहीं। एक संक्षिप्त चेकलिस्ट का उपयोग करें: अवधि, इकाइयां, और मेटाडेटा निर्दिष्ट करें; दृश्य और क्रिया परिभाषित करें; लाउडनेस लक्ष्य सेट करें; केवल यदि आवश्यक हो तो सबटाइटल्स सक्षम करें।

    VEO3 के लिए पुन: उपयोग योग्य प्रॉम्प्ट लाइब्रेरी बनाएं

    प्रॉम्प्ट्स को वर्शनयुक्त लाइब्रेरी में केंद्रीकृत करें और स्पष्ट टैग्स के साथ पुन: उपयोग योग्य ब्लॉक्स लागू करें। यह एकल सत्य का स्रोत उत्पादन को तेज करता है, स्वर विचलन को कम करता है, और वीडियो में स्केल करने को आसान बनाता है।

    ब्लॉक्स को संरचित करें: प्रॉम्प्ट टेक्स्ट, डिफ़ॉल्ट पैरामीटर्स, लागू उपयोग-केस, और एक छोटा सेट ऑफ वेरिएंट्स। प्रत्येक उपयोग-केस के लिए एक बेस ब्लॉक और कम से कम दो वेरिएंट्स शामिल करें: सेल्फी-स्टाइल, क्लोज-अप, और वाइड शॉट। स्थान, स्वर, और तकनीकी संकेतों द्वारा टैग करें: थ्रू, फ्लक्स, रोटरी, और ध्वनियां। हमेशा दृश्यमान विशेषताएं शामिल करें: आंखें (आंखें) दृश्यमान, मुस्कान, और रोटरी लेंस के माध्यम से समायोजित करने का विकल्प। दूर के दृश्यों के लिए, फ्रेमिंग को संकेत देने के लिए दूर का संदर्भ दें। प्रॉम्प्ट भाषा में, संपादकों और ऑपरेटरों को चुनने और अनुकूलित करने में मार्गदर्शन करने के लिए अनुरोध और उदाहरण शामिल करें। सुरक्षा नियमों का उल्लंघन करने वाले प्रॉम्प्ट्स से बचें (नहीं)।

    लाइब्रेरी को हल्का लेकिन अभिव्यंजक रखें: प्रत्येक प्रविष्टि को स्वतंत्र रूप से खड़ा होना चाहिए, वेरिएंट्स के बीच क्या बदलता है और यह स्वर और टेम्पो को कैसे प्रभावित करता है के बारे में संक्षिप्त नोट्स के साथ। बहुभाषी टीमों का समर्थन करने के लिए जहां उपयोगी हो वहां अंग्रेजी और सिरिलिक एंकर दोनों का उपयोग करें (प्रॉम्प्टा, प्रॉम्ट, उदाहरण)। यह दृष्टिकोण आपको विभिन्न स्थानों, ध्वनियों, और दृश्य संकेतों के साथ लचीली प्रयोग करने की अनुमति देते हुए सुसंगत स्वर उत्पन्न करने देता है।

    डिज़ाइन द्वारा शासन का उपयोग करें: मालिक नियुक्त करें, संस्करण ट्रैक करें, और परिवर्तनों के लिए तर्क दस्तावेज़ीकरण करें। त्वरित A/B जांच के लिए टेस्ट प्रॉम्प्ट्स बनाएं और जुड़ाव, स्पष्टता, और कथित गुणवत्ता पर मेट्रिक्स एकत्र करें। लक्ष्य प्रॉम्प्ट्स को एक अनुमान खेल नहीं बल्कि दोहराने योग्य संपत्ति बनाना है, इसलिए टीमें देखें कि क्या काम करता है और क्यों, अगले समायोजन के लिए स्पष्ट संकेतों के साथ।

    आईडीउपयोग-केसवेरिएबल्सउदाहरण प्रॉम्प्ट
    P-01स्टूडियो में इंट्रो टॉकिंग-हेडस्वर: गर्म, स्थान: स्टूडियो, शैली: सेल्फी-स्टाइल, लेंस: रोटरी, फ्लक्स: मीडियम, आंखें: दृश्यमान, मुस्कानएक गर्म स्वर के साथ सेल्फी-स्टाइल इंट्रो उत्पन्न करें, स्टूडियो बैकड्रॉप, आंखें दृश्यमान (आंखें), एक चमकदार मुस्कान, और शांत ध्वनियां। दृश्य के माध्यम से साफ, केंद्रित फ्रेम बनाए रखने के लिए मीडियम फ्लक्स के साथ रोटरी लेंस का उपयोग करें; अनुरोध संक्षिप्त और आकर्षक होना चाहिए।
    P-02आउटडोर ट्रैवल व्लॉगस्वर: साहसिक, स्थान: क्षितिज दूर, शैली: कैंडिड, लेंस: स्टैंडर्ड, फ्लक्स: लो, ध्वनियां: प्राकृतिकक्षितिज दृश्यमान के साथ दूर में एक कैंडिड, सेल्फी-स्टाइल ट्रैवल शॉट बनाएं। जिज्ञासा व्यक्त करने के लिए प्राकृतिक ध्वनि परिदृश्य, मध्यम गति, और एक सूक्ष्म मुस्कान बनाए रखें। दृश्य बदलते समय फ्रेम को स्थिर रखने के लिए रोटरी समायोजनों के माध्यम से।
    P-03ट्रांजिशन्स के साथ मोंटाजस्वर: गतिशील, स्थान: विविध, शैली: मिश्रित, फ्लक्स: वेरिएबलविभिन्न दृश्यों के माध्यम से संक्रमण करने वाली एक अनुक्रम असेंबल करें, स्वर और टेम्पो बदलते हुए। विभिन्न लुक्स उत्पन्न करने वाले प्रॉम्प्ट्स का उपयोग करें (उदाहरण) और सुनिश्चित करें कि प्रत्येक खंड दृश्यमान रहे, आंखें केंद्रित रहें और जहां उपयुक्त हो वहां नरम मुस्कान। रोटरी लेंस के माध्यम से, दृश्यों के माध्यम से सुचारू रूप से ड्रिफ्ट करें।
    P-04क्लोज-अप प्रोडक्ट शॉटस्वर: कुरकुरा, स्थान: स्टूडियो, शैली: सेल्फी-स्टाइल, लेंस: मैक्रो/रोटरी, फ्लक्स: लो, ध्वनियां: न्यूनतमकुरकुरे स्वर के साथ बनावट और रंग पर जोर देने वाला एक क्लोज-अप (प्रॉम्ट) उत्पादन करें। फ्रेम को आंखों और उत्पाद किनारे पर कसकर रखें, सुनिश्चित करें कि आंखें दृश्यमान रहें, और न्यूनतम ध्वनि पृष्ठभूमि का उपयोग करें। विवरणों को उभारने और स्थिर थ्रू-लाइन बनाए रखने के लिए रोटरी मैक्रो पास का उपयोग करें।

    VEO3 आउटपुट की व्याख्या करें और परिणामों के आधार पर प्रॉम्प्ट्स को परिष्कृत करें

    VEO3 आउटपुट को अलग करें जहां एम्बिएंट और डायलॉग संकेत टकराते हैं, फिर प्रॉम्प्ट्स को फिर से फ्रेम करें ताकि स्पष्ट लाइटिंग, गति, और चरित्र विवरणों की मांग की जा सके। एक पुरुष व्यक्ति को बैकपैक के साथ अंधेरे दृश्य के माध्यम से चलते हुए वर्णन करें, एक स्पष्ट प्रकाश स्रोत और जानबूझकर गति के साथ अभिनेता और सेटिंग दोनों को एंकर करने के लिए। निर्दिष्ट करें कि चरित्र क्या कहता है या प्रतिक्रिया देता है, और प्रमुख क्षणों के साथ सिंक में दिखने के लिए सबटाइटल्स (सबटाइटल्स) की आवश्यकता हो। वातावरण के लिए सटीक संकेतों का उपयोग करें, जैसे लाइटिंग एंगल्स, इकोइंग ध्वनियां, और हैलो या जोर से बात करने जैसे नोट्स का प्लेसमेंट, ताकि सिस्टम शुरू से ही इरादे से मेल खाए।

    VEO3 आउटपुट में क्या जांचें

    What to check in VEO3 output

    • डायलॉग का क्रिया के साथ संरेखण: सत्यापित करें कि हैलो या जोर से बात करने जैसे वाक्यांश इच्छित बीट्स (यहां, शुरूआत, दूसरा) पर होते हैं और कि इकोइंग या वातावरणीय ध्वनियां (इको, एम्बिएंट) क्षण का समर्थन करती हैं।
    • ध्वनि संकेत और भाषा टोकन: ध्वनि संकेतकों, ध्वनि संकेतों, और सबटाइटल्स (सबटाइटल्स) और बोली गई लाइनों के बीच किसी भी मिसमैच के लिए स्कैन करें; नोट करें जब ध्वनियां अस्पष्ट हों या एम्बिएंट शोर से डूब जाएं।
    • दृश्य एंकर: लाइटिंग गुणवत्ता (लाइटिंग, लाइट) और गति स्पष्टता का मूल्यांकन करें–चाहे हिलती हो, विषय की स्थिति, और बैकपैक या अन्य विशिष्ट प्रॉप्स की उपस्थिति।
    • पर्यावरण वर्णनकर्ता: अंधेरे स्थानों, पानी या बाढ़ वाले संदर्भों के संदर्भों को चिह्नित करें, और व्याख्या को शिफ्ट करने वाली किसी भी वातावरण (वातावरण) संकेत की।
    • चरित्र सुसंगतता: पुष्टि करें कि चरित्र पुरुष है, अकेले या दूसरों के साथ दिखाई देता है, और कि बैकस्टोरी संकेत (शुरूआत, कुछ, उनके) दृश्यों में सुसंगत रहें।

    ठोस उदाहरणों के साथ प्रॉम्प्ट्स को परिष्कृत करना

    Refining prompts with concrete examples

    • प्रॉम्प्ट वेरिएंट A: "एक पुरुष व्यक्ति बैकपैक के साथ अंधेरे कमरे के माध्यम से चल रहा है। उच्च कंट्रास्ट छायाएं बनाने के लिए एकल, केंद्रित प्रकाश स्रोत का उपयोग करें। एम्बिएंट ध्वनियां मौजूद हैं लेकिन अत्यधिक नहीं; दृश्य शांत शुरू होता है और फिर एक आवाज हैलो कहती है और दूसरे संकेत पर जोर से बात करती है। डायलॉग के साथ सिंक में सबटाइटल्स (सबटाइटल्स) शामिल करें; अत्यधिक इको से बचें। वातावरण तनावपूर्ण महसूस होना चाहिए, विषय आगे बढ़ने का संकेत देने वाली सूक्ष्म गति के साथ।"
    • प्रॉम्प्ट वेरिएंट B (बहुभाषी परीक्षण): "बाढ़ वाले गलियारे में, बैकपैक के साथ एक आकृति को चलते हुए दिखाएं; लाइटिंग मंद है और प्रकाश पानी पर खेलता है, प्रतिबिंब पैदा करता है। गति जानबूझकर महसूस होनी चाहिए, और सतह पर हिलती रोशनी। दूर के पदचिह्नों और कमरे के स्वर को प्रतिबिंबित करने वाले ध्वनि संकेत जोड़ें। हर बोली गई लाइन के लिए सबटाइटल्स (सबटाइटल्स) दिखाई दें, और हैलो शब्द को प्रारंभिक डायलॉग के लिए ट्रिगर के रूप में उपयोग करें।"
    • प्रॉम्प्ट वेरिएंट C (डायलॉग फोकस): "एक अकेले पुरुष को ऑफ-स्क्रीन संवाददाता से बोलते हुए वर्णन करें: हैलो, क्या आप मुझे सुन सकते हैं? कभी-कभी जोर से बात करता है, लेकिन ज्यादातर फुसफुसाता है। दृश्य में एक सेकंड का विराम, कुछ एम्बिएंट चैटर, और बड़े खाली स्थान में सूक्ष्म इको शामिल है। स्पीकर को पृष्ठभूमि से अलग करने के लिए स्पष्ट लाइटिंग का उपयोग करें, और सुनिश्चित करें कि सबटाइटल्स प्रत्येक वाक्य के साथ लाइन अप हों।"
    • प्रॉम्प्ट वेरिएंट D (त्रुटि-प्रूफिंग): "स्पष्ट विशेषताओं के साथ दृश्य को एंकर करें: चलना, गति, 20–30% पर लाइटिंग स्तर, अंधेरे आसपास, और दृश्यमान बैकपैक। यदि इको या पृष्ठभूमि रिवर्ब का संकेत देती है, तो सूखे कमरे की ध्वनिकी निर्दिष्ट करके इसे कम करने के लिए प्रॉम्प्ट को समायोजित करें। फोकल पॉइंट्स के लिए 'यहां' को संकेत के रूप में शामिल करें, और सुनिश्चित करें कि सबटाइटल्स (सबटाइटल्स) सटीक बोली गई वाक्यों को प्रतिबिंबित करें।"
    • टेस्ट प्रोटोकॉल: प्रत्येक वेरिएंट को छोटे बैच पर चलाएं (A से शुरू, फिर B, फिर C)। तीन मेट्रिक्स पर परिणामों की तुलना करें: डायलॉग का क्रिया से संरेखण, सबटाइटल्स की स्पष्टता, और वातावरण (वातावरण) और लाइटिंग की निष्ठा। प्रत्येक मेट्रिक के लिए पास/फेल रिकॉर्ड करें और क्रमिक प्रॉम्प्ट ट्वीक्स के साथ पुनरावृत्ति करें।

    त्वरित ध्वनि जांच: अंतिम प्रॉम्प्ट्स से पहले सत्यापन चरण

    शांत कमरे में 10-सेकंड की मौन बेसलाइन रिकॉर्ड करें और शोर तल नोट करें; एडाप्टर्स से बज़ और किसी भी हवा घुसपैठ के लिए देखें जो बाद के प्रॉम्प्ट्स को तिरछा कर सकती है।

    हवा सिमुलेशन चलाएं एक छोटे पंखे को रखकर या ड्राफ्ट बनाकर हवा जैसी उतार-चढ़ाव पैदा करने के लिए; एक छोटा क्लिप कैप्चर करें और शांत और तेज हवाओं के बीच अधिकतम-से-औसत dB परिवर्तन लॉग करें, विशेष रूप से कोनों के पास जहां हवा रिसाव सामान्य हैं।

    नर्सरी जैसा कोना पर जाएं और भीड़ भरे हॉल से तुलना करें; यह दिखाता है कि सतहें और दूरी प्रतिबिंबों को कैसे प्रभावित करती हैं। स्थानों के बीच सिग्नल स्तर, क्षय, और स्वर संतुलन में अंतर नोट करें, और यह मोड-टू-मोड व्यवहार में कैसे अनुवाद होता है, देखें कि ध्वनि स्थितियों के बीच कैसे यात्रा करती है।

    विभिन्न मॉडल्स (मॉडल्स) और मोड्स का परीक्षण करें; 2–3 कॉन्फ़िगरेशन्स सेट करें, प्रति सेटअप 15 सेकंड रिकॉर्ड करें, और पीक बज़, हवा रिसाव, और बास प्रतिक्रिया की तुलना करें। प्रॉम्प्ट्स के विश्वसनीय प्रदर्शन और जहां बाढ़ वाली रिवर्बरेशन परिणाम को विकृत कर सकती है, वहां मैप करने के लिए स्थानों के बीच तुलनाओं का उपयोग करें।

    एक चलने वाला परीक्षण लें: माइक फिक्स्ड के साथ जोनों के बीच चलें, और पढ़ाई कैसे शिफ्ट होती है; प्रतिक्रिया स्थिर दिखने वाली स्थितियों को लॉग करें और सतह प्रतिबिंब नियंत्रित रहें, विशेष रूप से इमारतों के पास या विशाल कमरों में।

    अंत में, फिर अंतिम प्रॉम्प्ट्स को आत्मविश्वासपूर्ण स्वर और सटीक संकेतों के साथ तैयार करें; यह सुनिश्चित करता है कि आप जानते हैं कि प्रॉम्प्ट्स कहां काम करते हैं, आमतौर पर भीड़ भरे वातावरणों या खुले हॉल में। अपनी नोट्स को संक्षिप्त रखें और ये अवलोकन शब्दों में ताकि शुरूआती अपेक्षाओं के साथ संरेखित रहें, और सुनिश्चित करें कि प्रक्रिया आपको खुद को जानने और परिणाम में आत्मविश्वास बनाए रखने में मदद करती है।

    📚 एआई जेनरेशन और प्रॉम्प्ट्स पर अधिक

    संबंधित लेख

    Ready to leverage AI for your business?

    Book a free strategy call — no strings attached.

    Get a Free Consultation