Seedance 2.0 का 20 दिन उपयोग करने के बाद, ये प्रॉम्प्ट फॉर्मूला सेट आप सेव करें

मैं वीडियो जनरेशन ट्रैक को लगभग तीन साल से फॉलो कर रहा हूं, Runway Gen-2 से शुरुआत करके Sora, Kling, Veo तक, बाजार के लगभग सभी मुख्य टूल का उपयोग कर चुका हूं। इन वर्षों में “क्रांतिकारी” के बहुत से नारे सुने हैं, लेकिन अधिकांश डेमो में आश्चर्यजनक लगते हैं, लेकिन जब आप खुद उपयोग करते हैं तो खराब हो जाते हैं।

इसलिए जब Seedance 2.0 आया, तो मैंने जल्दी से रिव्यू लिखने की नहीं, बल्कि दो सप्ताह तक गहराई से उपयोग किया, लगभग 50 वीडियो बनाए, बहुत से गलत किए, और आज वास्तव में उपयोगी व्यावहारिक अनुभव को संकलित कर रहा हूं।

पहले निष्कर्ष: यह टूल वास्तव में बहुत अच्छा है, लेकिन केवल तभी जब आप प्रॉम्प्ट लिखना जानते हों।

Seedance 2.0 20 दिन का उपयोग अनुभव

1. पहले समझें कि Seedance 2.0 वास्तव में कहां मजबूत है

अन्य सुविधाओं को छोड़कर, दो बिंदु सामान्य निर्माताओं के लिए सबसे व्यावहारिक हैं:

पहला, यह चार प्रकार के इनपुट का समर्थन करता है: इमेज, वीडियो, ऑडियो और टेक्स्ट। आप किसी भी अपलोड की गई सामग्री को प्राकृतिक भाषा में संदर्भित कर सकते हैं - क्रियाएं, प्रभाव, कैमरा मूवमेंट, पात्र, दृश्य, यहां तक कि आवाजें भी।

साधारण भाषा में: पहले, जब आपके दिमाग में कोई इमेज होती थी, तो आपको उसे “मंत्र” में अनुवाद करना पड़ता था जो मॉडल समझ सकता था। अब आप सीधे सामग्री डाल सकते हैं और उसे बता सकते हैं “इस वीडियो के कैमरा मूवमेंट का संदर्भ लें, इस इमेज के पात्र का संदर्भ लें”, और यह आपकी आवश्यकताओं को सटीक रूप से समझ जाएगा।

आधिकारिक सीमा अधिकतम 9 इमेज, 3 वीडियो (कुल अवधि 15 सेकंड से कम), 3 ऑडियो फ़ाइलें हैं, कुल 12 सामग्री से अधिक नहीं। अधिकांश परिदृश्यों के लिए 3-5 इमेज + 1 संदर्भ वीडियो पर्याप्त हैं, बहुत अधिक जोड़ने से सिग्नल कॉन्फ्लिक्ट हो सकता है।

एक और बिंदु जो मुझे शुरुआत में नहीं पता था लेकिन उपयोग करने के बाद बहुत अच्छा लगा: पुराने वीडियो जनरेशन टूल पहले इमेज बनाते हैं और बाद में ऑडियो जोड़ते हैं, लेकिन Seedance 2.0 डुअल-ब्रांच डिफ्यूजन ट्रांसफॉर्मर आर्किटेक्चर के माध्यम से एक साथ ऑडियो और वीडियो जनरेट करता है।

इसका क्या मतलब है? आप लिखते हैं “कैफे में एक लड़की मुस्कुराते हुए कह रही है ‘आज मौसम बहुत अच्छा है’”, और आपको जो वीडियो मिलता है उसमें होंठ की हिलावट मेल खाती है, परिवेश की आवाजें (कॉफी मशीन, हल्की बातचीत) सभी शामिल हैं, यहां तक कि बैकग्राउंड म्यूजिक भी पहले से मेल खाती है। पहले, यह प्रक्रिया कैपकट में आधा घंटा लगती थी, अब एक बार में हो जाती है।

2. वह सार्वभौमिक फॉर्मूला जो मैं अब हर दिन उपयोग करता हूं

इतने सारे वीडियो बनाने के बाद, मैंने सबसे स्थिर प्रॉम्प्ट संरचना को सारांशित किया है:

विषय + दृश्य + क्रिया + प्रकाश + कैमरा भाषा + शैली + बाधाएं

यह जटिल लगता है, लेकिन वास्तव में यह एक इमेज को 7 तत्वों में विभाजित करना है। सीधे उदाहरण लें, आप तुरंत समझ जाएंगे:

बेज रंग के निट स्वेटर पहनी एक युवा महिला, खिड़की के पास लकड़ी की मेज पर बैठी हुई (विषय + दृश्य), दोनों हाथों में गर्म कॉफी पकड़े हुए, कप के मुंह से निकल रही भाप को हल्के से उड़ाते हुए, फिर खिड़की के बाहर देख रही है (क्रिया), दोपहर का सूर्य का प्रकाश ब्लाइंड्स से होकर उसके चेहरे पर पड़ रहा है, दागदार प्रकाश और छाया बन रहा है (प्रकाश), कैमरा साइड मीडियम शॉट से धीरे-धीरे फेस क्लोज-अप तक बढ़ रहा है (कैमरा भाषा), सिनेमाई जापानी ताजा शैली, गर्म रंग, फिल्म के दाने (शैली), स्थिर और चिकनी छवि, स्पष्ट विवरण, हाथ की विकृति से बचें (बाधाएं)

अगर आप इसे सीधे Seedance में डालें, तो जनरेट किया गया वीडियो मूल रूप से सीधे उपयोग योग्य होगा।

3. कई बहुत गैर-सहज बिंदु, मैंने ये सभी गलत किए हैं

1. चीनी को अंग्रेजी में अनुवाद न करें

मैं पहले सप्ताह तक अंग्रेजी में प्रॉम्प्ट लिख रहा था, सोच रहा था कि Midjourney की तरह अंग्रेजी बेहतर काम करती है। पता चला कि Seedance 2.0 में यह बिल्कुल समस्या नहीं है, चीनी प्रॉम्प्ट को अंग्रेजी में अनुवाद करने की कोई जरूरत नहीं है, यह पूरी तरह से समय की बर्बादी है।

बस सीधे चीनी में लिखें, और जितना बोलचाल का होगा उतना सटीक होगा, “एक लड़की सुंदरता से बालों को पीछे करती है” “a girl elegantly touches her hair” से ज्यादा सटीक परिणाम देता है, क्योंकि इसका प्रशिक्षण डेटा मुख्य रूप से चीनी में है।

2. “अच्छा दिखने वाला”, “सुंदर”, “उच्च स्तरीय” जैसे शब्द कुछ नहीं कहते हैं

अस्पष्ट प्रॉम्प्ट केवल अप्रत्याशित परिणाम देते हैं। “रात का शहर” लिखने के बजाय, “साइबरपंक रात का दृश्य, गीली सड़कों पर नियन लाइटें परावर्तित हो रही हैं, पृष्ठभूमि में उड़ने वाली कारें हैं, बारिश हो रही है” लिखें।

सिद्धांत बहुत सरल है: आपको वह चीजें लिखनी चाहिए जो दृश्य रूप से वास्तव में देखी जा सकती हैं, न कि आपके दिमाग में व्यक्तिपरक भावनाएं।

3. क्रिया विवरण को स्टोरीबोर्ड के रूप में लिखें, न कि कहानी के रूप में

यह वह बिंदु है जिस पर मैं सबसे ज्यादा जोर देना चाहता हूं। “नाचना”, “चलना”, “हंसना” जैसे शब्द मूल रूप से बेकार हैं, आपको और अधिक विशिष्ट रूप से लिखना होगा:

❌ गलत उदाहरण: लड़की नाच रही है ✅ सही उदाहरण: लड़की पहले बाएं पैर से कदम बढ़ाती है, हाथ स्वाभाविक रूप से फैले हुए हैं, मुड़ते समय स्कर्ट उछलती है, अंत में रुकती है और साइड प्रोफाइल दिखाती है

मुख्य सिद्धांत: प्रॉम्प्ट को स्टोरीबोर्ड के रूप में लिखें, न कि कहानी के रूप में। हर वाक्य में उस विशिष्ट सामग्री का वर्णन होना चाहिए जो छवि में देखी जा सकती है। मैंने यह वाक्य अपने मॉनिटर पर टिका दिया है ताकि मैं हर दिन पढ़ सकूं।

इन कौशलों में महारत हासिल करने से आप मूल रूप से 80% गलतियों से बच जाएंगे, और जनरेट किए गए वीडियो की गुणवत्ता में स्पष्ट सुधार होगा। यदि आपने पहले अन्य AI वीडियो टूल का उपयोग किया है, तो मुझे विश्वास है कि जब आप Seedance 2.0 का उपयोग करेंगे तो आपको दक्षता में स्पष्ट सुधार महसूस होगा।

Seedance 2.0 का उपयोग शुरू करें