دليل Seedance
كيف تحافظ على اتساق صوت الشخصية عبر عدة لقطات في Seedance2
في مقاطع الذكاء الاصطناعي متعددة اللقطات، يُولى الاهتمام عادةً للاتساق البصري بينما يُهمل اتساق الصوت غالبًا. يشرح هذا الدليل كيفية الحفاظ على هوية صوتية مميزة عبر لقطات ومشاعر وحوارات مختلفة.

1) ثلاث طبقات لاتساق الصوت
| الطبقة | الهدف | نقطة فحص |
|---|---|---|
| طبقة الجرس | نفس الشخصية تبدو مستقرة | ملف تردد ورنين متشابه |
| طبقة التعبير | تتغير العاطفة وتبقى الهوية | غاضب/هادئ يبدو كذات الشخص |
| طبقة السرد | أدوار متعددة لا تمتزج | تبديل الحوار يبقى واضحًا |
2) كتابة أوامر Seedance: اربط المتحدث أولًا، السطور ثانيًا
أنشئ بطاقة هوية صوتية لكل شخصية:
- اسم الشخصية + فئة عمر + وسوم جرس
- نطاق سرعة الكلام
- حدود العاطفة
ثم أعد استخدام نفس البطاقة في كل اللقطات بدل إعادة التعريف في كل مرة.
3) سير عمل متعدد اللقطات
- قسّم الحوار والعاطفة لكل لقة.
- تحقق من مقاطع شخصية واحدة أولًا.
- ادمج في حوار متعدد الشخصيات.
- أعد توليد المقاطع المشكلة فقط.
- مراجعة نهائية للعلو، التوقفات، استمرارية التنفس.
4) مشاكل شائعة وحلول
- المشكلة: يتغير الصوت في اللقطة 3.
الحل: قلل كلمات الأسلوب، أبقِ قيود المتحدث هي الغالبة. - المشكلة: يمتزج المتحدث أ/ب.
الحل: عرّف صراحةً تناوب الأدوار ومدة التوقف. - المشكلة: تشويه عند ذروة العاطفة.
الحل: أضف قيودًا لنطق واضح عند شدة عالية.
تظهر هذه الطرق كثيرًا في أمثلة أخبار Seedance متعددة الشخصيات الأخيرة.
5) السيناريوهات الأنسب
- دراما قصيرة بالذكاء الاصطناعي مع حوار
- تدريب/تعليم بتبديل أدوار
- سرد ألعاب بصوت + سرد
- إعلانات قصصية بعلامة مع شخصيات متكررة