Seedance Logo Seedance

Seedance使い方ガイド

Seedance 2.0を20日間使ってみて、このプロンプトフォーミュラ集を保存することをおすすめします

Seedance 2.0の20日間の実際の使用経験のまとめ、最も安定したプロンプト万能フォーミュラ、3つの直接コピー可能なテンプレート、失敗から学んだいくつかの反直感的なテクニックで、遠回りを回避するのに役立ちます。

私は動画生成の分野を約3年間追跡しており、Runway Gen-2から始まり、Sora、Kling、Veoまで、市場の主流ツールはほぼすべて使用したことがあります。これらの年で「革命的」というスローガンをたくさん聞いてきましたが、大半はデモでは驚くほど素晴らしいのに、自分で使ってみると期待外れです。

そのため、Seedance 2.0がリリースされたとき、急いでレビューを書かずに、2週間集中的に使用して約50本の動画を作成し、多くの失敗を経験しました。今日は本当に役立つ実践的な経験をまとめます。

まず結論から言うと、このツールは本当に優れていますが、プロンプトの書き方を知っていることが前提です。

Seedance 2.0 20日間使用経験

1. まずSeedance 2.0の強みを理解しましょう

他の機能はさておき、普通のクリエイターにとって最も実用的な点が2つあります:

1つ目は、画像、動画、音声、テキストの4種類の入力に対応していることです。アップロードしたあらゆるコンテンツを自然言語で参照できます——アクション、エフェクト、カメラワーク、キャラクター、シーン、さらには音声まで。

簡単に言うと:以前は頭の中にイメージがあっても、モデルが理解できる「呪文」に翻訳する必要がありましたが、今は素材を直接渡して「この動画のカメラワークを参考に、この画像のキャラクターを使って」と指示するだけで、正確にニーズを理解してくれます。

公式の上限は最大9枚の画像、3本の動画(合計時間15秒以内)、3つの音声ファイル、合計で12個の素材までです。ほとんどのシナリオでは3~5枚の画像+1本の参考動画で十分で、多すぎると信号の衝突が発生しやすくなります。

もう1つ、最初は気づかなかったけど使ってみて非常に便利だと感じた点:以前の動画生成ツールはまず画像を生成してから後で音声を追加するのに対し、Seedance 2.0はデュアルブランチ拡散Transformerアーキテクチャにより音声と動画を同時に生成します。

これが何を意味するかというと:「カフェで笑いながら『今日はいい天気ですね』と言う女の子」と書くと、生成される動画には唇の動きが一致し、環境音(コーヒーマシンの音、小さな話し声)もすべて含まれ、BGMまで自動的に合わせてくれます。以前はこのプロセスをCapCutで30分かけて行っていましたが、今は1回で完了します。

2. 私が毎日使っている万能フォーミュラ

これだけ多くの動画を試した結果、最も安定したプロンプト構造としてまとめたのがこれです:

被写体 + シーン + 動作 + 光 + カメラ言語 + スタイル + 制約

複雑に聞こえるかもしれませんが、1つの画像を7つの要素に分解しているだけです。実際の例を見ればすぐに理解できます:

ベージュのニットセーターを着た若い女性が、窓際の木製テーブルに座っている(被写体+シーン)、両手でホットコーヒーを持ち、カップの口から立ち昇る湯気をそっと吹き、それから窓の外を見上げる(動作)、午後の陽光がブラインドを通して彼女の顔に降り注ぎ、まだらな光影を作り出す(光)、カメラが横からのミディアムショットからゆっくりと顔のクローズアップに移動する(カメラ言語)、映画風の日系ナチュラルスタイル、暖色系、フィルムグレイン(スタイル)、安定した滑らかな映像、細部が鮮明、手の歪みを回避(制約)

このテキストを直接Seedanceに入力すれば、生成される動画は基本的にそのまま使用できる品質になります。

3. 非常に反直感的なポイント——私はすべて失敗しました

1. 中国語を英語に翻訳しないでください

最初の1週間はMidjourneyと同じように英語でプロンプトを書いた方が効果が良いと思って英語で書いていました。しかし、Seedance 2.0にはそのような問題は全くなく、中国語のプロンプトを英語に翻訳する必要はまったくなく、完全に時間の無駄です。

直接中国語で書けば良く、しかも口語的であればあるほど正確です。「女の子が優雅に髪をかきあげる」という中国語の表記は、「a girl elegantly touches her hair」という英語表記よりも生成結果が正確です。なぜなら、学習データが主に中国語だからです。

2. 「かわいい」「美しい」「高級感」といった言葉は意味がありません

曖昧なプロンプトは予測不可能な結果しか生み出しません。「夜の街」と書くよりも、「サイバーパンクな夜景、濡れた道路にネオンが反射し、背景には空飛ぶ車が走っており、雨が降っている」と書く方が良いです。

理由は単純です:視覚的に実際に見えるものを書くべきで、心の中の主観的な感覚を書いてはいけないということです。

3. 動作の説明はストーリーボードとして書き、物語として書かないでください

これは最も強調したいポイントです。「踊る」「歩く」「笑う」といった言葉は基本的に無意味で、より具体的に書く必要があります:

❌ 悪い例:女の子が踊る ✅ 良い例:女の子が最初に左足を踏み出し、両手を自然に広げ、回転するときにスカートがなびき、最後に横を向いてポーズをとって止まる

核心原則:プロンプトはストーリーボードとして書き、物語として書かないこと。すべての文は、画像の中で観察できる具体的な内容を記述する必要があります。私は今この言葉をモニターに貼って毎日見ています。


これらのテクニックをマスターすれば、基本的に80%の失敗を回避でき、生成される動画の品質も大幅に向上します。以前に他のAI動画ツールを使用したことがあれば、Seedance 2.0を使用すると効率が明らかに向上することを実感できるでしょう。