Meta Pixel
DamienDamien
15 min read
514 文字

2025年版 AI動画プロンプトエンジニアリング完全ガイド

高品質なAI生成動画を実現するプロンプト作成の技術を習得していただけます。6つのレイヤーフレームワーク、映画撮影の専門用語、プラットフォーム別の手法をご紹介いたします。

2025年版 AI動画プロンプトエンジニアリング完全ガイド

AI動画のプロンプトエンジニアリングは、料理のレシピを完成させることに似ています。同じ材料でも、技術によって結果は大きく異なります。主要なプラットフォームで数え切れないほどの動画を生成してきた経験から、実際に効果のある手法を実践的なフレームワークにまとめさせていただきました。理論ではなく、一貫性のあるプロフェッショナルな結果を生み出す技術に焦点を当ててご説明いたします。

動画プロンプトの特殊性について

MidjourneyやDALL-Eなどの画像生成AIをご使用になったことがある方は、動画プロンプトも同じように機能すると思われるかもしれません。しかし、実際には異なります。動画には時間的な次元、つまり動き、ペース、トランジションが加わるため、プロンプトエンジニアリングは単一の指示から一連のシーケンスを演出することへと変わります。

これは、写真を撮ることとシーンを演出することの違いに例えられます。写真の場合はショットを設定すればよいのですが、動画の場合は時間の経過とともに何が起こるかを振り付けする必要がございます。

  • カメラはどのように動くのか?
  • どのようなアクションが展開されるのか?
  • 各要素はどのくらいの時間続くのか?
  • 感情的な流れはどうなるのか?

これらの疑問には、静止画像のプロンプトを超える語彙と構造が必要となります。

6つのレイヤーフレームワーク

プロフェッショナルな動画プロンプトは、構造化されたアプローチに従います。これを6つのレイヤーフレームワークと呼んでおります。各レイヤーは、AIをお客様のビジョンに導く具体性を追加いたします。

レイヤー1: 被写体とアクション

焦点を正確に定義いたします。曖昧な被写体は曖昧な結果を生み出します。

弱い例: 「庭にいる女性」 強い例: 「流れるような赤いドレスを着た女性が、バラの茂みをゆっくりと歩き、通り過ぎながら花びらを優しく触れる」

強い例では、衣服、動きの速度、環境との相互作用を指定しています。すべての詳細が、AIの解釈をお客様の意図に向けて制約いたします。

レイヤー2: ショットタイプとフレーミング

映画撮影技師は、1世紀をかけて視覚的な文法を開発してまいりました。それを活用させていただきましょう。

ショットタイプ使用場面
ワイドショットロケーションの確立、スケール
ミディアムショットキャラクターのやり取り、会話
クローズアップ感情、細部、親密さ
エクストリームクローズアップドラマチックな強調

例: 「ミディアムトラッキングショット、カメラは腰の高さに配置、横から追従」

レイヤー3: カメラの動き

静止したショットは素人っぽく感じられます。動きはエネルギーを生み出し、注意を導きます。

動き効果
パン水平方向に空間を明らかにする
チルト垂直方向に空間を明らかにする
ドリー/トラッキング奥行きを作り、被写体を追う
クレーンスケール、ドラマを確立
ハンドヘルド緊急性、ドキュメンタリーの雰囲気
ステディカム滑らかな追従、没入感

例: 「ドアを通って前方へゆっくりドリー、目線の高さの視点を維持」

レイヤー4: 照明と雰囲気

照明は、他のどの要素よりも強力にムードを設定いたします。

用語視覚効果
ゴールデンアワー温かい、ロマンチック、ノスタルジック
ブルーアワークール、瞑想的、神秘的
ハイキー明るい、楽観的、クリーン
ローキードラマチック、ムーディ、サスペンス
ボリュメトリックライト霧や埃を通る光線、幻想的
リムライティング分離、ドラマ、シルエットのエッジ

例: 「ゴールデンアワーの照明、埃っぽい窓を通るボリュメトリックな光線、温かいカラーグレーディング」

レイヤー5: 技術仕様

正確なコントロールが必要な場合は、特定の技術的パラメータを指定いたします。

  • レンズ: 35mm(自然)、50mm(ポートレート)、85mm(圧縮)、24mm(広角)
  • 被写界深度: 浅い(背景ボケ) vs. 深い(全てシャープ)
  • フレームレート: 24fps(映画的)、60fps(滑らか)、120fps(スローモーション)
  • アスペクト比: 16:9(標準)、2.39:1(映画的)、9:16(縦型)

例: 「85mmレンズで撮影、クリーミーなボケ味の浅い被写界深度、わずかなフィルムグレイン」

レイヤー6: 持続時間とペーシング

動画は時間の経過とともに展開されます。リズムを指定いたします。

  • シーン持続時間(通常3〜10秒)
  • トランジションスタイル(カット、ディゾルブ、ワイプ)
  • ペーシング(遅い/瞑想的 vs. 速い/エネルギッシュ)
  • 音楽同期のためのビートタイミング

例: 「6秒のショット、ゆっくりと意図的な動き、最終フレームで1秒間保持」

統合: 完全なプロンプトの例

レイヤーがどのようにプロフェッショナルなプロンプトに統合されるかをご紹介いたします。

シネマティックポートレート:

風化した漁師の顔のミディアムクローズアップ、早朝のブルーアワー、
85mmレンズで浅い被写界深度で撮影。優しいハンドヘルドの微妙な動き、
後ろからの柔らかいリムライティングが白髪にハロー効果を作り出す。
瞑想的な表情、目はカメラからわずかに外れている。
シャドウを持ち上げたクールなカラーグレーディング、5秒間の持続時間。

アクションシーケンス:

夕日に都市の屋上を走るパルクールアスリートを追うワイドトラッキングショット。
一定の距離を維持するダイナミックなステディカムの動き、
ドラマチックなシルエットを作り出すゴールデンアワーの逆光。24fpsのシネマティックモーション、
0.8倍速度のわずかなスローモーション。高コントラスト、ティール・オレンジのカラーグレーディング。
強度を増しながら8秒間。

商品ショーケース:

黒いベルベットの表面に置かれた高級時計の周りを360度ゆっくり回転。
複雑な文字盤の詳細を捉えるマクロレンズ、柔らかいキーライトと
微妙なフィルライトを持つコントロールされたスタジオ照明。被写体を分離する浅い被写界深度、
クリスタルの優しい反射。ゆっくりと意図的なカメラの動きによる高級感。
10秒間の持続時間。

ネガティブプロンプティング: AIに避けるべきものを伝える

望まないものを指定することも同様に重要でございます。各プラットフォームはこれを異なる方法で処理いたします。

一般的なネガティブプロンプト:

  • ぼやけた映像、モーションブラーのアーティファクト
  • 歪んだ顔、解剖学的エラー
  • ウォーターマーク、テキストオーバーレイ
  • 不自然な動き、ぎくしゃくしたトランジション
  • 低解像度、圧縮アーティファクト

プラットフォーム別の構文:

プラットフォーム方法
Veo 3専用のネガティブプロンプトフィールド
Klingプロンプトに「avoid」または「without」を含める
Runway別のネガティブプロンプトパラメータ
Sora重み付けベースの除外

例: 「回避: ぼやけた映像、歪んだ顔の特徴、ウォーターマーク、ぎくしゃくしたカメラの動き、過度に彩度の高い色」

スタイルリファレンスのスタッキング

独特の美学をお求めでしょうか?2〜3つの映画リファレンスを組み合わせます。

公式: [映画A]のカラーグレーディング + [映画B]の雰囲気 + [映画C]のカメラの動き

例:

  • 「ブレードランナー2049のカラーグレーディング + セブンの雰囲気 + ヒートのカメラの動き」
  • 「ウェス・アンダーソンのシンメトリー + スタジオジブリのカラーパレット + テレンス・マリックの自然光」
  • 「マッドマックス 怒りのデス・ロードのエネルギー + ロジャー・ディーキンスの照明 + スピルバーグのブロッキング」

リファレンスは3つまでに制限してください。それ以上は矛盾する信号を作り出します。

プラットフォーム別の最適化

各モデルには強みがございます。プロンプトスタイルをプラットフォームに合わせましょう。

モデル強みプロンプトの焦点
Kling 2.5運動動作、キャラクターアニメーションアクション動詞、物理的な動き
Sora 2マルチショットストーリーテリング、空間的一貫性シーントランジション、物語の弧
Veo 3精密コントロール、JSONフォーマット技術仕様、構造化構文
Runway Gen-3スタイライゼーション、芸術的解釈美的リファレンス、ムード記述子
WAN 2.5対話、リップシンクスピーチアクション、表情

Veo 3 JSONの例:

{
  "subject": "赤いドレスの女性",
  "action": "庭を歩く",
  "shot_type": "ミディアムトラッキング",
  "camera_movement": "右から左へドリー",
  "lighting": "ゴールデンアワー、ボリュメトリック",
  "lens": "35mm",
  "duration": "6秒"
}

5-10-1 コスト最適化ルール

プレミアムレンダリングは高額です。このワークフローをご使用ください。

  1. 5つのバリエーション を低コストモデルで(各40〜60クレジット)
  2. 10回の反復 で最良の候補を洗練
  3. 1回の最終レンダリング をプレミアムティアで(約350クレジット)

これにより、品質を維持しながらコストを数千から約1,000クレジットに削減できます。

避けるべき一般的な間違い

数百のプロンプトをレビューした結果、これらのエラーが最も頻繁に現れます。

間違い問題修正
カジュアルな説明AIが緩く解釈映画撮影の専門用語を使用
持続時間の不一致アクションが時間枠に合わない複雑さを持続時間に合わせる
スタイルの過負荷矛盾する美的信号リファレンスを最大3つに制限
動きの欠如静的で素人っぽい雰囲気常にカメラの動きを指定
曖昧な照明一貫性のないムード特定の照明設定を指定
ネガティブプロンプトなし望まないアーティファクト問題を明示的に除外

プロンプトライブラリの構築

一般的なシナリオのテンプレートを作成いたします。

インタビュー設定:

ミディアムショット、被写体は三分割法の左に配置、目線の高さのカメラ、
[LIGHTING_SETUP]、背景をぼかす浅い被写界深度、
自然な雰囲気のための微妙なハンドヘルドの微妙な動き、[DURATION]。

Bロール自然:

[SUBJECT]の[SHOT_TYPE]、[TIME_OF_DAY]の照明、
ゆっくりした[CAMERA_MOVEMENT]、[LENS]mmレンズ、ディープフォーカス、
[COLOR_GRADE]パレット、[DURATION]。

商品ヒーロー:

[SURFACE]上の[PRODUCT]の周りを[ORBIT_DIRECTION]に回転、
[KEY_LIGHT_POSITION]キーと微妙なフィルを持つスタジオ照明、
マクロ詳細の瞬間、[LENS]mm、完璧な反射、[DURATION]。

特定のニーズに合わせて括弧内を埋めてください。ユースケース別に整理されたライブラリを構築いたします。

反復戦略

完璧なプロンプトは、体系的な洗練を通じて生まれます。

  1. シンプルに始める: コアの被写体とアクションのみ
  2. 1つの要素を追加: 単一の追加をテスト
  3. 機能するものを文書化: 効果的なフレーズのログを保持
  4. A/Bテストのフレージング: 同じコンセプト、異なる言葉
  5. 勝者を保存: プロンプトライブラリを構築

ログフォーマット:

プロンプト: [完全なプロンプト]
モデル: [使用したプラットフォーム]
結果: [1〜5の評価]
メモ: [機能したこと/しなかったこと]

品質レビューチェックリスト

AI動画を完成させる前に、以下をご確認ください。

  • 全体を通した被写体の一貫性
  • 自然な動き(ぎくしゃくしていない)
  • 照明の連続性
  • 顔の歪みなし
  • カラーグレーディングの一貫性
  • 適切なペーシング
  • クリーンなオーディオ(該当する場合)
  • ウォーターマークやアーティファクトなし

次のステップ

プロンプトエンジニアリングは実践とともに向上いたします。シンプルなショットから始めて、各レイヤーをマスターし、それらを組み合わせてください。目標は専門用語を暗記することではなく、動画を魅力的にするものへの直感を養うことです。

生成ログを保持してください。機能したものをレビューしてください。ライブラリを構築してください。アマチュアとプロフェッショナルなAI動画の違いは、多くの場合、プロンプトの正確さに帰着いたします。

カメラはお待ちしております。撮影を始めましょう。

この記事は役に立ちましたか?

Damien

Damien

AI開発者

リヨン出身のAI開発者で、複雑な機械学習の概念をシンプルなレシピに変えることが大好きです。モデルのデバッグをしていない時は、ローヌ渓谷をサイクリングしています。

関連記事

これらの関連投稿で探索を続けてください

この記事はお楽しみいただけましたか?

最新コンテンツで、さらに深いインサイトを発見してください。

2025年版 AI動画プロンプトエンジニアリング完全ガイド