Meta Pixel
DamienDamien
8 min read
1443 Wörter

Der vollständige Leitfaden für AI Video Prompt Engineering 2025

Beherrschen Sie die Kunst, Prompts zu erstellen, die hochwertige AI-generierte Videos erzeugen. Lernen Sie das Sechs-Ebenen-Framework, filmische Terminologie und plattformspezifische Techniken.

Der vollständige Leitfaden für AI Video Prompt Engineering 2025

Prompt Engineering für AI-Video lässt sich mit dem Perfektionieren eines Rezepts vergleichen: Die gleichen Zutaten liefern völlig unterschiedliche Ergebnisse, abhängig von der Technik. Nach zahlreichen Stunden der Videogenerierung auf allen wichtigen Plattformen habe ich die funktionierenden Ansätze in ein praktisches Framework destilliert. Konzentrieren wir uns auf Techniken, die konsistente, professionelle Ergebnisse liefern.

Warum Video-Prompts anders sind

Wenn Sie mit Bildgeneratoren wie Midjourney oder DALL-E gearbeitet haben, könnten Sie annehmen, dass Video-Prompts identisch funktionieren. Das ist nicht der Fall. Video fügt eine zeitliche Dimension hinzu – Bewegung, Rhythmus, Übergänge – die Prompt Engineering von einer einzelnen Anweisung in die Orchestrierung einer Sequenz transformiert.

Der Unterschied lässt sich mit dem zwischen einer Fotografie und der Regie einer Szene vergleichen. Für ein Foto stellen Sie die Aufnahme ein. Für ein Video müssen Sie choreografieren, was im Zeitverlauf geschieht:

  • Wie bewegt sich die Kamera?
  • Welche Handlungen entfalten sich?
  • Wie lange dauert jedes Element?
  • Was ist der emotionale Bogen?

Diese Fragen erfordern Vokabular und Struktur, die über statische Bild-Prompts hinausgehen.

Das Sechs-Ebenen-Framework

Professionelle Video-Prompts folgen einem strukturierten Ansatz. Ich nenne es das Sechs-Ebenen-Framework – jede Ebene fügt Spezifität hinzu, die die AI zu Ihrer Vision führt:

Ebene 1: Subjekt und Aktion

Definieren Sie Ihren Fokus präzise. Vage Subjekte produzieren vage Ergebnisse.

Schwach: "Eine Frau in einem Garten" Stark: "Eine Frau in einem fließenden roten Kleid geht langsam durch Rosensträucher und berührt sanft Blütenblätter beim Vorbeigehen"

Die starke Version spezifiziert Kleidung, Bewegungsgeschwindigkeit und Interaktion mit der Umgebung. Jedes Detail begrenzt die Interpretation der AI in Richtung Ihrer Absicht.

Ebene 2: Aufnahmetyp und Bildausschnitt

Kameramänner haben ein Jahrhundert damit verbracht, visuelle Grammatik zu entwickeln. Nutzen Sie sie.

AufnahmetypVerwendungszweck
Wide ShotEtablierung von Ort, Maßstab
Medium ShotCharakterinteraktion, Dialog
Close-upEmotion, Detail, Intimität
Extreme Close-upDramatische Betonung

Beispiel: "Medium Tracking Shot, Kamera auf Hüfthöhe positioniert, von der Seite folgend"

Ebene 3: Kamerabewegung

Statische Aufnahmen wirken amateurhaft. Bewegung erzeugt Energie und lenkt Aufmerksamkeit.

BewegungEffekt
PanEnthüllt Raum horizontal
TiltEnthüllt Raum vertikal
Dolly/TrackingErzeugt Tiefe, folgt Subjekt
CraneEtabliert Maßstab, Drama
HandheldDringlichkeit, dokumentarisches Gefühl
SteadicamSanftes Folgen, Immersion

Beispiel: "Langsamer Dolly Forward durch die Tür, Perspektive auf Augenhöhe beibehaltend"

Ebene 4: Beleuchtung und Atmosphäre

Beleuchtung bestimmt die Stimmung kraftvoller als jedes andere Element.

BegriffVisueller Effekt
Golden HourWarm, romantisch, nostalgisch
Blue HourKühl, kontemplativ, mysteriös
High KeyHell, optimistisch, klar
Low KeyDramatisch, stimmungsvoll, spannungsgeladen
Volumetric LightStrahlen durch Nebel/Staub, ätherisch
Rim LightingSeparation, Drama, Silhouettenkante

Beispiel: "Golden Hour Beleuchtung mit volumetrischen Strahlen durch staubige Fenster, warmes Color Grading"

Ebene 5: Technische Spezifikationen

Benennen Sie spezifische technische Parameter, wenn Sie präzise Kontrolle benötigen:

  • Objektiv: 35mm (natürlich), 50mm (Portrait), 85mm (Kompression), 24mm (Weitwinkel)
  • Schärfentiefe: Gering (Bokeh-Hintergrund) vs. tief (alles scharf)
  • Bildrate: 24fps (filmisch), 60fps (flüssig), 120fps (Zeitlupe)
  • Seitenverhältnis: 16:9 (Standard), 2.39:1 (filmisch), 9:16 (vertikal)

Beispiel: "Aufgenommen mit 85mm Objektiv, geringe Schärfentiefe mit cremigem Bokeh, leichtes Filmkorn"

Ebene 6: Dauer und Rhythmus

Video entfaltet sich über Zeit. Spezifizieren Sie den Rhythmus:

  • Szenendauer (3-10 Sekunden typisch)
  • Übergangsstil (Cut, Dissolve, Wipe)
  • Tempo (langsam/kontemplativ vs. schnell/energetisch)
  • Beat-Timing für Musiksynchronisation

Beispiel: "6-Sekunden-Aufnahme mit langsamer, bedachter Bewegung, am finalen Frame 1 Sekunde haltend"

Integration: Vollständige Prompt-Beispiele

So kombinieren sich Ebenen zu professionellen Prompts:

Filmisches Portrait:

Medium Close-up eines verwitterten Fischergesichts, frühmorgendliche Blue Hour,
aufgenommen mit 85mm Objektiv mit geringer Schärfentiefe. Sanfte Handheld-Mikrobewegungen,
weiches Rim Lighting von hinten erzeugt Halo-Effekt auf grauem Haar.
Kontemplative Mimik, Augen leicht neben Kamera blickend.
Kühles Color Grading mit angehobenen Schatten, 5 Sekunden Dauer.

Action-Sequenz:

Wide Tracking Shot folgt Parkour-Athleten über urbane Dächer
bei Sonnenuntergang. Dynamische Steadicam-Bewegung hält konstante Distanz,
Golden Hour Gegenlicht erzeugt dramatische Silhouette. 24fps filmische Bewegung,
leichte Zeitlupe bei 0.8x Geschwindigkeit. Hoher Kontrast, Teal-Orange Color Grading.
8 Sekunden mit steigender Intensität.

Produktpräsentation:

Langsame 360-Grad-Orbit um Luxusuhr auf schwarzer Samtoberläche.
Makro-Objektiv erfasst detaillierte Zifferblatt-Details, kontrollierte Studio-Beleuchtung
mit weichem Key Light und subtilem Fill. Geringe Schärfentiefe isoliert
das Subjekt, sanfte Reflexionen auf Kristall. Premium-Eindruck mit
langsamer, bedachter Kamerabewegung. 10 Sekunden Dauer.

Negative Prompting: Der AI mitteilen, was zu vermeiden ist

Ebenso wichtig ist die Spezifikation dessen, was Sie nicht möchten. Jede Plattform handhabt dies unterschiedlich:

Häufige Negative Prompts:

  • Unscharfes Footage, Motion-Blur-Artefakte
  • Verzerrte Gesichter, anatomische Fehler
  • Wasserzeichen, Text-Overlays
  • Unnatürliche Bewegungen, ruckartige Übergänge
  • Niedrige Auflösung, Kompressionsartefakte

Plattformspezifische Syntax:

PlattformMethode
Veo 3Dediziertes Negative-Prompt-Feld
Kling"avoid" oder "without" im Prompt einschließen
RunwaySeparater Negative-Prompt-Parameter
SoraGewichtungsbasierte Ausschlüsse

Beispiel: "Avoid: blurry footage, distorted facial features, watermarks, jerky camera movement, oversaturated colors"

Style Reference Stacking

Sie möchten eine charakteristische Ästhetik? Kombinieren Sie 2-3 Filmreferenzen:

Formel: [Film A] Color Grading + [Film B] Atmosphäre + [Film C] Kamerabewegung

Beispiele:

  • "Blade Runner 2049 Color Grading plus Se7en Atmosphäre plus Heat Kamerabewegung"
  • "Wes Anderson Symmetrie plus Studio Ghibli Farbpalette plus Terrence Malick natürliche Beleuchtung"
  • "Mad Max: Fury Road Energie plus Roger Deakins Beleuchtung plus Spielberg Blocking"

Limitieren Sie auf 3 Referenzen. Mehr erzeugt widersprüchliche Signale.

Plattformspezifische Optimierung

Jedes Modell hat Stärken. Passen Sie Ihren Prompt-Stil an die Plattform an:

ModellStärkenPrompt-Fokus
Kling 2.5Athletische Bewegung, CharakteranimationAction-Verben, physische Bewegung
Sora 2Multi-Shot-Storytelling, räumliche KonsistenzSzenenübergänge, narrativer Bogen
Veo 3Präzisionskontrolle, JSON-FormatierungTechnische Spezifikationen, strukturierte Syntax
Runway Gen-3Stilisierung, künstlerische InterpretationÄsthetische Referenzen, Stimmungsdeskriptoren
WAN 2.5Dialog, Lip-SyncSprachaktionen, Gesichtsausdrücke

Veo 3 JSON-Beispiel:

{
  "subject": "woman in red dress",
  "action": "walking through garden",
  "shot_type": "medium tracking",
  "camera_movement": "dolly right to left",
  "lighting": "golden hour, volumetric",
  "lens": "35mm",
  "duration": "6 seconds"
}

Die 5-10-1 Kostenoptimierungsregel

Premium-Renderings sind kostenintensiv. Verwenden Sie diesen Workflow:

  1. 5 Variationen auf kostengünstigeren Modellen (40-60 Credits jeweils)
  2. 10 Iterationen zur Verfeinerung des besten Kandidaten
  3. 1 finales Rendering auf Premium-Tier (~350 Credits)

Dies reduziert Kosten von Tausenden auf etwa 1.000 Credits bei gleichbleibender Qualität.

Häufige Fehler zu vermeiden

Nach Überprüfung hunderter Prompts treten diese Fehler am häufigsten auf:

FehlerProblemLösung
Umgangssprachliche BeschreibungenAI interpretiert lockerVerwenden Sie filmische Terminologie
Dauer-MismatchAktion passt nicht in ZeitrahmenPassen Sie Komplexität an Dauer an
Style-ÜberladungWidersprüchliche ästhetische SignaleLimitieren auf maximal 3 Referenzen
Fehlende BewegungStatisches, amateurhaftes GefühlSpezifizieren Sie immer Kamerabewegung
Vage BeleuchtungInkonsistente StimmungBenennen Sie spezifische Beleuchtungs-Setups
Keine Negative PromptsUnerwünschte ArtefakteSchließen Sie Probleme explizit aus

Aufbau Ihrer Prompt-Bibliothek

Erstellen Sie Templates für häufige Szenarien:

Interview-Setup:

Medium Shot, Subjekt nach Drittelregel links positioniert, Kamera auf Augenhöhe,
[LIGHTING_SETUP], geringe Schärfentiefe verwischt Hintergrund,
subtile Handheld-Mikrobewegungen für natürliches Gefühl, [DURATION].

B-Roll Natur:

[SHOT_TYPE] von [SUBJECT], [TIME_OF_DAY] Beleuchtung,
langsame [CAMERA_MOVEMENT], [LENS]mm Objektiv, tiefe Schärfe,
[COLOR_GRADE] Palette, [DURATION].

Produkt-Hero:

[ORBIT_DIRECTION] Orbit um [PRODUCT] auf [SURFACE],
Studio-Beleuchtung mit [KEY_LIGHT_POSITION] Key und subtilem Fill,
Makro-Detail-Momente, [LENS]mm, makellose Reflexionen, [DURATION].

Füllen Sie Klammern für spezifische Anforderungen. Bauen Sie eine nach Anwendungsfall organisierte Bibliothek auf.

Iterations-Strategie

Perfekte Prompts entstehen durch systematische Verfeinerung:

  1. Einfach beginnen: Nur Kern-Subjekt und Aktion
  2. Ein Element hinzufügen: Einzelne Ergänzungen testen
  3. Funktionierendes dokumentieren: Protokoll effektiver Phrasen führen
  4. A/B-Test der Formulierung: Gleiches Konzept, unterschiedliche Worte
  5. Gewinner speichern: Ihre Prompt-Bibliothek aufbauen

Protokoll-Format:

Prompt: [vollständiger Prompt]
Model: [verwendete Plattform]
Result: [1-5 Bewertung]
Notes: [was funktionierte/nicht funktionierte]

Qualitätsprüfungs-Checkliste

Vor Finalisierung jedes AI-Videos verifizieren:

  • Subjekt-Konsistenz durchgehend
  • Natürliche Bewegung (keine Ruckler)
  • Beleuchtungs-Kontinuität
  • Keine Gesichtsverzerrungen
  • Color-Grade-Konsistenz
  • Angemessenes Tempo
  • Sauberer Audio (falls zutreffend)
  • Keine Wasserzeichen oder Artefakte

Nächste Schritte

Prompt Engineering verbessert sich mit Übung. Beginnen Sie mit einfacheren Aufnahmen, beherrschen Sie jede Ebene, kombinieren Sie sie dann. Das Ziel ist nicht das Auswendiglernen von Terminologie – es ist die Entwicklung einer Intuition dafür, was Video überzeugend macht.

Führen Sie ein Generierungs-Protokoll. Überprüfen Sie, was funktionierte. Bauen Sie Ihre Bibliothek auf. Der Unterschied zwischen Amateur- und professionellem AI-Video liegt oft in der Prompt-Präzision.

Ihre Kamera wartet. Beginnen Sie zu filmen.

War dieser Artikel hilfreich?

Damien

Damien

KI-Entwickler

KI-Entwickler aus Lyon, der es liebt, komplexe ML-Konzepte in einfache Rezepte zu verwandeln. Wenn er nicht gerade Modelle debuggt, findet man ihn beim Radfahren durch das Rhônetal.

Verwandte Artikel

Entdecken Sie weitere verwandte Beiträge

Hat Ihnen dieser Artikel gefallen?

Entdecken Sie weitere Einblicke und bleiben Sie mit unseren neuesten Inhalten auf dem Laufenden.

Der vollständige Leitfaden für AI Video Prompt Engineering 2025