Der vollständige Leitfaden für AI Video Prompt Engineering 2025
Beherrschen Sie die Kunst, Prompts zu erstellen, die hochwertige AI-generierte Videos erzeugen. Lernen Sie das Sechs-Ebenen-Framework, filmische Terminologie und plattformspezifische Techniken.

Prompt Engineering für AI-Video lässt sich mit dem Perfektionieren eines Rezepts vergleichen: Die gleichen Zutaten liefern völlig unterschiedliche Ergebnisse, abhängig von der Technik. Nach zahlreichen Stunden der Videogenerierung auf allen wichtigen Plattformen habe ich die funktionierenden Ansätze in ein praktisches Framework destilliert. Konzentrieren wir uns auf Techniken, die konsistente, professionelle Ergebnisse liefern.
Warum Video-Prompts anders sind
Wenn Sie mit Bildgeneratoren wie Midjourney oder DALL-E gearbeitet haben, könnten Sie annehmen, dass Video-Prompts identisch funktionieren. Das ist nicht der Fall. Video fügt eine zeitliche Dimension hinzu – Bewegung, Rhythmus, Übergänge – die Prompt Engineering von einer einzelnen Anweisung in die Orchestrierung einer Sequenz transformiert.
Der Unterschied lässt sich mit dem zwischen einer Fotografie und der Regie einer Szene vergleichen. Für ein Foto stellen Sie die Aufnahme ein. Für ein Video müssen Sie choreografieren, was im Zeitverlauf geschieht:
- Wie bewegt sich die Kamera?
- Welche Handlungen entfalten sich?
- Wie lange dauert jedes Element?
- Was ist der emotionale Bogen?
Diese Fragen erfordern Vokabular und Struktur, die über statische Bild-Prompts hinausgehen.
Das Sechs-Ebenen-Framework
Professionelle Video-Prompts folgen einem strukturierten Ansatz. Ich nenne es das Sechs-Ebenen-Framework – jede Ebene fügt Spezifität hinzu, die die AI zu Ihrer Vision führt:
Ebene 1: Subjekt und Aktion
Definieren Sie Ihren Fokus präzise. Vage Subjekte produzieren vage Ergebnisse.
Schwach: "Eine Frau in einem Garten" Stark: "Eine Frau in einem fließenden roten Kleid geht langsam durch Rosensträucher und berührt sanft Blütenblätter beim Vorbeigehen"
Die starke Version spezifiziert Kleidung, Bewegungsgeschwindigkeit und Interaktion mit der Umgebung. Jedes Detail begrenzt die Interpretation der AI in Richtung Ihrer Absicht.
Ebene 2: Aufnahmetyp und Bildausschnitt
Kameramänner haben ein Jahrhundert damit verbracht, visuelle Grammatik zu entwickeln. Nutzen Sie sie.
| Aufnahmetyp | Verwendungszweck |
|---|---|
| Wide Shot | Etablierung von Ort, Maßstab |
| Medium Shot | Charakterinteraktion, Dialog |
| Close-up | Emotion, Detail, Intimität |
| Extreme Close-up | Dramatische Betonung |
Beispiel: "Medium Tracking Shot, Kamera auf Hüfthöhe positioniert, von der Seite folgend"
Ebene 3: Kamerabewegung
Statische Aufnahmen wirken amateurhaft. Bewegung erzeugt Energie und lenkt Aufmerksamkeit.
| Bewegung | Effekt |
|---|---|
| Pan | Enthüllt Raum horizontal |
| Tilt | Enthüllt Raum vertikal |
| Dolly/Tracking | Erzeugt Tiefe, folgt Subjekt |
| Crane | Etabliert Maßstab, Drama |
| Handheld | Dringlichkeit, dokumentarisches Gefühl |
| Steadicam | Sanftes Folgen, Immersion |
Beispiel: "Langsamer Dolly Forward durch die Tür, Perspektive auf Augenhöhe beibehaltend"
Ebene 4: Beleuchtung und Atmosphäre
Beleuchtung bestimmt die Stimmung kraftvoller als jedes andere Element.
| Begriff | Visueller Effekt |
|---|---|
| Golden Hour | Warm, romantisch, nostalgisch |
| Blue Hour | Kühl, kontemplativ, mysteriös |
| High Key | Hell, optimistisch, klar |
| Low Key | Dramatisch, stimmungsvoll, spannungsgeladen |
| Volumetric Light | Strahlen durch Nebel/Staub, ätherisch |
| Rim Lighting | Separation, Drama, Silhouettenkante |
Beispiel: "Golden Hour Beleuchtung mit volumetrischen Strahlen durch staubige Fenster, warmes Color Grading"
Ebene 5: Technische Spezifikationen
Benennen Sie spezifische technische Parameter, wenn Sie präzise Kontrolle benötigen:
- Objektiv: 35mm (natürlich), 50mm (Portrait), 85mm (Kompression), 24mm (Weitwinkel)
- Schärfentiefe: Gering (Bokeh-Hintergrund) vs. tief (alles scharf)
- Bildrate: 24fps (filmisch), 60fps (flüssig), 120fps (Zeitlupe)
- Seitenverhältnis: 16:9 (Standard), 2.39:1 (filmisch), 9:16 (vertikal)
Beispiel: "Aufgenommen mit 85mm Objektiv, geringe Schärfentiefe mit cremigem Bokeh, leichtes Filmkorn"
Ebene 6: Dauer und Rhythmus
Video entfaltet sich über Zeit. Spezifizieren Sie den Rhythmus:
- Szenendauer (3-10 Sekunden typisch)
- Übergangsstil (Cut, Dissolve, Wipe)
- Tempo (langsam/kontemplativ vs. schnell/energetisch)
- Beat-Timing für Musiksynchronisation
Beispiel: "6-Sekunden-Aufnahme mit langsamer, bedachter Bewegung, am finalen Frame 1 Sekunde haltend"
Integration: Vollständige Prompt-Beispiele
So kombinieren sich Ebenen zu professionellen Prompts:
Filmisches Portrait:
Medium Close-up eines verwitterten Fischergesichts, frühmorgendliche Blue Hour,
aufgenommen mit 85mm Objektiv mit geringer Schärfentiefe. Sanfte Handheld-Mikrobewegungen,
weiches Rim Lighting von hinten erzeugt Halo-Effekt auf grauem Haar.
Kontemplative Mimik, Augen leicht neben Kamera blickend.
Kühles Color Grading mit angehobenen Schatten, 5 Sekunden Dauer.Action-Sequenz:
Wide Tracking Shot folgt Parkour-Athleten über urbane Dächer
bei Sonnenuntergang. Dynamische Steadicam-Bewegung hält konstante Distanz,
Golden Hour Gegenlicht erzeugt dramatische Silhouette. 24fps filmische Bewegung,
leichte Zeitlupe bei 0.8x Geschwindigkeit. Hoher Kontrast, Teal-Orange Color Grading.
8 Sekunden mit steigender Intensität.Produktpräsentation:
Langsame 360-Grad-Orbit um Luxusuhr auf schwarzer Samtoberläche.
Makro-Objektiv erfasst detaillierte Zifferblatt-Details, kontrollierte Studio-Beleuchtung
mit weichem Key Light und subtilem Fill. Geringe Schärfentiefe isoliert
das Subjekt, sanfte Reflexionen auf Kristall. Premium-Eindruck mit
langsamer, bedachter Kamerabewegung. 10 Sekunden Dauer.Negative Prompting: Der AI mitteilen, was zu vermeiden ist
Ebenso wichtig ist die Spezifikation dessen, was Sie nicht möchten. Jede Plattform handhabt dies unterschiedlich:
Häufige Negative Prompts:
- Unscharfes Footage, Motion-Blur-Artefakte
- Verzerrte Gesichter, anatomische Fehler
- Wasserzeichen, Text-Overlays
- Unnatürliche Bewegungen, ruckartige Übergänge
- Niedrige Auflösung, Kompressionsartefakte
Plattformspezifische Syntax:
| Plattform | Methode |
|---|---|
| Veo 3 | Dediziertes Negative-Prompt-Feld |
| Kling | "avoid" oder "without" im Prompt einschließen |
| Runway | Separater Negative-Prompt-Parameter |
| Sora | Gewichtungsbasierte Ausschlüsse |
Beispiel: "Avoid: blurry footage, distorted facial features, watermarks, jerky camera movement, oversaturated colors"
Style Reference Stacking
Sie möchten eine charakteristische Ästhetik? Kombinieren Sie 2-3 Filmreferenzen:
Formel: [Film A] Color Grading + [Film B] Atmosphäre + [Film C] Kamerabewegung
Beispiele:
- "Blade Runner 2049 Color Grading plus Se7en Atmosphäre plus Heat Kamerabewegung"
- "Wes Anderson Symmetrie plus Studio Ghibli Farbpalette plus Terrence Malick natürliche Beleuchtung"
- "Mad Max: Fury Road Energie plus Roger Deakins Beleuchtung plus Spielberg Blocking"
Limitieren Sie auf 3 Referenzen. Mehr erzeugt widersprüchliche Signale.
Plattformspezifische Optimierung
Jedes Modell hat Stärken. Passen Sie Ihren Prompt-Stil an die Plattform an:
| Modell | Stärken | Prompt-Fokus |
|---|---|---|
| Kling 2.5 | Athletische Bewegung, Charakteranimation | Action-Verben, physische Bewegung |
| Sora 2 | Multi-Shot-Storytelling, räumliche Konsistenz | Szenenübergänge, narrativer Bogen |
| Veo 3 | Präzisionskontrolle, JSON-Formatierung | Technische Spezifikationen, strukturierte Syntax |
| Runway Gen-3 | Stilisierung, künstlerische Interpretation | Ästhetische Referenzen, Stimmungsdeskriptoren |
| WAN 2.5 | Dialog, Lip-Sync | Sprachaktionen, Gesichtsausdrücke |
Veo 3 JSON-Beispiel:
{
"subject": "woman in red dress",
"action": "walking through garden",
"shot_type": "medium tracking",
"camera_movement": "dolly right to left",
"lighting": "golden hour, volumetric",
"lens": "35mm",
"duration": "6 seconds"
}Die 5-10-1 Kostenoptimierungsregel
Premium-Renderings sind kostenintensiv. Verwenden Sie diesen Workflow:
- 5 Variationen auf kostengünstigeren Modellen (40-60 Credits jeweils)
- 10 Iterationen zur Verfeinerung des besten Kandidaten
- 1 finales Rendering auf Premium-Tier (~350 Credits)
Dies reduziert Kosten von Tausenden auf etwa 1.000 Credits bei gleichbleibender Qualität.
Häufige Fehler zu vermeiden
Nach Überprüfung hunderter Prompts treten diese Fehler am häufigsten auf:
| Fehler | Problem | Lösung |
|---|---|---|
| Umgangssprachliche Beschreibungen | AI interpretiert locker | Verwenden Sie filmische Terminologie |
| Dauer-Mismatch | Aktion passt nicht in Zeitrahmen | Passen Sie Komplexität an Dauer an |
| Style-Überladung | Widersprüchliche ästhetische Signale | Limitieren auf maximal 3 Referenzen |
| Fehlende Bewegung | Statisches, amateurhaftes Gefühl | Spezifizieren Sie immer Kamerabewegung |
| Vage Beleuchtung | Inkonsistente Stimmung | Benennen Sie spezifische Beleuchtungs-Setups |
| Keine Negative Prompts | Unerwünschte Artefakte | Schließen Sie Probleme explizit aus |
Aufbau Ihrer Prompt-Bibliothek
Erstellen Sie Templates für häufige Szenarien:
Interview-Setup:
Medium Shot, Subjekt nach Drittelregel links positioniert, Kamera auf Augenhöhe,
[LIGHTING_SETUP], geringe Schärfentiefe verwischt Hintergrund,
subtile Handheld-Mikrobewegungen für natürliches Gefühl, [DURATION].B-Roll Natur:
[SHOT_TYPE] von [SUBJECT], [TIME_OF_DAY] Beleuchtung,
langsame [CAMERA_MOVEMENT], [LENS]mm Objektiv, tiefe Schärfe,
[COLOR_GRADE] Palette, [DURATION].Produkt-Hero:
[ORBIT_DIRECTION] Orbit um [PRODUCT] auf [SURFACE],
Studio-Beleuchtung mit [KEY_LIGHT_POSITION] Key und subtilem Fill,
Makro-Detail-Momente, [LENS]mm, makellose Reflexionen, [DURATION].Füllen Sie Klammern für spezifische Anforderungen. Bauen Sie eine nach Anwendungsfall organisierte Bibliothek auf.
Iterations-Strategie
Perfekte Prompts entstehen durch systematische Verfeinerung:
- Einfach beginnen: Nur Kern-Subjekt und Aktion
- Ein Element hinzufügen: Einzelne Ergänzungen testen
- Funktionierendes dokumentieren: Protokoll effektiver Phrasen führen
- A/B-Test der Formulierung: Gleiches Konzept, unterschiedliche Worte
- Gewinner speichern: Ihre Prompt-Bibliothek aufbauen
Protokoll-Format:
Prompt: [vollständiger Prompt]
Model: [verwendete Plattform]
Result: [1-5 Bewertung]
Notes: [was funktionierte/nicht funktionierte]Qualitätsprüfungs-Checkliste
Vor Finalisierung jedes AI-Videos verifizieren:
- Subjekt-Konsistenz durchgehend
- Natürliche Bewegung (keine Ruckler)
- Beleuchtungs-Kontinuität
- Keine Gesichtsverzerrungen
- Color-Grade-Konsistenz
- Angemessenes Tempo
- Sauberer Audio (falls zutreffend)
- Keine Wasserzeichen oder Artefakte
Nächste Schritte
Prompt Engineering verbessert sich mit Übung. Beginnen Sie mit einfacheren Aufnahmen, beherrschen Sie jede Ebene, kombinieren Sie sie dann. Das Ziel ist nicht das Auswendiglernen von Terminologie – es ist die Entwicklung einer Intuition dafür, was Video überzeugend macht.
Führen Sie ein Generierungs-Protokoll. Überprüfen Sie, was funktionierte. Bauen Sie Ihre Bibliothek auf. Der Unterschied zwischen Amateur- und professionellem AI-Video liegt oft in der Prompt-Präzision.
Ihre Kamera wartet. Beginnen Sie zu filmen.
War dieser Artikel hilfreich?

Damien
KI-EntwicklerKI-Entwickler aus Lyon, der es liebt, komplexe ML-Konzepte in einfache Rezepte zu verwandeln. Wenn er nicht gerade Modelle debuggt, findet man ihn beim Radfahren durch das Rhônetal.
Verwandte Artikel
Entdecken Sie weitere verwandte Beiträge

Pika 2.5: KI-Video durch Geschwindigkeit, Preis und kreative Werkzeuge zugänglich machen
Pika Labs veröffentlicht Version 2.5, die schnellere Generierung, verbesserte Physik und kreative Werkzeuge wie Pikaframes und Pikaffects kombiniert, um KI-Video für jeden zugänglich zu machen.

Runway Gen-4.5 erreicht Platz 1: Wie 100 Ingenieure Google und OpenAI übertrafen
Runway hat mit Gen-4.5 den Spitzenplatz in der Video Arena erreicht. Dies belegt, dass ein kleines Team mit Billionen-Dollar-Konzernen in der KI-Videogenerierung konkurrieren kann.

CraftStory Model 2.0: Wie bidirektionale Diffusion 5-minütige KI-Videos ermöglicht
Während Sora 2 bei 25 Sekunden endet, hat CraftStory ein System vorgestellt, das kohärente 5-minütige Videos generiert. Das Geheimnis? Paralleler Betrieb mehrerer Diffusions-Engines mit bidirektionalen Einschränkungen.