Meta Pixel
DamienDamien
8 min read
1468 slov

Kompletní průvodce prompt engineeringem pro AI video v roce 2025

Ovládněte umění tvorby promptů, které vytváří úchvatná AI videa. Naučte se šestivrstvý framework, filmařskou terminologii a techniky specifické pro jednotlivé platformy.

Kompletní průvodce prompt engineeringem pro AI video v roce 2025

Prompt engineering pro AI video je jako zdokonalování receptu: stejné ingredience dávají naprosto odlišné výsledky v závislosti na technice. Po nespočtu hodin generování videí na všech hlavních platformách jsem destiloval to, co skutečně funguje, do praktického frameworku. Pojďme prorazit hluk a zaměřit se na techniky, které přinášejí konzistentní, profesionální výsledky.

Proč jsou video prompty jiné

Pokud jste pracovali s generátory obrázků jako Midjourney nebo DALL-E, možná si myslíte, že video prompty fungují stejně. Nefungují. Video přidává časovou dimenzi—pohyb, rytmus, přechody—což transformuje prompt engineering z jediné instrukce na orchestraci sekvence.

Představte si to jako rozdíl mezi focením fotografie a režírováním scény. Pro fotku nastavíte záběr. Pro video potřebujete choreografovat, co se děje v čase:

  • Jak se pohybuje kamera?
  • Jaké akce se odvíjejí?
  • Jak dlouho každý prvek trvá?
  • Jaký je emocionální oblouk?

Tyto otázky vyžadují slovník a strukturu, které přesahují statické prompty pro obrázky.

Šestivrstvý framework

Profesionální video prompty následují strukturovaný přístup. Říkám tomu šestivrstvý framework—každá vrstva přidává specifičnost, která vede AI k vaší vizi:

Vrstva 1: Předmět a akce

Definujte své zaměření s přesností. Vágní předměty produkují vágní výsledky.

Slabé: "Žena na zahradě" Silné: "Žena ve vlajících červených šatech kráčející pomalu mezi keři růží, jemně se dotýkající okvětních lístků, když prochází kolem"

Silná verze specifikuje oblečení, rychlost pohybu a interakci s prostředím. Každý detail omezuje interpretaci AI směrem k vašemu záměru.

Vrstva 2: Typ záběru a orámování

Kameramani strávili století vývojem vizuální gramatiky. Použijte ji.

Typ záběruPoužití
Široký záběrZavedení lokace, měřítka
Střední záběrInterakce postav, dialog
DetailEmoce, detail, intimita
Extrémní detailDramatický důraz

Příklad: "Střední sledovací záběr, kamera umístěná ve výši pasu, sledující ze strany"

Vrstva 3: Pohyb kamery

Statické záběry působí amatérsky. Pohyb vytváří energii a řídí pozornost.

PohybEfekt
PanOdhaluje prostor horizontálně
TiltOdhaluje prostor vertikálně
Dolly/trackingVytváří hloubku, sleduje subjekt
JeřábVytváří měřítko, drama
Ruční kameraNaléhavost, dokumentární pocit
SteadicamPlynulé sledování, ponoření

Příklad: "Pomalý dolly vpřed dveřmi, udržující perspektivu na úrovni očí"

Vrstva 4: Osvětlení a atmosféra

Osvětlení nastavuje náladu silněji než jakýkoli jiný element.

TermínVizuální efekt
Zlatá hodinaTeplé, romantické, nostalgické
Modrá hodinaChladné, rozjímavé, tajemné
High keySvětlé, optimistické, čisté
Low keyDramatické, náladové, napínavé
Volumetrické světloPaprsky skrz mlhu/prach, éterické
Rim lightingOddělení, drama, siluetový okraj

Příklad: "Osvětlení zlaté hodiny s volumetrickými paprsky filtrujícími skrz zaprášená okna, teplá barevná grada"

Vrstva 5: Technické specifikace

Pojmenujte konkrétní technické parametry, když chcete přesnou kontrolu:

  • Objektiv: 35mm (přirozené), 50mm (portrét), 85mm (komprese), 24mm (širokoúhlé)
  • Hloubka ostrosti: Mělká (bokeh pozadí) vs. hluboká (vše ostré)
  • Frame rate: 24fps (filmové), 60fps (plynulé), 120fps (slow motion)
  • Aspect ratio: 16:9 (standardní), 2.39:1 (filmové), 9:16 (vertikální)

Příklad: "Natočeno na 85mm objektiv, mělká hloubka ostrosti s krémovým bokeh, lehké filmové zrno"

Vrstva 6: Délka a tempo

Video se odvíjí v čase. Specifikujte rytmus:

  • Délka scény (typicky 3-10 sekund)
  • Styl přechodu (cut, dissolve, wipe)
  • Tempo (pomalé/rozjímavé vs. rychlé/energické)
  • Načasování beatů pro synchronizaci s hudbou

Příklad: "6sekundový záběr s pomalým, promyšleným pohybem, držící na závěrečném snímku 1 sekundu"

Sestavení celku: Příklady celých promptů

Takhle se vrstvy kombinují do profesionálních promptů:

Filmový portrét:

Střední detail obličeje ošlehaného rybáře, brzy ráno v modrou hodinu,
natočeno na 85mm objektiv s mělkou hloubkou ostrosti. Jemné mikropohyby ruční kamery,
měkké rim lighting zezadu vytvářející haló efekt na jeho šedivých vlasech.
Rozjímavý výraz, oči hledící mírně mimo kameru.
Chladná barevná grada se zdviženými stíny, 5 sekund trvání.

Akční sekvence:

Široký sledovací záběr následující parkour atleta běžícího po městských střechách
při západu slunce. Dynamický pohyb steadicam udržující konstantní vzdálenost,
protisvetlo zlaté hodiny vytvářející dramatickou siluetu. 24fps filmový pohyb,
mírný slow-motion na 0.8x rychlost. Vysoký kontrast, teal-orange barevná grada.
8 sekund s narůstající intenzitou.

Prezentace produktu:

Pomalá 360stupňová oběžná dráha kolem luxusních hodinek na černém sametovém povrchu.
Makro objektiv zachycující složité detaily ciferníku, kontrolované studiové osvětlení
s měkkým hlavním světlem a jemnou výplní. Mělká hloubka ostrosti izolující
subjekt, jemné odrazy na kryštálu. Prémiový pocit s
pomalým, promyšleným pohybem kamery. 10 sekund trvání.

Negativní promptování: Říkat AI, čemu se vyhnout

Stejně důležité je specifikovat, co nechcete. Každá platforma to řeší jinak:

Běžné negativní prompty:

  • Rozmazané záběry, artefakty motion blur
  • Zkreslené obličeje, anatomické chyby
  • Vodoznaky, textové překryvy
  • Nepřirozené pohyby, trhavé přechody
  • Nízké rozlišení, kompresní artefakty

Syntaxe specifická pro platformu:

PlatformaMetoda
Veo 3Dedikované pole negativního promptu
KlingZahrnutí "avoid" nebo "without" v promptu
RunwaySamostatný parametr negativního promptu
SoraVyloučení založená na váhách

Příklad: "Avoid: blurry footage, distorted facial features, watermarks, jerky camera movement, oversaturated colors"

Skládání stylových referencí

Chcete výraznou estetiku? Zkombinujte 2-3 filmové reference:

Vzorec: [Film A] color grading + [Film B] atmosféra + [Film C] pohyb kamery

Příklady:

  • "Blade Runner 2049 color grading plus Se7en atmosféra plus Heat pohyb kamery"
  • "Wes Anderson symetrie plus Studio Ghibli barevná paleta plus Terrence Malick přirozené osvětlení"
  • "Mad Max: Fury Road energie plus Roger Deakins osvětlení plus Spielberg blocking"

Omezte na 3 reference. Více vytváří konfliktní signály.

Optimalizace specifická pro platformu

Každý model má silné stránky. Přizpůsobte styl promptu platformě:

ModelSilné stránkyZaměření promptu
Kling 2.5Atletický pohyb, animace postavAkční slovesa, fyzický pohyb
Sora 2Vícezáběrové vyprávění, prostorová konzistencePřechody scén, narativní oblouk
Veo 3Přesná kontrola, JSON formátováníTechnické specifikace, strukturovaná syntaxe
Runway Gen-3Stylizace, umělecká interpretaceEstetické reference, popisovače nálady
WAN 2.5Dialog, lip-syncMluvní akce, mimické výrazy

Veo 3 JSON příklad:

{
  "subject": "woman in red dress",
  "action": "walking through garden",
  "shot_type": "medium tracking",
  "camera_movement": "dolly right to left",
  "lighting": "golden hour, volumetric",
  "lens": "35mm",
  "duration": "6 seconds"
}

Pravidlo 5-10-1 pro optimalizaci nákladů

Prémiové rendery jsou drahé. Použijte tento workflow:

  1. 5 variací na levnějších modelech (40-60 kreditů každá)
  2. 10 iterací vylepšování nejlepšího kandidáta
  3. 1 finální render na prémiové úrovni (~350 kreditů)

To snižuje náklady z tisíců na přibližně 1 000 kreditů při zachování kvality.

Běžné chyby, kterým se vyhnout

Po přezkoumání stovek promptů se tyto chyby objevují nejčastěji:

ChybaProblémŘešení
Casualní popisyAI interpretuje volněPoužijte kinematografickou terminologii
Nesoulad délkyAkce nezapadá do časového rámcePřizpůsobte komplexitu délce
Přetížení stylemKonfliktní estetické signályOmezte na max 3 reference
Chybějící pohybStatický, amatérský pocitVždy specifikujte pohyb kamery
Vágní osvětleníNekonzistentní náladaPojmenujte konkrétní osvětlovací sestavy
Žádné negativní promptyNežádoucí artefaktyExplicitně vylučte problémy

Budování vlastní knihovny promptů

Vytvořte šablony pro běžné scénáře:

Nastavení rozhovoru:

Střední záběr, subjekt umístěn vlevo podle pravidla třetin, kamera na úrovni očí,
[LIGHTING_SETUP], mělká hloubka ostrosti rozmazávající pozadí,
jemné mikropohyby ruční kamery pro přirozený pocit, [DURATION].

B-Roll příroda:

[SHOT_TYPE] of [SUBJECT], [TIME_OF_DAY] osvětlení,
pomalý [CAMERA_MOVEMENT], [LENS]mm objektiv, hluboké zaostření,
[COLOR_GRADE] paleta, [DURATION].

Produktový hrdina:

[ORBIT_DIRECTION] oběžná dráha kolem [PRODUCT] na [SURFACE],
studiové osvětlení s [KEY_LIGHT_POSITION] hlavním světlem a jemnou výplní,
makro detailní momenty, [LENS]mm, dokonalé odrazy, [DURATION].

Vyplňte závorky pro specifické potřeby. Vybudujte knihovnu organizovanou podle případů použití.

Iterační strategie

Perfektní prompty se rodí systematickým vylepšováním:

  1. Začněte jednoduše: Pouze základní subjekt a akce
  2. Přidejte jeden element: Testujte jednotlivá přidání
  3. Dokumentujte, co funguje: Veďte si záznam efektivních frází
  4. A/B testujte formulace: Stejný koncept, různá slova
  5. Ukládejte vítěze: Vybudujte svou knihovnu promptů

Formát záznamu:

Prompt: [celý prompt]
Model: [použitá platforma]
Result: [hodnocení 1-5]
Notes: [co fungovalo/nefungovalo]

Checklist kontroly kvality

Před dokončením jakéhokoli AI videa ověřte:

  • Konzistence subjektu v průběhu celého videa
  • Přirozený pohyb (žádné trhání)
  • Kontinuita osvětlení
  • Žádné zkreslení obličejů
  • Konzistence barevné grady
  • Vhodné tempo
  • Čistý zvuk (pokud je aplikovatelné)
  • Žádné vodoznaky nebo artefakty

Další kroky

Prompt engineering se zlepšuje s praxí. Začněte s jednoduššími záběry, ovládněte každou vrstvu, pak je zkombinujte. Cílem není memorovat terminologii—jde o rozvoj intuice pro to, co dělá video přesvědčivým.

Veďte si záznam generování. Přezkoumávejte, co fungovalo. Budujte svou knihovnu. Rozdíl mezi amatérským a profesionálním AI videem často spočívá v přesnosti promptu.

Vaše kamera čeká. Začněte natáčet.

Byl tento článek užitečný?

Damien

Damien

AI vývojář

AI vývojář z Lyonu, který rád přeměňuje složité ML koncepty na jednoduché recepty. Když právě neladí modely, najdete ho na kole v údolí Rhôny.

Související články

Pokračujte ve zkoumání s těmito souvisejícími příspěvky

Líbil se vám tento článek?

Objevte více poznatků a zůstaňte aktuální s naším nejnovějším obsahem.

Kompletní průvodce prompt engineeringem pro AI video v roce 2025