Kompletní průvodce prompt engineeringem pro AI video v roce 2025
Ovládněte umění tvorby promptů, které vytváří úchvatná AI videa. Naučte se šestivrstvý framework, filmařskou terminologii a techniky specifické pro jednotlivé platformy.

Prompt engineering pro AI video je jako zdokonalování receptu: stejné ingredience dávají naprosto odlišné výsledky v závislosti na technice. Po nespočtu hodin generování videí na všech hlavních platformách jsem destiloval to, co skutečně funguje, do praktického frameworku. Pojďme prorazit hluk a zaměřit se na techniky, které přinášejí konzistentní, profesionální výsledky.
Proč jsou video prompty jiné
Pokud jste pracovali s generátory obrázků jako Midjourney nebo DALL-E, možná si myslíte, že video prompty fungují stejně. Nefungují. Video přidává časovou dimenzi—pohyb, rytmus, přechody—což transformuje prompt engineering z jediné instrukce na orchestraci sekvence.
Představte si to jako rozdíl mezi focením fotografie a režírováním scény. Pro fotku nastavíte záběr. Pro video potřebujete choreografovat, co se děje v čase:
- Jak se pohybuje kamera?
- Jaké akce se odvíjejí?
- Jak dlouho každý prvek trvá?
- Jaký je emocionální oblouk?
Tyto otázky vyžadují slovník a strukturu, které přesahují statické prompty pro obrázky.
Šestivrstvý framework
Profesionální video prompty následují strukturovaný přístup. Říkám tomu šestivrstvý framework—každá vrstva přidává specifičnost, která vede AI k vaší vizi:
Vrstva 1: Předmět a akce
Definujte své zaměření s přesností. Vágní předměty produkují vágní výsledky.
Slabé: "Žena na zahradě" Silné: "Žena ve vlajících červených šatech kráčející pomalu mezi keři růží, jemně se dotýkající okvětních lístků, když prochází kolem"
Silná verze specifikuje oblečení, rychlost pohybu a interakci s prostředím. Každý detail omezuje interpretaci AI směrem k vašemu záměru.
Vrstva 2: Typ záběru a orámování
Kameramani strávili století vývojem vizuální gramatiky. Použijte ji.
| Typ záběru | Použití |
|---|---|
| Široký záběr | Zavedení lokace, měřítka |
| Střední záběr | Interakce postav, dialog |
| Detail | Emoce, detail, intimita |
| Extrémní detail | Dramatický důraz |
Příklad: "Střední sledovací záběr, kamera umístěná ve výši pasu, sledující ze strany"
Vrstva 3: Pohyb kamery
Statické záběry působí amatérsky. Pohyb vytváří energii a řídí pozornost.
| Pohyb | Efekt |
|---|---|
| Pan | Odhaluje prostor horizontálně |
| Tilt | Odhaluje prostor vertikálně |
| Dolly/tracking | Vytváří hloubku, sleduje subjekt |
| Jeřáb | Vytváří měřítko, drama |
| Ruční kamera | Naléhavost, dokumentární pocit |
| Steadicam | Plynulé sledování, ponoření |
Příklad: "Pomalý dolly vpřed dveřmi, udržující perspektivu na úrovni očí"
Vrstva 4: Osvětlení a atmosféra
Osvětlení nastavuje náladu silněji než jakýkoli jiný element.
| Termín | Vizuální efekt |
|---|---|
| Zlatá hodina | Teplé, romantické, nostalgické |
| Modrá hodina | Chladné, rozjímavé, tajemné |
| High key | Světlé, optimistické, čisté |
| Low key | Dramatické, náladové, napínavé |
| Volumetrické světlo | Paprsky skrz mlhu/prach, éterické |
| Rim lighting | Oddělení, drama, siluetový okraj |
Příklad: "Osvětlení zlaté hodiny s volumetrickými paprsky filtrujícími skrz zaprášená okna, teplá barevná grada"
Vrstva 5: Technické specifikace
Pojmenujte konkrétní technické parametry, když chcete přesnou kontrolu:
- Objektiv: 35mm (přirozené), 50mm (portrét), 85mm (komprese), 24mm (širokoúhlé)
- Hloubka ostrosti: Mělká (bokeh pozadí) vs. hluboká (vše ostré)
- Frame rate: 24fps (filmové), 60fps (plynulé), 120fps (slow motion)
- Aspect ratio: 16:9 (standardní), 2.39:1 (filmové), 9:16 (vertikální)
Příklad: "Natočeno na 85mm objektiv, mělká hloubka ostrosti s krémovým bokeh, lehké filmové zrno"
Vrstva 6: Délka a tempo
Video se odvíjí v čase. Specifikujte rytmus:
- Délka scény (typicky 3-10 sekund)
- Styl přechodu (cut, dissolve, wipe)
- Tempo (pomalé/rozjímavé vs. rychlé/energické)
- Načasování beatů pro synchronizaci s hudbou
Příklad: "6sekundový záběr s pomalým, promyšleným pohybem, držící na závěrečném snímku 1 sekundu"
Sestavení celku: Příklady celých promptů
Takhle se vrstvy kombinují do profesionálních promptů:
Filmový portrét:
Střední detail obličeje ošlehaného rybáře, brzy ráno v modrou hodinu,
natočeno na 85mm objektiv s mělkou hloubkou ostrosti. Jemné mikropohyby ruční kamery,
měkké rim lighting zezadu vytvářející haló efekt na jeho šedivých vlasech.
Rozjímavý výraz, oči hledící mírně mimo kameru.
Chladná barevná grada se zdviženými stíny, 5 sekund trvání.Akční sekvence:
Široký sledovací záběr následující parkour atleta běžícího po městských střechách
při západu slunce. Dynamický pohyb steadicam udržující konstantní vzdálenost,
protisvetlo zlaté hodiny vytvářející dramatickou siluetu. 24fps filmový pohyb,
mírný slow-motion na 0.8x rychlost. Vysoký kontrast, teal-orange barevná grada.
8 sekund s narůstající intenzitou.Prezentace produktu:
Pomalá 360stupňová oběžná dráha kolem luxusních hodinek na černém sametovém povrchu.
Makro objektiv zachycující složité detaily ciferníku, kontrolované studiové osvětlení
s měkkým hlavním světlem a jemnou výplní. Mělká hloubka ostrosti izolující
subjekt, jemné odrazy na kryštálu. Prémiový pocit s
pomalým, promyšleným pohybem kamery. 10 sekund trvání.Negativní promptování: Říkat AI, čemu se vyhnout
Stejně důležité je specifikovat, co nechcete. Každá platforma to řeší jinak:
Běžné negativní prompty:
- Rozmazané záběry, artefakty motion blur
- Zkreslené obličeje, anatomické chyby
- Vodoznaky, textové překryvy
- Nepřirozené pohyby, trhavé přechody
- Nízké rozlišení, kompresní artefakty
Syntaxe specifická pro platformu:
| Platforma | Metoda |
|---|---|
| Veo 3 | Dedikované pole negativního promptu |
| Kling | Zahrnutí "avoid" nebo "without" v promptu |
| Runway | Samostatný parametr negativního promptu |
| Sora | Vyloučení založená na váhách |
Příklad: "Avoid: blurry footage, distorted facial features, watermarks, jerky camera movement, oversaturated colors"
Skládání stylových referencí
Chcete výraznou estetiku? Zkombinujte 2-3 filmové reference:
Vzorec: [Film A] color grading + [Film B] atmosféra + [Film C] pohyb kamery
Příklady:
- "Blade Runner 2049 color grading plus Se7en atmosféra plus Heat pohyb kamery"
- "Wes Anderson symetrie plus Studio Ghibli barevná paleta plus Terrence Malick přirozené osvětlení"
- "Mad Max: Fury Road energie plus Roger Deakins osvětlení plus Spielberg blocking"
Omezte na 3 reference. Více vytváří konfliktní signály.
Optimalizace specifická pro platformu
Každý model má silné stránky. Přizpůsobte styl promptu platformě:
| Model | Silné stránky | Zaměření promptu |
|---|---|---|
| Kling 2.5 | Atletický pohyb, animace postav | Akční slovesa, fyzický pohyb |
| Sora 2 | Vícezáběrové vyprávění, prostorová konzistence | Přechody scén, narativní oblouk |
| Veo 3 | Přesná kontrola, JSON formátování | Technické specifikace, strukturovaná syntaxe |
| Runway Gen-3 | Stylizace, umělecká interpretace | Estetické reference, popisovače nálady |
| WAN 2.5 | Dialog, lip-sync | Mluvní akce, mimické výrazy |
Veo 3 JSON příklad:
{
"subject": "woman in red dress",
"action": "walking through garden",
"shot_type": "medium tracking",
"camera_movement": "dolly right to left",
"lighting": "golden hour, volumetric",
"lens": "35mm",
"duration": "6 seconds"
}Pravidlo 5-10-1 pro optimalizaci nákladů
Prémiové rendery jsou drahé. Použijte tento workflow:
- 5 variací na levnějších modelech (40-60 kreditů každá)
- 10 iterací vylepšování nejlepšího kandidáta
- 1 finální render na prémiové úrovni (~350 kreditů)
To snižuje náklady z tisíců na přibližně 1 000 kreditů při zachování kvality.
Běžné chyby, kterým se vyhnout
Po přezkoumání stovek promptů se tyto chyby objevují nejčastěji:
| Chyba | Problém | Řešení |
|---|---|---|
| Casualní popisy | AI interpretuje volně | Použijte kinematografickou terminologii |
| Nesoulad délky | Akce nezapadá do časového rámce | Přizpůsobte komplexitu délce |
| Přetížení stylem | Konfliktní estetické signály | Omezte na max 3 reference |
| Chybějící pohyb | Statický, amatérský pocit | Vždy specifikujte pohyb kamery |
| Vágní osvětlení | Nekonzistentní nálada | Pojmenujte konkrétní osvětlovací sestavy |
| Žádné negativní prompty | Nežádoucí artefakty | Explicitně vylučte problémy |
Budování vlastní knihovny promptů
Vytvořte šablony pro běžné scénáře:
Nastavení rozhovoru:
Střední záběr, subjekt umístěn vlevo podle pravidla třetin, kamera na úrovni očí,
[LIGHTING_SETUP], mělká hloubka ostrosti rozmazávající pozadí,
jemné mikropohyby ruční kamery pro přirozený pocit, [DURATION].B-Roll příroda:
[SHOT_TYPE] of [SUBJECT], [TIME_OF_DAY] osvětlení,
pomalý [CAMERA_MOVEMENT], [LENS]mm objektiv, hluboké zaostření,
[COLOR_GRADE] paleta, [DURATION].Produktový hrdina:
[ORBIT_DIRECTION] oběžná dráha kolem [PRODUCT] na [SURFACE],
studiové osvětlení s [KEY_LIGHT_POSITION] hlavním světlem a jemnou výplní,
makro detailní momenty, [LENS]mm, dokonalé odrazy, [DURATION].Vyplňte závorky pro specifické potřeby. Vybudujte knihovnu organizovanou podle případů použití.
Iterační strategie
Perfektní prompty se rodí systematickým vylepšováním:
- Začněte jednoduše: Pouze základní subjekt a akce
- Přidejte jeden element: Testujte jednotlivá přidání
- Dokumentujte, co funguje: Veďte si záznam efektivních frází
- A/B testujte formulace: Stejný koncept, různá slova
- Ukládejte vítěze: Vybudujte svou knihovnu promptů
Formát záznamu:
Prompt: [celý prompt]
Model: [použitá platforma]
Result: [hodnocení 1-5]
Notes: [co fungovalo/nefungovalo]Checklist kontroly kvality
Před dokončením jakéhokoli AI videa ověřte:
- Konzistence subjektu v průběhu celého videa
- Přirozený pohyb (žádné trhání)
- Kontinuita osvětlení
- Žádné zkreslení obličejů
- Konzistence barevné grady
- Vhodné tempo
- Čistý zvuk (pokud je aplikovatelné)
- Žádné vodoznaky nebo artefakty
Další kroky
Prompt engineering se zlepšuje s praxí. Začněte s jednoduššími záběry, ovládněte každou vrstvu, pak je zkombinujte. Cílem není memorovat terminologii—jde o rozvoj intuice pro to, co dělá video přesvědčivým.
Veďte si záznam generování. Přezkoumávejte, co fungovalo. Budujte svou knihovnu. Rozdíl mezi amatérským a profesionálním AI videem často spočívá v přesnosti promptu.
Vaše kamera čeká. Začněte natáčet.
Byl tento článek užitečný?

Damien
AI vývojářAI vývojář z Lyonu, který rád přeměňuje složité ML koncepty na jednoduché recepty. Když právě neladí modely, najdete ho na kole v údolí Rhôny.
Související články
Pokračujte ve zkoumání s těmito souvisejícími příspěvky

Pika 2.5: Dostupné AI video skrz rychlost, cenu a nástroje
Pika Labs vydává verzi 2.5 s rychlejší generací, vylepšenou fyzikou a nástroji jako Pikaframes a Pikaffects pro práci s videem.

Kling O1: Kuaishou se připojuje k závodu o jednotný multimodální video model
Kuaishou právě spustil Kling O1, jednotnou multimodální AI, která myslí současně ve videu, zvuku a textu. Závod o audiovizuální inteligenci nabírá na obrátkách.

Runway Gen-4.5 na prvním místě: 100 inženýrů porazilo Google a OpenAI
Runway právě obsadilo první místo na Video Arena s Gen-4.5. Důkaz, že malý tým může konkurovat trilionovým gigantům v AI generování videa.