Teljes útmutató az AI videó prompt engineering-hez 2025-ben
Sajátítsd el a lenyűgöző AI-generált videókat létrehozó promptok tervezésének művészetét. Ismerd meg a hatszintű keretrendszert, a filmművészeti terminológiát és a platformspecifikus technikákat.

A prompt engineering az AI videókhoz olyan, mint egy recept tökéletesítése: ugyanazok az összetevők vadul eltérő eredményeket adnak a technikai kivitelezéstől függően. Miután számtalan órát töltöttem videók generálásával minden jelentős platformon, összegyűjtöttem a gyakorlatban bevált módszereket egy használható keretrendszerbe. Vágunk bele a lényegre, és a következetes, professzionális eredményeket adó technikákra fókuszálunk.
Miért különböznek a videó promptok
Ha dolgoztál már képgenerátorokkal, mint a Midjourney vagy a DALL-E, azt gondolhatod, hogy a videó promptok ugyanúgy működnek. Nem teszik. A videó egy időbeli dimenziót ad hozzá – mozgást, tempót, átmeneteket – amely a prompt engineeringet egyetlen utasításból egy szekvencia vezénylésébe változtatja.
Gondolj rá úgy, mint a különbségre egy fénykép készítése és egy jelenet rendezése között. Egy fotóhoz beállítod a beállítást. A videóhoz meg kell koreografálnod, mi történik az idő múlásával:
- Hogyan mozog a kamera?
- Milyen akciók bontakoznak ki?
- Mennyi ideig tart minden elem?
- Mi az érzelmi ív?
Ezek a kérdések olyan szókincs és struktúra használatát követelik meg, amely túlmutat a statikus képi promptokon.
A hatszintű keretrendszer
A professzionális videó promptok strukturált megközelítést követnek. Ezt nevezem a hatszintű keretrendszernek – minden szint specifikusságot ad hozzá, amely az AI-t a te víziód felé vezeti:
1. szint: Tárgy és cselekvés
Határozd meg a fókuszt precízen. A homályos tárgyak homályos eredményeket adnak.
Gyenge: "Egy nő egy kertben" Erős: "Egy nő piros folyó ruhában lassan sétál rózsabokrok között, finoman megérinti a szirmokat, ahogy elhalad"
Az erős verzió meghatározza a ruházatot, a mozgás sebességét és a környezettel való interakciót. Minden részlet korlátozza az AI értelmezését a szándékod irányába.
2. szint: Felvétel típusa és keretezés
A filmesek egy évszázadot töltöttek a vizuális grammatika fejlesztésével. Használd ki.
| Felvétel típus | Használati eset |
|---|---|
| Wide shot | Helyszín megállapítása, méretarány |
| Medium shot | Karakter interakció, párbeszéd |
| Close-up | Érzelem, részlet, intimitás |
| Extreme close-up | Drámai hangsúly |
Példa: "Közepes követőfelvétel, kamera deréktávolságban, oldalról követve"
3. szint: Kamera mozgás
A statikus felvételek amatőr hatást keltenek. A mozgás energiát teremt és vezeti a figyelmet.
| Mozgás | Hatás |
|---|---|
| Pan | Tér feltárása vízszintesen |
| Tilt | Tér feltárása függőlegesen |
| Dolly/tracking | Mélységet teremt, követi a tárgyat |
| Crane | Méretet, drámaiságot teremt |
| Handheld | Sürgősség, dokumentumfilm-érzés |
| Steadicam | Sima követés, belemerülés |
Példa: "Lassú dolly előre az ajtónyíláson keresztül, szemmagasságban tartva a perspektívát"
4. szint: Világítás és atmoszféra
A világítás hatásosabban alakítja a hangulatot, mint bármely más elem.
| Kifejezés | Vizuális hatás |
|---|---|
| Golden hour | Meleg, romantikus, nosztalgikus |
| Blue hour | Hűvös, kontemplatív, titokzatos |
| High key | Világos, optimista, tiszta |
| Low key | Drámai, hangulatteljes, feszült |
| Volumetric light | Sugarak ködön/poron keresztül, éteri |
| Rim lighting | Szeparáció, dráma, sziluett széle |
Példa: "Golden hour világítás volumetrikus sugarakkal a poros ablakokon keresztül, meleg színezés"
5. szint: Technikai specifikációk
Nevezz meg konkrét technikai paramétereket, ha precíz kontrollra van szükséged:
- Objektív: 35mm (természetes), 50mm (portré), 85mm (tömörítés), 24mm (wide)
- Mélységélesség: Sekély (bokeh háttér) vs. mély (minden éles)
- Képkockasebesség: 24fps (filmes), 60fps (sima), 120fps (lassított)
- Képarány: 16:9 (standard), 2.39:1 (filmes), 9:16 (függőleges)
Példa: "85mm objektívvel felvéve, sekély mélységélesség krémes bokeh-val, enyhe filmszemcsézettség"
6. szint: Időtartam és tempó
A videó időben bomlik ki. Határozd meg a ritmust:
- Jelenet időtartama (tipikusan 3-10 másodperc)
- Átmenet stílusa (vágás, áttűnés, törlés)
- Tempó (lassú/kontemplatív vs. gyors/energikus)
- Ütemidőzítés zenei szinkronizációhoz
Példa: "6 másodperces felvétel lassú, megfontolt mozgással, 1 másodpercig tartva a végső képkockán"
Összerakás: Teljes prompt példák
Így kombinálódnak a szintek professzionális promptokká:
Filmes portré:
Közepes közeli a viharvert halász arcáról, kora reggeli blue hour,
85mm objektívvel felvéve sekély mélységélességgel. Gyengéd kézikamera mikromozgások,
lágy rim világítás hátulról, amely halo hatást kelt az ősz haján.
Kontemplatív arckifejezés, szemek enyhén kameránkívül néznek.
Hűvös színezés megemelt árnyékokkal, 5 másodperc időtartam.Akció szekvencia:
Wide tracking shot, követve egy parkour sportolót, amint városi háztetőkön fut át
naplementekor. Dinamikus steadicam mozgás állandó távolságot tartva,
golden hour háttérvilágítás drámai sziluettet teremtve. 24fps filmes mozgás,
enyhe lassítás 0.8x sebességgel. Magas kontraszt, teal-narancs színezés.
8 másodperc növekvő intenzitással.Termékbemutató:
Lassú 360 fokos körbefordulás egy luxus óra körül fekete bársony felületen.
Makró objektív, amely a bonyolult számlap részleteit ragadja meg, kontrollált stúdió világítás
lágy főfénnyel és finom kitöltéssel. Sekély mélységélesség a tárgyat izolálva,
gyengéd tükröződések a kristályon. Prémium érzés
lassú, megfontolt kamera mozgással. 10 másodperc időtartam.Negatív prompting: Mondd meg az AI-nak, mit kerüljön
Ugyanilyen fontos meghatározni, mit nem akarsz. Minden platform ezt másképp kezeli:
Gyakori negatív promptok:
- Elmosódott felvétel, mozgási elmosódás műtermékek
- Torz arcok, anatómiai hibák
- Vízjelek, szöveg átfedések
- Természetellenes mozgások, akadozó átmenetek
- Alacsony felbontás, tömörítési műtermékek
Platformspecifikus szintaxis:
| Platform | Módszer |
|---|---|
| Veo 3 | Dedikált negatív prompt mező |
| Kling | "avoid" vagy "without" használata a promptban |
| Runway | Külön negatív prompt paraméter |
| Sora | Súlyalapú kizárások |
Példa: "Avoid: elmosódott felvétel, torz arcvonások, vízjelek, akadozó kamera mozgás, túltelített színek"
Stílus referencia halmozás
Szeretnél megkülönböztető esztétikát? Kombinálj 2-3 filmes referenciát:
Formula: [A film] színezés + [B film] atmoszféra + [C film] kamera mozgás
Példák:
- "Blade Runner 2049 színezés plusz Se7en atmoszféra plusz Heat kamera mozgás"
- "Wes Anderson szimmetria plusz Studio Ghibli színpaletta plusz Terrence Malick természetes világítás"
- "Mad Max: Fury Road energia plusz Roger Deakins világítás plusz Spielberg blokkolás"
Korlátozd 3 referenciára. Több egymásnak ellentmondó jelzéseket hoz létre.
Platformspecifikus optimalizálás
Minden modellnek megvannak az erősségei. Igazítsd a prompt stílusodat a platformhoz:
| Modell | Erősségek | Prompt fókusz |
|---|---|---|
| Kling 2.5 | Atlétikai mozgás, karakter animáció | Cselekvési igék, fizikai mozgás |
| Sora 2 | Több felvételes történetmesélés, térbeli konzisztencia | Jelenet átmenetek, narratív ív |
| Veo 3 | Precíziós kontroll, JSON formázás | Technikai specifikációk, strukturált szintaxis |
| Runway Gen-3 | Stilizáció, művészi interpretáció | Esztétikai referenciák, hangulat leírók |
| WAN 2.5 | Párbeszéd, ajakszinkron | Beszéd akciók, arcmimika |
Veo 3 JSON példa:
{
"subject": "nő piros ruhában",
"action": "kerten keresztül sétál",
"shot_type": "medium tracking",
"camera_movement": "dolly jobbról balra",
"lighting": "golden hour, volumetrikus",
"lens": "35mm",
"duration": "6 másodperc"
}Az 5-10-1 költségoptimalizálási szabály
A prémium renderek drágák. Használd ezt a munkafolyamatot:
- 5 variáció alacsonyabb költségű modelleken (40-60 kredit mindegyik)
- 10 iteráció a legjobb jelölt finomítása
- 1 végső render prémium szinten (~350 kredit)
Ez csökkenti a költségeket több ezerről körülbelül 1000 kreditre, miközben fenntartja a minőséget.
Gyakori hibák, amiket kerülj
Több száz prompt áttekintése után ezek a hibák jelennek meg leggyakrabban:
| Hiba | Probléma | Javítás |
|---|---|---|
| Hétköznapi leírások | Az AI lazán értelmezi | Használj filmművészeti terminológiát |
| Időtartam eltérés | Az akció nem fér bele az időkeretbe | Igazítsd a komplexitást az időtartamhoz |
| Stílus túltöltés | Egymásnak ellentmondó esztétikai jelek | Korlátozd maximum 3 referenciára |
| Hiányzó mozgás | Statikus, amatőr érzés | Mindig határozz meg kamera mozgást |
| Homályos világítás | Következetlen hangulat | Nevezz meg konkrét világítási beállításokat |
| Nincs negatív prompt | Nem kívánt műtermékek | Explicit módon zárd ki a problémákat |
Prompt könyvtárad építése
Készíts sablonokat gyakori forgatókönyvekhez:
Interjú beállítás:
Medium shot, alany harmadok szabálya szerint bal oldalon elhelyezve, szemmagasságú kamera,
[LIGHTING_SETUP], sekély mélységélesség elmossa a hátteret,
finom kézikamera mikromozgások természetes érzésért, [DURATION].B-Roll természet:
[SHOT_TYPE] [SUBJECT]-ról/ről, [TIME_OF_DAY] világítás,
lassú [CAMERA_MOVEMENT], [LENS]mm objektív, mély fókusz,
[COLOR_GRADE] paletta, [DURATION].Termék hős:
[ORBIT_DIRECTION] körbefordulás [PRODUCT] körül [SURFACE]-en/on,
stúdió világítás [KEY_LIGHT_POSITION] főfénnyel és finom kitöltéssel,
makró részlet pillanatok, [LENS]mm, hibátlan tükröződések, [DURATION].Töltsd ki a szögletes zárójeleket konkrét igények szerint. Építsd fel a könyvtáradat használati esetek szerint rendezve.
Iterációs stratégia
A tökéletes promptok szisztematikus finomításon keresztül jelennek meg:
- Kezdd egyszerűen: Csak alapvető tárgy és cselekvés
- Adj hozzá egy elemet: Tesztelj egyedi hozzáadásokat
- Dokumentáld, ami működik: Vezess naplót a hatékony kifejezésekről
- A/B teszteld a megfogalmazást: Ugyanaz a koncepció, más szavak
- Mentsd a nyerteseket: Építsd fel a prompt könyvtáradat
Napló formátum:
Prompt: [teljes prompt]
Modell: [használt platform]
Eredmény: [1-5 értékelés]
Jegyzetek: [mi működött/nem működött]Minőségellenőrzési ellenőrzőlista
Mielőtt bármilyen AI videót véglegesítesz, ellenőrizd:
- Tárgy konzisztencia végig
- Természetes mozgás (nincs akadozás)
- Világítás folytonosság
- Nincs arc torzítás
- Színezés konzisztencia
- Megfelelő tempó
- Tiszta hang (ha alkalmazható)
- Nincs vízjel vagy műtermékek
Következő lépések
A prompt engineering gyakorlással fejlődik. Kezdj egyszerűbb felvételekkel, sajátíts el minden szintet, majd kombináld őket. A cél nem a terminológia memorizálása – hanem az intuíció fejlesztése arra, mi teszi a videót meggyőzővé.
Vezess egy generálási naplót. Nézd át, mi működött. Építsd fel a könyvtáradat. Az amatőr és professzionális AI videó közötti különbség gyakran a prompt precizitásán múlik.
A kamerádat vár. Kezdj el forgatni.
Hasznos volt ez a cikk?

Damien
AI FejlesztőAI fejlesztő Lyonból, aki szereti az összetett gépi tanulási koncepciókat egyszerű receptekké alakítani. Amikor épp nem modelleket hibakeres, a Rhône-völgyön kerékpározik.
Kapcsolódó cikkek
Fedezd fel ezeket a kapcsolódó bejegyzéseket

Pika 2.5: Az AI videó demokratizálása sebesség, ár és kreatív eszközök révén
A Pika Labs kiadja a 2.5-ös verziót, amely gyorsabb generálást, fejlett fizikát és kreatív eszközöket, például Pikaframes-t és Pikaffects-t kombinál, hogy az AI videót mindenki számára elérhetővé tegye.

Kling O1: A Kuaishou Csatlakozik az Egységes Multimodális Video Versenyhez
A Kuaishou most indította el a Kling O1-et, egy egységes multimodális AI-t, amely videóban, hangban és szövegben gondolkodik egyszerre. Az audiovizuális intelligencia versenye felforrósodik.

Runway Gen-4.5 az 1. helyen: Hogyan előzte meg 100 mérnök a Google-t és az OpenAI-t
A Runway most szerezte meg az első helyet a Video Arenán a Gen-4.5-del, bebizonyítva, hogy egy kis csapat is felülmúlhatja a trillió dolláros óriásokat az AI videogenerálásban.