Komplett guide till AI-videoprompt-engineering 2025
Lär dig skapa prompter som ger professionella AI-genererade videor. Upptäck sexskiktsramverket, filmterminologi och plattformsspecifika tekniker.

Prompt-engineering för AI-video är som att förfina ett recept: samma ingredienser ger helt olika resultat beroende på teknik. Efter otaliga timmar med videogenerering på alla stora plattformar har jag destillerat det som faktiskt fungerar till ett praktiskt ramverk. Låt oss fokusera på tekniker som ger konsekventa, professionella resultat.
Varför videopromter är annorlunda
Om du har jobbat med bildgeneratorer som Midjourney eller DALL-E kanske du tror att videopromter fungerar på samma sätt. Det gör de inte. Video lägger till en tidsdimension – rörelse, tempo, övergångar – som förvandlar prompt-engineering från en enstaka instruktion till att orkestrera en sekvens.
Tänk på det som skillnaden mellan att ta ett fotografi och att regissera en scen. För ett foto sätter du upp bilden. För video måste du koreografera vad som händer över tid:
- Hur rör sig kameran?
- Vilka handlingar utspelas?
- Hur länge varar varje element?
- Vad är den emotionella bågen?
Dessa frågor kräver ordförråd och struktur som går bortom statiska bildprompter.
Sexskiktsramverket
Professionella videopromter följer en strukturerad metod. Jag kallar det sexskiktsramverket – varje skikt lägger till specificitet som vägleder AI:n mot din vision:
Skikt 1: Subjekt och handling
Definiera ditt fokus med precision. Vaga subjekt ger vaga resultat.
Svag: "En kvinna i en trädgård" Stark: "En kvinna i en flödande röd klänning som går långsamt genom rosensnår och försiktigt nuddar kronblad när hon passerar"
Den starka versionen specificerar kläder, rörelsehastighet och interaktion med omgivningen. Varje detalj begränsar AI:ns tolkning mot din avsikt.
Skikt 2: Bildtyp och inramning
Fotografer har spenderat ett sekel på att utveckla visuell grammatik. Använd den.
| Bildtyp | Användningsområde |
|---|---|
| Wide shot | Etablera plats, skala |
| Medium shot | Karaktärsinteraktion, dialog |
| Close-up | Känsla, detalj, intimitet |
| Extreme close-up | Dramatisk betoning |
Exempel: "Medium tracking shot, kamera placerad i midjehöjd, följer från sidan"
Skikt 3: Kamerarörelse
Statiska bilder känns amatörmässiga. Rörelse skapar energi och styr uppmärksamhet.
| Rörelse | Effekt |
|---|---|
| Pan | Avslöjar rum horisontellt |
| Tilt | Avslöjar rum vertikalt |
| Dolly/tracking | Skapar djup, följer subjekt |
| Crane | Etablerar skala, drama |
| Handheld | Brådska, dokumentärkänsla |
| Steadicam | Mjuk följning, fördjupning |
Exempel: "Långsam dolly framåt genom dörröppningen, bibehåller ögonhöjdsperspektiv"
Skikt 4: Belysning och atmosfär
Belysning skapar stämning kraftfullare än något annat element.
| Term | Visuell effekt |
|---|---|
| Golden hour | Varm, romantisk, nostalgisk |
| Blue hour | Sval, kontemplativ, mystisk |
| High key | Ljus, optimistisk, ren |
| Low key | Dramatisk, stämningsfull, spänd |
| Volumetric light | Strålar genom dimma/damm, eterisk |
| Rim lighting | Separation, drama, siluettkant |
Exempel: "Golden hour-belysning med volumetriska strålar som filtrerar genom dammiga fönster, varm färggradient"
Skikt 5: Tekniska specifikationer
Namnge specifika tekniska parametrar när du vill ha precis kontroll:
- Lins: 35mm (naturlig), 50mm (porträtt), 85mm (kompression), 24mm (vidvinkel)
- Depth of field: Grund (bokeh-bakgrund) vs. djup (allt skarpt)
- Frame rate: 24fps (filmisk), 60fps (mjuk), 120fps (slow motion)
- Aspect ratio: 16:9 (standard), 2.39:1 (filmisk), 9:16 (vertikal)
Exempel: "Filmad med 85mm-lins, grund depth of field med mjuk bokeh, lätt filmkorn"
Skikt 6: Varaktighet och tempo
Video utvecklas över tid. Specificera rytm:
- Scenlängd (3-10 sekunder typiskt)
- Övergångsstil (cut, dissolve, wipe)
- Tempo (långsam/kontemplativ vs. snabb/energisk)
- Taktning för musiksynkronisering
Exempel: "6-sekundersscen med långsam, avsiktlig rörelse, håller sista bilden i 1 sekund"
Att sätta ihop allt: Kompletta promptexempel
Här är hur skikten kombineras till professionella prompter:
Filmiskt porträtt:
Medium close-up av en väderbiten fiskares ansikte, tidig morgon blue hour,
filmad med 85mm-lins och grund depth of field. Mjuka handheld-mikrorörelser,
mjuk rim lighting bakifrån som skapar en gloria-effekt på hans grå hår.
Kontemplativt uttryck, ögon som ser lätt förbi kameran.
Sval färggradient med lyfta skuggor, 5 sekunders varaktighet.Actionsekvens:
Wide tracking shot som följer en parkouratlet som springer över stadstak
i solnedgången. Dynamisk steadicam-rörelse som bibehåller konsekvent avstånd,
golden hour-motljus som skapar dramatisk siluett. 24fps filmisk rörelse,
lätt slow-motion på 0.8x hastighet. Hög kontrast, teal-orange färggradient.
8 sekunder med stigande intensitet.Produktvisning:
Långsam 360-graders orbit runt en lyxklocka på svart sammetsyta.
Makrolins som fångar intrikata urtavledetaljer, kontrollerad studiobelysning
med mjukt nyckelljus och subtil fill. Grund depth of field som isolerar
subjektet, mjuka reflektioner på kristallen. Premiumpräglad känsla med
långsam, avsiktlig kamerarörelse. 10 sekunders varaktighet.Negativ prompting: Berätta för AI vad som ska undvikas
Lika viktigt är att specificera vad du inte vill ha. Varje plattform hanterar detta olika:
Vanliga negativa prompter:
- Suddig footage, motion blur-artefakter
- Förvrängda ansikten, anatomiska fel
- Vattenmärken, textöverlägg
- Onaturliga rörelser, ryckiga övergångar
- Låg upplösning, kompressionsartefakter
Plattformsspecifik syntax:
| Plattform | Metod |
|---|---|
| Veo 3 | Dedikerat negativt promptfält |
| Kling | Inkludera "avoid" eller "without" i prompt |
| Runway | Separat negativ promptparameter |
| Sora | Viktbaserade uteslutningar |
Exempel: "Avoid: blurry footage, distorted facial features, watermarks, jerky camera movement, oversaturated colors"
Stilreferensstackning
Vill du ha en distinkt estetik? Kombinera 2-3 filmreferenser:
Formel: [Film A] color grading + [Film B] atmosfär + [Film C] kamerarörelse
Exempel:
- "Blade Runner 2049 color grading plus Se7en-atmosfär plus Heat-kamerarörelse"
- "Wes Anderson-symmetri plus Studio Ghibli-färgpalett plus Terrence Malick naturligt ljus"
- "Mad Max: Fury Road-energi plus Roger Deakins-belysning plus Spielberg-blockering"
Begränsa till 3 referenser. Fler skapar motstridiga signaler.
Plattformsspecifik optimering
Varje modell har styrkor. Matcha din promptstil till plattformen:
| Modell | Styrkor | Promptfokus |
|---|---|---|
| Kling 2.5 | Atletisk rörelse, karaktärsanimation | Aktiva verb, fysisk rörelse |
| Sora 2 | Flerscensberättande, rumslig konsistens | Scenövergångar, narrativ båge |
| Veo 3 | Precisionskontroll, JSON-formatering | Tekniska specifikationer, strukturerad syntax |
| Runway Gen-3 | Stilisering, konstnärlig tolkning | Estetiska referenser, stämningsbeskrivningar |
| WAN 2.5 | Dialog, läppsynk | Talhandlingar, ansiktsuttryck |
Veo 3 JSON-exempel:
{
"subject": "woman in red dress",
"action": "walking through garden",
"shot_type": "medium tracking",
"camera_movement": "dolly right to left",
"lighting": "golden hour, volumetric",
"lens": "35mm",
"duration": "6 seconds"
}5-10-1 kostnadsoptimeringsregeln
Premiumrenderingar är dyra. Använd detta arbetsflöde:
- 5 varianter på billigare modeller (40-60 krediter var)
- 10 iterationer som förfinar den bästa kandidaten
- 1 slutlig rendering på premiumtier (~350 krediter)
Detta minskar kostnaderna från tusentals till runt 1 000 krediter samtidigt som kvaliteten bibehålls.
Vanliga misstag att undvika
Efter att ha granskat hundratals prompter dyker dessa fel upp oftast:
| Misstag | Problem | Lösning |
|---|---|---|
| Vardagliga beskrivningar | AI tolkar löst | Använd filmterminologi |
| Varaktighetsfel | Handling passar inte tidsramen | Matcha komplexitet till varaktighet |
| Stilöverbelastning | Motstridiga estetiska signaler | Begränsa till max 3 referenser |
| Saknar rörelse | Statisk, amatörmässig känsla | Specificera alltid kamerarörelse |
| Vag belysning | Inkonsekvent stämning | Namnge specifika belysningsuppsättningar |
| Inga negativa prompter | Oönskade artefakter | Uteslut explicit problem |
Bygg ditt promptbibliotek
Skapa mallar för vanliga scenarion:
Intervjuuppsättning:
Medium shot, subjekt placerat rule-of-thirds vänster, ögonhöjdskamera,
[LIGHTING_SETUP], grund depth of field som suddar bakgrunden,
subtila handheld-mikrorörelser för naturlig känsla, [DURATION].B-Roll natur:
[SHOT_TYPE] av [SUBJECT], [TIME_OF_DAY]-belysning,
långsam [CAMERA_MOVEMENT], [LENS]mm-lins, djup focus,
[COLOR_GRADE]-palett, [DURATION].Produkthjälte:
[ORBIT_DIRECTION] orbit runt [PRODUCT] på [SURFACE],
studiobelysning med [KEY_LIGHT_POSITION] key och subtil fill,
makrodetaljstunder, [LENS]mm, rena reflektioner, [DURATION].Fyll i hakparenteser för specifika behov. Bygg ett bibliotek organiserat efter användningsfall.
Iterationsstrategi
Perfekta prompter framträder genom systematisk förfining:
- Börja enkelt: Endast kärnsubjekt och handling
- Lägg till ett element: Testa enstaka tillägg
- Dokumentera vad som fungerar: Håll en logg över effektiva fraser
- A/B-testa formulering: Samma koncept, olika ord
- Spara vinnare: Bygg ditt promptbibliotek
Loggformat:
Prompt: [full prompt]
Model: [plattform använd]
Result: [1-5 betyg]
Notes: [vad som fungerade/inte]Kvalitetsgranskningschecklista
Innan du slutför någon AI-video, verifiera:
- Subjektkonsistens genomgående
- Naturlig rörelse (ingen ryckighet)
- Belysningskontinuitet
- Inga ansiktsförvrängningar
- Färggradientkonsistens
- Lämpligt tempo
- Rent ljud (om tillämpligt)
- Inga vattenmärken eller artefakter
Nästa steg
Prompt-engineering förbättras med övning. Börja med enklare bilder, bemästra varje skikt och kombinera dem sedan. Målet är inte att memorera terminologi – det är att utveckla intuition för vad som gör video övertygande.
Håll en genereringslogg. Granska vad som fungerade. Bygg ditt bibliotek. Skillnaden mellan amatör- och professionell AI-video handlar ofta om promptprecision.
Din kamera väntar. Börja filma.
Var den här artikeln hjälpsam?

Damien
AI-utvecklareAI-utvecklare från Lyon som älskar att förvandla komplexa ML-koncept till enkla recept. När han inte felsöker modeller hittar du honom cyklande genom Rhônedalen.
Relaterade artiklar
Fortsätt utforska med dessa relaterade inlägg

Pika 2.5: Demokratisering av AI-video genom hastighet, pris och kreativa verktyg
Pika Labs släpper version 2.5, som kombinerar snabbare generering, förbättrad fysik och kreativa verktyg som Pikaframes och Pikaffects för att göra AI-video tillgängligt för alla.

Karaktärskonsistens i AI-video: Hur modeller lär sig att komma ihåg ansikten
En teknisk genomgång av de arkitektoniska innovationer som möjliggör att AI-videomodeller bibehåller karaktärsidentitet mellan tagningar, från uppmärksamhetsmekanismer till identitetsbevarande inbäddningar.

Runway Gen-4.5 tar förstaplatsen: Hur 100 ingenjörer överträffade Google och OpenAI
Runway har tagit toppositionen på Video Arena med Gen-4.5. Beviset att ett litet team kan konkurrera med jättar värda biljoner dollar inom AI-videogenerering.