Komplet guide til AI video prompt engineering i 2025
Lær kunsten at skrive prompts der producerer imponerende AI-genererede videoer. Forstå det seks-lags framework, cinematografisk terminologi og platformsspecifikke teknikker.

Prompt engineering til AI video er som at perfektionere en opskrift: de samme ingredienser giver vidt forskellige resultater afhængigt af teknikken. Efter utallige timer med at generere videoer på alle større platforme, har jeg destilleret det der faktisk virker ned til et praktisk framework. Lad os skære igennem støjen og fokusere på teknikker der giver konsekvente, professionelle resultater.
Hvorfor video prompts er anderledes
Hvis du har arbejdet med billede-generatorer som Midjourney eller DALL-E, tænker du måske at video prompts virker på samme måde. Det gør de ikke. Video tilføjer en temporal dimension—bevægelse, tempo, overgange—der transformerer prompt engineering fra en enkelt instruktion til at orkestrere en sekvens.
Tænk på det som forskellen mellem at tage et fotografi og at instruere en scene. Til et foto sætter du bare optagelsen op. Til video skal du koreografere hvad der sker over tid:
- Hvordan bevæger kameraet sig?
- Hvilke handlinger folder sig ud?
- Hvor længe varer hvert element?
- Hvad er den følelsesmæssige bue?
Disse spørgsmål kræver et ordforråd og en struktur der går ud over statiske billed-prompts.
Seks-lags frameworket
Professionelle video prompts følger en struktureret tilgang. Jeg kalder det seks-lags frameworket—hvert lag tilføjer specificitet der guider AI'en mod din vision:
Lag 1: Subjekt og handling
Definer dit fokus præcist. Vage subjekter producerer vage resultater.
Svag: "En kvinde i en have" Stærk: "En kvinde i en flagrende rød kjole går langsomt gennem rosenbuskene og rører forsigtigt ved kronbladene når hun passerer"
Den stærke version specificerer tøj, bevægelseshastighed og interaktion med omgivelserne. Hver detalje begrænser AI'ens tolkning mod din intention.
Lag 2: Optagelsestype og indramning
Filmfotografer har brugt et århundrede på at udvikle visuel grammatik. Brug den.
| Optagelsestype | Anvendelse |
|---|---|
| Wide shot | Etablering af lokation, skala |
| Medium shot | Karakter-interaktion, dialog |
| Close-up | Følelse, detalje, intimitet |
| Extreme close-up | Dramatisk vægt |
Eksempel: "Medium tracking shot, kamera placeret i hoftehøjde, følger fra siden"
Lag 3: Kamerabevægelse
Statiske optagelser føles amatøragtige. Bevægelse skaber energi og styrer opmærksomhed.
| Bevægelse | Effekt |
|---|---|
| Pan | Afslører rum horisontalt |
| Tilt | Afslører rum vertikalt |
| Dolly/tracking | Skaber dybde, følger subjekt |
| Crane | Etablerer skala, drama |
| Handheld | Hast, dokumentarfølelse |
| Steadicam | Glat følgning, fordybelse |
Eksempel: "Langsom dolly fremad gennem døråbningen, bevarer øjenhøjde perspektiv"
Lag 4: Belysning og atmosfære
Belysning sætter stemningen mere kraftfuldt end noget andet element.
| Term | Visuel effekt |
|---|---|
| Golden hour | Varm, romantisk, nostalgisk |
| Blue hour | Kølig, kontemplativ, mystisk |
| High key | Lys, optimistisk, ren |
| Low key | Dramatisk, melankolsk, spændingsfyldt |
| Volumetric light | Stråler gennem tåge/støv, æterisk |
| Rim lighting | Adskillelse, drama, silhuet-kant |
Eksempel: "Golden hour belysning med volumetriske stråler der filtrerer gennem støvede vinduer, varm farvekorrektion"
Lag 5: Tekniske specifikationer
Navngiv specifikke tekniske parametre når du vil have præcis kontrol:
- Linse: 35mm (naturlig), 50mm (portræt), 85mm (kompression), 24mm (vid)
- Dybdeskarphed: Lav (bokeh baggrund) vs. dyb (alt skarpt)
- Framerate: 24fps (cinematisk), 60fps (glat), 120fps (slow motion)
- Billedformat: 16:9 (standard), 2.39:1 (cinematisk), 9:16 (vertikal)
Eksempel: "Optaget på 85mm linse, lav dybdeskarphed med cremet bokeh, let filmkorn"
Lag 6: Varighed og tempo
Video folder sig ud over tid. Specificer rytme:
- Scene-varighed (3-10 sekunder typisk)
- Overgangsstil (cut, dissolve, wipe)
- Tempo (langsomt/kontemplativt vs. hurtigt/energisk)
- Beat-timing til musiksynkronisering
Eksempel: "6-sekunders optagelse med langsom, bevidst bevægelse, holder på slutbilledet i 1 sekund"
Samlet: Komplette prompt-eksempler
Sådan kombineres lag til professionelle prompts:
Cinematisk portræt:
Medium close-up af en vejrbidt fiskers ansigt, tidlig morgen blue hour,
optaget på 85mm linse med lav dybdeskarphed. Blid handheld mikro-bevægelser,
blød rim lighting bagfra der skaber en glorie-effekt på hans grå hår.
Kontemplativt udtryk, øjne kigger let ved siden af kameraet.
Kølig farvekorrektion med løftede skygger, 5 sekunders varighed.Action-sekvens:
Wide tracking shot der følger en parkour-atlet løbe hen over urbane tage
ved solnedgang. Dynamisk steadicam-bevægelse bevarer konsistent afstand,
golden hour modlys skaber dramatisk silhuet. 24fps cinematisk bevægelse,
let slow-motion ved 0.8x hastighed. Høj kontrast, teal-orange farvekorrektion.
8 sekunder med stigende intensitet.Produkt-showcase:
Langsom 360-graders orbit omkring et luksusur på sort fløjlsoverflade.
Makro-linse fanger indviklede urskivedetaljer, kontrolleret studie-belysning
med blød key light og subtil fill. Lav dybdeskarphed isolerer
subjektet, blide refleksioner på krystal. Premium-følelse med
langsom, bevidst kamerabevægelse. 10 sekunders varighed.Negativ prompting: Fortæl AI'en hvad den skal undgå
Lige så vigtigt er at specificere hvad du ikke vil have. Hver platform håndterer dette forskelligt:
Almindelige negative prompts:
- Sløret optagelse, motion blur artefakter
- Forvrængede ansigter, anatomiske fejl
- Vandmærker, tekst-overlays
- Unaturlige bevægelser, rykvise overgange
- Lav opløsning, komprimerings-artefakter
Platformsspecifik syntaks:
| Platform | Metode |
|---|---|
| Veo 3 | Dedikeret negativ prompt-felt |
| Kling | Inkluder "avoid" eller "without" i prompt |
| Runway | Separat negativ prompt-parameter |
| Sora | Vægtbaserede ekskluderinger |
Eksempel: "Avoid: blurry footage, distorted facial features, watermarks, jerky camera movement, oversaturated colors"
Style reference stacking
Vil du have en distinkt æstetik? Kombiner 2-3 film-referencer:
Formel: [Film A] farvekorrektion + [Film B] atmosfære + [Film C] kamerabevægelse
Eksempler:
- "Blade Runner 2049 farvekorrektion plus Se7en atmosfære plus Heat kamerabevægelse"
- "Wes Anderson symmetri plus Studio Ghibli farvepalette plus Terrence Malick naturlig belysning"
- "Mad Max: Fury Road energi plus Roger Deakins belysning plus Spielberg blocking"
Begræns til 3 referencer. Flere skaber modstridende signaler.
Platformsspecifik optimering
Hver model har styrker. Match din prompt-stil til platformen:
| Model | Styrker | Prompt-fokus |
|---|---|---|
| Kling 2.5 | Atletisk bevægelse, karakter-animation | Handlingsverber, fysisk bevægelse |
| Sora 2 | Multi-shot storytelling, rumlig konsistens | Scene-overgange, narrativ bue |
| Veo 3 | Præcisionskontrol, JSON formatering | Tekniske specifikationer, struktureret syntaks |
| Runway Gen-3 | Stilisering, kunstnerisk fortolkning | Æstetiske referencer, stemningsbeskrivelser |
| WAN 2.5 | Dialog, lip-sync | Tale-handlinger, ansigtsudtryk |
Veo 3 JSON eksempel:
{
"subject": "woman in red dress",
"action": "walking through garden",
"shot_type": "medium tracking",
"camera_movement": "dolly right to left",
"lighting": "golden hour, volumetric",
"lens": "35mm",
"duration": "6 seconds"
}5-10-1 omkostningsoptimerings-reglen
Premium renders er dyre. Brug denne arbejdsgang:
- 5 variationer på billigere modeller (40-60 credits hver)
- 10 iterationer forfine den bedste kandidat
- 1 final render på premium niveau (~350 credits)
Dette reducerer omkostninger fra tusinder til omkring 1.000 credits mens kvaliteten bevares.
Almindelige fejl at undgå
Efter at have gennemgået hundredvis af prompts, ses disse fejl oftest:
| Fejl | Problem | Løsning |
|---|---|---|
| Uformelle beskrivelser | AI fortolker løst | Brug cinematografi-terminologi |
| Varigheds-mismatch | Handling passer ikke til tidsramme | Match kompleksitet til varighed |
| Stil-overbelastning | Modstridende æstetiske signaler | Begræns til max 3 referencer |
| Manglende bevægelse | Statisk, amatøragtig følelse | Specificer altid kamerabevægelse |
| Vag belysning | Inkonsistent stemning | Navngiv specifikke belysnings-setups |
| Ingen negative prompts | Uønskede artefakter | Ekskluder eksplicit problemer |
Byg dit prompt-bibliotek
Opret templates til almindelige scenarier:
Interview-setup:
Medium shot, subjekt placeret rule-of-thirds venstre, øjenhøjde kamera,
[LIGHTING_SETUP], lav dybdeskarphed slører baggrund,
subtil handheld mikro-bevægelser for naturlig følelse, [DURATION].B-Roll natur:
[SHOT_TYPE] af [SUBJECT], [TIME_OF_DAY] belysning,
langsom [CAMERA_MOVEMENT], [LENS]mm linse, dyb fokus,
[COLOR_GRADE] palette, [DURATION].Produkt hero:
[ORBIT_DIRECTION] orbit omkring [PRODUCT] på [SURFACE],
studie-belysning med [KEY_LIGHT_POSITION] key og subtil fill,
makro-detaljemomenter, [LENS]mm, pristine refleksioner, [DURATION].Udfyld parenteser efter specifikke behov. Byg et bibliotek organiseret efter use case.
Iterations-strategi
Perfekte prompts opstår gennem systematisk forfining:
- Start simpelt: Kun kernesubjekt og handling
- Tilføj ét element: Test enkelte tilføjelser
- Dokumenter hvad virker: Hold en log over effektive fraser
- A/B test formulering: Samme koncept, forskellige ord
- Gem vindere: Byg dit prompt-bibliotek
Log format:
Prompt: [fuld prompt]
Model: [platform brugt]
Resultat: [1-5 rating]
Noter: [hvad virkede/virkede ikke]Kvalitetskontrol tjekliste
Før du afslutter nogen AI video, verificer:
- Subjekt-konsistens gennem hele forløbet
- Naturlig bevægelse (ingen rykken)
- Belysnings-kontinuitet
- Ingen ansigts-forvrængninger
- Farvekorrektions-konsistens
- Passende tempo
- Rent lyd (hvis relevant)
- Ingen vandmærker eller artefakter
Næste skridt
Prompt engineering forbedres med praksis. Start med simplere optagelser, mestre hvert lag, kombiner dem så. Målet er ikke at memorere terminologi—det er at udvikle intuition for hvad der gør video overbevisende.
Hold en generations-log. Gennemgå hvad der virkede. Byg dit bibliotek. Forskellen mellem amatør- og professionel AI video kommer ofte ned til prompt-præcision.
Dit kamera venter. Start optagelsen.
Var denne artikel nyttig?

Damien
AI-udviklerAI-udvikler fra Lyon, der elsker at omsætte komplekse ML-koncepter til simple opskrifter. Når han ikke debugger modeller, finder du ham på cykeltur gennem Rhône-dalen.
Relaterede artikler
Fortsæt med at udforske disse relaterede indlæg

Pika 2.5: Demokratisering af AI-video gennem hastighed, pris og kreative værktøjer
Pika Labs udgiver version 2.5, der kombinerer hurtigere generering, forbedret fysik og kreative værktøjer som Pikaframes og Pikaffects for at gøre AI-video tilgængelig for alle.

Runway Gen-4.5 når førstepladsen: Sådan klarede 100 ingeniører sig bedre end Google og OpenAI
Runway har netop taget førstepladsen på Video Arena med Gen-4.5, hvilket viser, at et lille hold kan konkurrere med trilliondollar-giganter i AI-videogenerering.

CraftStory Model 2.0: Hvordan tovejs-diffusion muliggør 5-minutters AI-videoer
Mens Sora 2 stopper ved 25 sekunder, har CraftStory netop lanceret et system, der genererer sammenhængende 5-minutters videoer. Hemmeligheden? Kørsel af flere diffusionsmotorer parallelt med tovejs-begrænsninger.