Komplett guide til AI-video prompt engineering i 2025
Lær kunsten å lage prompts som produserer imponerende AI-genererte videoer. Lær seks-lags-rammeverket, kinematografisk terminologi og plattformspesifikke teknikker.

Prompt engineering for AI-video er som å perfeksjonere en oppskrift: de samme ingrediensene gir vidt forskjellige resultater avhengig av teknikk. Etter å ha brukt utallige timer på å generere videoer på alle større plattformer, har jeg destillert det som faktisk fungerer til et praktisk rammeverk. La oss kutte ut støyen og fokusere på teknikker som produserer konsistente, profesjonelle resultater.
Hvorfor video-prompts er annerledes
Hvis du har jobbet med bildegeneratorer som Midjourney eller DALL-E, tror du kanskje at video-prompts fungerer på samme måte. Det gjør de ikke. Video legger til en tidslig dimensjon – bevegelse, tempo, overganger – som transformerer prompt engineering fra en enkelt instruksjon til å orkestrere en sekvens.
Tenk på det som forskjellen mellom å ta et fotografi og å regissere en scene. For et foto setter du opp bildet. For video må du koreografere hva som skjer over tid:
- Hvordan beveger kameraet seg?
- Hvilke handlinger utspiller seg?
- Hvor lenge varer hvert element?
- Hva er den emosjonelle buen?
Disse spørsmålene krever vokabular og struktur som går utover statiske bilde-prompts.
Seks-lags-rammeverket
Profesjonelle video-prompts følger en strukturert tilnærming. Jeg kaller det seks-lags-rammeverket – hvert lag legger til spesifisitet som veileder AI-en mot visjonen din:
Lag 1: Subjekt og handling
Definer fokuset ditt med presisjon. Vage subjekter produserer vage resultater.
Svak: "En kvinne i en hage" Sterk: "En kvinne i en flagrende rød kjole går sakte gjennom rosebusker, forsiktig rører ved kronblader mens hun passerer"
Den sterke versjonen spesifiserer klær, bevegelseshastighet og interaksjon med omgivelsene. Hvert detalj begrenser AI-ens tolkning mot intensjonen din.
Lag 2: Shot-type og innramming
Kinematografer har brukt et århundre på å utvikle visuell grammatikk. Bruk den.
| Shot-type | Bruksområde |
|---|---|
| Wide shot | Etablere lokasjon, skala |
| Medium shot | Karakterinteraksjon, dialog |
| Close-up | Følelse, detalj, intimitet |
| Extreme close-up | Dramatisk vektlegging |
Eksempel: "Medium tracking shot, kamera plassert i midjehøyde, følger fra siden"
Lag 3: Kamerabevegelse
Statiske shots virker amatørmessige. Bevegelse skaper energi og styrer oppmerksomhet.
| Bevegelse | Effekt |
|---|---|
| Pan | Avslører rom horisontalt |
| Tilt | Avslører rom vertikalt |
| Dolly/tracking | Skaper dybde, følger subjekt |
| Crane | Etablerer skala, drama |
| Handheld | Hast, dokumentarfølelse |
| Steadicam | Jevn følging, fordypelse |
Eksempel: "Sakte dolly fremover gjennom døråpningen, opprettholder øyehøyde-perspektiv"
Lag 4: Belysning og atmosfære
Belysning setter stemning kraftigere enn noe annet element.
| Begrep | Visuell effekt |
|---|---|
| Golden hour | Varm, romantisk, nostalgisk |
| Blue hour | Kjølig, kontemplativ, mystisk |
| High key | Lys, optimistisk, ren |
| Low key | Dramatisk, stemningsfull, spenningsfylt |
| Volumetric light | Stråler gjennom tåke/støv, eterisk |
| Rim lighting | Separasjon, drama, silhuettkant |
Eksempel: "Golden hour-belysning med volumetriske stråler som filtrerer gjennom støvete vinduer, varm fargegrading"
Lag 5: Tekniske spesifikasjoner
Navngi spesifikke tekniske parametere når du vil ha presis kontroll:
- Linse: 35mm (naturlig), 50mm (portrett), 85mm (kompresjon), 24mm (vid)
- Dybdeskarphet: Grunn (bokeh-bakgrunn) vs. dyp (alt skarpt)
- Bilderate: 24fps (kinematisk), 60fps (jevn), 120fps (sakte film)
- Aspektforhold: 16:9 (standard), 2.39:1 (kinematisk), 9:16 (vertikal)
Eksempel: "Filmet på 85mm linse, grunn dybdeskarphet med kremet bokeh, lett filmkorn"
Lag 6: Varighet og tempo
Video utfolder seg over tid. Spesifiser rytme:
- Scenevarighet (3-10 sekunder typisk)
- Overgangsstil (kutt, dissolve, wipe)
- Tempo (sakte/kontemplativ vs. rask/energisk)
- Taktiming for musikksynkronisering
Eksempel: "6-sekunders shot med sakte, bevisst bevegelse, holder på sluttbildet i 1 sekund"
Sette det sammen: Fulle prompt-eksempler
Slik kombineres lagene til profesjonelle prompts:
Kinematisk portrett:
Medium close-up av et værbitt fiskerhode, tidlig morgen blue hour,
filmet på 85mm linse med grunn dybdeskarphet. Forsiktige handheld mikrobevegelser,
myk rim-belysning bakfra som skaper en glorie-effekt på det grå håret.
Kontemplativt uttrykk, øyne ser litt ved siden av kameraet.
Kjølig fargegrading med løftede skygger, 5 sekunders varighet.Action-sekvens:
Wide tracking shot følger en parkour-utøver som løper over urbane hustak
ved solnedgang. Dynamisk steadicam-bevegelse opprettholder konsistent avstand,
golden hour-baklys skaper dramatisk silhuett. 24fps kinematisk bevegelse,
lett sakte film på 0.8x hastighet. Høy kontrast, teal-orange fargegrading.
8 sekunder med økende intensitet.Produktvisning:
Sakte 360-graders orbit rundt en luksusklokke på svart fløyelsoverflate.
Makrolinse fanger intrikate detaljer på urskiven, kontrollert studiobelysning
med myk key light og subtil fill. Grunn dybdeskarphet isolerer
subjektet, forsiktige refleksjoner på krystall. Premium-følelse med
sakte, bevisst kamerabevegelse. 10 sekunders varighet.Negativ prompting: Fortelle AI hva den skal unngå
Like viktig er å spesifisere hva du ikke vil ha. Hver plattform håndterer dette forskjellig:
Vanlige negative prompts:
- Uskarpt materiale, motion blur-artefakter
- Forvrengte ansikter, anatomiske feil
- Vannmerker, tekstoverlegg
- Unaturlige bevegelser, hakkete overganger
- Lav oppløsning, komprimeringsartefakter
Plattformspesifikk syntaks:
| Plattform | Metode |
|---|---|
| Veo 3 | Dedikert negativ prompt-felt |
| Kling | Inkluder "avoid" eller "without" i prompt |
| Runway | Separat negativ prompt-parameter |
| Sora | Vektbaserte ekskluderinger |
Eksempel: "Avoid: blurry footage, distorted facial features, watermarks, jerky camera movement, oversaturated colors"
Style reference stacking
Vil du ha en distinktiv estetikk? Kombiner 2-3 filmreferanser:
Formel: [Film A] fargegrading + [Film B] atmosfære + [Film C] kamerabevegelse
Eksempler:
- "Blade Runner 2049-fargegrading pluss Se7en-atmosfære pluss Heat-kamerabevegelse"
- "Wes Anderson-symmetri pluss Studio Ghibli-fargepalett pluss Terrence Malick naturlig belysning"
- "Mad Max: Fury Road-energi pluss Roger Deakins-belysning pluss Spielberg-blokkering"
Begrens til 3 referanser. Flere skaper motstridende signaler.
Plattformspesifikk optimalisering
Hver modell har styrker. Tilpass prompt-stilen din til plattformen:
| Modell | Styrker | Prompt-fokus |
|---|---|---|
| Kling 2.5 | Atletisk bevegelse, karakteranimasjon | Handlingsverb, fysisk bevegelse |
| Sora 2 | Flershot-historiefortelling, romlig konsistens | Sceneoverganger, narrativ bue |
| Veo 3 | Presisjonskontroll, JSON-formatering | Tekniske spesifikasjoner, strukturert syntaks |
| Runway Gen-3 | Stilisering, kunstnerisk tolkning | Estetiske referanser, stemningsmessige beskrivelser |
| WAN 2.5 | Dialog, lippesynkronisering | Talehandlinger, ansiktsuttrykk |
Veo 3 JSON-eksempel:
{
"subject": "woman in red dress",
"action": "walking through garden",
"shot_type": "medium tracking",
"camera_movement": "dolly right to left",
"lighting": "golden hour, volumetric",
"lens": "35mm",
"duration": "6 seconds"
}5-10-1 kostnadsoptimaliseringsregelen
Premium-renderinger er dyre. Bruk denne arbeidsflyten:
- 5 variasjoner på rimeligere modeller (40-60 credits hver)
- 10 iterasjoner som raffinerer den beste kandidaten
- 1 endelig rendering på premium-nivå (~350 credits)
Dette reduserer kostnader fra tusenvis til rundt 1000 credits samtidig som kvaliteten opprettholdes.
Vanlige feil å unngå
Etter å ha gjennomgått hundrevis av prompts, dukker disse feilene opp oftest:
| Feil | Problem | Løsning |
|---|---|---|
| Uformelle beskrivelser | AI tolker løst | Bruk kinematografisk terminologi |
| Varighet-mismatch | Handling passer ikke tidsrammen | Tilpass kompleksitet til varighet |
| Stiloverbelastning | Motstridende estetiske signaler | Begrens til maks 3 referanser |
| Manglende bevegelse | Statisk, amatørmessig følelse | Alltid spesifiser kamerabevegelse |
| Vag belysning | Inkonsistent stemning | Navngi spesifikke belysningsoppsett |
| Ingen negative prompts | Uønskede artefakter | Ekskluder problemer eksplisitt |
Bygg ditt prompt-bibliotek
Lag maler for vanlige scenarioer:
Intervjuoppsett:
Medium shot, subjekt plassert tredjedelsregel venstre, øyehøydekamera,
[LIGHTING_SETUP], grunn dybdeskarphet uskarp bakgrunn,
subtile handheld-mikrobevegelser for naturlig følelse, [DURATION].B-Roll natur:
[SHOT_TYPE] av [SUBJECT], [TIME_OF_DAY]-belysning,
sakte [CAMERA_MOVEMENT], [LENS]mm linse, dyp fokus,
[COLOR_GRADE]-palett, [DURATION].Produkthelt:
[ORBIT_DIRECTION] orbit rundt [PRODUCT] på [SURFACE],
studiobelysning med [KEY_LIGHT_POSITION] key og subtil fill,
makrodetaljmomenter, [LENS]mm, rene refleksjoner, [DURATION].Fyll inn parenteser for spesifikke behov. Bygg et bibliotek organisert etter bruksområde.
Iterasjonsstrategi
Perfekte prompts fremkommer gjennom systematisk raffinering:
- Start enkelt: Kun kjernesubjekt og handling
- Legg til ett element: Test enkeltlegninger
- Dokumenter hva som fungerer: Hold en logg over effektive fraser
- A/B-test formulering: Samme konsept, forskjellige ord
- Lagre vinnere: Bygg prompt-biblioteket ditt
Loggformat:
Prompt: [full prompt]
Model: [platform used]
Result: [1-5 rating]
Notes: [what worked/didn't]Kvalitetssjekkliste
Før du ferdigstiller noen AI-video, verifiser:
- Subjektkonsistens gjennom hele
- Naturlig bevegelse (ingen rykkighet)
- Belysningskontinuitet
- Ingen ansiktsforvrengninger
- Fargegrading-konsistens
- Passende tempo
- Ren lyd (hvis aktuelt)
- Ingen vannmerker eller artefakter
Neste steg
Prompt engineering forbedres med praksis. Start med enklere shots, mestre hvert lag, kombiner dem deretter. Målet er ikke å memorere terminologi – det er å utvikle intuisjon for hva som gjør video overbevisende.
Hold en generasjonslogg. Gjennomgå hva som fungerte. Bygg biblioteket ditt. Forskjellen mellom amatør- og profesjonell AI-video kommer ofte ned til prompt-presisjon.
Kameraet ditt venter. Start å filme.
Var denne artikkelen nyttig?

Damien
KI-utviklerKI-utvikler fra Lyon som elsker å gjøre komplekse ML-konsepter om til enkle oppskrifter. Når han ikke feilsøker modeller, finner du ham på sykkel gjennom Rhône-dalen.
Relaterte artikler
Fortsett å utforske med disse relaterte innleggene

Pika 2.5: Demokratisering av AI-video gjennom hastighet, pris og kreative verktøy
Pika Labs utgir versjon 2.5, som kombinerer raskere generering, forbedret fysikk og kreative verktøy som Pikaframes og Pikaffects for å gjøre AI-video tilgjengelig for alle.

Runway Gen-4.5 Tar Førsteplass: Hvordan 100 Ingeniører Gikk Forbi Google og OpenAI
Runway tok toppposisjonen på Video Arena med Gen-4.5, og viser at et lite team kan konkurrere med triljon-dollar-selskaper i AI-videogenerering.

CraftStory Model 2.0: Hvordan Bidirectional Diffusion Låser Opp 5-Minutters AI-Videoer
Mens Sora 2 stopper på 25 sekunder, har CraftStory nettopp lansert et system som genererer sammenhengende 5-minutters videoer. Hemmeligheten? Å kjøre flere diffusion-motorer parallelt med toveisbegrensninger.