Meta Pixel
DamienDamien
8 min read
1413 ord

Komplett guide til AI-video prompt engineering i 2025

Lær kunsten å lage prompts som produserer imponerende AI-genererte videoer. Lær seks-lags-rammeverket, kinematografisk terminologi og plattformspesifikke teknikker.

Komplett guide til AI-video prompt engineering i 2025

Prompt engineering for AI-video er som å perfeksjonere en oppskrift: de samme ingrediensene gir vidt forskjellige resultater avhengig av teknikk. Etter å ha brukt utallige timer på å generere videoer på alle større plattformer, har jeg destillert det som faktisk fungerer til et praktisk rammeverk. La oss kutte ut støyen og fokusere på teknikker som produserer konsistente, profesjonelle resultater.

Hvorfor video-prompts er annerledes

Hvis du har jobbet med bildegeneratorer som Midjourney eller DALL-E, tror du kanskje at video-prompts fungerer på samme måte. Det gjør de ikke. Video legger til en tidslig dimensjon – bevegelse, tempo, overganger – som transformerer prompt engineering fra en enkelt instruksjon til å orkestrere en sekvens.

Tenk på det som forskjellen mellom å ta et fotografi og å regissere en scene. For et foto setter du opp bildet. For video må du koreografere hva som skjer over tid:

  • Hvordan beveger kameraet seg?
  • Hvilke handlinger utspiller seg?
  • Hvor lenge varer hvert element?
  • Hva er den emosjonelle buen?

Disse spørsmålene krever vokabular og struktur som går utover statiske bilde-prompts.

Seks-lags-rammeverket

Profesjonelle video-prompts følger en strukturert tilnærming. Jeg kaller det seks-lags-rammeverket – hvert lag legger til spesifisitet som veileder AI-en mot visjonen din:

Lag 1: Subjekt og handling

Definer fokuset ditt med presisjon. Vage subjekter produserer vage resultater.

Svak: "En kvinne i en hage" Sterk: "En kvinne i en flagrende rød kjole går sakte gjennom rosebusker, forsiktig rører ved kronblader mens hun passerer"

Den sterke versjonen spesifiserer klær, bevegelseshastighet og interaksjon med omgivelsene. Hvert detalj begrenser AI-ens tolkning mot intensjonen din.

Lag 2: Shot-type og innramming

Kinematografer har brukt et århundre på å utvikle visuell grammatikk. Bruk den.

Shot-typeBruksområde
Wide shotEtablere lokasjon, skala
Medium shotKarakterinteraksjon, dialog
Close-upFølelse, detalj, intimitet
Extreme close-upDramatisk vektlegging

Eksempel: "Medium tracking shot, kamera plassert i midjehøyde, følger fra siden"

Lag 3: Kamerabevegelse

Statiske shots virker amatørmessige. Bevegelse skaper energi og styrer oppmerksomhet.

BevegelseEffekt
PanAvslører rom horisontalt
TiltAvslører rom vertikalt
Dolly/trackingSkaper dybde, følger subjekt
CraneEtablerer skala, drama
HandheldHast, dokumentarfølelse
SteadicamJevn følging, fordypelse

Eksempel: "Sakte dolly fremover gjennom døråpningen, opprettholder øyehøyde-perspektiv"

Lag 4: Belysning og atmosfære

Belysning setter stemning kraftigere enn noe annet element.

BegrepVisuell effekt
Golden hourVarm, romantisk, nostalgisk
Blue hourKjølig, kontemplativ, mystisk
High keyLys, optimistisk, ren
Low keyDramatisk, stemningsfull, spenningsfylt
Volumetric lightStråler gjennom tåke/støv, eterisk
Rim lightingSeparasjon, drama, silhuettkant

Eksempel: "Golden hour-belysning med volumetriske stråler som filtrerer gjennom støvete vinduer, varm fargegrading"

Lag 5: Tekniske spesifikasjoner

Navngi spesifikke tekniske parametere når du vil ha presis kontroll:

  • Linse: 35mm (naturlig), 50mm (portrett), 85mm (kompresjon), 24mm (vid)
  • Dybdeskarphet: Grunn (bokeh-bakgrunn) vs. dyp (alt skarpt)
  • Bilderate: 24fps (kinematisk), 60fps (jevn), 120fps (sakte film)
  • Aspektforhold: 16:9 (standard), 2.39:1 (kinematisk), 9:16 (vertikal)

Eksempel: "Filmet på 85mm linse, grunn dybdeskarphet med kremet bokeh, lett filmkorn"

Lag 6: Varighet og tempo

Video utfolder seg over tid. Spesifiser rytme:

  • Scenevarighet (3-10 sekunder typisk)
  • Overgangsstil (kutt, dissolve, wipe)
  • Tempo (sakte/kontemplativ vs. rask/energisk)
  • Taktiming for musikksynkronisering

Eksempel: "6-sekunders shot med sakte, bevisst bevegelse, holder på sluttbildet i 1 sekund"

Sette det sammen: Fulle prompt-eksempler

Slik kombineres lagene til profesjonelle prompts:

Kinematisk portrett:

Medium close-up av et værbitt fiskerhode, tidlig morgen blue hour,
filmet på 85mm linse med grunn dybdeskarphet. Forsiktige handheld mikrobevegelser,
myk rim-belysning bakfra som skaper en glorie-effekt på det grå håret.
Kontemplativt uttrykk, øyne ser litt ved siden av kameraet.
Kjølig fargegrading med løftede skygger, 5 sekunders varighet.

Action-sekvens:

Wide tracking shot følger en parkour-utøver som løper over urbane hustak
ved solnedgang. Dynamisk steadicam-bevegelse opprettholder konsistent avstand,
golden hour-baklys skaper dramatisk silhuett. 24fps kinematisk bevegelse,
lett sakte film på 0.8x hastighet. Høy kontrast, teal-orange fargegrading.
8 sekunder med økende intensitet.

Produktvisning:

Sakte 360-graders orbit rundt en luksusklokke på svart fløyelsoverflate.
Makrolinse fanger intrikate detaljer på urskiven, kontrollert studiobelysning
med myk key light og subtil fill. Grunn dybdeskarphet isolerer
subjektet, forsiktige refleksjoner på krystall. Premium-følelse med
sakte, bevisst kamerabevegelse. 10 sekunders varighet.

Negativ prompting: Fortelle AI hva den skal unngå

Like viktig er å spesifisere hva du ikke vil ha. Hver plattform håndterer dette forskjellig:

Vanlige negative prompts:

  • Uskarpt materiale, motion blur-artefakter
  • Forvrengte ansikter, anatomiske feil
  • Vannmerker, tekstoverlegg
  • Unaturlige bevegelser, hakkete overganger
  • Lav oppløsning, komprimeringsartefakter

Plattformspesifikk syntaks:

PlattformMetode
Veo 3Dedikert negativ prompt-felt
KlingInkluder "avoid" eller "without" i prompt
RunwaySeparat negativ prompt-parameter
SoraVektbaserte ekskluderinger

Eksempel: "Avoid: blurry footage, distorted facial features, watermarks, jerky camera movement, oversaturated colors"

Style reference stacking

Vil du ha en distinktiv estetikk? Kombiner 2-3 filmreferanser:

Formel: [Film A] fargegrading + [Film B] atmosfære + [Film C] kamerabevegelse

Eksempler:

  • "Blade Runner 2049-fargegrading pluss Se7en-atmosfære pluss Heat-kamerabevegelse"
  • "Wes Anderson-symmetri pluss Studio Ghibli-fargepalett pluss Terrence Malick naturlig belysning"
  • "Mad Max: Fury Road-energi pluss Roger Deakins-belysning pluss Spielberg-blokkering"

Begrens til 3 referanser. Flere skaper motstridende signaler.

Plattformspesifikk optimalisering

Hver modell har styrker. Tilpass prompt-stilen din til plattformen:

ModellStyrkerPrompt-fokus
Kling 2.5Atletisk bevegelse, karakteranimasjonHandlingsverb, fysisk bevegelse
Sora 2Flershot-historiefortelling, romlig konsistensSceneoverganger, narrativ bue
Veo 3Presisjonskontroll, JSON-formateringTekniske spesifikasjoner, strukturert syntaks
Runway Gen-3Stilisering, kunstnerisk tolkningEstetiske referanser, stemningsmessige beskrivelser
WAN 2.5Dialog, lippesynkroniseringTalehandlinger, ansiktsuttrykk

Veo 3 JSON-eksempel:

{
  "subject": "woman in red dress",
  "action": "walking through garden",
  "shot_type": "medium tracking",
  "camera_movement": "dolly right to left",
  "lighting": "golden hour, volumetric",
  "lens": "35mm",
  "duration": "6 seconds"
}

5-10-1 kostnadsoptimaliseringsregelen

Premium-renderinger er dyre. Bruk denne arbeidsflyten:

  1. 5 variasjoner på rimeligere modeller (40-60 credits hver)
  2. 10 iterasjoner som raffinerer den beste kandidaten
  3. 1 endelig rendering på premium-nivå (~350 credits)

Dette reduserer kostnader fra tusenvis til rundt 1000 credits samtidig som kvaliteten opprettholdes.

Vanlige feil å unngå

Etter å ha gjennomgått hundrevis av prompts, dukker disse feilene opp oftest:

FeilProblemLøsning
Uformelle beskrivelserAI tolker løstBruk kinematografisk terminologi
Varighet-mismatchHandling passer ikke tidsrammenTilpass kompleksitet til varighet
StiloverbelastningMotstridende estetiske signalerBegrens til maks 3 referanser
Manglende bevegelseStatisk, amatørmessig følelseAlltid spesifiser kamerabevegelse
Vag belysningInkonsistent stemningNavngi spesifikke belysningsoppsett
Ingen negative promptsUønskede artefakterEkskluder problemer eksplisitt

Bygg ditt prompt-bibliotek

Lag maler for vanlige scenarioer:

Intervjuoppsett:

Medium shot, subjekt plassert tredjedelsregel venstre, øyehøydekamera,
[LIGHTING_SETUP], grunn dybdeskarphet uskarp bakgrunn,
subtile handheld-mikrobevegelser for naturlig følelse, [DURATION].

B-Roll natur:

[SHOT_TYPE] av [SUBJECT], [TIME_OF_DAY]-belysning,
sakte [CAMERA_MOVEMENT], [LENS]mm linse, dyp fokus,
[COLOR_GRADE]-palett, [DURATION].

Produkthelt:

[ORBIT_DIRECTION] orbit rundt [PRODUCT] på [SURFACE],
studiobelysning med [KEY_LIGHT_POSITION] key og subtil fill,
makrodetaljmomenter, [LENS]mm, rene refleksjoner, [DURATION].

Fyll inn parenteser for spesifikke behov. Bygg et bibliotek organisert etter bruksområde.

Iterasjonsstrategi

Perfekte prompts fremkommer gjennom systematisk raffinering:

  1. Start enkelt: Kun kjernesubjekt og handling
  2. Legg til ett element: Test enkeltlegninger
  3. Dokumenter hva som fungerer: Hold en logg over effektive fraser
  4. A/B-test formulering: Samme konsept, forskjellige ord
  5. Lagre vinnere: Bygg prompt-biblioteket ditt

Loggformat:

Prompt: [full prompt]
Model: [platform used]
Result: [1-5 rating]
Notes: [what worked/didn't]

Kvalitetssjekkliste

Før du ferdigstiller noen AI-video, verifiser:

  • Subjektkonsistens gjennom hele
  • Naturlig bevegelse (ingen rykkighet)
  • Belysningskontinuitet
  • Ingen ansiktsforvrengninger
  • Fargegrading-konsistens
  • Passende tempo
  • Ren lyd (hvis aktuelt)
  • Ingen vannmerker eller artefakter

Neste steg

Prompt engineering forbedres med praksis. Start med enklere shots, mestre hvert lag, kombiner dem deretter. Målet er ikke å memorere terminologi – det er å utvikle intuisjon for hva som gjør video overbevisende.

Hold en generasjonslogg. Gjennomgå hva som fungerte. Bygg biblioteket ditt. Forskjellen mellom amatør- og profesjonell AI-video kommer ofte ned til prompt-presisjon.

Kameraet ditt venter. Start å filme.

Var denne artikkelen nyttig?

Damien

Damien

KI-utvikler

KI-utvikler fra Lyon som elsker å gjøre komplekse ML-konsepter om til enkle oppskrifter. Når han ikke feilsøker modeller, finner du ham på sykkel gjennom Rhône-dalen.

Relaterte artikler

Fortsett å utforske med disse relaterte innleggene

Likte du denne artikkelen?

Oppdag mer innsikt og hold deg oppdatert på vårt nyeste innhold.

Komplett guide til AI-video prompt engineering i 2025