Meta Pixel
DamienDamien
9 min read
1704 paraules

La guia completa d'enginyeria de prompts de vídeo AI el 2025

Domina l'art de crear prompts que produeixen vídeos generats per IA impressionants. Aprèn el marc de sis capes, terminologia cinematogràfica i tècniques específiques de plataforma.

La guia completa d'enginyeria de prompts de vídeo AI el 2025

L'enginyeria de prompts per a vídeo AI és com perfeccionar una recepta: els mateixos ingredients donen resultats radicalment diferents segons la tècnica. Després de passar innombrables hores generant vídeos a través de cada plataforma principal, he destil·lat el que realment funciona en un marc pràctic. Tallem el soroll i centrem-nos en tècniques que produeixen resultats consistents i professionals.

Per què els prompts de vídeo són diferents

Si has treballat amb generadors d'imatges com Midjourney o DALL-E, podries pensar que els prompts de vídeo funcionen de la mateixa manera. No ho fan. El vídeo afegeix una dimensió temporal (moviment, ritme, transicions) que transforma l'enginyeria de prompts d'una sola instrucció a orquestrar una seqüència.

Pensa-ho com la diferència entre fer una fotografia i dirigir una escena. Per a una foto, prepares la presa. Per al vídeo, necessites coreografiar què passa amb el temps:

  • Com es mou la càmera?
  • Quines accions es desenvolupen?
  • Quant de temps dura cada element?
  • Quin és l'arc emocional?

Aquestes preguntes requereixen vocabulari i estructura que van més enllà dels prompts d'imatge estàtica.

El marc de sis capes

Els prompts de vídeo professionals segueixen un enfocament estructurat. L'anomeno el marc de sis capes: cada capa afegeix especificitat que guia la IA cap a la teva visió:

Capa 1: Subjecte i acció

Defineix el teu focus amb precisió. Subjectes vagues produeixen resultats vagues.

Feble: "Una dona en un jardí" Fort: "Una dona amb un vestit vermell flotant caminant lentament a través de rosers, tocant suavament pètals mentre passa"

La versió forta especifica roba, velocitat de moviment i interacció amb l'entorn. Cada detall restringeix la interpretació de la IA cap a la teva intenció.

Capa 2: Tipus de presa i enquadrament

Els directors de fotografia han passat un segle desenvolupant gramàtica visual. Utilitza-la.

Tipus de presaCas d'ús
Pla generalEstablir ubicació, escala
Pla mitjàInteracció de personatges, diàleg
Primer plaEmoció, detall, intimitat
Primer pla extremÈmfasi dramàtic

Exemple: "Pla mitjà de seguiment, càmera posicionada a l'altura de la cintura, seguint des del costat"

Capa 3: Moviment de càmera

Les preses estàtiques semblen amateurs. El moviment crea energia i guia l'atenció.

MovimentEfecte
PanoràmicaRevela espai horitzontalment
InclinacióRevela espai verticalment
Dolly/seguimentCrea profunditat, segueix subjecte
GruaEstableix escala, drama
Urgència, sensació documental
SteadicamSeguiment suau, immersió

Exemple: "Dolly lent endavant a través de la porta, mantenint perspectiva a nivell d'ulls"

Capa 4: Il·luminació i atmosfera

La il·luminació estableix l'estat d'ànim més poderosament que qualsevol altre element.

TermeEfecte visual
Hora dauradaCàlid, romàntic, nostàlgic
Hora blavaFred, contemplatiu, misteriós
Clau altaBrillant, optimista, net
Clau baixaDramàtic, melangiós, suspens
Llum volumètricaRaigs a través de boira/pols, eteri
Llum de voraSeparació, drama, vora de silueta

Exemple: "Il·luminació d'hora daurada amb raigs volumètrics filtrant-se a través de finestres polsegoses, gradació de color càlida"

Capa 5: Especificacions tècniques

Anomena paràmetres tècnics específics quan vulguis control precís:

  • Objectiu: 35mm (natural), 50mm (retrat), 85mm (compressió), 24mm (ample)
  • Profunditat de camp: Superficial (fons desenfocament) vs. profunda (tot nítid)
  • Velocitat de fotogrames: 24fps (cinematogràfic), 60fps (suau), 120fps (càmera lenta)
  • Relació d'aspecte: 16:9 (estàndard), 2.39:1 (cinematogràfic), 9:16 (vertical)

Exemple: "Gravat amb objectiu 85mm, profunditat de camp superficial amb desenfocament cremós, lleuger gra de pel·lícula"

Capa 6: Durada i ritme

El vídeo es desenvolupa amb el temps. Especifica el ritme:

  • Durada de l'escena (3-10 segons típic)
  • Estil de transició (tall, dissolució, netejat)
  • Ritme (lent/contemplatiu vs. ràpid/enèrgic)
  • Temps de batec per a sincronització musical

Exemple: "Presa de 6 segons amb moviment lent i deliberat, mantenint el fotograma final durant 1 segon"

Juntar-ho tot: Exemples de prompts complets

Així és com les capes es combinen en prompts professionals:

Retrat cinematogràfic:

Primer pla mitjà de la cara d'un pescador desgastat, hora blava matinal,
gravat amb objectiu 85mm amb profunditat de camp superficial. Lleugers micromoviments de mà,
llum suau de vora des de darrere creant un efecte d'halo al seu cabell gris.
Expressió contemplativa, ulls mirant lleugerament fora de càmera.
Gradació de color freda amb ombres elevades, durada de 5 segons.

Seqüència d'acció:

Pla general de seguiment seguint un atleta de parkour corrent per terrats urbans
a la posta de sol. Moviment dinàmic de steadicam mantenint distància consistent,
contralum d'hora daurada creant silueta dramàtica. Moviment cinematogràfic a 24fps,
lleu càmera lenta a 0.8x velocitat. Alt contrast, gradació de color verd-taronja.
8 segons amb intensitat creixent.

Presentació de producte:

Òrbita lenta de 360 graus al voltant d'un rellotge de luxe sobre superfície de vellut negre.
Objectiu macro capturant detalls complexos de la esfera, il·luminació d'estudi controlada
amb llum clau suau i llum de farciment subtil. Profunditat de camp superficial aïllant
el subjecte, reflexions suaus al cristall. Sensació premium amb
moviment de càmera lent i deliberat. Durada de 10 segons.

Prompts negatius: Indicar a la IA què evitar

Igualment important és especificar el que no vols. Cada plataforma gestiona això de manera diferent:

Prompts negatius comuns:

  • Imatges borroses, artefactes de desenfocament de moviment
  • Cares distorsionades, errors anatòmics
  • Marques d'aigua, superposicions de text
  • Moviments no naturals, transicions espasmòdiques
  • Baixa resolució, artefactes de compressió

Sintaxi específica de plataforma:

PlataformaMètode
Veo 3Camp de prompt negatiu dedicat
KlingInclou "evita" o "sense" al prompt
RunwayParàmetre de prompt negatiu separat
SoraExclusions basades en pes

Exemple: "Evita: imatges borroses, característiques facials distorsionades, marques d'aigua, moviment de càmera espasmòdic, colors sobresaturats"

Apilament de referències d'estil

Vols una estètica distintiva? Combina 2-3 referències de pel·lícules:

Fórmula: Gradació de color [Pel·lícula A] + atmosfera [Pel·lícula B] + moviment de càmera [Pel·lícula C]

Exemples:

  • "Gradació de color de Blade Runner 2049 més atmosfera de Se7en més moviment de càmera de Heat"
  • "Simetria de Wes Anderson més paleta de colors de Studio Ghibli més il·luminació natural de Terrence Malick"
  • "Energia de Mad Max: Fury Road més il·luminació de Roger Deakins més bloqueig de Spielberg"

Limita't a 3 referències. Més crea senyals conflictius.

Optimització específica de plataforma

Cada model té fortaleses. Adapta el teu estil de prompt a la plataforma:

ModelFortalesesFocus del prompt
Kling 2.5Moviment atlètic, animació de personatgesVerbs d'acció, moviment físic
Sora 2Narració multi-presa, consistència espacialTransicions d'escena, arc narratiu
Veo 3Control de precisió, format JSONEspecificacions tècniques, sintaxi estructurada
Runway Gen-3Estilització, interpretació artísticaReferències estètiques, descriptors d'humor
WAN 2.5Diàleg, sincronització labialAccions de parla, expressions facials

Exemple JSON de Veo 3:

{
  "subject": "dona amb vestit vermell",
  "action": "caminant pel jardí",
  "shot_type": "seguiment mitjà",
  "camera_movement": "dolly dreta a esquerra",
  "lighting": "hora daurada, volumètrica",
  "lens": "35mm",
  "duration": "6 segons"
}

La regla d'optimització de costos 5-10-1

Les renderitzacions premium són cares. Utilitza aquest flux de treball:

  1. 5 variacions en models de baix cost (40-60 crèdits cadascun)
  2. 10 iteracions refinant el millor candidat
  3. 1 renderització final en nivell premium (~350 crèdits)

Això redueix els costos de milers a uns 1.000 crèdits mentre manté la qualitat.

Errors comuns a evitar

Després de revisar centenars de prompts, aquests errors apareixen més sovint:

ErrorProblemaSolució
Descripcions casualsLa IA interpreta vagamentUtilitza terminologia cinematogràfica
Desajust de duradaL'acció no s'adapta al tempsAdapta la complexitat a la durada
Sobrecàrrega d'estilSenyals estètics conflictiusLimita a 3 referències màx
Moviment absentSensació estàtica, amateurEspecifica sempre moviment de càmera
Il·luminació vagaHumor inconsistentAnomena configuracions d'il·luminació específiques
Sense prompts negatiusArtefactes no desitjatsExclou explícitament problemes

Construir la teva biblioteca de prompts

Crea plantilles per a escenaris comuns:

Configuració d'entrevista:

Pla mitjà, subjecte posicionat regla dels terços esquerra, càmera a nivell d'ulls,
[CONFIGURACIÓ_IL·LUMINACIÓ], profunditat de camp superficial desenfocant fons,
subtils micromoviments de mà per a sensació natural, [DURADA].

B-Roll de natura:

[TIPUS_PRESA] de [SUBJECTE], il·luminació [HORA_DIA],
[MOVIMENT_CÀMERA] lent, objectiu [OBJECTIU]mm, focus profund,
paleta [GRADACIÓ_COLOR], [DURADA].

Producte hero:

Òrbita [DIRECCIÓ_ÒRBITA] al voltant de [PRODUCTE] sobre [SUPERFÍCIE],
il·luminació d'estudi amb clau [POSICIÓ_CLAU] i llum de farciment subtil,
moments de detall macro, [OBJECTIU]mm, reflexions impecables, [DURADA].

Omple els claudàtors per a necessitats específiques. Construeix una biblioteca organitzada per cas d'ús.

Estratègia d'iteració

Els prompts perfectes emergeixen mitjançant refinament sistemàtic:

  1. Comença simple: Només subjecte i acció central
  2. Afegeix un element: Prova addicions úniques
  3. Documenta el que funciona: Mantén un registre de frases efectives
  4. Prova A/B de redacció: Mateix concepte, paraules diferents
  5. Desa guanyadors: Construeix la teva biblioteca de prompts

Format de registre:

Prompt: [prompt complet]
Model: [plataforma utilitzada]
Resultat: [valoració 1-5]
Notes: [què va funcionar/no va funcionar]

Llista de verificació de revisió de qualitat

Abans de finalitzar qualsevol vídeo AI, verifica:

  • Consistència del subjecte durant tot
  • Moviment natural (sense sacsejos)
  • Continuïtat d'il·luminació
  • Sense distorsions facials
  • Consistència de gradació de color
  • Ritme apropiat
  • Àudio net (si aplicable)
  • Sense marques d'aigua o artefactes

Passos següents

L'enginyeria de prompts millora amb la pràctica. Comença amb preses més simples, domina cada capa, després combina-les. L'objectiu no és memoritzar terminologia, és desenvolupar intuïció per al que fa que el vídeo sigui atractiu.

Mantén un registre de generació. Revisa el que va funcionar. Construeix la teva biblioteca. La diferència entre vídeo AI amateur i professional sovint es redueix a la precisió del prompt.

La teva càmera està esperant. Comença a filmar.

T'ha resultat útil aquest article?

Damien

Damien

Desenvolupador d'IA

Desenvolupador d'IA de Lió que li encanta convertir conceptes complexos de ML en receptes simples. Quan no està depurant models, el trobaràs pedalant per la vall del Roine.

Articles relacionats

Continua explorant amb aquests articles relacionats

T'ha agradat aquest article?

Descobreix més idees i mantén-te al dia amb el nostre contingut més recent.

La guia completa d'enginyeria de prompts de vídeo AI el 2025