La guia completa d'enginyeria de prompts de vídeo AI el 2025
Domina l'art de crear prompts que produeixen vídeos generats per IA impressionants. Aprèn el marc de sis capes, terminologia cinematogràfica i tècniques específiques de plataforma.

L'enginyeria de prompts per a vídeo AI és com perfeccionar una recepta: els mateixos ingredients donen resultats radicalment diferents segons la tècnica. Després de passar innombrables hores generant vídeos a través de cada plataforma principal, he destil·lat el que realment funciona en un marc pràctic. Tallem el soroll i centrem-nos en tècniques que produeixen resultats consistents i professionals.
Per què els prompts de vídeo són diferents
Si has treballat amb generadors d'imatges com Midjourney o DALL-E, podries pensar que els prompts de vídeo funcionen de la mateixa manera. No ho fan. El vídeo afegeix una dimensió temporal (moviment, ritme, transicions) que transforma l'enginyeria de prompts d'una sola instrucció a orquestrar una seqüència.
Pensa-ho com la diferència entre fer una fotografia i dirigir una escena. Per a una foto, prepares la presa. Per al vídeo, necessites coreografiar què passa amb el temps:
- Com es mou la càmera?
- Quines accions es desenvolupen?
- Quant de temps dura cada element?
- Quin és l'arc emocional?
Aquestes preguntes requereixen vocabulari i estructura que van més enllà dels prompts d'imatge estàtica.
El marc de sis capes
Els prompts de vídeo professionals segueixen un enfocament estructurat. L'anomeno el marc de sis capes: cada capa afegeix especificitat que guia la IA cap a la teva visió:
Capa 1: Subjecte i acció
Defineix el teu focus amb precisió. Subjectes vagues produeixen resultats vagues.
Feble: "Una dona en un jardí" Fort: "Una dona amb un vestit vermell flotant caminant lentament a través de rosers, tocant suavament pètals mentre passa"
La versió forta especifica roba, velocitat de moviment i interacció amb l'entorn. Cada detall restringeix la interpretació de la IA cap a la teva intenció.
Capa 2: Tipus de presa i enquadrament
Els directors de fotografia han passat un segle desenvolupant gramàtica visual. Utilitza-la.
| Tipus de presa | Cas d'ús |
|---|---|
| Pla general | Establir ubicació, escala |
| Pla mitjà | Interacció de personatges, diàleg |
| Primer pla | Emoció, detall, intimitat |
| Primer pla extrem | Èmfasi dramàtic |
Exemple: "Pla mitjà de seguiment, càmera posicionada a l'altura de la cintura, seguint des del costat"
Capa 3: Moviment de càmera
Les preses estàtiques semblen amateurs. El moviment crea energia i guia l'atenció.
| Moviment | Efecte |
|---|---|
| Panoràmica | Revela espai horitzontalment |
| Inclinació | Revela espai verticalment |
| Dolly/seguiment | Crea profunditat, segueix subjecte |
| Grua | Estableix escala, drama |
| Mà | Urgència, sensació documental |
| Steadicam | Seguiment suau, immersió |
Exemple: "Dolly lent endavant a través de la porta, mantenint perspectiva a nivell d'ulls"
Capa 4: Il·luminació i atmosfera
La il·luminació estableix l'estat d'ànim més poderosament que qualsevol altre element.
| Terme | Efecte visual |
|---|---|
| Hora daurada | Càlid, romàntic, nostàlgic |
| Hora blava | Fred, contemplatiu, misteriós |
| Clau alta | Brillant, optimista, net |
| Clau baixa | Dramàtic, melangiós, suspens |
| Llum volumètrica | Raigs a través de boira/pols, eteri |
| Llum de vora | Separació, drama, vora de silueta |
Exemple: "Il·luminació d'hora daurada amb raigs volumètrics filtrant-se a través de finestres polsegoses, gradació de color càlida"
Capa 5: Especificacions tècniques
Anomena paràmetres tècnics específics quan vulguis control precís:
- Objectiu: 35mm (natural), 50mm (retrat), 85mm (compressió), 24mm (ample)
- Profunditat de camp: Superficial (fons desenfocament) vs. profunda (tot nítid)
- Velocitat de fotogrames: 24fps (cinematogràfic), 60fps (suau), 120fps (càmera lenta)
- Relació d'aspecte: 16:9 (estàndard), 2.39:1 (cinematogràfic), 9:16 (vertical)
Exemple: "Gravat amb objectiu 85mm, profunditat de camp superficial amb desenfocament cremós, lleuger gra de pel·lícula"
Capa 6: Durada i ritme
El vídeo es desenvolupa amb el temps. Especifica el ritme:
- Durada de l'escena (3-10 segons típic)
- Estil de transició (tall, dissolució, netejat)
- Ritme (lent/contemplatiu vs. ràpid/enèrgic)
- Temps de batec per a sincronització musical
Exemple: "Presa de 6 segons amb moviment lent i deliberat, mantenint el fotograma final durant 1 segon"
Juntar-ho tot: Exemples de prompts complets
Així és com les capes es combinen en prompts professionals:
Retrat cinematogràfic:
Primer pla mitjà de la cara d'un pescador desgastat, hora blava matinal,
gravat amb objectiu 85mm amb profunditat de camp superficial. Lleugers micromoviments de mà,
llum suau de vora des de darrere creant un efecte d'halo al seu cabell gris.
Expressió contemplativa, ulls mirant lleugerament fora de càmera.
Gradació de color freda amb ombres elevades, durada de 5 segons.Seqüència d'acció:
Pla general de seguiment seguint un atleta de parkour corrent per terrats urbans
a la posta de sol. Moviment dinàmic de steadicam mantenint distància consistent,
contralum d'hora daurada creant silueta dramàtica. Moviment cinematogràfic a 24fps,
lleu càmera lenta a 0.8x velocitat. Alt contrast, gradació de color verd-taronja.
8 segons amb intensitat creixent.Presentació de producte:
Òrbita lenta de 360 graus al voltant d'un rellotge de luxe sobre superfície de vellut negre.
Objectiu macro capturant detalls complexos de la esfera, il·luminació d'estudi controlada
amb llum clau suau i llum de farciment subtil. Profunditat de camp superficial aïllant
el subjecte, reflexions suaus al cristall. Sensació premium amb
moviment de càmera lent i deliberat. Durada de 10 segons.Prompts negatius: Indicar a la IA què evitar
Igualment important és especificar el que no vols. Cada plataforma gestiona això de manera diferent:
Prompts negatius comuns:
- Imatges borroses, artefactes de desenfocament de moviment
- Cares distorsionades, errors anatòmics
- Marques d'aigua, superposicions de text
- Moviments no naturals, transicions espasmòdiques
- Baixa resolució, artefactes de compressió
Sintaxi específica de plataforma:
| Plataforma | Mètode |
|---|---|
| Veo 3 | Camp de prompt negatiu dedicat |
| Kling | Inclou "evita" o "sense" al prompt |
| Runway | Paràmetre de prompt negatiu separat |
| Sora | Exclusions basades en pes |
Exemple: "Evita: imatges borroses, característiques facials distorsionades, marques d'aigua, moviment de càmera espasmòdic, colors sobresaturats"
Apilament de referències d'estil
Vols una estètica distintiva? Combina 2-3 referències de pel·lícules:
Fórmula: Gradació de color [Pel·lícula A] + atmosfera [Pel·lícula B] + moviment de càmera [Pel·lícula C]
Exemples:
- "Gradació de color de Blade Runner 2049 més atmosfera de Se7en més moviment de càmera de Heat"
- "Simetria de Wes Anderson més paleta de colors de Studio Ghibli més il·luminació natural de Terrence Malick"
- "Energia de Mad Max: Fury Road més il·luminació de Roger Deakins més bloqueig de Spielberg"
Limita't a 3 referències. Més crea senyals conflictius.
Optimització específica de plataforma
Cada model té fortaleses. Adapta el teu estil de prompt a la plataforma:
| Model | Fortaleses | Focus del prompt |
|---|---|---|
| Kling 2.5 | Moviment atlètic, animació de personatges | Verbs d'acció, moviment físic |
| Sora 2 | Narració multi-presa, consistència espacial | Transicions d'escena, arc narratiu |
| Veo 3 | Control de precisió, format JSON | Especificacions tècniques, sintaxi estructurada |
| Runway Gen-3 | Estilització, interpretació artística | Referències estètiques, descriptors d'humor |
| WAN 2.5 | Diàleg, sincronització labial | Accions de parla, expressions facials |
Exemple JSON de Veo 3:
{
"subject": "dona amb vestit vermell",
"action": "caminant pel jardí",
"shot_type": "seguiment mitjà",
"camera_movement": "dolly dreta a esquerra",
"lighting": "hora daurada, volumètrica",
"lens": "35mm",
"duration": "6 segons"
}La regla d'optimització de costos 5-10-1
Les renderitzacions premium són cares. Utilitza aquest flux de treball:
- 5 variacions en models de baix cost (40-60 crèdits cadascun)
- 10 iteracions refinant el millor candidat
- 1 renderització final en nivell premium (~350 crèdits)
Això redueix els costos de milers a uns 1.000 crèdits mentre manté la qualitat.
Errors comuns a evitar
Després de revisar centenars de prompts, aquests errors apareixen més sovint:
| Error | Problema | Solució |
|---|---|---|
| Descripcions casuals | La IA interpreta vagament | Utilitza terminologia cinematogràfica |
| Desajust de durada | L'acció no s'adapta al temps | Adapta la complexitat a la durada |
| Sobrecàrrega d'estil | Senyals estètics conflictius | Limita a 3 referències màx |
| Moviment absent | Sensació estàtica, amateur | Especifica sempre moviment de càmera |
| Il·luminació vaga | Humor inconsistent | Anomena configuracions d'il·luminació específiques |
| Sense prompts negatius | Artefactes no desitjats | Exclou explícitament problemes |
Construir la teva biblioteca de prompts
Crea plantilles per a escenaris comuns:
Configuració d'entrevista:
Pla mitjà, subjecte posicionat regla dels terços esquerra, càmera a nivell d'ulls,
[CONFIGURACIÓ_IL·LUMINACIÓ], profunditat de camp superficial desenfocant fons,
subtils micromoviments de mà per a sensació natural, [DURADA].B-Roll de natura:
[TIPUS_PRESA] de [SUBJECTE], il·luminació [HORA_DIA],
[MOVIMENT_CÀMERA] lent, objectiu [OBJECTIU]mm, focus profund,
paleta [GRADACIÓ_COLOR], [DURADA].Producte hero:
Òrbita [DIRECCIÓ_ÒRBITA] al voltant de [PRODUCTE] sobre [SUPERFÍCIE],
il·luminació d'estudi amb clau [POSICIÓ_CLAU] i llum de farciment subtil,
moments de detall macro, [OBJECTIU]mm, reflexions impecables, [DURADA].Omple els claudàtors per a necessitats específiques. Construeix una biblioteca organitzada per cas d'ús.
Estratègia d'iteració
Els prompts perfectes emergeixen mitjançant refinament sistemàtic:
- Comença simple: Només subjecte i acció central
- Afegeix un element: Prova addicions úniques
- Documenta el que funciona: Mantén un registre de frases efectives
- Prova A/B de redacció: Mateix concepte, paraules diferents
- Desa guanyadors: Construeix la teva biblioteca de prompts
Format de registre:
Prompt: [prompt complet]
Model: [plataforma utilitzada]
Resultat: [valoració 1-5]
Notes: [què va funcionar/no va funcionar]Llista de verificació de revisió de qualitat
Abans de finalitzar qualsevol vídeo AI, verifica:
- Consistència del subjecte durant tot
- Moviment natural (sense sacsejos)
- Continuïtat d'il·luminació
- Sense distorsions facials
- Consistència de gradació de color
- Ritme apropiat
- Àudio net (si aplicable)
- Sense marques d'aigua o artefactes
Passos següents
L'enginyeria de prompts millora amb la pràctica. Comença amb preses més simples, domina cada capa, després combina-les. L'objectiu no és memoritzar terminologia, és desenvolupar intuïció per al que fa que el vídeo sigui atractiu.
Mantén un registre de generació. Revisa el que va funcionar. Construeix la teva biblioteca. La diferència entre vídeo AI amateur i professional sovint es redueix a la precisió del prompt.
La teva càmera està esperant. Comença a filmar.
T'ha resultat útil aquest article?

Damien
Desenvolupador d'IADesenvolupador d'IA de Lió que li encanta convertir conceptes complexos de ML en receptes simples. Quan no està depurant models, el trobaràs pedalant per la vall del Roine.
Articles relacionats
Continua explorant amb aquests articles relacionats

Consistència de personatges en vídeo AI: Com els models estan aprenent a recordar cares
Una immersió tècnica profunda en les innovacions arquitectòniques que permeten als models de vídeo AI mantenir la identitat dels personatges a través dels talls, des de mecanismes d'atenció fins a incrustacions que preserven la identitat.
Extensió de vídeo AI: Allarga fàcilment els teus vídeos amb IA
Descobreix com l'extensió de vídeo AI revoluciona la creació de contingut allargant vídeos sense esforç mentre manté la qualitat i la consistència visual.

ByteDance Seedance 1.5 Pro: El model que genera àudio i vídeo junts
ByteDance llança Seedance 1.5 Pro amb generació audiovisual nativa, controls de càmera de qualitat cinematogràfica i sincronització labial multilingüe. Disponible gratuïtament a CapCut.