Meta Pixel
HenryHenry
7 min read
1376 paraules

Google Flow i Veo 3.1: L'edició de vídeo amb IA entra en una nova era

Google llança actualitzacions importants a Flow amb Veo 3.1, introduint eines d'edició Insert i Remove, àudio en totes les funcions, i portant l'edició de vídeo amb IA més enllà de la simple generació cap al veritable control creatiu.

Google Flow i Veo 3.1: L'edició de vídeo amb IA entra en una nova era

Google acaba de llançar l'actualització més gran de la seva plataforma de vídeo amb IA des del llançament. Flow impulsat per Veo 3.1 no es tracta només de generar vídeos més bonics. Es tracta d'editar-los amb IA, inserir elements, eliminar objectes, estendre clips, tot mantenint l'àudio sincronitzat. Després de 275 milions de vídeos generats, Google està senyalant que el futur de l'edició de vídeo és generatiu.

Més enllà de la generació: la revolució de l'edició

Hem passat l'últim any obsessionats amb la qualitat de generació. Quin model produeix les explosions més fotorealistes? Qui gestiona millor la física? Pot la IA renderitzar dits correctament encara?

Aquestes preguntes encara importen. Però Google està formulant una de diferent: Què passa després de generar?

La resposta, aparentment, és Flow.

💡

Flow ha generat més de 275 milions de vídeos des del seu llançament el maig de 2025. Les noves actualitzacions de Veo 3.1 el transformen d'una eina de generació a un paquet complet d'edició creativa.

L'edició de vídeo tradicional és destructiva. Talles, empalmes, superposes, renderitzes. Fer canvis significa tornar a renderitzar. Afegir un element significa trobar material, fer keying, composició.

L'edició generativa canvia això. Vols afegir un ocell volant per la teva escena? Descriu-ho. Vols eliminar aquest senyal distret al fons? Digues-ho a la IA. Gestiona les ombres, la il·luminació, la continuïtat de l'escena.

Què aporta Veo 3.1 a Flow

Deixa'm desglossar les capacitats reals, perquè el comunicat de premsa amaga algunes funcions genuïnament significatives.

Insert: afegeix elements a escenes existents

Aquesta és la funció destacada. Ara pots afegir nous objectes o personatges a clips de vídeo generats o pujats.

Entrada: Un camí forestal tranquil, llum solar tacada
Comanda d'inserció: "Un cérvol creuant el camí, fent una pausa per mirar la càmera"
Sortida: El cérvol apareix naturalment, ombres precises, il·luminació consistent

El sistema gestiona les parts difícils automàticament. La direcció de l'ombra coincideix amb la il·luminació de l'escena. L'element inserit interactua correctament amb els objectes existents. No és composició, és regenerar l'escena amb la teva addició incorporada.

Remove: elimina elements no desitjats

Pròximament a Flow, la funció Remove et permet eliminar objectes o personatges de les escenes. La IA reconstrueix el que hauria d'estar darrere d'ells.

Això és més difícil del que sembla. Quan elimines una persona d'una escena, necessites:

  1. Entendre com hauria de ser el fons
  2. Gestionar qualsevol ombra o reflexió que projectin
  3. Mantenir la consistència temporal entre fotogrames
  4. Mantenir l'eliminació invisible: sense artefactes, sense esfumats estranys

Els equips tradicionals de VFX passen hores en treball de placa neta. L'eliminació generativa ho fa en segons.

Àudio en totes les funcions

Aquí està l'actualització silenciosa: l'àudio ara funciona amb funcions que anteriorment eren silencioses.

FuncióAnteriorAra
Ingredients to VideoSortida silenciosaÀudio generat
Frames to VideoSortida silenciosaÀudio generat
ExtendÀudio opcionalIntegració completa d'àudio

Ingredients to Video et permet combinar múltiples imatges de referència per controlar personatges, objectes i estil. Ara aquests vídeos generats venen amb àudio sincronitzat: sons ambients, diàleg, efectes.

Frames to Video genera transicions fluides entre un fotograma d'inici i un de final. Anteriorment obtenies morfosis visuals suaus però havies d'afegir so després. Ara l'àudio emergeix naturalment amb els visuals.

Extend et permet empènyer clips més enllà de la seva durada original. Amb integració d'àudio, pots crear vídeos de més d'un minut amb paisatges sonors consistents al llarg.

El salt tècnic

El que fa això possible són les millores de Veo 3.1 respecte al seu predecessor. Pel que puc deduir dels experiments:

~10ms
Precisió de sincronització labial
60s+
Durada coherent
Natiu
Generació d'àudio

Característiques de rendiment basades en documentació i proves de Veo 3.1

Les innovacions clau:

Textures fidedignes: Veo 3.1 captura superfícies realistes millor que qualsevol versió anterior. Pell, teixit, metall, vidre: les textures responen correctament als canvis d'il·luminació.

Control narratiu millorat: El model segueix indicacions complexes amb més precisió. Pots especificar moments emocionals, temporització, moviments de càmera, i realment escolta.

Major adherència d'imatge a vídeo: Quan converteix imatges estàtiques a vídeo, Veo 3.1 manté millor la consistència del personatge i la fidelitat de l'escena que Veo 3.

Com això canvia els fluxos de treball creatius

He estat provant Flow per a una sèrie de contingut, i el canvi de flux de treball és significatiu.

Flux de treball antic:

  1. Escriure guió
  2. Generar tomes individuals
  3. Exportar a programari d'edició
  4. Afegir efectes de so manualment
  5. Composar qualsevol element addicional
  6. Tornar a renderitzar constantment a mesura que es produeixen canvis

Flux de treball Flow:

  1. Escriure guió
  2. Generar tomes amb àudio
  3. Utilitzar Insert/Remove per refinar
  4. Estendre clips segons sigui necessari
  5. Exportar vídeo final

El bucle d'iteració es col·lapsa. No estàs canviant entre aplicacions. No estàs sincronitzant l'àudio manualment. Els canvis passen al mateix entorn on passa la generació.

Comparació amb la competència

L'espai de vídeo amb IA està ple. Com es compara Flow amb Veo 3.1?

Runway Gen-4.5 actualment lidera en pura qualitat de generació. Sora 2 destaca en clips més llargs i més coherents amb millor comprensió de la física.

Però cap ofereix les capacitats d'edició que Flow acaba d'introduir. Insert i Remove són genuïnament noves. La integració d'àudio a totes les funcions no té igual.

La pregunta esdevé: què necessites? Si estàs generant tomes individuals per a una producció més gran, la qualitat podria ser primordial. Si estàs creant vídeos complets dins d'una plataforma, l'ecosistema de Flow comença a semblar convincent.

Casos d'ús pràctics

On és això realment important?

Creació de contingut social: Genera un vídeo, t'adones que vols afegir un producte a l'escena, insereix-lo directament. Sense tornar a gravar, sense composició.

Visualització de prototips: Mostra als clients un concepte amb vídeo generat per IA, després itera afegint o eliminant elements en temps real durant la reunió.

Contingut educatiu: Crea vídeos explicatius on pots inserir diagrames, personatges o ajudes visuals després del fet.

Actius de màrqueting: Genera b-roll per a anuncis, elimina elements no desitjats del material d'arxiu, estén clips per coincidir amb la temporització de la música.

Accés a Flow

Flow està disponible a través de múltiples canals:

  • flow.google: La interfície web principal
  • Gemini API: Per a desenvolupadors que construeixen sobre Veo 3.1
  • Vertex AI: Per a clients empresarials que necessiten escala i SLAs
  • Gemini App: Accés de consumidor a través de l'assistent d'IA de Google

La funció Insert s'està desplegant ara. Remove vindrà aviat. La integració d'àudio ja està activa a totes les funcions compatibles.

Què significa això per a la indústria

Estem veient com la definició d'"edició de vídeo" canvia en temps real.

L'edició tradicional assumeix que tens material. El talles, l'organitzes, el millores. El material és la restricció.

L'edició generativa assumeix que tens imaginació. Descrius el que vols. La IA genera, modifica, estén. La teva visió creativa és la restricció.

Això no està substituint els editors tradicionals, encara. La producció cinematogràfica d'alta gamma encara requereix control a nivell de fotograma, efectes pràctics, actors reals. Però per a la gran majoria del contingut de vídeo (xarxes socials, màrqueting, educatiu, prototipat) les eines acaben de fer-se radicalment més accessibles.

Els 275 milions de vídeos generats a Flow són només el començament. Amb capacitats d'edició que rivalitzen amb programari de VFX dedicat, aquest nombre està a punt d'explotar.

Prova-ho ara

Si vols experimentar aquest canvi de primera mà:

  1. Ves a flow.google
  2. Genera una escena simple
  3. Utilitza Insert per afegir un element
  4. Observa com la IA gestiona ombres i il·luminació
  5. Estén el clip i nota com l'àudio es manté coherent

Després prova alguna cosa complexa. Genera una conversa, insereix un element de fons, estén-lo amb àudio. Sent com de diferent és això de l'edició tradicional.

El futur de l'edició de vídeo no es tracta de millors eines per tallar material.

Es tracta de descriure el que vols i veure-ho aparèixer.

T'ha resultat útil aquest article?

Henry

Henry

Tecnòleg Creatiu

Tecnòleg creatiu de Lausana que explora on la IA es troba amb l'art. Experimenta amb models generatius entre sessions de música electrònica.

Articles relacionats

Continua explorant amb aquests articles relacionats

T'ha agradat aquest article?

Descobreix més idees i mantén-te al dia amb el nostre contingut més recent.

Google Flow i Veo 3.1: L'edició de vídeo amb IA entra en una nova era