Meta Pixel
HenryHenry
9 min read
1606 paraules

SenseTime Seko 2.0: Genera sèries de 100 episodis amb IA des d'un sol prompt

SenseTime acaba de llançar el primer agent de vídeo IA multi-episodi de la indústria. Seko 2.0 pot crear sèries animades completes amb personatges, veus i trames consistents a partir d'una sola idea creativa. L'era del contingut serialitzat generat per IA ha arribat.

SenseTime Seko 2.0: Genera sèries de 100 episodis amb IA des d'un sol prompt

I si poguessis descriure un concepte d'història i fer que la IA generés una sèrie animada de 100 episodis? No clips desconnectats. Una narrativa coherent amb personatges, veus i continuïtat argumental consistents. SenseTime acaba de fer-ho realitat amb Seko 2.0.

Més enllà dels clips individuals: El problema de la serialització

Cada model de vídeo IA s'enfronta a la mateixa limitació: generen moments aïllats. Un clip de 10 segons d'un personatge caminant. Un altre d'ells parlant. Un tercer reaccionant. Cosir-los en una història coherent? Això és problema teu.

💡

El problema de la serialització no és la qualitat de generació. És la memòria. Com recorda la IA que el protagonista té una cicatriu a la galta esquerra? Que el dolent va canviar de bàndol a l'episodi 12? Que el nom de l'interès romàntic s'escriu d'una manera específica als subtítols?

Per això l'animació professional encara requereix exèrcits d'artistes comprovant fulls de model, mantenint guies d'estil i assegurant la continuïtat entre episodis. La IA podia generar fotogrames individuals, però no podia mantenir la història.

Fins ara.

Què fa realment Seko 2.0

El 15 de desembre de 2025, SenseTime va llançar Seko 2.0, que descriuen com el primer agent de generació de vídeo multi-episodi de la indústria. La paraula clau és "agent", no "model".

100
Episodis d'un sol prompt
25 FPS
Velocitat de generació
3.5s
Latència del primer fotograma

Aquí està el flux de treball:

  1. Proporciones un concepte creatiu en llenguatge natural
  2. Seko 2.0 genera un esquema complet de la història
  3. El sistema crea un desglossament detallat de la trama per a fins a 100 episodis
  4. Cada episodi es genera amb disseny de personatges, veu i construcció del món consistents
  5. Els personatges recorden esdeveniments anteriors i les relacions evolucionen

La IA no està generant 100 clips aleatoris. Està mantenint un estat narratiu al llarg de tota la sèrie.

L'arquitectura tècnica

Memòria multi-episodi

  • Base de dades global de personatges
  • Seguiment de l'estat del món
  • Consistència de la línia temporal
  • Gràfics de relacions
  • Motor de continuïtat argumental

Pipeline de generació

  • SekoIDX per a modelatge d'imatge/personatge
  • SekoTalk per a sincronització labial amb veu
  • Destil·lació DMD per fases
  • Processament paral·lel amb 8 GPU
  • Reducció de costos 25x vs línia base
💡

SekoTalk és particularment impressionant: és la primera solució que suporta sincronització labial per a més de dos parlants simultàniament. Escenes de diàleg multi-personatge, que abans requerien animació fotograma a fotograma, ara es generen en temps real.

La "destil·lació DMD per fases" mereix atenció. Aquesta tècnica comprimeix dramàticament els costos d'inferència mentre preserva la qualitat del moviment i l'expressió emocional. SenseTime afirma fins a 25x de reducció de costos comparat amb els seus models base, fent que la generació serialitzada sigui econòmicament viable.

Què significa això per als creadors

Deixa'm pintar el quadre del que això permet:

Producció tradicional de sèries animades:

  • Desenvolupament del concepte: 3-6 mesos
  • Pre-producció: 6-12 mesos
  • Producció per episodi: 2-4 setmanes cadascun
  • Gravació de veu: Múltiples sessions d'estudi per episodi
  • Cost: 100.000$+ per episodi (per contingut de qualitat)

Producció amb Seko 2.0:

  • Concepte: Un paràgraf
  • Generació: Hores per episodi
  • Veu: Generada juntament amb els visuals
  • Cost: "Una tassa de te amb llet" segons SenseTime

La democratització aquí és impressionant. Un sol creador ara pot produir el que abans requeria un estudi.

L'impuls xinès en vídeo IA

Seko 2.0 és part d'un patró més ampli que hem estat seguint. Les empreses tecnològiques xineses estan llançant capacitats agressives de vídeo IA a un ritme notable:

5 de desembre

Kuaishou Kling O1

Primer model de vídeo multimodal unificat

15 de desembre

SenseTime Seko 2.0

Primer agent de generació multi-episodi

16 de desembre

Alibaba Wan2.6

Referència-a-vídeo amb preservació d'identitat

17 de desembre

Tencent HunyuanVideo 1.5

Codi obert compatible amb GPU de consum

⚠️

Aquests no són actualitzacions incrementals. Cadascun representa una nova capacitat que no existia en el panorama de vídeo IA fa un mes.

El context estratègic importa. Les empreses xineses s'enfronten a restriccions d'exportació de xips i limitacions de serveis cloud dels EUA. La seva resposta? Innovar en arquitectura i eficiència de software en lloc de computació bruta. La reducció de costos 25x de Seko 2.0 és un resultat directe d'aquesta pressió.

Consistència de personatges a escala

Un dels problemes més difícils en vídeo IA és mantenir la consistència dels personatges entre generacions. Ho vam explorar en la nostra anàlisi profunda sobre consistència de personatges, i Seko 2.0 representa un avenç significatiu.

El sistema manté:

  • Trets facials a tots els episodis
  • Consistència de roba i accessoris
  • Timbre de veu i patrons de parla
  • Alçada i proporcions dels personatges
  • Dinàmiques de relació entre personatges

Això va més enllà de la consistència tècnica. La IA entén que els personatges haurien de comportar-se de manera consistent. Un personatge tímid no es torna de sobte extravertit a l'episodi 50 a menys que l'arc argumental ho demani.

Validació del món real

SenseTime no només està llançant demos tècniques. Tenen desplegaments en producció:

🎬

Wanxinji a Douyin

Un curtmetratge d'acció real generat per Seko va arribar al número 1 al rànquing de curtmetratges IA de Douyin (el TikTok xinès). Això no és una demostració tècnica, és contingut competint amb entreteniment produït per humans.

🎥

Associació amb Yuandongli Film

SenseTime va anunciar una cooperació estratègica amb Yuandongli Film per explorar AIGC en producció cinematogràfica i televisiva. Planegen llançar curtmetratges generats per IA i estan incubant pel·lícules teatrals per l'any que ve.

La transició de "demo impressionant" a "contingut comercial" és la validació real. Quan els espectadors reals trien veure sèries generades per IA sobre les alternatives, la tecnologia ha creuat un llindar.

La connexió Cambricon

💡

Un detall sovint passat per alt: Seko 2.0 s'executa en xips Cambricon, un fabricant xinès de xips IA. Això representa la localització completa de les capacitats de vídeo IA.

La importància és estratègica. Les empreses xineses d'IA estan construint piles tecnològiques completes que no depenen de les exportacions de maquinari dels EUA. Si veus això com preocupant o admirable depèn de la teva perspectiva, però l'assoliment tècnic és innegable.

Com es compara

On encaixa Seko 2.0 en el panorama actual?

ModelClips individualsMulti-episodiMemòria de personatgesÀudio natiu
Sora 2Excel·lentNoLimitada
Runway Gen-4.5Qualitat superiorNoLimitada
Veo 3.1FortNoLimitada
Kling O1FortNoLimitada
Seko 2.0Bo100 episodisCompleta

Seko 2.0 no està competint en qualitat de clips individuals. Està creant una categoria completament nova: producció de vídeo IA serialitzada.

Punts forts de Seko 2.0

Generació multi-episodi amb continuïtat narrativa, memòria de personatges a través de sèries, cost-eficient a escala, sincronització labial multi-parlant

Limitacions actuals

Interfície principalment en xinès, menys madur que alternatives occidentals per clips individuals, ecosistema encara en desenvolupament

Què significa això per a la indústria

Les implicacions s'estenen més enllà de la creació de contingut:

Per a creadors:

  • Producció en solitari de contingut serialitzat
  • Prototipatge ràpid de conceptes d'història
  • Contingut de fans a escala sense precedents
  • Entreteniment personalitzat

Per a estudis:

  • Pre-visualització a nivell de sèrie
  • Reducció de costos per animació
  • Nous fluxos de treball de desenvolupament d'IP
  • Localització i adaptació

La pressió competitiva sobre els estudis d'animació tradicionals s'acaba d'intensificar significativament. Quan una sola persona pot produir el que abans requeria un equip de 50, l'economia de la producció de contingut canvia fonamentalment.

Prova-ho tu mateix

Seko 2.0 està disponible per a proves públiques a través de la plataforma de SenseTime:

  1. Visita seko.sensetime.com
  2. Introdueix un concepte creatiu en llenguatge natural
  3. Deixa que el sistema generi un esquema d'història
  4. Revisa el desglossament d'episodis
  5. Genera episodis amb personatges consistents

La interfície és principalment en xinès, però la tecnologia parla per si mateixa. Fins i tot veient les demos es pot captar el que permet la generació multi-episodi.

La imatge més gran

Estem presenciant un canvi de categoria en vídeo IA. La pregunta ja no és "pot la IA generar vídeo?" sinó "pot la IA explicar històries?"

Seko 2.0 respon sí. No perfectament, no per a cada cas d'ús, però significativament. El problema de serialització que limitava el vídeo IA a clips aïllats s'està resolent.

Per més context sobre com està evolucionant el panorama de vídeo IA:

La bretxa entre concepte i contingut continua col·lapsant. Amb Seko 2.0, aquest col·lapse s'estén dels clips individuals a sèries completes.

Un prompt. Cent episodis. Un creador.

El futur de l'entreteniment serialitzat acaba d'arribar el desembre de 2025.


Fonts

T'ha resultat útil aquest article?

Henry

Henry

Tecnòleg Creatiu

Tecnòleg creatiu de Lausana que explora on la IA es troba amb l'art. Experimenta amb models generatius entre sessions de música electrònica.

Articles relacionats

Continua explorant amb aquests articles relacionats

T'ha agradat aquest article?

Descobreix més idees i mantén-te al dia amb el nostre contingut més recent.

SenseTime Seko 2.0: Genera sèries de 100 episodis amb IA des d'un sol prompt