SenseTime Seko 2.0: Genera sèries de 100 episodis amb IA des d'un sol prompt

I si poguessis descriure un concepte d'història i fer que la IA generés una sèrie animada de 100 episodis? No clips desconnectats. Una narrativa coherent amb personatges, veus i continuïtat argumental consistents. SenseTime acaba de fer-ho realitat amb Seko 2.0.

Més enllà dels clips individuals: El problema de la serialització

Cada model de vídeo IA s'enfronta a la mateixa limitació: generen moments aïllats. Un clip de 10 segons d'un personatge caminant. Un altre d'ells parlant. Un tercer reaccionant. Cosir-los en una història coherent? Això és problema teu.

💡

El problema de la serialització no és la qualitat de generació. És la memòria. Com recorda la IA que el protagonista té una cicatriu a la galta esquerra? Que el dolent va canviar de bàndol a l'episodi 12? Que el nom de l'interès romàntic s'escriu d'una manera específica als subtítols?

Per això l'animació professional encara requereix exèrcits d'artistes comprovant fulls de model, mantenint guies d'estil i assegurant la continuïtat entre episodis. La IA podia generar fotogrames individuals, però no podia mantenir la història.

Fins ara.

Què fa realment Seko 2.0

El 15 de desembre de 2025, SenseTime va llançar Seko 2.0, que descriuen com el primer agent de generació de vídeo multi-episodi de la indústria. La paraula clau és "agent", no "model".

100

Episodis d'un sol prompt

25 FPS

Velocitat de generació

3.5s

Latència del primer fotograma

Aquí està el flux de treball:

Proporciones un concepte creatiu en llenguatge natural
Seko 2.0 genera un esquema complet de la història
El sistema crea un desglossament detallat de la trama per a fins a 100 episodis
Cada episodi es genera amb disseny de personatges, veu i construcció del món consistents
Els personatges recorden esdeveniments anteriors i les relacions evolucionen

La IA no està generant 100 clips aleatoris. Està mantenint un estat narratiu al llarg de tota la sèrie.

L'arquitectura tècnica

Memòria multi-episodi

Base de dades global de personatges
Seguiment de l'estat del món
Consistència de la línia temporal
Gràfics de relacions
Motor de continuïtat argumental

Pipeline de generació

SekoIDX per a modelatge d'imatge/personatge
SekoTalk per a sincronització labial amb veu
Destil·lació DMD per fases
Processament paral·lel amb 8 GPU
Reducció de costos 25x vs línia base

💡

SekoTalk és particularment impressionant: és la primera solució que suporta sincronització labial per a més de dos parlants simultàniament. Escenes de diàleg multi-personatge, que abans requerien animació fotograma a fotograma, ara es generen en temps real.

La "destil·lació DMD per fases" mereix atenció. Aquesta tècnica comprimeix dramàticament els costos d'inferència mentre preserva la qualitat del moviment i l'expressió emocional. SenseTime afirma fins a 25x de reducció de costos comparat amb els seus models base, fent que la generació serialitzada sigui econòmicament viable.

Què significa això per als creadors

Deixa'm pintar el quadre del que això permet:

Producció tradicional de sèries animades:

Desenvolupament del concepte: 3-6 mesos
Pre-producció: 6-12 mesos
Producció per episodi: 2-4 setmanes cadascun
Gravació de veu: Múltiples sessions d'estudi per episodi
Cost: 100.000$+ per episodi (per contingut de qualitat)

Producció amb Seko 2.0:

Concepte: Un paràgraf
Generació: Hores per episodi
Veu: Generada juntament amb els visuals
Cost: "Una tassa de te amb llet" segons SenseTime

La democratització aquí és impressionant. Un sol creador ara pot produir el que abans requeria un estudi.

L'impuls xinès en vídeo IA

Seko 2.0 és part d'un patró més ampli que hem estat seguint. Les empreses tecnològiques xineses estan llançant capacitats agressives de vídeo IA a un ritme notable:

5 de desembre

Kuaishou Kling O1

Primer model de vídeo multimodal unificat

15 de desembre

SenseTime Seko 2.0

Primer agent de generació multi-episodi

16 de desembre

Alibaba Wan2.6

Referència-a-vídeo amb preservació d'identitat

17 de desembre

Tencent HunyuanVideo 1.5

Codi obert compatible amb GPU de consum

⚠️

Aquests no són actualitzacions incrementals. Cadascun representa una nova capacitat que no existia en el panorama de vídeo IA fa un mes.

El context estratègic importa. Les empreses xineses s'enfronten a restriccions d'exportació de xips i limitacions de serveis cloud dels EUA. La seva resposta? Innovar en arquitectura i eficiència de software en lloc de computació bruta. La reducció de costos 25x de Seko 2.0 és un resultat directe d'aquesta pressió.

Consistència de personatges a escala

Un dels problemes més difícils en vídeo IA és mantenir la consistència dels personatges entre generacions. Ho vam explorar en la nostra anàlisi profunda sobre consistència de personatges, i Seko 2.0 representa un avenç significatiu.

El sistema manté:

✓Trets facials a tots els episodis
✓Consistència de roba i accessoris
✓Timbre de veu i patrons de parla
✓Alçada i proporcions dels personatges
✓Dinàmiques de relació entre personatges

Això va més enllà de la consistència tècnica. La IA entén que els personatges haurien de comportar-se de manera consistent. Un personatge tímid no es torna de sobte extravertit a l'episodi 50 a menys que l'arc argumental ho demani.

Validació del món real

SenseTime no només està llançant demos tècniques. Tenen desplegaments en producció:

🎬

Wanxinji a Douyin

Un curtmetratge d'acció real generat per Seko va arribar al número 1 al rànquing de curtmetratges IA de Douyin (el TikTok xinès). Això no és una demostració tècnica, és contingut competint amb entreteniment produït per humans.

🎥

Associació amb Yuandongli Film

SenseTime va anunciar una cooperació estratègica amb Yuandongli Film per explorar AIGC en producció cinematogràfica i televisiva. Planegen llançar curtmetratges generats per IA i estan incubant pel·lícules teatrals per l'any que ve.

La transició de "demo impressionant" a "contingut comercial" és la validació real. Quan els espectadors reals trien veure sèries generades per IA sobre les alternatives, la tecnologia ha creuat un llindar.

La connexió Cambricon

💡

Un detall sovint passat per alt: Seko 2.0 s'executa en xips Cambricon, un fabricant xinès de xips IA. Això representa la localització completa de les capacitats de vídeo IA.

La importància és estratègica. Les empreses xineses d'IA estan construint piles tecnològiques completes que no depenen de les exportacions de maquinari dels EUA. Si veus això com preocupant o admirable depèn de la teva perspectiva, però l'assoliment tècnic és innegable.

Com es compara

On encaixa Seko 2.0 en el panorama actual?

Model	Clips individuals	Multi-episodi	Memòria de personatges	Àudio natiu
Sora 2	Excel·lent	No	Limitada	Sí
Runway Gen-4.5	Qualitat superior	No	Limitada	Sí
Veo 3.1	Fort	No	Limitada	Sí
Kling O1	Fort	No	Limitada	Sí
Seko 2.0	Bo	100 episodis	Completa	Sí

Seko 2.0 no està competint en qualitat de clips individuals. Està creant una categoria completament nova: producció de vídeo IA serialitzada.

✓Punts forts de Seko 2.0

Generació multi-episodi amb continuïtat narrativa, memòria de personatges a través de sèries, cost-eficient a escala, sincronització labial multi-parlant

✗Limitacions actuals

Interfície principalment en xinès, menys madur que alternatives occidentals per clips individuals, ecosistema encara en desenvolupament

Què significa això per a la indústria

Les implicacions s'estenen més enllà de la creació de contingut:

Per a creadors:

Producció en solitari de contingut serialitzat
Prototipatge ràpid de conceptes d'història
Contingut de fans a escala sense precedents
Entreteniment personalitzat

Per a estudis:

Pre-visualització a nivell de sèrie
Reducció de costos per animació
Nous fluxos de treball de desenvolupament d'IP
Localització i adaptació

La pressió competitiva sobre els estudis d'animació tradicionals s'acaba d'intensificar significativament. Quan una sola persona pot produir el que abans requeria un equip de 50, l'economia de la producció de contingut canvia fonamentalment.

Prova-ho tu mateix

Seko 2.0 està disponible per a proves públiques a través de la plataforma de SenseTime:

Visita seko.sensetime.com
Introdueix un concepte creatiu en llenguatge natural
Deixa que el sistema generi un esquema d'història
Revisa el desglossament d'episodis
Genera episodis amb personatges consistents

La interfície és principalment en xinès, però la tecnologia parla per si mateixa. Fins i tot veient les demos es pot captar el que permet la generació multi-episodi.

La imatge més gran

Estem presenciant un canvi de categoria en vídeo IA. La pregunta ja no és "pot la IA generar vídeo?" sinó "pot la IA explicar històries?"

✅

Seko 2.0 respon sí. No perfectament, no per a cada cas d'ús, però significativament. El problema de serialització que limitava el vídeo IA a clips aïllats s'està resolent.

Per més context sobre com està evolucionant el panorama de vídeo IA:

Kling O1 explora arquitectures multimodals unificades
La revolució del vídeo IA de codi obert cobreix alternatives accessibles
Vídeo IA i generació d'àudio examina l'avenç en àudio

La bretxa entre concepte i contingut continua col·lapsant. Amb Seko 2.0, aquest col·lapse s'estén dels clips individuals a sèries completes.

Un prompt. Cent episodis. Un creador.

El futur de l'entreteniment serialitzat acaba d'arribar el desembre de 2025.

Fonts

Anunci del llançament de SenseTime Seko 2.0 (AI Base)
SenseTime llança agent IA generatiu multi-sèrie (AI Base)
Seko 2.0 de SenseTime i associació amb Cambricon (DigiTimes)
L'era dels micro-drames IA (Pandaily)
Plataforma SenseTime Seko (Oficial)