SenseTime Seko 2.0: Genera sèries de 100 episodis amb IA des d'un sol prompt
SenseTime acaba de llançar el primer agent de vídeo IA multi-episodi de la indústria. Seko 2.0 pot crear sèries animades completes amb personatges, veus i trames consistents a partir d'una sola idea creativa. L'era del contingut serialitzat generat per IA ha arribat.

I si poguessis descriure un concepte d'història i fer que la IA generés una sèrie animada de 100 episodis? No clips desconnectats. Una narrativa coherent amb personatges, veus i continuïtat argumental consistents. SenseTime acaba de fer-ho realitat amb Seko 2.0.
Més enllà dels clips individuals: El problema de la serialització
Cada model de vídeo IA s'enfronta a la mateixa limitació: generen moments aïllats. Un clip de 10 segons d'un personatge caminant. Un altre d'ells parlant. Un tercer reaccionant. Cosir-los en una història coherent? Això és problema teu.
El problema de la serialització no és la qualitat de generació. És la memòria. Com recorda la IA que el protagonista té una cicatriu a la galta esquerra? Que el dolent va canviar de bàndol a l'episodi 12? Que el nom de l'interès romàntic s'escriu d'una manera específica als subtítols?
Per això l'animació professional encara requereix exèrcits d'artistes comprovant fulls de model, mantenint guies d'estil i assegurant la continuïtat entre episodis. La IA podia generar fotogrames individuals, però no podia mantenir la història.
Fins ara.
Què fa realment Seko 2.0
El 15 de desembre de 2025, SenseTime va llançar Seko 2.0, que descriuen com el primer agent de generació de vídeo multi-episodi de la indústria. La paraula clau és "agent", no "model".
Aquí està el flux de treball:
- Proporciones un concepte creatiu en llenguatge natural
- Seko 2.0 genera un esquema complet de la història
- El sistema crea un desglossament detallat de la trama per a fins a 100 episodis
- Cada episodi es genera amb disseny de personatges, veu i construcció del món consistents
- Els personatges recorden esdeveniments anteriors i les relacions evolucionen
La IA no està generant 100 clips aleatoris. Està mantenint un estat narratiu al llarg de tota la sèrie.
L'arquitectura tècnica
Memòria multi-episodi
- Base de dades global de personatges
- Seguiment de l'estat del món
- Consistència de la línia temporal
- Gràfics de relacions
- Motor de continuïtat argumental
Pipeline de generació
- SekoIDX per a modelatge d'imatge/personatge
- SekoTalk per a sincronització labial amb veu
- Destil·lació DMD per fases
- Processament paral·lel amb 8 GPU
- Reducció de costos 25x vs línia base
SekoTalk és particularment impressionant: és la primera solució que suporta sincronització labial per a més de dos parlants simultàniament. Escenes de diàleg multi-personatge, que abans requerien animació fotograma a fotograma, ara es generen en temps real.
La "destil·lació DMD per fases" mereix atenció. Aquesta tècnica comprimeix dramàticament els costos d'inferència mentre preserva la qualitat del moviment i l'expressió emocional. SenseTime afirma fins a 25x de reducció de costos comparat amb els seus models base, fent que la generació serialitzada sigui econòmicament viable.
Què significa això per als creadors
Deixa'm pintar el quadre del que això permet:
Producció tradicional de sèries animades:
- Desenvolupament del concepte: 3-6 mesos
- Pre-producció: 6-12 mesos
- Producció per episodi: 2-4 setmanes cadascun
- Gravació de veu: Múltiples sessions d'estudi per episodi
- Cost: 100.000$+ per episodi (per contingut de qualitat)
Producció amb Seko 2.0:
- Concepte: Un paràgraf
- Generació: Hores per episodi
- Veu: Generada juntament amb els visuals
- Cost: "Una tassa de te amb llet" segons SenseTime
La democratització aquí és impressionant. Un sol creador ara pot produir el que abans requeria un estudi.
L'impuls xinès en vídeo IA
Seko 2.0 és part d'un patró més ampli que hem estat seguint. Les empreses tecnològiques xineses estan llançant capacitats agressives de vídeo IA a un ritme notable:
Kuaishou Kling O1
Primer model de vídeo multimodal unificat
SenseTime Seko 2.0
Primer agent de generació multi-episodi
Alibaba Wan2.6
Referència-a-vídeo amb preservació d'identitat
Tencent HunyuanVideo 1.5
Codi obert compatible amb GPU de consum
Aquests no són actualitzacions incrementals. Cadascun representa una nova capacitat que no existia en el panorama de vídeo IA fa un mes.
El context estratègic importa. Les empreses xineses s'enfronten a restriccions d'exportació de xips i limitacions de serveis cloud dels EUA. La seva resposta? Innovar en arquitectura i eficiència de software en lloc de computació bruta. La reducció de costos 25x de Seko 2.0 és un resultat directe d'aquesta pressió.
Consistència de personatges a escala
Un dels problemes més difícils en vídeo IA és mantenir la consistència dels personatges entre generacions. Ho vam explorar en la nostra anàlisi profunda sobre consistència de personatges, i Seko 2.0 representa un avenç significatiu.
El sistema manté:
- ✓Trets facials a tots els episodis
- ✓Consistència de roba i accessoris
- ✓Timbre de veu i patrons de parla
- ✓Alçada i proporcions dels personatges
- ✓Dinàmiques de relació entre personatges
Això va més enllà de la consistència tècnica. La IA entén que els personatges haurien de comportar-se de manera consistent. Un personatge tímid no es torna de sobte extravertit a l'episodi 50 a menys que l'arc argumental ho demani.
Validació del món real
SenseTime no només està llançant demos tècniques. Tenen desplegaments en producció:
Wanxinji a Douyin
Un curtmetratge d'acció real generat per Seko va arribar al número 1 al rànquing de curtmetratges IA de Douyin (el TikTok xinès). Això no és una demostració tècnica, és contingut competint amb entreteniment produït per humans.
Associació amb Yuandongli Film
SenseTime va anunciar una cooperació estratègica amb Yuandongli Film per explorar AIGC en producció cinematogràfica i televisiva. Planegen llançar curtmetratges generats per IA i estan incubant pel·lícules teatrals per l'any que ve.
La transició de "demo impressionant" a "contingut comercial" és la validació real. Quan els espectadors reals trien veure sèries generades per IA sobre les alternatives, la tecnologia ha creuat un llindar.
La connexió Cambricon
Un detall sovint passat per alt: Seko 2.0 s'executa en xips Cambricon, un fabricant xinès de xips IA. Això representa la localització completa de les capacitats de vídeo IA.
La importància és estratègica. Les empreses xineses d'IA estan construint piles tecnològiques completes que no depenen de les exportacions de maquinari dels EUA. Si veus això com preocupant o admirable depèn de la teva perspectiva, però l'assoliment tècnic és innegable.
Com es compara
On encaixa Seko 2.0 en el panorama actual?
| Model | Clips individuals | Multi-episodi | Memòria de personatges | Àudio natiu |
|---|---|---|---|---|
| Sora 2 | Excel·lent | No | Limitada | Sí |
| Runway Gen-4.5 | Qualitat superior | No | Limitada | Sí |
| Veo 3.1 | Fort | No | Limitada | Sí |
| Kling O1 | Fort | No | Limitada | Sí |
| Seko 2.0 | Bo | 100 episodis | Completa | Sí |
Seko 2.0 no està competint en qualitat de clips individuals. Està creant una categoria completament nova: producció de vídeo IA serialitzada.
Generació multi-episodi amb continuïtat narrativa, memòria de personatges a través de sèries, cost-eficient a escala, sincronització labial multi-parlant
Interfície principalment en xinès, menys madur que alternatives occidentals per clips individuals, ecosistema encara en desenvolupament
Què significa això per a la indústria
Les implicacions s'estenen més enllà de la creació de contingut:
Per a creadors:
- Producció en solitari de contingut serialitzat
- Prototipatge ràpid de conceptes d'història
- Contingut de fans a escala sense precedents
- Entreteniment personalitzat
Per a estudis:
- Pre-visualització a nivell de sèrie
- Reducció de costos per animació
- Nous fluxos de treball de desenvolupament d'IP
- Localització i adaptació
La pressió competitiva sobre els estudis d'animació tradicionals s'acaba d'intensificar significativament. Quan una sola persona pot produir el que abans requeria un equip de 50, l'economia de la producció de contingut canvia fonamentalment.
Prova-ho tu mateix
Seko 2.0 està disponible per a proves públiques a través de la plataforma de SenseTime:
- Visita seko.sensetime.com
- Introdueix un concepte creatiu en llenguatge natural
- Deixa que el sistema generi un esquema d'història
- Revisa el desglossament d'episodis
- Genera episodis amb personatges consistents
La interfície és principalment en xinès, però la tecnologia parla per si mateixa. Fins i tot veient les demos es pot captar el que permet la generació multi-episodi.
La imatge més gran
Estem presenciant un canvi de categoria en vídeo IA. La pregunta ja no és "pot la IA generar vídeo?" sinó "pot la IA explicar històries?"
Seko 2.0 respon sí. No perfectament, no per a cada cas d'ús, però significativament. El problema de serialització que limitava el vídeo IA a clips aïllats s'està resolent.
Per més context sobre com està evolucionant el panorama de vídeo IA:
- Kling O1 explora arquitectures multimodals unificades
- La revolució del vídeo IA de codi obert cobreix alternatives accessibles
- Vídeo IA i generació d'àudio examina l'avenç en àudio
La bretxa entre concepte i contingut continua col·lapsant. Amb Seko 2.0, aquest col·lapse s'estén dels clips individuals a sèries completes.
Un prompt. Cent episodis. Un creador.
El futur de l'entreteniment serialitzat acaba d'arribar el desembre de 2025.
Fonts
- Anunci del llançament de SenseTime Seko 2.0 (AI Base)
- SenseTime llança agent IA generatiu multi-sèrie (AI Base)
- Seko 2.0 de SenseTime i associació amb Cambricon (DigiTimes)
- L'era dels micro-drames IA (Pandaily)
- Plataforma SenseTime Seko (Oficial)
T'ha resultat útil aquest article?

Henry
Tecnòleg CreatiuTecnòleg creatiu de Lausana que explora on la IA es troba amb l'art. Experimenta amb models generatius entre sessions de música electrònica.
Articles relacionats
Continua explorant amb aquests articles relacionats

YouTube porta Veo 3 Fast als Shorts: Generació de vídeo amb IA gratuïta per a 2.500 milions d'usuaris
Google integra el seu model Veo 3 Fast directament a YouTube Shorts, oferint generació de vídeo a partir de text amb àudio de manera gratuïta per a creadors de tot el món. Això és el que significa per a la plataforma i l'accessibilitat del vídeo amb IA.

Kling 2.6: La clonacio de veu i el control de moviment redefineixen la creacio de video amb IA
L'ultima actualitzacio de Kuaishou introdueix generacio audiovisual simultania, entrenament de veu personalitzat i captura de moviment precisa que podrien transformar la manera com els creadors aborden la produccio de video amb IA.

Pika 2.5: Democratitzant el vídeo amb IA a través de velocitat, preu i eines creatives
Pika Labs llança la versió 2.5, combinant generació més ràpida, física millorada i eines creatives com Pikaframes i Pikaffects per fer el vídeo amb IA accessible per a tothom.