Meta Pixel
HenryHenry
7 min read
1329 слоў

SenseTime Seko 2.0: Стварэнне 100-серыйнага AI-шоу з аднаго запыту

SenseTime толькі што запусціў першага ў галіне шматсерыйнага AI-відэа агента. Seko 2.0 можа ствараць цэлыя анімацыйныя серыялы з паслядоўнымі персанажамі, галасамі і сюжэтамі з адной творчай ідэі. Эра AI-генераванага серыйнага кантэнту настала.

SenseTime Seko 2.0: Стварэнне 100-серыйнага AI-шоу з аднаго запыту

Што калі б вы маглі апісаць канцэпцыю гісторыі і штучны інтэлект стварыў бы цэлы 100-серыйны анімацыйны серыял? Не адасобленыя кліпы. Звязную апавяданне з паслядоўнымі персанажамі, галасамі і сюжэтнай пераемнасцю. SenseTime толькі што зрабіў гэта рэальнасцю з Seko 2.0.

Больш за адзіночныя кліпы: Праблема серыялізацыі

Кожная AI-відэа мадэль сутыкаецца з тым жа абмежаваннем: яны генеруюць ізаляваныя моманты. 10-секундны кліп персанажа, які ідзе. Яшчэ адзін кліп, дзе ён размаўляе. Трэці, дзе ён рэагуе. Складанне іх у звязную гісторыю? Гэта ваша праблема.

💡

Праблема серыялізацыі не ў якасці генерацыі. Гэта пытанне памяці. Як AI запамінае, што ў пратаганіста шрам на левай шчацэ? Што антаганіст змяніў бок у 12 эпізодзе? Што імя каханага пішацца пэўным чынам у субтытрах?

Вось чаму прафесійная анімацыя ўсё яшчэ патрабуе арміі мастакоў, якія правяраюць лісты мадэляў, падтрымліваюць кіраўніцтвы па стылі і забяспечваюць пераемнасць паміж эпізодамі. AI мог генераваць асобныя кадры, але не мог падтрымліваць гісторыю.

Да гэтага моманту.

Што рэальна робіць Seko 2.0

15 снежня 2025 года SenseTime выпусціў Seko 2.0, які яны апісваюць як першага ў галіне шматсерыйнага відэа-агента. Ключавое слова, «агент», а не «мадэль».

100
Эпізодаў з аднаго запыту
25 FPS
Хуткасць генерацыі
3.5s
Латэнтнасць першага кадра

Вось працоўны працэс:

  1. Вы даяце творчую канцэпцыю на натуральнай мове
  2. Seko 2.0 генеруе поўны план гісторыі
  3. Сістэма стварае падрабязны разбор сюжэта да 100 эпізодаў
  4. Кожны эпізод генеруецца з паслядоўным дызайнам персанажаў, голасам і светабудаўніцтвам
  5. Персанажы памятаюць папярэднія падзеі, а ўзаемаадносіны развіваюцца

AI не генеруе 100 выпадковых кліпаў. Ён падтрымлівае апавядальны стан праз увесь серыял.

Тэхнічная архітэктура

Шматсерыйная памяць

  • Глабальная база персанажаў
  • Адсочванне стану свету
  • Паслядоўнасць хроналогіі
  • Графы ўзаемаадносін
  • Рухавік сюжэтнай пераемнасці

Канвеер генерацыі

  • SekoIDX для мадэлявання выяў/персанажаў
  • SekoTalk для сінхранізацыі губ па галасе
  • Паступовая дысціляцыя DMD
  • Паралельная апрацоўка на 8 GPU
  • Зніжэнне кошту ў 25× у параўнанні з базавым
💡

SekoTalk асабліва ўражвае: гэта першае рашэнне з падтрымкай сінхранізацыі губ для больш чым двух гаворачых адначасова. Шматперсанажныя дыялогавыя сцэны, якія раней патрабавалі пакадравай анімацыі, цяпер генеруюцца ў рэальным часе.

«Паступовая дысціляцыя DMD» заслугоўвае ўвагі. Гэтая тэхніка драматычна сціскае выдаткі на вывад, захоўваючы якасць руху і эмацыянальную выразнасць. SenseTime сцвярджае зніжэнне кошту да 25× у параўнанні з іх базавымі мадэлямі, робячы серыйную генерацыю эканамічна жыццяздольнай.

Чаму гэта важна для стваральнікаў

Дазвольце намаляваць карціну таго, што гэта дазваляе:

Традыцыйная вытворчасць анімацыйных серыялаў:

  • Распрацоўка канцэпцыі: 3-6 месяцаў
  • Перадвытворчасць: 6-12 месяцаў
  • Вытворчасць эпізода: 2-4 тыдні на кожны
  • Запіс голасу: Некалькі студыйных сеансаў на эпізод
  • Кошт: $100,000+ за эпізод (для якаснага кантэнту)

Вытворчасць Seko 2.0:

  • Канцэпцыя: Адзін абзац
  • Генерацыя: Гадзіны на эпізод
  • Голас: Генеруецца разам з візуалізацыяй
  • Кошт: «Кубак малочнага гарбаты» паводле SenseTime

Дэмакратызацыя тут ашаламляльная. Адзін стваральнік цяпер можа вырабляць тое, што раней патрабавала студыі.

Кітайскі AI-відэа штуршок

Seko 2.0 з'яўляецца часткай больш шырокага патэрна, які мы адсочваем. Кітайскія тэхнічныя кампаніі пастаўляюць агрэсіўныя AI-відэа магчымасці з выдатнай хуткасцю:

5 снежня

Kuaishou Kling O1

Першая ўніфікаваная мультымадальная відэа мадэль

15 снежня

SenseTime Seko 2.0

Першы шматсерыйны агент генерацыі

16 снежня

Alibaba Wan2.6

Спасылка на відэа з захаваннем ідэнтычнасці

17 снежня

Tencent HunyuanVideo 1.5

Адкрыты код, сумяшчальны з спажывецкімі GPU

⚠️

Гэта не паступовыя абнаўленні. Кожнае прадстаўляе новую магчымасць, якой не існавала ў AI-відэа ландшафце месяц таму.

Стратэгічны кантэкст важны. Кітайскія кампаніі сутыкаюцца з абмежаваннямі на экспарт чыпаў і абмежаваннямі аблачных сэрвісаў ЗША. Іх адказ? Інавацыі ў архітэктуры і праграмнай эфектыўнасці, а не ў неапрацаваных вылічальных рэсурсах. Зніжэнне кошту Seko 2.0 у 25× з'яўляецца непасрэдным вынікам гэтага ціску.

Паслядоўнасць персанажаў у маштабе

Адна з самых складаных праблем у AI-відэа гэта падтрыманне паслядоўнасці персанажаў паміж генерацыямі. Мы даследавалі гэта ў нашым глыбокім аналізе паслядоўнасці персанажаў, і Seko 2.0 прадстаўляе значны прагрэс.

Сістэма падтрымлівае:

  • Рысы твару ва ўсіх эпізодах
  • Паслядоўнасць адзення і аксесуараў
  • Тэмбр голасу і шаблоны маўлення
  • Вышыня і прапорцыі персанажа
  • Дынаміка ўзаемаадносін паміж персанажамі

Гэта выходзіць за межы тэхнічнай паслядоўнасці. AI разумее, што персанажы павінны паводзіць сябе паслядоўна. Саромлівы персанаж не становіцца раптам экстравертам у 50 эпізодзе, калі толькі сюжэтная лінія гэтага не патрабуе.

Рэальная праверка

SenseTime не проста выпускае тэхнічныя дэманстрацыі. У іх ёсць вытворчыя разгортванні:

🎬

Wanxinji на Douyin

Кароткая драма з удзелам жывых акцёраў, згенераваная Seko, дасягнула #1 у табліцы AI-кароткіх драм Douyin (кітайскі TikTok). Гэта не тэхнічная дэманстрацыя, гэта кантэнт, які канкуруе з чалавечай забавай.

🎥

Партнёрства з Yuandongli Film

SenseTime аб'явіў пра стратэгічнае супрацоўніцтва з Yuandongli Film для даследавання AIGC у вытворчасці фільмаў і тэлебачання. Яны плануюць запусціць AI-генераваныя кароткія драмы і інкубуюць тэатральныя фільмы на наступны год.

Пераход ад «ўражлівай дэманстрацыі» да «камерцыйнага кантэнту» гэта сапраўдная праверка. Калі рэальныя гледачы вырашаюць глядзець AI-генераваныя серыялы замест альтэрнатыў, тэхналогія перайшла парог.

Сувязь з Cambricon

💡

Часта упушчаная дэталь: Seko 2.0 працуе на чыпах Cambricon, кітайскага вытворцы AI-чыпаў. Гэта прадстаўляе поўную лакалізацыю AI-відэа магчымасцей.

Значэнне стратэгічнае. Кітайскія AI-кампаніі будуюць поўныя тэхналагічныя стэкі, якія не залежаць ад экспарту абсталявання ЗША. Незалежна ад таго, лічыце вы гэта трывожным ці захапляльным, тэхнічнае дасягненне бясспрэчнае.

Як гэта параўноўваецца

Дзе Seko 2.0 змяшчаецца ў бягучым ландшафце?

МадэльАдзіночныя кліпыШматсерыйнасцьПамяць персанажаўНатыўны аўдыё
Sora 2✅ ВыдатнаАбмежавана
Runway Gen-4.5✅ Найлепшая якасцьАбмежавана
Veo 3.1✅ МоцныАбмежавана
Kling O1✅ МоцныАбмежавана
Seko 2.0✅ Добра✅ 100 эпізодаў✅ Поўная

Seko 2.0 не канкуруе па якасці адзіночных кліпаў. Ён стварае цалкам новую катэгорыю: серыйная AI-відэа вытворчасць.

Перавагі Seko 2.0

Шматсерыйная генерацыя з апавядальнай пераемнасцю, памяць персанажаў праз серыял, эканамічная эфектыўнасць у маштабе, сінхранізацыя губ для некалькіх гаворачых

Бягучыя абмежаванні

Пераважна кітайскамоўны інтэрфейс, менш дасведчаны чым заходнія альтэрнатывы для адзіночных кліпаў, экасістэма ўсё яшчэ развіваецца

Што гэта азначае для індустрыі

Наступствы выходзяць за межы стварэння кантэнту:

Для стваральнікаў:

  • Сольная вытворчасць серыйнага кантэнту
  • Хуткае прататыпаванне сюжэтных канцэпцый
  • Фанатскі кантэнт у беспрэцэдэнтным маштабе
  • Персаналізаваная забава

Для студый:

  • Перадвізуалізацыя на ўзроўні серыяла
  • Зніжэнне кошту анімацыі
  • Новыя працоўныя працэсы распрацоўкі IP
  • Лакалізацыя і адаптацыя

Канкурэнтны ціск на традыцыйныя анімацыйныя студыі толькі што значна ўзмацніўся. Калі адзін чалавек можа вырабляць тое, што раней патрабавала каманды з 50 чалавек, эканоміка вытворчасці кантэнту фундаментальна змяняецца.

Паспрабуйце самі

Seko 2.0 даступны для публічнага тэсціравання праз платформу SenseTime:

  1. Наведайце seko.sensetime.com
  2. Увядзіце творчую канцэпцыю на натуральнай мове
  3. Дазвольце сістэме згенераваць план гісторыі
  4. Праглядзіце разбор эпізодаў
  5. Генеруйце эпізоды з паслядоўнымі персанажамі

Інтэрфейс пераважна на кітайскай мове, але тэхналогія гаворыць сама за сябе. Нават прагляд дэманстрацый дае вам разуменне таго, што дозваліць шматсерыйная генерацыя.

Большая карціна

Мы назіраем катэгарыйную змену ў AI-відэа. Пытанне больш не «можа AI генераваць відэа?», а «можа AI распавядаць гісторыі?»

Seko 2.0 адказвае так. Не ідэальна, не для кожнага выпадку выкарыстання, але змястоўна. Праблема серыялізацыі, якая абмяжоўвала AI-відэа да ізаляваных кліпаў, вырашаецца.

Для больш поўнага кантэксту таго, як развіваецца AI-відэа ландшафт:

Разрыв паміж канцэпцыяй і кантэнтам працягвае скарачацца. З Seko 2.0 гэтае скарачэнне распаўсюджваецца ад адзіночных кліпаў да цэлых серыялаў.

Адзін запыт. Сто эпізодаў. Адзін стваральнік.

Будучыня серыйнай забавы толькі што прыбыла ў снежні 2025 года.


Крыніцы

Гэты артыкул быў карысны?

Henry

Henry

Творчы тэхнолаг

Творчы тэхнолаг з Лазаны, які даследуе сутыкненне ШІ і мастацтва. Эксперыментуе з генератыўнымі мадэлямі паміж сеансамі электроннай музыкі.

Звязаныя артыкулы

Працягвайце даследаванне з гэтымі звязанымі допісамі

Спадабаўся гэты артыкул?

Адкрывайце больш ўзнасцаў і будзьце ў курсе нашага апошняга кантэнту

SenseTime Seko 2.0: Стварэнне 100-серыйнага AI-шоу з аднаго запыту