Meta Pixel
HenryHenry
6 min read
1147 besed

Runway GWM-1: Splošni model sveta, ki simulira resničnost v realnem času

Runway-ev GWM-1 označuje prelomnico, prehod iz generiranja videoposnetkov v simulacijo svetov. Raziščite, kako ta avtoregresivni model ustvarja okolja, ki jih lahko raziskujete, fotorealistične avatarje in simulacije za treniranje robotov.

Runway GWM-1: Splošni model sveta, ki simulira resničnost v realnem času
Kaj če lahko AI naredi več kot le generiranje videoposnetkov? Kaj če lahko simulira cele svetove, ki jih lahko raziskujete, like, s katerimi se lahko pogovarjate, in robote, ki jih lahko trenirate, vse v realnem času?

To je obljuba Runway-evega GWM-1, njihovega prvega Splošnega modela sveta, napovedanega decembra 2025. In to ni le trženjski govor. To predstavlja temeljno spremembo načina, kako razmišljamo o AI video tehnologiji.

Od generiranja videa do simulacije svetov

Tradicionalni generatorji videa ustvarjajo posnetke. Vnesete poizvedbo, počakate in dobite vnaprej določeno zaporedje sličic. GWM-1 deluje drugače. Gradi notranjo reprezentacijo okolja in jo uporablja za simulacijo prihodnjih dogodkov znotraj tega okolja.

💡

GWM-1 je avtoregresiven, generira sličico za sličico v realnem času. Za razliko od paketnega generiranja videa reagira na vaše vnose, ko jih vnašate.

Razmislite o posledicah. Ko raziskujete virtualni prostor, ki ga je ustvaril GWM-1, objekti ostanejo tam, kjer bi morali biti, ko se obrnete. Fizika ostaja dosledna. Svetloba se odziva na gibanje vaše kamere. To ni vnaprej upodobljen video, to je simulacija, ki poteka sproti.

Trije stebri GWM-1

Runway je razdelil GWM-1 v tri specializirane različice, vsaka cilja na drugo domeno. Danes so to ločeni modeli, podjetje pa načrtuje, da jih združi v enoten sistem.

🌍

GWM Worlds

Okolja, ki jih lahko raziskujete, z geometrijo, svetlobo in fiziko za gaming, VR in treniranje agentov.

👤

GWM Avatars

Liki, gnani z zvokom, s sinhronizacijo ustnic, gibi oči in gestami, ki delujejo skozi dolge pogovore.

🤖

GWM Robotics

Generator sintetičnih podatkov za treniranje robot politik, odstrani ozko grlo fizične strojne opreme.

GWM Worlds: Neskončni prostori, skozi katere lahko hodite

Različica Worlds ustvarja okolja, ki jih lahko interaktivno raziskujete. Gibate se skozi proceduralno dosleden prostor in model vzdržuje prostorsko koherenco: če hodite naprej, zavijete levo, nato se obrnete, boste videli, kar pričakujete.

To rešuje enega najtežjih problemov pri AI videu: doslednost skozi dolga zaporedja. Prejšnji pristopi so se borili z vzdrževanjem položajev objektov in koherence scene skozi čas. GWM Worlds obravnava okolje kot trajno stanje, ne kot zaporedje nepovezanih sličic.

Uporabe segajo od gaminga, izkušenj virtualne resničnosti do treniranja AI agentov. Predstavljajte si, da pustite algoritmu za reinforcement learning raziskovati tisoče proceduralno generiranih okolij brez potrebe, da bi vsako ročno gradili.

GWM Avatars: Fotorealistični liki, ki poslušajo

Različica Avatars generira like, gnane z zvokom, z neobičajno stopnjo podrobnosti. Poleg osnovne sinhronizacije ustnic upodablja:

  • Naravne izraze obraza
  • Realistične gibe oči in smer pogleda
  • Sinhronizacijo ustnic z govorom
  • Geste med govorom in poslušanjem

Del s "poslušanjem" je pomemben. Večina sistemov za avatarje animira le, ko lik govori. GWM Avatars vzdržuje naravno vedenje v mirovanju, subtilne gibe in odzivne izraze tudi, ko lik ne govori, zaradi česar so pogovori manj podobni pogovoru s posnetkom.

Runway trdi, da sistem deluje skozi "dolge pogovore brez poslabšanja kakovosti", kar kaže, da so rešili problem časovne doslednosti, ki muči dolgotrajno generiranje avatarjev.

GWM Robotics: Miselni eksperimenti v velikih razsežnostih

Morda najpragmatičnejša uporaba je treniranje robotike. Fizični roboti so dragi, se pokvarijo in lahko izvajajo le en eksperiment naenkrat. GWM Robotics generira sintetične podatke za treniranje, kar razvijalcem omogoča, da testirajo politike v simulaciji, preden se dotaknejo prave strojne opreme.

💡

Model podpira kontrafaktično generiranje, tako da lahko raziskujete scenarije "kaj če bi robot zgrabil objekt drugače?" brez fizične intervencije.

SDK pristop je tu pomemben. Runway ponuja GWM Robotics prek Python vmesnika, pri čemer ga pozicionira kot infrastrukturo za robotska podjetja in ne kot potrošniški izdelek. Vodijo pogovore z robotskimi podjetji za podjetniško distribucijo.

Tehnične specifikacije

720p
Ločljivost
24 fps
Frekvenca sličic
2 min
Maks. dolžina
Realni čas
Hitrost generiranja

GWM-1 je zgrajen na vrhu Gen-4.5, Runway-evega video modela, ki je nedavno zavzel vrh pred Google-om in OpenAI-jem na lestvici Video Arena. Avtoregresivna arhitektura pomeni, da generira sličico za sličico, namesto da bi združeval celotno zaporedje.

Pogojnost akcije sprejema več tipov vnosov: prilagoditve pogleda kamere, ukaze, osnovane na dogodkih, parametre poz robota in govor/avdio vnose. To ga naredi pravi interaktivni sistem, ne generatorja enega poskusa.

Kako se to primerja s konkurenco

Runway eksplicitno trdi, da je GWM-1 bolj "splošen" od Google-ovega Genie-3 in drugih poskusov modelov sveta. Razlika je pomembna: medtem ko se Genie-3 osredotoča na okolja, podobna igram, Runway GWM-1 predstavlja kot model, ki lahko simulira skozi domene, od robotike do znanosti o življenju.

Tradicionalni generatorji videa

Generirajo fiksna zaporedja. Brez interakcije, brez raziskovanja, brez odgovora v realnem času na vnos.

GWM-1 model sveta

Simulira obstojna okolja. Odgovarja na akcije v realnem času. Vzdržuje prostorsko in časovno doslednost.

Robotski kot je posebej zanimiv. Medtem ko večina AI video podjetij sledi kreativnim strokovnjakom in tržnikom, Runway gradi infrastrukturo za industrijske aplikacije. To je stava, da modeli sveta pomenijo več kot le zabavo.

Kaj to pomeni za ustvarjalce

Za nas v AI video prostoru GWM-1 signalizira širšo spremembo. Preživeli smo leta učenja, kako ustvarjati boljše poizvedbe in verižiti posnetke skupaj. Modeli sveta kažejo na prihodnost, v kateri oblikujemo prostore, postavljamo pravila in pustimo simulacijo, da teče.

To se povezuje z razgovorom o modelih sveta, ki ga spremljamo. Teza, da mora AI razumeti fiziko in vzročnost, ne le ujemati vzorce pikslov, postaja produktna resničnost.

Razvijalci iger bi morali biti pozorni. Ustvarjanje okolij, ki jih je mogoče raziskovati v 3D, običajno zahteva umetnike, oblikovalce nivojev in motorje, kot sta Unity ali Unreal. GWM Worlds namiguje na prihodnost, v kateri opišete prostor in pustite AI, da zapolni geometrijo.

Gen-4.5 dobi tudi zvok

Ob napovedi GWM-1 je Runway posodobil Gen-4.5 z nativnim generiranjem zvoka. Zdaj lahko generirate videoposnetke s sinhroniziranim zvokom neposredno, brez potrebe po dodajanju zvoka v postprodukciji. Dodali so tudi zmožnosti urejanja zvoka in urejanja videa z več posnetki za ustvarjanje minutnih posnetkov z doslednimi liki.

Za globji pogled na to, kako zvok transformira AI video, preverite našo obravnavo o tem, kako se tiha era AI videa končuje.

Pot naprej

Tri različice GWM-1, Worlds, Avatars in Robotics, se bodo sčasoma združile v en sam model. Cilj je enoten sistem, ki lahko simulira katero koli vrsto okolja, lika ali fizičnega sistema.

💡

GWM Avatars in izboljšane funkcije World prihajajo "kmalu". GWM Robotics SDK je na voljo na zahtevo.

Kar me najbolj navdušuje, ni nobena posamezna funkcija. To je okvir. Runway ne prodaja več video posnetkov. Prodajajo simulacijsko infrastrukturo. To je popolnoma drugačna kategorija izdelkov.

Vprašanje ni, ali bodo modeli sveta nadomestili generatorje videa. Vprašanje je, kako hitro se bo zabrisala razlika med "ustvarjanjem videa" in "simuliranjem svetov". Glede na GWM-1 se Runway stavi na prej kot slej.


Runway-ev GWM-1 je na voljo v raziskovalnem pregledu, širši dostop pa je pričakovan v začetku leta 2026. Za primerjave z drugimi vodilnimi AI video orodji si oglejte našo analizo Sora 2 vs Runway vs Veo 3.

Vam je bil ta članek v pomoč?

Henry

Henry

Ustvarjalni Tehnolog

Ustvarjalni tehnolog iz Lausanne, ki raziskuje, kje se UI srečuje z umetnostjo. Eksperimentira z generativnimi modeli med sesjami elektronske glasbe.

Sorodni članki

Nadaljujte raziskovanje s temi sorodnimi objavami

Vam je bil članek všeč?

Odkrijte več vpogledov in ostanite na tekočem z našimi najnovejšimi vsebinami.

Runway GWM-1: Splošni model sveta, ki simulira resničnost v realnem času