PixVerse R1: Reaalajas interaktiivse AI-video päikeseloojang
Alibaba toetatud PixVerse avab R1, esimese maailmamudelit, mis suudab genereerida 1080p videot, mis reageerib koheselt kasutaja sisendile, avades uksed lõpmatutele mängudele ja interaktiivsele kinole.

Mis juhtunuks, kui video võiks sulle vastata, kuigi seda luuakse veel? PixVerse tegi just selle küsimuse obsoletseeks vastates sellele.
- jaanuaril 2026 avaldas Alibaba toetatud startup PixVerse midagi, mis tundub pigem paradigmamuutuselt kui toote uuenduselt. R1 on esimene reaalajas maailmamudeleid, mis suudab genereerida 1080p videot, mis reageerib koheselt kasutaja sisendile. Mitte partiidena. Pole edenemisriba järel. Praegu, siin ja praegu, kui sa vaatad.
Reaalajas AI-video genereerimine tähendab, et tegelased saavad käsul nutt, tantsida, frita või vrakeldada, kusjuures muutused toimuvad koheselt, kui video jätkub.
Partii töötlemisest lõpmatute voogudeni
Traditsiooniline video genereerimine toimib nii: kirjutad viite, ootad mõnest sekundist mitme minutini ja saad kindla pikkusega klipi. See on taotlus-vastuse muster, mis on laenatud teksti-pildi varasetest päevadest. PixVerse R1 purustab selle mustri täielikult.
Süsteem muudab video genereerimise selleks, mida ettevõte kutsub "lõpmatuks, pidevaks ja interaktiivseks visuaalseks vooluks." Ooteaega pole. Pole eelnevalt määratud lõpp-punkti. Sina juhatad stseeni, kuigi see areneb.
Reaalajas genereerimine arhitektuuri taga
Kuidas teha difusioonimudeleid reaalajas kasutamiseks piisavalt kiireks? PixVerse lahendas seda nn "temporal trajectory foldingi" kaudu.
Standard difusiooni proovivõtmine nõuab kümneid iteratiivseid samme, millest igaüks peenhäärida väljundit müra juurest sidusa videoni. R1 surub selle protsessi alla ühe kuni nelja sammuni otsese ennustamise kaudu. Vahetatakse genereerimise paindlikkus reaalajas interaktsiooni vajalikuks kiiruseks.
Reaalajas reageerimine võimaldab uusi rakendusi, mis on partii genereerimisega võimatud, nagu interaktiivsed narratiivid ja AI-native mängud.
Otsene ennustamine annab vähem kontrolli peeninese genereerimise üle võrreldes täieliku difusiooni proovivõtmisega.
Aluseks olev mudel on see, mida PixVerse kirjeldab kui "Omni Native Multimodal Foundation Model". Selle asemel, et suunata teksti, pilte, heli ja videot eraldi töötlemisetappide kaudu, käsitleb R1 kõiki sisendeid ühtse märkide vooluna. See arhitektuurivalik välistab handoff latentsi, mis vaevab tavapäraseid multimodaalseid süsteeme.
Mida see tähendab loojatele?
Tagajärjed ulatuvad kaugemale kiiremat rendereerimisest. Reaalajas genereerimine võimaldab täiesti uusi loovaid töövoogusid.
AI-native mängud
Kujuta ette mänge, kus keskkond ja narratiivid arenevad dünaamiliselt reaktsioonina mängija tegevustele, ilma eelnevalt kujundatud joonideta, ilma sisupiirangutega.
Interaktiivne kino
Mikro-draamad, kus vaatajad mõjutavad lugu arengust. Mitte vali oma seiklus hargnevate rajadega, vaid pidev narratiiv, mis vormib ennast ümber.
Reaalajas režisseerimine
Režissöörid saavad stseene reaalajas kohandada, testida erinevaid emotsionaalset biidet, valgustuse muutusi või tegelaste tegevust ilma renderdamise ootamiseta.
Konkurentsipiirkond: Hiina AI-video domineerimine
PixVerse R1 tugevdab mustrit, mis on ehitatud kogu 2025 aasta jooksul: Hiina meeskonnad juhivad AI-video genereerimist. AI-võrdlusfirma Artificial Analysixi kohaselt pärinevad kaheksa paremat video genereerimismudelit seitsest Hiina ettevõtetelt. Ainult Iisraeli startup Lightricks katkestab sarja.
Hiina kasvavast mõjust AI-videos sügavamate analüüsi jaoks vaata meie analüüsi kuidas Hiina ettevõtted kujundavad ümber konkurentsimaastikku.
"Sora määrab endiselt video genereerimise kvaliteeditippu, kuid piiratud genereerimisel ja API kulude võrra", märgib Wei Sun, Counterpointin pealinanalüütik. PixVerse R1 rünnakud täpselt neid piiranguid, pakkudes erinevat väärtuspakkumist: mitte maksimaalset kvaliteeti, vaid maksimaalset reaktiivsust.
| Mõõdik | PixVerse R1 | Tavalised mudelid |
|---|---|---|
| Vastuse aeg | Reaalajas | Sekundist minutiteni |
| Video pikkus | Lõpmatu voog | Fikseeritud klipid (5-30 s) |
| Kasutaja interaktsioon | Pidev | Viide, siis ootamine |
| Eraldusvõime | 1080p | Kuni 4K (partii) |
Reaalajas video äri
PixVerse ei lihtsalt ehita tehnoloogiat, ehitab äri. Ettevõte teatas oktoobris 2025 aastaarendest 40 miljonist dollarist ja kasvas 100 miljoni registreeritud kasutajani. Kaasasutaja Jaden Xie eesmärk on kasutajate arv kahekordistada 200 miljonini 2026. aasta keskpaigaks.
Startup kogus eelmisel sügisel üle 60 miljoni dollari Alibaba juhitud rahandusvōistlusel, millesse osales Antler. See kapital juurutatakse agressiivselt: palgalistel võiks lähiajal kahekordistuda 200 töötajani.
PixVerse'i asutamine
Ettevõte käivitub AI-video genereerimisele keskendunult.
100M kasutajat
Platvorm saavutab 100 miljoni registreeritud kasutaja.
60M+ dollarit rahastust
Alibaba juhitud rahastusring 40M ARR juures.
R1 käivitus
Esimene reaalajas maailmamudel käivitub.
Proovi ise
R1 on praegu saadaval aadressil realtime.pixverse.ai, kuigi juurdepääs on praegu ainult kutsetud, kuigi meeskond infrastruktuuri skaleerib. Kui oled jälginud maailmamudeli arengut või eksperimenteerinud TurboDiffusioniga, esindab R1 loogilist järgmist sammu: mitte lihtsalt kiirem genereerimine, vaid põhimõtteliselt erinev interaktsiooniparadigma.
Küsimus pole enam "kui kiiresti AI videot genereerida?" Küsimus on "mis muutub võimalikuks, kui videogeenereermisel pole tajutavat latentsi?" PixVerse hakkas just sellele küsimusele vastama. Ülejäänud meist jooksevad järele.
Mis tuleb edasi?
Reaalajas genereerimine 1080p juures on muljetavaldav, kuid trajektoor on selge: kõrgem eraldusvõime, pikemad konteksti aknad ja sügavam multimodaalne integratsioon. Infrastruktuuri skaleerudes ja sellist tehnikaid kui temporal trajectory folding laienedes võime näha reaalajas 4K genereerimise muutumist tavapäraseks.
Praegu on R1 kontseptsiooni tõestus, mis kaksnes tootmissüsteemina. See näitab, et rida "videote genereerimine" ja "videote režisseerimine" vahel võib udustuks muutuda kuni see täielikult kadunud. See pole ainult tehniline saavutus. See on loov.
Seotud lugemine: Uuri, kuidas difusiooni transformaatorid jõustavad modernset videot genereerimist, või uurida Runway'i lähenemist maailmamudeli juurde teise vaatenurga jaoks interaktiivse video juurde.
Kas see artikkel oli kasulik?

Henry
Loov tehnoloogLoov tehnoloog Lausanne'ist, kes uurib tehisintellekti ja kunsti kohtumispunkti. Eksperimenteerib generatiivsete mudelitega elektroonilise muusika seansside vahel.
Seotud artiklid
Jätkake uurimist nende seotud postitustega

Runway GWM-1: Üldine maailmamudel, mis simuleerib reaalsust reaalajas
Runway GWM-1 märgib paradigma muutust videote genereerimiselt maailmade simuleerimisele. Uurige, kuidas see autoregressive mudel loob uuritavaid keskkondi, fotorealistlikke avataare ja robotite treenimissimulatsioone.

Yann LeCun lahkub Metast, et panustada 3,5 miljardit dollarit maailmamudelitesse
Turingi auhinna laureaat käivitab AMI Labsi, uue idufirma, mis keskendub maailmamudelitele, mitte suurkeelemudelitele, sihtides robootikat, tervishoidu ja videomõistmist.

Füüsika simulatsioon AI videos: Kuidas mudelid lõpuks õppisid reaalsust austama
Teleporteeruvatest korvpallidest realistlike põrgeteni, AI videomudelid mõistavad nüüd gravitatsiooni, impulssi ja materjalide dünaamikat. Uurime tehnilisi läbimurdeid, mis seda võimaldavad.