World Labs Marble: Vízia priestorovej inteligencie Fei-Fei Li
Priekopníčka AI Fei-Fei Li spúšťa Marble, komerčnú platformu ktorá generuje prieskumné 3D svety z textu a obrázkov, a otvára novú frontu v priestorovom AI.

Od ImageNetu k modelom sveta
Pre kontext, ako sa modely sveta hodia do evolúcie AI videa, pozri náš prehľad modelov sveta ako ďalšej fronty.
Fei-Fei Li spôsobila revolúciu v počítačovom videní s ImageNetom, datasetom, ktorý umožnil moderné hlboké učenie. Teraz, po roku budovania World Labs s financovaním 230 miliónov dolárov, spustila Marble, prvý komerčný produkt spoločnosti.
Téza je jednoduchá: AI ovládlo text, potom obrázky, potom video. Ďalšou frontou je priestorová inteligencia, schopnosť vnímať, generovať a interagovať s 3D svetmi.
Čo Marble robí
Marble generuje perzistentné, stiahnuteľné 3D prostredia z viacerých typov vstupov:
- ✓Textové výzvy
- ✓Jednotlivé obrázky
- ✓Videá
- ✓Panorámy
- ✓3D dispozície
Na rozdiel od modelov sveta v reálnom čase od konkurentov ako Decart Oasis alebo Google Genie vytvára Marble stabilné svety s minimálnym morphingom. Vygenerujete raz, potom preskúmavate voľne, bez toho aby AI "zabudlo", čo vytvorilo.
Editor Chisel
AI-natívna 3D editácia
Chisel oddeľuje priestorovú štruktúru od vizuálneho štýlu. Najprv načrtnite dispozíciu, potom aplikujte textové štýlové pokyny.
Tento hybridný prístup odlišuje Marble od modelov text-na-scénu. Namiesto dúfania, že AI pochopí váš priestorový zámer, definujete geometriu explicitne. AI sa stará o estetiku, materiály a osvetlenie.
Predstavte si to ako načrtnutie pôdorysu, než požiadate interiérového dizajnéra o dekoráciu. Kontrola nad priestorovými vzťahmi zostáva vaša.
Exportné formáty a kompatibilita
Vygenerované svety sa exportujú v troch formátoch:
| Formát | Použitie |
|---|---|
| Gaussovské splaty | Rendering v reálnom čase, nové pohľady |
| Meshe | Herné enginy, integrácia CAD |
| Videá | Tvorba obsahu, pre-vis |
Všetky svety Marble sú VR-kompatibilné s headsetmi Vision Pro a Quest 3 hneď po vybalení.
Cenová štruktúra
World Labs ponúka štyri úrovne:
| Úroveň | Cena | Generovanie | Kľúčové funkcie |
|---|---|---|---|
| Free | $0 | 4/mesiac | Text, obrázok alebo panoramatický vstup |
| Standard | $20/mesiac | 12/mesiac | Viac obrázkov/video vstup, pokročilá editácia |
| Pro | $35/mesiac | 25/mesiac | Rozšírenie scény, komerčné práva |
| Max | $95/mesiac | 75/mesiac | Všetky funkcie, maximálne generovanie |
Bezplatná úroveň vám umožňuje vyhodnotiť technológiu. Pre produkčnú prácu vyžadujúcu komerčné práva predstavuje úroveň Pro za $35/mesiac rozumnú vstupnú cenu za tak novú schopnosť.
Prečo priestorová inteligencia záleží
"Priestorová inteligencia je určujúcou výzvou budúceho desaťročia." - Fei-Fei Li
Li tvrdí, že súčasné AI má zásadné omezenie: zle uvažuje o 3D priestore. Jazykové modely halucinujú fyziku. Video modely vytvárajú nemožné geometrie. Generátory obrázkov bojujú s konzistentnými priestorovými vzťahmi.
Pre robotiku to má obrovský význam. Robot navigujúci v kuchyni potrebuje priestorové porozumenie, nie predikciu snímok. Pre VFX potrebujú režiséri prieskumné prostredia, nie fixné cesty kamery.
Vznikajúce prípady použitia
Gaming Generujte ambientné prostredia a pozadia. Nezávislí vývojári môžu vytvárať prieskumné oblasti, ktoré by vyžadovali mesiace tradičnej umeleckej produkcie.
Vizuálne efekty Pre-vizualizácia sa stává interaktívnou. Načrtnite scénu priestorovo, potom preskúmajte uhly kamery pred záväzkom na zábery.
Architektúra Preveďte pôdorysy na prieskumné prechody. Klienti zažívajú priestory pred začiatkom stavby.
Vzdelávanie Li si predstavuje študentov prechádzajúcich sa vnútri bunky, chirurgov trénujúcich vnútri anatomických simulácií.
Rozšírenie sveta a režim Composer
Dve funkcie riešia omezenia mierky:
Rozšírenie sveta vám umožňuje raz rozšíriť vygenerovaný svet, pridávať detaily do okrajových oblastí, kde kvalita typicky degraduje. To posúva hranice prieskumného priestoru za počiatočné limity generovania.
Režim Composer kombinuje viac svetov do väčších prostredí. Generujte jednotlivé miestnosti, potom ich spojte do kompletnej budovy.
Tieto nástroje uznávajú súčasné omezenia a zároveň poskytujú praktické riešenia.
Konkurenčné prostredie
Marble vstupuje do zaplneného poľa:
| Produkt | Prístup | Diferenciátor |
|---|---|---|
| Decart Oasis | Generovanie hier v reálnom čase | Interaktívne, ale svety sa posúvajú počas preskúmavania |
| Google Genie | Generovanie herných svetov | Predikcia snímok bez skutočného 3D |
| Odyssey | Perzistentné modely sveta | Zameranie na podniky |
| World Labs Marble | Statické 3D generovanie | Stiahnuteľné, editovateľné, VR-ready |
Kompromis je jasný. Modely v reálnom čase ako Oasis ponúkajú okamžitosť, ale nestabilitu. Marble uprednostňuje persistenciu a editovateľnosť pred interaktivitou.
Spojenie s generovaním videa
Pre základy difúznych architektúr používaných v priestorovom AI pozri náš technický prehľad difúznych transformátorov.
Ako súvisí generovanie 3D svetov s videom? Zdieľajú matematické základy v difúznych modeloch, ale riešia rôzne problémy.
Generovanie videa vytvára časové sekvencie, snímok za snímkom. Priestorové AI vytvára geometrické reprezentácie, povrchy a objemy. Video odpovedá "čo sa stane ďalej?" Priestorové AI odpovedá "čo tu existuje?"
Bod konvergencie: navigovateľné video. Vygenerujte 3D svet, potom renderujte video pri pohybe cez neho. Tento prístup ponúka kontrolu kamery nemožnú s čistým generovaním videa.
Omedzenia na zváženie
Marble nie je kompletné riešenie:
- ○Žiadne animované postavy alebo dynamické prvky
- ○Limity generovania môžu obmedziť produkčný workflow
- ○Degradácia okrajov vyžaduje rozširujúce prechody
- ○Len statické prostredia
Pre animovaný obsah stále potrebujete modely generovania videa. Marble exceluje v prostrediach a priestoroch, nie v hercoch alebo akciách.
Väčší obraz
Fei-Fei Li vidí priestorovú inteligenciu ako zásadnú pre pokrok AI:
"Myslím, že všetci máme zodpovednosť pri uvádzaní AI do lepšieho stavu, ako sa stáva mocnejšou. Všetci by sme mali chcieť, aby ľudstvo zvíťazilo a prosperovalo."
Jej vízia presahuje zábavu. Lekárske simulácie, kde študenti preskúmavajú anatómiu. Vedecké vizualizácie, kde výskumníci navigujú molekulárne štruktúry. Robotické tréningové prostredia generované na vyžiadanie.
Marble je prvý krok, komerčný dôkaz konceptu. Výskum pokračuje smerom k dynamickejšiemu, interaktívnejšiemu a fyzikálne presnejšiemu generovaniu svetov.
Začíname
World Labs ponúka bezplatnú úroveň so 4 generovaniami mesačne. Dosť na vyhodnotenie technológie a pochopenie jej obmedzení.
Pre tvorcov už pracujúcich v 3D integruje schopnosť exportu meshov s existujúcimi pipeline. Pre producentov videa poskytuje export videa možnosti pre-vizualizácie nedostupné inde.
Súvisiace čítanie: Náš sprievodca konzistenciou postáv v AI videu pokrýva techniky pre udržanie koherencie naprieč generovaným obsahom, výzvu, ktorú Marble rieši prostredníctvom perzistentnej 3D reprezentácie.
Prechod od 2D generovania k tvorbe 3D svetov predstavuje zásadný posun v tom, čo môže AI produkovať. Marble robí tento posun prístupným.
Bol tento článok užitočný?

Alexis
AI inžinierAI inžinier z Lausanne, ktorý spája hĺbku výskumu s praktickou inováciou. Čas delí medzi architektúry modelov a alpské vrcholy.
Súvisiace články
Pokračujte v objavovaní s týmito súvisiacimi príspevkami

Runway GWM-1: Všeobecný svetový model, ktorý simuluje realitu v reálnom čase
Runway GWM-1 predstavuje zmenu paradigmy od generovania videí k simulácii svetov. Objavte, ako tento autoregresívny model vytvára preskúmateľné prostredia, fotorealistické avatary a simulácie pre tréning robotov.

YouTube prináša Veo 3 Fast do Shorts: bezplatné generovanie AI videa pre 2,5 miliardy používateľov
Google integruje model Veo 3 Fast priamo do YouTube Shorts a ponúka bezplatné generovanie videa z textu so zvukom pre tvorcov po celom svete. Čo to znamená pre platformu a dostupnosť AI videa.

Video jazykové modely: Ďalšia hranica po LLM a AI agentoch
Svetové modely učia AI rozumieť fyzickej realite, čo umožňuje robotom plánovať akcie a simulovať výsledky pred tým, ako pohnú jediným aktuátorom.