Meta Pixel
AlexisAlexis
6 min read
1090 slová

World Labs Marble: Vízia priestorovej inteligencie Fei-Fei Li

Priekopníčka AI Fei-Fei Li spúšťa Marble, komerčnú platformu ktorá generuje prieskumné 3D svety z textu a obrázkov, a otvára novú frontu v priestorovom AI.

World Labs Marble: Vízia priestorovej inteligencie Fei-Fei Li
Výskumníčka, ktorá dala strojom schopnosť vidieť, ich teraz učí predstavovať si celé svety. S World Labs Marble robí Fei-Fei Li ďalší krok za generovanie videa do perzistentných, prieskumných 3D prostredí.

Od ImageNetu k modelom sveta

💡

Pre kontext, ako sa modely sveta hodia do evolúcie AI videa, pozri náš prehľad modelov sveta ako ďalšej fronty.

Fei-Fei Li spôsobila revolúciu v počítačovom videní s ImageNetom, datasetom, ktorý umožnil moderné hlboké učenie. Teraz, po roku budovania World Labs s financovaním 230 miliónov dolárov, spustila Marble, prvý komerčný produkt spoločnosti.

Téza je jednoduchá: AI ovládlo text, potom obrázky, potom video. Ďalšou frontou je priestorová inteligencia, schopnosť vnímať, generovať a interagovať s 3D svetmi.

$230M
Získané financovanie
4
Cenové úrovne
3D
Natívny výstup

Čo Marble robí

Marble generuje perzistentné, stiahnuteľné 3D prostredia z viacerých typov vstupov:

  • Textové výzvy
  • Jednotlivé obrázky
  • Videá
  • Panorámy
  • 3D dispozície

Na rozdiel od modelov sveta v reálnom čase od konkurentov ako Decart Oasis alebo Google Genie vytvára Marble stabilné svety s minimálnym morphingom. Vygenerujete raz, potom preskúmavate voľne, bez toho aby AI "zabudlo", čo vytvorilo.

Editor Chisel

🔨

AI-natívna 3D editácia

Chisel oddeľuje priestorovú štruktúru od vizuálneho štýlu. Najprv načrtnite dispozíciu, potom aplikujte textové štýlové pokyny.

Tento hybridný prístup odlišuje Marble od modelov text-na-scénu. Namiesto dúfania, že AI pochopí váš priestorový zámer, definujete geometriu explicitne. AI sa stará o estetiku, materiály a osvetlenie.

Predstavte si to ako načrtnutie pôdorysu, než požiadate interiérového dizajnéra o dekoráciu. Kontrola nad priestorovými vzťahmi zostáva vaša.

Exportné formáty a kompatibilita

Vygenerované svety sa exportujú v troch formátoch:

FormátPoužitie
Gaussovské splatyRendering v reálnom čase, nové pohľady
MesheHerné enginy, integrácia CAD
VideáTvorba obsahu, pre-vis
💡

Všetky svety Marble sú VR-kompatibilné s headsetmi Vision Pro a Quest 3 hneď po vybalení.

Cenová štruktúra

World Labs ponúka štyri úrovne:

ÚroveňCenaGenerovanieKľúčové funkcie
Free$04/mesiacText, obrázok alebo panoramatický vstup
Standard$20/mesiac12/mesiacViac obrázkov/video vstup, pokročilá editácia
Pro$35/mesiac25/mesiacRozšírenie scény, komerčné práva
Max$95/mesiac75/mesiacVšetky funkcie, maximálne generovanie

Bezplatná úroveň vám umožňuje vyhodnotiť technológiu. Pre produkčnú prácu vyžadujúcu komerčné práva predstavuje úroveň Pro za $35/mesiac rozumnú vstupnú cenu za tak novú schopnosť.

Prečo priestorová inteligencia záleží

"Priestorová inteligencia je určujúcou výzvou budúceho desaťročia." - Fei-Fei Li

Li tvrdí, že súčasné AI má zásadné omezenie: zle uvažuje o 3D priestore. Jazykové modely halucinujú fyziku. Video modely vytvárajú nemožné geometrie. Generátory obrázkov bojujú s konzistentnými priestorovými vzťahmi.

Súčasné prístupy
Video modely generujú sekvencie snímok bez skutočného 3D porozumenia. Pohyby kamery odhaľujú nezrovnalosti. Objekty menia pozíciu alebo miznú.
Priestorová inteligencia
Natívna 3D reprezentácia umožňuje fyzikálne konzistentné svety. Pohybujte kamerou voľne. Prostredie pretrváva, pretože existuje ako geometria, nie pixely.

Pre robotiku to má obrovský význam. Robot navigujúci v kuchyni potrebuje priestorové porozumenie, nie predikciu snímok. Pre VFX potrebujú režiséri prieskumné prostredia, nie fixné cesty kamery.

Vznikajúce prípady použitia

Gaming Generujte ambientné prostredia a pozadia. Nezávislí vývojári môžu vytvárať prieskumné oblasti, ktoré by vyžadovali mesiace tradičnej umeleckej produkcie.

Vizuálne efekty Pre-vizualizácia sa stává interaktívnou. Načrtnite scénu priestorovo, potom preskúmajte uhly kamery pred záväzkom na zábery.

Architektúra Preveďte pôdorysy na prieskumné prechody. Klienti zažívajú priestory pred začiatkom stavby.

Vzdelávanie Li si predstavuje študentov prechádzajúcich sa vnútri bunky, chirurgov trénujúcich vnútri anatomických simulácií.

Rozšírenie sveta a režim Composer

Dve funkcie riešia omezenia mierky:

Rozšírenie sveta vám umožňuje raz rozšíriť vygenerovaný svet, pridávať detaily do okrajových oblastí, kde kvalita typicky degraduje. To posúva hranice prieskumného priestoru za počiatočné limity generovania.

Režim Composer kombinuje viac svetov do väčších prostredí. Generujte jednotlivé miestnosti, potom ich spojte do kompletnej budovy.

Tieto nástroje uznávajú súčasné omezenia a zároveň poskytujú praktické riešenia.

Konkurenčné prostredie

Marble vstupuje do zaplneného poľa:

ProduktPrístupDiferenciátor
Decart OasisGenerovanie hier v reálnom časeInteraktívne, ale svety sa posúvajú počas preskúmavania
Google GenieGenerovanie herných svetovPredikcia snímok bez skutočného 3D
OdysseyPerzistentné modely svetaZameranie na podniky
World Labs MarbleStatické 3D generovanieStiahnuteľné, editovateľné, VR-ready

Kompromis je jasný. Modely v reálnom čase ako Oasis ponúkajú okamžitosť, ale nestabilitu. Marble uprednostňuje persistenciu a editovateľnosť pred interaktivitou.

Spojenie s generovaním videa

💡

Pre základy difúznych architektúr používaných v priestorovom AI pozri náš technický prehľad difúznych transformátorov.

Ako súvisí generovanie 3D svetov s videom? Zdieľajú matematické základy v difúznych modeloch, ale riešia rôzne problémy.

Generovanie videa vytvára časové sekvencie, snímok za snímkom. Priestorové AI vytvára geometrické reprezentácie, povrchy a objemy. Video odpovedá "čo sa stane ďalej?" Priestorové AI odpovedá "čo tu existuje?"

Bod konvergencie: navigovateľné video. Vygenerujte 3D svet, potom renderujte video pri pohybe cez neho. Tento prístup ponúka kontrolu kamery nemožnú s čistým generovaním videa.

Omedzenia na zváženie

Marble nie je kompletné riešenie:

  • Žiadne animované postavy alebo dynamické prvky
  • Limity generovania môžu obmedziť produkčný workflow
  • Degradácia okrajov vyžaduje rozširujúce prechody
  • Len statické prostredia

Pre animovaný obsah stále potrebujete modely generovania videa. Marble exceluje v prostrediach a priestoroch, nie v hercoch alebo akciách.

Väčší obraz

Fei-Fei Li vidí priestorovú inteligenciu ako zásadnú pre pokrok AI:

"Myslím, že všetci máme zodpovednosť pri uvádzaní AI do lepšieho stavu, ako sa stáva mocnejšou. Všetci by sme mali chcieť, aby ľudstvo zvíťazilo a prosperovalo."

Jej vízia presahuje zábavu. Lekárske simulácie, kde študenti preskúmavajú anatómiu. Vedecké vizualizácie, kde výskumníci navigujú molekulárne štruktúry. Robotické tréningové prostredia generované na vyžiadanie.

Marble je prvý krok, komerčný dôkaz konceptu. Výskum pokračuje smerom k dynamickejšiemu, interaktívnejšiemu a fyzikálne presnejšiemu generovaniu svetov.

Začíname

World Labs ponúka bezplatnú úroveň so 4 generovaniami mesačne. Dosť na vyhodnotenie technológie a pochopenie jej obmedzení.

Pre tvorcov už pracujúcich v 3D integruje schopnosť exportu meshov s existujúcimi pipeline. Pre producentov videa poskytuje export videa možnosti pre-vizualizácie nedostupné inde.

💡

Súvisiace čítanie: Náš sprievodca konzistenciou postáv v AI videu pokrýva techniky pre udržanie koherencie naprieč generovaným obsahom, výzvu, ktorú Marble rieši prostredníctvom perzistentnej 3D reprezentácie.

Prechod od 2D generovania k tvorbe 3D svetov predstavuje zásadný posun v tom, čo môže AI produkovať. Marble robí tento posun prístupným.

Bol tento článok užitočný?

Alexis

Alexis

AI inžinier

AI inžinier z Lausanne, ktorý spája hĺbku výskumu s praktickou inováciou. Čas delí medzi architektúry modelov a alpské vrcholy.

Súvisiace články

Pokračujte v objavovaní s týmito súvisiacimi príspevkami

Páčil sa vám tento článok?

Objavte ďalšie postrehy a sledujte náš najnovší obsah.

World Labs Marble: Vízia priestorovej inteligencie Fei-Fei Li