World Labs Marble: Vize prostorové inteligence Fei-Fei Li
Průkopnice AI Fei-Fei Li spouští Marble, komerční platformu která generuje průzkumné 3D světy z textu a obrázků, a otevírá novou frontu v prostorovém AI.

Od ImageNetu k modelům světa
Pro kontext, jak se modely světa hodí do evoluce AI videa, viz náš přehled modelů světa jako další fronty.
Fei-Fei Li způsobila revoluci v počítačovém vidění s ImageNetem, datasetem, který umožnil moderní hluboké učení. Nyní, po roce budování World Labs s financováním 230 milionů dolarů, spustila Marble, první komerční produkt společnosti.
Teze je jednoduchá: AI ovládlo text, pak obrázky, pak video. Další frontou je prostorová inteligence, schopnost vnímat, generovat a interagovat s 3D světy.
Co Marble dělá
Marble generuje perzistentní, stažitelná 3D prostředí z více typů vstupů:
- ✓Textové výzvy
- ✓Jednotlivé obrázky
- ✓Videa
- ✓Panoramata
- ✓3D dispozice
Na rozdíl od modelů světa v reálném čase od konkurentů jako Decart Oasis nebo Google Genie vytváří Marble stabilní světy s minimálním morphingem. Vygenerujete jednou, pak prozkoumáváte svobodně, aniž by AI "zapomnělo", co vytvořilo.
Editor Chisel
AI-nativní 3D editace
Chisel odděluje prostorovou strukturu od vizuálního stylu. Nejdříve načrtněte dispozici, pak aplikujte textové stylové pokyny.
Tento hybridní přístup odlišuje Marble od modelů text-na-scénu. Místo doufání, že AI pochopí váš prostorový záměr, definujete geometrii explicitně. AI se stará o estetiku, materiály a osvětlení.
Představte si to jako načrtnutí půdorysu, než požádáte interiérového designéra o dekoraci. Kontrola nad prostorovými vztahy zůstává vaše.
Exportní formáty a kompatibilita
Vygenerované světy se exportují ve třech formátech:
| Formát | Použití |
|---|---|
| Gaussovské splatty | Rendering v reálném čase, nové pohledy |
| Meshe | Herní enginy, integrace CAD |
| Videa | Tvorba obsahu, pre-vis |
Všechny světy Marble jsou VR-kompatibilní s headsety Vision Pro a Quest 3 hned po vybalení.
Cenová struktura
World Labs nabízí čtyři úrovně:
| Úroveň | Cena | Generování | Klíčové funkce |
|---|---|---|---|
| Free | $0 | 4/měsíc | Text, obrázek nebo panoramatický vstup |
| Standard | $20/měsíc | 12/měsíc | Více obrázků/video vstup, pokročilá editace |
| Pro | $35/měsíc | 25/měsíc | Rozšíření scény, komerční práva |
| Max | $95/měsíc | 75/měsíc | Všechny funkce, maximální generování |
Bezplatná úroveň vám umožňuje vyhodnotit technologii. Pro produkční práci vyžadující komerční práva představuje úroveň Pro za $35/měsíc rozumnou vstupní cenu za tak novou schopnost.
Proč prostorová inteligence záleží
"Prostorová inteligence je určujícím výzvou příštího desetiletí." - Fei-Fei Li
Li tvrdí, že současné AI má zásadní omezení: špatně uvažuje o 3D prostoru. Jazykové modely halucinují fyziku. Video modely vytvářejí nemožné geometrie. Generátory obrázků bojují s konzistentními prostorovými vztahy.
Pro robotiku to má obrovský význam. Robot navigující v kuchyni potřebuje prostorové porozumění, ne predikci snímků. Pro VFX potřebují režiséři průzkumná prostředí, ne fixní cesty kamery.
Vznikající případy použití
Gaming Generujte ambientní prostředí a pozadí. Nezávislí vývojáři mohou vytvářet průzkumné oblasti, které by vyžadovaly měsíce tradiční umělecké produkce.
Vizuální efekty Pre-vizualizace se stává interaktivní. Načrtněte scénu prostorově, pak prozkoumejte úhly kamery před závazkem na záběry.
Architektura Převeďte půdorysy na průzkumné průchody. Klienti zažívají prostory před zahájením stavby.
Vzdělávání Li si představuje studenty procházející se uvnitř buňky, chirurgy trénující uvnitř anatomických simulací.
Rozšíření světa a režim Composer
Dvě funkce řeší omezení měřítka:
Rozšíření světa vám umožňuje jednou rozšířit vygenerovaný svět, přidávat detaily do okrajových oblastí, kde kvalita typicky degraduje. To posouvá hranice průzkumného prostoru za počáteční limity generování.
Režim Composer kombinuje více světů do větších prostředí. Generujte jednotlivé místnosti, pak je spojte do kompletní budovy.
Tyto nástroje uznávají současná omezení a zároveň poskytují praktická řešení.
Konkurenční prostředí
Marble vstupuje do zaplněného pole:
| Produkt | Přístup | Diferenciátor |
|---|---|---|
| Decart Oasis | Generování her v reálném čase | Interaktivní, ale světy se posouvají během prozkoumávání |
| Google Genie | Generování herních světů | Predikce snímků bez skutečného 3D |
| Odyssey | Perzistentní modely světa | Zaměření na podniky |
| World Labs Marble | Statické 3D generování | Stažitelné, editovatelné, VR-ready |
Kompromis je jasný. Modely v reálném čase jako Oasis nabízejí okamžitost, ale nestabilitu. Marble upřednostňuje perzistenci a editovatelnost před interaktivitou.
Spojení s generováním videa
Pro základy difuzních architektur používaných v prostorovém AI viz náš technický přehled difuzních transformátorů.
Jak souvisí generování 3D světů s videem? Sdílejí matematické základy v difuzních modelech, ale řeší různé problémy.
Generování videa vytváří časové sekvence, snímek za snímkem. Prostorové AI vytváří geometrické reprezentace, povrchy a objemy. Video odpovídá "co se stane dál?" Prostorové AI odpovídá "co tu existuje?"
Bod konvergence: navigovatelné video. Vygenerujte 3D svět, pak renderujte video při pohybu skrz něj. Tento přístup nabízí kontrolu kamery nemožnou s čistým generováním videa.
Omezení ke zvážení
Marble není kompletní řešení:
- ○Žádné animované postavy nebo dynamické prvky
- ○Limity generování mohou omezit produkční workflow
- ○Degradace okrajů vyžaduje rozšiřovací průchody
- ○Pouze statická prostředí
Pro animovaný obsah stále potřebujete modely generování videa. Marble exceluje v prostředích a prostorech, ne v hercích nebo akcích.
Větší obraz
Fei-Fei Li vidí prostorovou inteligenci jako zásadní pro pokrok AI:
"Myslím, že všichni máme zodpovědnost při uvádění AI do lepšího stavu, jak se stává mocnější. Všichni bychom měli chtít, aby lidstvo zvítězilo a prosperovalo."
Její vize přesahuje zábavu. Lékařské simulace, kde studenti prozkoumávají anatomii. Vědecké vizualizace, kde výzkumníci navigují molekulární struktury. Robotická tréninková prostředí generovaná na vyžádání.
Marble je první krok, komerční důkaz konceptu. Výzkum pokračuje směrem k dynamičtějšímu, interaktivnějšímu a fyzikálně přesnějšímu generování světů.
Začínáme
World Labs nabízí bezplatnou úroveň se 4 generováními měsíčně. Dost na vyhodnocení technologie a pochopení jejích omezení.
Pro tvůrce již pracující v 3D integruje schopnost exportu meshů s existujícími pipeline. Pro producenty videa poskytuje export videa možnosti pre-vizualizace nedostupné jinde.
Související četba: Náš průvodce konzistencí postav v AI videu pokrývá techniky pro udržení koherence napříč generovaným obsahem, výzvu, kterou Marble řeší prostřednictvím perzistentní 3D reprezentace.
Přechod od 2D generování k tvorbě 3D světů představuje zásadní posun v tom, co může AI produkovat. Marble dělá tento posun přístupným.
Byl tento článek užitečný?

Alexis
AI inženýrAI inženýr z Lausanne kombinující hloubku výzkumu s praktickými inovacemi. Čas dělí mezi architekturami modelů a alpskými vrcholky.
Související články
Pokračujte ve zkoumání s těmito souvisejícími příspěvky

Runway GWM-1: univerzální model světa simulující realitu v reálném čase
GWM-1 od Runway představuje posun od generování videa k simulaci světů. Zjistěte, jak tento autoregresivní model vytváří prozkoumatelná prostředí, fotorealistické avatary a simulace pro trénink robotů.

YouTube přináší Veo 3 Fast do Shorts: bezplatné generování AI videa pro 2,5 miliardy uživatelů
Google integruje model Veo 3 Fast přímo do YouTube Shorts a nabízí bezplatné generování videa z textu se zvukem pro tvůrce po celém světě. Co to znamená pro platformu a dostupnost AI videa.

Video jazykové modely: Další hranice po LLM a AI agentech
Modely světa učí AI rozumět fyzické realitě, což robotům umožňuje plánovat akce a simulovat výsledky před jakýmkoliv pohybem.