Meta Pixel
AlexisAlexis
6 min read
1087 slov

World Labs Marble: Vize prostorové inteligence Fei-Fei Li

Průkopnice AI Fei-Fei Li spouští Marble, komerční platformu která generuje průzkumné 3D světy z textu a obrázků, a otevírá novou frontu v prostorovém AI.

World Labs Marble: Vize prostorové inteligence Fei-Fei Li
Výzkumnice, která dala strojům schopnost vidět, je nyní učí představovat si celé světy. S World Labs Marble dělá Fei-Fei Li další krok za generování videa do perzistentních, průzkumných 3D prostředí.

Od ImageNetu k modelům světa

💡

Pro kontext, jak se modely světa hodí do evoluce AI videa, viz náš přehled modelů světa jako další fronty.

Fei-Fei Li způsobila revoluci v počítačovém vidění s ImageNetem, datasetem, který umožnil moderní hluboké učení. Nyní, po roce budování World Labs s financováním 230 milionů dolarů, spustila Marble, první komerční produkt společnosti.

Teze je jednoduchá: AI ovládlo text, pak obrázky, pak video. Další frontou je prostorová inteligence, schopnost vnímat, generovat a interagovat s 3D světy.

$230M
Získané financování
4
Cenové úrovně
3D
Nativní výstup

Co Marble dělá

Marble generuje perzistentní, stažitelná 3D prostředí z více typů vstupů:

  • Textové výzvy
  • Jednotlivé obrázky
  • Videa
  • Panoramata
  • 3D dispozice

Na rozdíl od modelů světa v reálném čase od konkurentů jako Decart Oasis nebo Google Genie vytváří Marble stabilní světy s minimálním morphingem. Vygenerujete jednou, pak prozkoumáváte svobodně, aniž by AI "zapomnělo", co vytvořilo.

Editor Chisel

🔨

AI-nativní 3D editace

Chisel odděluje prostorovou strukturu od vizuálního stylu. Nejdříve načrtněte dispozici, pak aplikujte textové stylové pokyny.

Tento hybridní přístup odlišuje Marble od modelů text-na-scénu. Místo doufání, že AI pochopí váš prostorový záměr, definujete geometrii explicitně. AI se stará o estetiku, materiály a osvětlení.

Představte si to jako načrtnutí půdorysu, než požádáte interiérového designéra o dekoraci. Kontrola nad prostorovými vztahy zůstává vaše.

Exportní formáty a kompatibilita

Vygenerované světy se exportují ve třech formátech:

FormátPoužití
Gaussovské splattyRendering v reálném čase, nové pohledy
MesheHerní enginy, integrace CAD
VideaTvorba obsahu, pre-vis
💡

Všechny světy Marble jsou VR-kompatibilní s headsety Vision Pro a Quest 3 hned po vybalení.

Cenová struktura

World Labs nabízí čtyři úrovně:

ÚroveňCenaGenerováníKlíčové funkce
Free$04/měsícText, obrázek nebo panoramatický vstup
Standard$20/měsíc12/měsícVíce obrázků/video vstup, pokročilá editace
Pro$35/měsíc25/měsícRozšíření scény, komerční práva
Max$95/měsíc75/měsícVšechny funkce, maximální generování

Bezplatná úroveň vám umožňuje vyhodnotit technologii. Pro produkční práci vyžadující komerční práva představuje úroveň Pro za $35/měsíc rozumnou vstupní cenu za tak novou schopnost.

Proč prostorová inteligence záleží

"Prostorová inteligence je určujícím výzvou příštího desetiletí." - Fei-Fei Li

Li tvrdí, že současné AI má zásadní omezení: špatně uvažuje o 3D prostoru. Jazykové modely halucinují fyziku. Video modely vytvářejí nemožné geometrie. Generátory obrázků bojují s konzistentními prostorovými vztahy.

Současné přístupy
Video modely generují sekvence snímků bez skutečného 3D porozumění. Pohyby kamery odhalují nesrovnalosti. Objekty mění pozici nebo mizí.
Prostorová inteligence
Nativní 3D reprezentace umožňuje fyzikálně konzistentní světy. Pohybujte kamerou svobodně. Prostředí přetrvává, protože existuje jako geometrie, ne pixely.

Pro robotiku to má obrovský význam. Robot navigující v kuchyni potřebuje prostorové porozumění, ne predikci snímků. Pro VFX potřebují režiséři průzkumná prostředí, ne fixní cesty kamery.

Vznikající případy použití

Gaming Generujte ambientní prostředí a pozadí. Nezávislí vývojáři mohou vytvářet průzkumné oblasti, které by vyžadovaly měsíce tradiční umělecké produkce.

Vizuální efekty Pre-vizualizace se stává interaktivní. Načrtněte scénu prostorově, pak prozkoumejte úhly kamery před závazkem na záběry.

Architektura Převeďte půdorysy na průzkumné průchody. Klienti zažívají prostory před zahájením stavby.

Vzdělávání Li si představuje studenty procházející se uvnitř buňky, chirurgy trénující uvnitř anatomických simulací.

Rozšíření světa a režim Composer

Dvě funkce řeší omezení měřítka:

Rozšíření světa vám umožňuje jednou rozšířit vygenerovaný svět, přidávat detaily do okrajových oblastí, kde kvalita typicky degraduje. To posouvá hranice průzkumného prostoru za počáteční limity generování.

Režim Composer kombinuje více světů do větších prostředí. Generujte jednotlivé místnosti, pak je spojte do kompletní budovy.

Tyto nástroje uznávají současná omezení a zároveň poskytují praktická řešení.

Konkurenční prostředí

Marble vstupuje do zaplněného pole:

ProduktPřístupDiferenciátor
Decart OasisGenerování her v reálném časeInteraktivní, ale světy se posouvají během prozkoumávání
Google GenieGenerování herních světůPredikce snímků bez skutečného 3D
OdysseyPerzistentní modely světaZaměření na podniky
World Labs MarbleStatické 3D generováníStažitelné, editovatelné, VR-ready

Kompromis je jasný. Modely v reálném čase jako Oasis nabízejí okamžitost, ale nestabilitu. Marble upřednostňuje perzistenci a editovatelnost před interaktivitou.

Spojení s generováním videa

💡

Pro základy difuzních architektur používaných v prostorovém AI viz náš technický přehled difuzních transformátorů.

Jak souvisí generování 3D světů s videem? Sdílejí matematické základy v difuzních modelech, ale řeší různé problémy.

Generování videa vytváří časové sekvence, snímek za snímkem. Prostorové AI vytváří geometrické reprezentace, povrchy a objemy. Video odpovídá "co se stane dál?" Prostorové AI odpovídá "co tu existuje?"

Bod konvergence: navigovatelné video. Vygenerujte 3D svět, pak renderujte video při pohybu skrz něj. Tento přístup nabízí kontrolu kamery nemožnou s čistým generováním videa.

Omezení ke zvážení

Marble není kompletní řešení:

  • Žádné animované postavy nebo dynamické prvky
  • Limity generování mohou omezit produkční workflow
  • Degradace okrajů vyžaduje rozšiřovací průchody
  • Pouze statická prostředí

Pro animovaný obsah stále potřebujete modely generování videa. Marble exceluje v prostředích a prostorech, ne v hercích nebo akcích.

Větší obraz

Fei-Fei Li vidí prostorovou inteligenci jako zásadní pro pokrok AI:

"Myslím, že všichni máme zodpovědnost při uvádění AI do lepšího stavu, jak se stává mocnější. Všichni bychom měli chtít, aby lidstvo zvítězilo a prosperovalo."

Její vize přesahuje zábavu. Lékařské simulace, kde studenti prozkoumávají anatomii. Vědecké vizualizace, kde výzkumníci navigují molekulární struktury. Robotická tréninková prostředí generovaná na vyžádání.

Marble je první krok, komerční důkaz konceptu. Výzkum pokračuje směrem k dynamičtějšímu, interaktivnějšímu a fyzikálně přesnějšímu generování světů.

Začínáme

World Labs nabízí bezplatnou úroveň se 4 generováními měsíčně. Dost na vyhodnocení technologie a pochopení jejích omezení.

Pro tvůrce již pracující v 3D integruje schopnost exportu meshů s existujícími pipeline. Pro producenty videa poskytuje export videa možnosti pre-vizualizace nedostupné jinde.

💡

Související četba: Náš průvodce konzistencí postav v AI videu pokrývá techniky pro udržení koherence napříč generovaným obsahem, výzvu, kterou Marble řeší prostřednictvím perzistentní 3D reprezentace.

Přechod od 2D generování k tvorbě 3D světů představuje zásadní posun v tom, co může AI produkovat. Marble dělá tento posun přístupným.

Byl tento článek užitečný?

Alexis

Alexis

AI inženýr

AI inženýr z Lausanne kombinující hloubku výzkumu s praktickými inovacemi. Čas dělí mezi architekturami modelů a alpskými vrcholky.

Související články

Pokračujte ve zkoumání s těmito souvisejícími příspěvky

Líbil se vám tento článek?

Objevte více poznatků a zůstaňte aktuální s naším nejnovějším obsahem.

World Labs Marble: Vize prostorové inteligence Fei-Fei Li