World Labs Marble: Fei-Fei Li hir Visioun fir räimlech Intelligenz
D'KI-Pionierin Fei-Fei Li presentéiert Marble, eng kommerziell Plattform déi erforschbar 3D-Welten aus Text a Biller generéiert. Dëst markéiert en neie Mäilestein an der räimlecher KI.

Vun ImageNet zu World Models
Fir Kontext, wéi World Models an d'Evolutioun vun der KI-Videogeneréierung anzeuerdnen sinn, kuckt eis Iwwerbléck zu World Models als nächst Grenz.
Fei-Fei Li huet Computer Vision mat ImageNet revolutionéiert, dem Dataset, dee modern Deep Learning méiglech gemaach huet. No engem Joer vum Opbau vu World Labs mat 230 Milliounen Dollar Finanzéierung presentéiert si elo Marble, dat éischt kommerziellt Produkt vun der Firma.
D'These ass kloer: KI huet Text gemeeschtert, dunn Biller, dunn Video. Déi nächst Grenz ass räimlech Intelligenz – d'Fäegkeet, 3D-Welten wouerhuelen, ze generéieren a mat hinnen ze interagéieren.
Wéi Marble funktionéiert
Marble generéiert persistent, erofluedbar 3D-Ëmgéigenden aus verschiddenen Agabstypen:
- ✓Text-Prompts
- ✓Eenzel Biller
- ✓Videoen
- ✓Panoramen
- ✓3D-Layouts
Anescht wéi Echtzäit-World-Models vu Konkurrenten wéi Decarts Oasis oder Googles Genie erstellt Marble stabil Welten mat minimaler Verformung. Dir generéiert eemol, erfuerscht dunn fräi, ouni datt d'KI "vergësst", wat se erstallt huet.
Den Chisel-Editor
KI-native 3D-Beaarbechtung
Chisel trennt räimlech Struktur vu visuellem Stil. Definéiert als éischt Äert Layout, wendelt dunn textbaséiert Stilrichtlinne un.
Dësen hybriden Approche ënnerscheet Marble vun Text-zu-Szene-Modeller. Amplaz ze hoffen, datt d'KI Är räimlech Intentioun versteet, definéiert Dir d'Geometrie explizit. D'KI iwwerhëlt Ästhetik, Materialien a Beliichtung.
Vergläichbar mam Skizzéieren vun engem Grondplang, ier Dir en Innenarchitekt mat der Dekoratioun beoptaart. D'Kontroll iwwer räimlech Bezéiungen bleift bei Iech.
Exportformater a Kompatibilitéit
Generéiert Welten ginn an dräi Formater exportéiert:
| Format | Unwendungsfall |
|---|---|
| Gaussian Splats | Echtzäit-Rendering, nei Perspektiven |
| Meshes | Game Engines, CAD-Integratioun |
| Videoen | Content-Erstellung, Pre-Visualiséierung |
All Marble-Welten si standardméisseg VR-kompatibel mat Vision Pro a Quest 3 Headsets.
Präisstruktur
World Labs bitt véier Stufen:
| Stuf | Präis | Generéierungen | Haaptfunktiounen |
|---|---|---|---|
| Free | 0 $ | 4/Mount | Text-, Bild- oder Panorama-Agab |
| Standard | 20 $/Mount | 12/Mount | Multi-Bild-/Video-Agab, erweidert Beaarbechtung |
| Pro | 35 $/Mount | 25/Mount | Szenen-Erweiderung, kommerziell Rechter |
| Max | 95 $/Mount | 75/Mount | All Funktiounen, maximal Generéierungen |
Déi gratis Stuf erlaabt d'Evaluéierung vun der Technologie. Fir Produktiounsaarbecht mat kommerziellen Rechter stellt d'Pro-Stuf fir 35 $/Mount en ugemessenen Astiegspräis fir esou eng neuaarteg Fäegkeet duer.
Firwat räimlech Intelligenz relevant ass
"Räimlech Intelligenz ass déi entscheedend Erausfuerderung vum nächste Joerzéngt." - Fei-Fei Li
Li argumentéiert, datt aktuell KI eng fundamental Aschränkung huet: Si veraarbecht 3D-Raum onzoureichend. Sproochmodeller halluzinéieren Physik. Videomodeller erzeien onméiglech Geometrien. Bild-Generatoren hunn Schwieregkeeten mat konsistente räimleche Bezéiungen.
Fir Robotik ass dat vu groussem Bedeiten. E Roboter, dee sech an enger Kichen beweegt, brauch räimlecht Verständnis, keng Frame-Virsoen. Fir VFX brauchen Regisseuren erforschbar Ëmgéigenden, keng fest Kamerapfaad.
Sech entwécklend Unwendungsfäll
Gaming Generéierung vun atmosphäreschen Ëmgéigenden a Hannergrondberäicher. Indie-Entwéckler kënnen Erforschungsgebidder erstellen, déi Mount vun traditioneller Konschtproduktioun erfuerderen géifen.
Visuell Effekter Pre-Visualiséierung gëtt interaktiv. Blockéiert eng Szen räimlech aus, erfuerscht dunn Kamerawénkelen, ier Dir Iech op Ophuelen festleet.
Architektur Konvertéierung vu Grondpläng zu erforschbare Ronddéierungen. Clienten erliewen Raim virun der Bauunnfank.
Bildung Li stellt sech vir, wéi Studenten duerch eng Zell ginn, Chirurge an anatomesche Simulatiounen üben.
World Expansion a Composer Mode
Zwou Funktiounen adresséieren Skaléierungsaschränkungen:
World Expansion erlaabt d'eemoleg Erweiderung vun enger generéierter Welt, wou Detailer a Randberäicher bäigefüügt ginn, wou d'Qualitéit typesch ofhëlt. Dëst erweidert d'Grenzen vum erforschbare Raum iwwer déi initial Generéierungslimiten eraus.
Composer Mode kombinéiert méi Welten zu méi grousse Ëmgéigenden. Generéiert eenzel Raim, setzt se dunn zu engem komplette Gebai zesummen.
Dës Werkzeeën erkennen aktuell Aschränkungen un a bidden praktesch Léisungen.
D'Konkurrenzëmfeld
Marble trëtt an e bekämpfte Feld an:
| Produkt | Approche | Ënnerscheedungsmerkmal |
|---|---|---|
| Decart Oasis | Echtzäit-Spillgeneréierung | Interaktiv, awer Welten verréckelen sech wärend der Erforschung |
| Google Genie | Spillweltgeneréierung | Frame-Virsoen ouni richtegt 3D |
| Odyssey | Persistent World Models | Enterprise-Fokus |
| World Labs Marble | Statesch 3D-Generéierung | Erofluedbar, beaarbedbar, VR-fäeg |
De Kompromëss ass eendeiteg. Echtzäit-Modeller wéi Oasis bidden Ëmmeddelschheet, awer Instabilitéit. Marble priorisséiert Persistenz an Editéierbarkeet géigeniwwer Interaktivitéit.
Verbindung zur Videogeneréierung
Fir Hannergrondsinformatiounen zu Diffusiounsarchitekturen a räimlecher KI kuckt eis technesch Iwwerbléck zu Diffusion Transformers.
Wéi verhält sech 3D-Weltgeneréierung zur Videogeneréierung? Si deelen mathematesch Grondlagen a Diffusiounsmodeller, léisen awer ënnerschiddlech Problemer.
Videogeneréierung erstellt temporal Sequenzen, Frame fir Frame. Räimlech KI erstellt geometresch Representatiounen, Uerflächenen a Volummen. Video äntwert "wat passéiert als Nächst?" Räimlech KI äntwert "wat existéiert hei?"
De Konvergenzpunkt: navigéierbar Video. Generéiert eng 3D-Welt, rendert dunn Video wärend der Beweegung duerch dës. Dësen Approche bitt Kamerakontroll, déi mat pure Videogeneréierung onméiglech ass.
Ze berücksichtegend Aschränkungen
Marble ass keng komplett Léisung:
- ○Keng animéiert Charakteren oder dynamesch Elementer
- ○Generéierungslimiten kënne Produktiouns-Workflows aschränken
- ○Randdegradatioun erfuerdert Erweiderungsduerchläf
- ○Nëmme statesch Ëmgéigenden
Fir animéiert Inhalter braucht Dir nach ëmmer Videogeneréierungsmodeller. Marble eegent sech fir Ëmgéigenden a Raim, net fir Akteuren oder Handlungen.
Dat méi grouss Bild
Fei-Fei Li kuckt räimlech Intelligenz als essentiell fir de Fortschrëtt vun der KI:
"Mir all droen Verantwortung dofir, KI an e besseren Zoustand ze bréngen, wärend se méi mächteg gëtt. Mir all solle wëllen, datt d'Mënschheet gewënnt a gedeift."
Hir Visioun geet iwwer Ënnerhaltung eraus. Medezinesch Simulatiounen, wou Studenten Anatomie erfuerschen. Wëssenschaftlech Visualiséierungen, wou Fuerscher duerch molekular Strukturen navigéieren. Roboter-Trainingsëmgéigenden, déi op Oprouf generéiert ginn.
Marble ass Schrëtt eent, e kommerziellen Proof of Concept. D'Fuerschung geet weider a Richtung dynamesch, interaktiv a physikalesch méi genee Weltgeneréierung.
Éischt Schrëtt
World Labs bitt eng gratis Stuf mat 4 Generéierungen pro Mount. Genuch, fir d'Technologie ze evaluéieren an hir Grenzen ze verstoen.
Fir Kreativen, déi scho a 3D schaffen, integréiert d'Mesh-Export-Fäegkeet sech a bestehend Pipelines. Fir Videoproduzenten bitt de Video-Export Pre-Visualiséierungsfäegkeeten, déi aneschterwou net verfügbar sinn.
Weiderféierend Lektür: Eis Leedung zur Charakterkonsistenz an KI-Videoen behandelt Techniken zur Erhaltung vun der Kohärenz iwwer generéierten Content, eng Erausfuerderung, déi Marble duerch persistent 3D-Representatioun adresséiert.
Den Iwwergang vun 2D-Generéierung zu 3D-Welterstellung stellt e fundamentale Wandel vu deem duer, wat KI produzéiere kann. Marble mécht dëse Wandel zougänglech.
War dësen Artikel hëllefräich?

Alexis
KI-IngenieurKI-Ingenieur aus Lausanne, deen Fuerschungsdetail mat praktescher Innovatioun kombinéiert. Deelt seng Zäit tëscht Modell-Architekturen an alpinne Gëpfelen.
Verbonne Artikelen
Entdeckt weider mat dësen verbonnenen Artikelen

Runway GWM-1: Dat allgemeng Weltmodell dat d'Realitéit an Echtzäit simuléiert
Runway säin GWM-1 markéiert e Paradigmawiessel vun der Videogeneratioun zur Weltsimulatioun. Entdeckt wéi dëst autoregressivt Modell exploréierbar Ëmfeld, photoreaalistesch Avatare a Roboter-Trainingssimulatioune kreéiert.

YouTube bréngt Veo 3 Fast op Shorts: Gratis KI-Videogeneratioun fir 2,5 Milliarden Benotzer
Google integréiert säi Veo 3 Fast Modell direkt an YouTube Shorts an offréiert gratis Text-zu-Video Generatioun mat Audio fir Creatoren weltwäit. Hei ass wat et fir d'Plattform an d'KI-Video-Accessibilitéit bedeit.

Video Sproochmodeller: Déi nächst Frontier no LLMs an AI Agenten
Weltmodeller léieren AI d'kierperlech Realitéit ze verstoen, wat Roboter erlaabt Aktiounen ze plangen a Resultater ze simuléieren ier een eenzegen Aktuator sech beweegt.