World Labs Marble: Fei-Fei Li's visie voor ruimtelijke intelligentie
AI-pionier Fei-Fei Li lanceert Marble, een commercieel platform dat verkennbare 3D-werelden genereert uit tekst en afbeeldingen. Dit markeert een nieuwe grens in ruimtelijke AI.

Van ImageNet naar world models
Voor context over hoe world models passen in de evolutie van AI-video, zie ons overzicht van world models als volgende grens.
Fei-Fei Li revolutioneerde computer vision met ImageNet, de dataset die modern deep learning mogelijk maakte. Nu, na een jaar World Labs bouwen met $230 miljoen financiering, lanceert ze Marble, het eerste commerciële product van het bedrijf.
De these is simpel: AI heeft tekst overwonnen, daarna afbeeldingen, daarna video. De volgende grens is ruimtelijke intelligentie – het vermogen om 3D-werelden waar te nemen, te genereren en ermee te interacteren.
Wat Marble doet
Marble genereert persistente, downloadbare 3D-omgevingen uit meerdere invoertypes:
- ✓Tekst prompts
- ✓Losse afbeeldingen
- ✓Video's
- ✓Panorama's
- ✓3D-layouts
Anders dan realtime world models van concurrenten zoals Decart's Oasis of Google's Genie, creëert Marble stabiele werelden met minimale vervorming. Je genereert één keer, verkent daarna vrij zonder dat de AI "vergeet" wat het gemaakt heeft.
De Chisel-editor
AI-native 3D-editing
Chisel scheidt ruimtelijke structuur van visuele stijl. Blokkeer eerst je layout uit, pas daarna tekstgebaseerde stijlrichtlijnen toe.
Deze hybride aanpak onderscheidt Marble van tekst-naar-scène-modellen. In plaats van hopen dat de AI je ruimtelijke intentie begrijpt, definieer je de geometrie expliciet. De AI regelt esthetiek, materialen en belichting.
Vergelijk het met het schetsen van een plattegrond voordat je een interieurontwerper vraagt om te decoreren. De controle over ruimtelijke relaties blijft bij jou.
Exportformaten en compatibiliteit
Gegenereerde werelden exporteren in drie formaten:
| Formaat | Toepassing |
|---|---|
| Gaussian Splats | Realtime rendering, nieuwe perspectieven |
| Meshes | Game engines, CAD-integratie |
| Video's | Content creatie, pre-visualisatie |
Alle Marble-werelden zijn standaard VR-compatibel met Vision Pro en Quest 3 headsets.
Prijsstructuur
World Labs biedt vier niveaus:
| Niveau | Prijs | Generaties | Belangrijkste features |
|---|---|---|---|
| Free | $0 | 4/maand | Tekst-, afbeelding- of panorama-invoer |
| Standard | $20/maand | 12/maand | Multi-afbeelding-/video-invoer, geavanceerde editing |
| Pro | $35/maand | 25/maand | Scène-uitbreiding, commerciële rechten |
| Max | $95/maand | 75/maand | Alle features, maximale generaties |
Het gratis niveau laat je de technologie evalueren. Voor productiewerk met commerciële rechten is het Pro-niveau voor $35/maand een redelijke instapprijs voor zo'n nieuwe mogelijkheid.
Waarom ruimtelijke intelligentie belangrijk is
"Ruimtelijke intelligentie is de bepalende uitdaging van het volgende decennium." - Fei-Fei Li
Li stelt dat huidige AI een fundamentele beperking heeft: het redeneert slecht over 3D-ruimte. Taalmodellen hallucineren fysica. Videomodellen creëren onmogelijke geometrieën. Afbeeldingengeneratoren worstelen met consistente ruimtelijke relaties.
Voor robotica is dit enorm belangrijk. Een robot die door een keuken navigeert heeft ruimtelijk begrip nodig, geen frame-voorspelling. Voor VFX hebben regisseurs verkennbare omgevingen nodig, geen vaste camerapaden.
Toepassingen in ontwikkeling
Gaming Genereer sfeervolle omgevingen en achtergrondruimtes. Indie-ontwikkelaars kunnen verkenningsgebieden creëren die maanden traditionele artproductie zouden vergen.
Visuele effecten Pre-visualisatie wordt interactief. Blokkeer een scène ruimtelijk uit, verken daarna camerahoeken voordat je schoten vastlegt.
Architectuur Converteer plattegronden naar verkennbare rondleidingen. Klanten ervaren ruimtes voordat de bouw begint.
Onderwijs Li stelt zich voor dat studenten door een cel lopen, chirurgen oefenen in anatomische simulaties.
World Expansion en Composer Mode
Twee features pakken schaalbeperkingen aan:
World Expansion laat je een gegenereerde wereld één keer uitbreiden, met extra detail aan de randen waar de kwaliteit typisch afneemt. Dit vergroot de grenzen van verkennbare ruimte voorbij initiële generatielimieten.
Composer Mode combineert meerdere werelden tot grotere omgevingen. Genereer individuele kamers, voeg ze daarna samen tot een compleet gebouw.
Deze tools erkennen huidige beperkingen en bieden praktische workarounds.
Het competitielandschap
Marble betreedt een druk veld:
| Product | Aanpak | Onderscheidend vermogen |
|---|---|---|
| Decart Oasis | Realtime game-generatie | Interactief, maar werelden verschuiven tijdens verkenning |
| Google Genie | Game world-generatie | Frame-voorspelling zonder echte 3D |
| Odyssey | Persistente world models | Enterprise-focus |
| World Labs Marble | Statische 3D-generatie | Downloadbaar, bewerkbaar, VR-ready |
De trade-off is duidelijk. Realtime modellen zoals Oasis bieden directheid maar instabiliteit. Marble prioriteert persistentie en bewerkbaarheid boven interactiviteit.
Connectie met videogeneratie
Voor achtergrond over diffusion-architecturen in ruimtelijke AI, zie ons technisch overzicht van diffusion transformers.
Hoe verhoudt 3D-wereldgeneratie zich tot video? Ze delen wiskundige fundamenten in diffusion models, maar lossen verschillende problemen op.
Videogeneratie creëert temporele sequenties, frame na frame. Ruimtelijke AI creëert geometrische representaties, oppervlakken en volumes. Video beantwoordt "wat gebeurt er hierna?" Ruimtelijke AI beantwoordt "wat bestaat hier?"
Het convergentiepunt: navigeerbare video. Genereer een 3D-wereld, render daarna video terwijl je erdoorheen beweegt. Deze aanpak biedt cameracontrole die onmogelijk is met pure videogeneratie.
Beperkingen om rekening mee te houden
Marble is geen complete oplossing:
- ○Geen geanimeerde personages of dynamische elementen
- ○Generatielimieten kunnen productie-workflows beperken
- ○Randdegradatie vereist uitbreidingspasses
- ○Alleen statische omgevingen
Voor geanimeerde content heb je nog steeds videogeneratiemodellen nodig. Marble blinkt uit in omgevingen en ruimtes, niet in acteurs of acties.
Het grotere plaatje
Fei-Fei Li ziet ruimtelijke intelligentie als essentieel voor AI-vooruitgang:
"Ik denk dat we allemaal een verantwoordelijkheid hebben om AI naar een betere staat te brengen naarmate het krachtiger wordt. We moeten allemaal willen dat de mensheid wint en bloeit."
Haar visie gaat verder dan entertainment. Medische simulaties waar studenten anatomie verkennen. Wetenschappelijke visualisaties waar onderzoekers door moleculaire structuren navigeren. Robotica-trainingsomgevingen die on-demand gegenereerd worden.
Marble is stap één, een commercieel proof of concept. Het onderzoek gaat door naar meer dynamische, interactieve en fysiek nauwkeurige wereldgeneratie.
Aan de slag
World Labs biedt een gratis niveau met 4 generaties per maand. Genoeg om de technologie te evalueren en de beperkingen te begrijpen.
Voor makers die al in 3D werken, integreert de mesh-export met bestaande pipelines. Voor videoproducers biedt de video-export pre-visualisatiemogelijkheden die nergens anders beschikbaar zijn.
Gerelateerde lectuur: Onze gids voor AI-video karakterconsistentie behandelt technieken voor het behouden van coherentie over gegenereerde content, een uitdaging die Marble aanpakt door persistente 3D-representatie.
De transitie van 2D-generatie naar 3D-wereldcreatie vertegenwoordigt een fundamentele verschuiving in wat AI kan produceren. Marble maakt die verschuiving toegankelijk.
Was dit artikel nuttig?

Alexis
AI IngenieurAI ingenieur uit Lausanne die onderzoeksdiepgang combineert met praktische innovatie. Verdeelt zijn tijd tussen modelarchitecturen en Alpentoppen.
Gerelateerde artikelen
Ontdek meer met deze gerelateerde posts

Runway GWM-1: Het General World Model dat de werkelijkheid in real-time simuleert
Runway's GWM-1 markeert een paradigmaverschuiving van video's genereren naar werelden simuleren. Ontdek hoe dit autoregressieve model verkenbare omgevingen, fotorealistische avatars en robottrainingsimulaties creëert.

YouTube Brengt Veo 3 Fast naar Shorts: Gratis AI-Videogeneratie voor 2,5 Miljard Gebruikers
Google integreert zijn Veo 3 Fast-model direct in YouTube Shorts en biedt gratis tekst-naar-video generatie met audio voor creators wereldwijd. Dit is wat het betekent voor het platform en de toegankelijkheid van AI-video.

Video Taalmodellen: De Volgende Grens na LLMs en AI-Agents
Wereldmodellen leren AI de fysieke realiteit begrijpen, waardoor robots acties kunnen plannen en uitkomsten kunnen simuleren voordat ze ook maar een actuator bewegen.