Meta Pixel
AlexisAlexis
6 min read
1110 Wierder

World Labs Marble: Fei-Fei Li hir Visioun fir räimlech Intelligenz

D'KI-Pionierin Fei-Fei Li presentéiert Marble, eng kommerziell Plattform déi erforschbar 3D-Welten aus Text a Biller generéiert. Dëst markéiert en neie Mäilestein an der räimlecher KI.

World Labs Marble: Fei-Fei Li hir Visioun fir räimlech Intelligenz
D'Fuerscherin, déi Maschinnen d'Gesinn bäibruecht huet, léiert se elo ganz Welten ze kreéieren. Mat World Labs Marble mécht Fei-Fei Li den nächste Schrëtt iwwer Videogeneréierung eraus a persistent, erforschbar 3D-Ëmgéigenden.

Vun ImageNet zu World Models

💡

Fir Kontext, wéi World Models an d'Evolutioun vun der KI-Videogeneréierung anzeuerdnen sinn, kuckt eis Iwwerbléck zu World Models als nächst Grenz.

Fei-Fei Li huet Computer Vision mat ImageNet revolutionéiert, dem Dataset, dee modern Deep Learning méiglech gemaach huet. No engem Joer vum Opbau vu World Labs mat 230 Milliounen Dollar Finanzéierung presentéiert si elo Marble, dat éischt kommerziellt Produkt vun der Firma.

D'These ass kloer: KI huet Text gemeeschtert, dunn Biller, dunn Video. Déi nächst Grenz ass räimlech Intelligenz – d'Fäegkeet, 3D-Welten wouerhuelen, ze generéieren a mat hinnen ze interagéieren.

230 Mio. $
Finanzéierung
4
Präisstufen
3D
Native Ausgab

Wéi Marble funktionéiert

Marble generéiert persistent, erofluedbar 3D-Ëmgéigenden aus verschiddenen Agabstypen:

  • Text-Prompts
  • Eenzel Biller
  • Videoen
  • Panoramen
  • 3D-Layouts

Anescht wéi Echtzäit-World-Models vu Konkurrenten wéi Decarts Oasis oder Googles Genie erstellt Marble stabil Welten mat minimaler Verformung. Dir generéiert eemol, erfuerscht dunn fräi, ouni datt d'KI "vergësst", wat se erstallt huet.

Den Chisel-Editor

🔨

KI-native 3D-Beaarbechtung

Chisel trennt räimlech Struktur vu visuellem Stil. Definéiert als éischt Äert Layout, wendelt dunn textbaséiert Stilrichtlinne un.

Dësen hybriden Approche ënnerscheet Marble vun Text-zu-Szene-Modeller. Amplaz ze hoffen, datt d'KI Är räimlech Intentioun versteet, definéiert Dir d'Geometrie explizit. D'KI iwwerhëlt Ästhetik, Materialien a Beliichtung.

Vergläichbar mam Skizzéieren vun engem Grondplang, ier Dir en Innenarchitekt mat der Dekoratioun beoptaart. D'Kontroll iwwer räimlech Bezéiungen bleift bei Iech.

Exportformater a Kompatibilitéit

Generéiert Welten ginn an dräi Formater exportéiert:

FormatUnwendungsfall
Gaussian SplatsEchtzäit-Rendering, nei Perspektiven
MeshesGame Engines, CAD-Integratioun
VideoenContent-Erstellung, Pre-Visualiséierung
💡

All Marble-Welten si standardméisseg VR-kompatibel mat Vision Pro a Quest 3 Headsets.

Präisstruktur

World Labs bitt véier Stufen:

StufPräisGeneréierungenHaaptfunktiounen
Free0 $4/MountText-, Bild- oder Panorama-Agab
Standard20 $/Mount12/MountMulti-Bild-/Video-Agab, erweidert Beaarbechtung
Pro35 $/Mount25/MountSzenen-Erweiderung, kommerziell Rechter
Max95 $/Mount75/MountAll Funktiounen, maximal Generéierungen

Déi gratis Stuf erlaabt d'Evaluéierung vun der Technologie. Fir Produktiounsaarbecht mat kommerziellen Rechter stellt d'Pro-Stuf fir 35 $/Mount en ugemessenen Astiegspräis fir esou eng neuaarteg Fäegkeet duer.

Firwat räimlech Intelligenz relevant ass

"Räimlech Intelligenz ass déi entscheedend Erausfuerderung vum nächste Joerzéngt." - Fei-Fei Li

Li argumentéiert, datt aktuell KI eng fundamental Aschränkung huet: Si veraarbecht 3D-Raum onzoureichend. Sproochmodeller halluzinéieren Physik. Videomodeller erzeien onméiglech Geometrien. Bild-Generatoren hunn Schwieregkeeten mat konsistente räimleche Bezéiungen.

Aktuell Approchen
Videomodeller generéieren Bildsequenzen ouni richtegt 3D-Verständnis. Kamerabewegungen offenbaren Inkonsistenzen. Objeten änneren Positioun oder verschwannen.
Räimlech Intelligenz
Native 3D-Representatioun erméiglecht physikalesch konsistent Welten. Beweegt d'Kamera fräi. D'Ëmgéigung bleift bestoen, well si als Geometrie existéiert, net als Pixel.

Fir Robotik ass dat vu groussem Bedeiten. E Roboter, dee sech an enger Kichen beweegt, brauch räimlecht Verständnis, keng Frame-Virsoen. Fir VFX brauchen Regisseuren erforschbar Ëmgéigenden, keng fest Kamerapfaad.

Sech entwécklend Unwendungsfäll

Gaming Generéierung vun atmosphäreschen Ëmgéigenden a Hannergrondberäicher. Indie-Entwéckler kënnen Erforschungsgebidder erstellen, déi Mount vun traditioneller Konschtproduktioun erfuerderen géifen.

Visuell Effekter Pre-Visualiséierung gëtt interaktiv. Blockéiert eng Szen räimlech aus, erfuerscht dunn Kamerawénkelen, ier Dir Iech op Ophuelen festleet.

Architektur Konvertéierung vu Grondpläng zu erforschbare Ronddéierungen. Clienten erliewen Raim virun der Bauunnfank.

Bildung Li stellt sech vir, wéi Studenten duerch eng Zell ginn, Chirurge an anatomesche Simulatiounen üben.

World Expansion a Composer Mode

Zwou Funktiounen adresséieren Skaléierungsaschränkungen:

World Expansion erlaabt d'eemoleg Erweiderung vun enger generéierter Welt, wou Detailer a Randberäicher bäigefüügt ginn, wou d'Qualitéit typesch ofhëlt. Dëst erweidert d'Grenzen vum erforschbare Raum iwwer déi initial Generéierungslimiten eraus.

Composer Mode kombinéiert méi Welten zu méi grousse Ëmgéigenden. Generéiert eenzel Raim, setzt se dunn zu engem komplette Gebai zesummen.

Dës Werkzeeën erkennen aktuell Aschränkungen un a bidden praktesch Léisungen.

D'Konkurrenzëmfeld

Marble trëtt an e bekämpfte Feld an:

ProduktApprocheËnnerscheedungsmerkmal
Decart OasisEchtzäit-SpillgeneréierungInteraktiv, awer Welten verréckelen sech wärend der Erforschung
Google GenieSpillweltgeneréierungFrame-Virsoen ouni richtegt 3D
OdysseyPersistent World ModelsEnterprise-Fokus
World Labs MarbleStatesch 3D-GeneréierungErofluedbar, beaarbedbar, VR-fäeg

De Kompromëss ass eendeiteg. Echtzäit-Modeller wéi Oasis bidden Ëmmeddelschheet, awer Instabilitéit. Marble priorisséiert Persistenz an Editéierbarkeet géigeniwwer Interaktivitéit.

Verbindung zur Videogeneréierung

💡

Fir Hannergrondsinformatiounen zu Diffusiounsarchitekturen a räimlecher KI kuckt eis technesch Iwwerbléck zu Diffusion Transformers.

Wéi verhält sech 3D-Weltgeneréierung zur Videogeneréierung? Si deelen mathematesch Grondlagen a Diffusiounsmodeller, léisen awer ënnerschiddlech Problemer.

Videogeneréierung erstellt temporal Sequenzen, Frame fir Frame. Räimlech KI erstellt geometresch Representatiounen, Uerflächenen a Volummen. Video äntwert "wat passéiert als Nächst?" Räimlech KI äntwert "wat existéiert hei?"

De Konvergenzpunkt: navigéierbar Video. Generéiert eng 3D-Welt, rendert dunn Video wärend der Beweegung duerch dës. Dësen Approche bitt Kamerakontroll, déi mat pure Videogeneréierung onméiglech ass.

Ze berücksichtegend Aschränkungen

Marble ass keng komplett Léisung:

  • Keng animéiert Charakteren oder dynamesch Elementer
  • Generéierungslimiten kënne Produktiouns-Workflows aschränken
  • Randdegradatioun erfuerdert Erweiderungsduerchläf
  • Nëmme statesch Ëmgéigenden

Fir animéiert Inhalter braucht Dir nach ëmmer Videogeneréierungsmodeller. Marble eegent sech fir Ëmgéigenden a Raim, net fir Akteuren oder Handlungen.

Dat méi grouss Bild

Fei-Fei Li kuckt räimlech Intelligenz als essentiell fir de Fortschrëtt vun der KI:

"Mir all droen Verantwortung dofir, KI an e besseren Zoustand ze bréngen, wärend se méi mächteg gëtt. Mir all solle wëllen, datt d'Mënschheet gewënnt a gedeift."

Hir Visioun geet iwwer Ënnerhaltung eraus. Medezinesch Simulatiounen, wou Studenten Anatomie erfuerschen. Wëssenschaftlech Visualiséierungen, wou Fuerscher duerch molekular Strukturen navigéieren. Roboter-Trainingsëmgéigenden, déi op Oprouf generéiert ginn.

Marble ass Schrëtt eent, e kommerziellen Proof of Concept. D'Fuerschung geet weider a Richtung dynamesch, interaktiv a physikalesch méi genee Weltgeneréierung.

Éischt Schrëtt

World Labs bitt eng gratis Stuf mat 4 Generéierungen pro Mount. Genuch, fir d'Technologie ze evaluéieren an hir Grenzen ze verstoen.

Fir Kreativen, déi scho a 3D schaffen, integréiert d'Mesh-Export-Fäegkeet sech a bestehend Pipelines. Fir Videoproduzenten bitt de Video-Export Pre-Visualiséierungsfäegkeeten, déi aneschterwou net verfügbar sinn.

💡

Weiderféierend Lektür: Eis Leedung zur Charakterkonsistenz an KI-Videoen behandelt Techniken zur Erhaltung vun der Kohärenz iwwer generéierten Content, eng Erausfuerderung, déi Marble duerch persistent 3D-Representatioun adresséiert.

Den Iwwergang vun 2D-Generéierung zu 3D-Welterstellung stellt e fundamentale Wandel vu deem duer, wat KI produzéiere kann. Marble mécht dëse Wandel zougänglech.

War dësen Artikel hëllefräich?

Alexis

Alexis

KI-Ingenieur

KI-Ingenieur aus Lausanne, deen Fuerschungsdetail mat praktescher Innovatioun kombinéiert. Deelt seng Zäit tëscht Modell-Architekturen an alpinne Gëpfelen.

Verbonne Artikelen

Entdeckt weider mat dësen verbonnenen Artikelen

Huet Iech dësen Artikel gefall?

Entdeckt weider Ablécker a bleift mat eisen neisten Inhalter um Lafenden.

World Labs Marble: Fei-Fei Li hir Visioun fir räimlech Intelligenz