World Labs Marble: Il-Viżjoni ta' Fei-Fei Li għall-Intelliġenza Spazjali
Il-pijuniera tal-AI Fei-Fei Li tniedi Marble, pjattaforma kummerċjali li tiġġenera dinjiet 3D esplorabli minn test u immaġini, u timmarkja fruntiera ġdida fl-AI spazjali.

Minn ImageNet għal Mudelli tad-Dinja
Għal kuntest dwar kif il-mudelli tad-dinja jidħlu fl-evoluzzjoni tal-vidjo AI, ara l-ħarsa ġenerali tagħna tal-mudelli tad-dinja bħala l-fruntiera li jmiss.
Fei-Fei Li rivoluzzjonat il-viżjoni tal-kompjuter b'ImageNet, is-sett tad-data li għamel possibbli t-tagħlim profond modern. Issa, wara sena libniet World Labs b'$230 miljun f'finanzjament, hi nediet Marble, l-ewwel prodott kummerċjali tal-kumpanija.
It-teżi hija sempliċi: l-AI rebħet it-test, imbagħad l-immaġini, imbagħad il-vidjo. Il-fruntiera li jmiss hija l-intelliġenza spazjali, il-kapaċità li tipperċepi, tiġġenera u tinteraġixxi ma' dinjiet 3D.
X'Jagħmel Marble
Marble jiġġenera ambjenti 3D persistenti u downloadable minn diversi tipi ta' input:
- ✓Prompts tat-test
- ✓Immaġini waħdanin
- ✓Vidjows
- ✓Panorami
- ✓Layouts 3D
B'differenza mill-mudelli tad-dinja f'ħin reali tal-kompetizzjoni bħal Oasis ta' Decart jew Genie ta' Google, Marble joħloq dinjiet stabbli b'morphing minimu. Tiġġenera darba, imbagħad tesplora liberament mingħajr ma l-AI "tinsa" dak li ħolqot.
L-Editur Chisel
Editjar 3D Nattiv AI
Chisel jissepara l-istruttura spazjali mill-istil viżwali. L-ewwel abbozza l-layout tiegħek, imbagħad applika gwida ta' stil ibbażata fuq test.
Dan l-approċċ ibridu jiddistingwi Marble mill-mudelli test-għal-xena. Minflok ma tittama li l-AI jifhem l-intenzjoni spazjali tiegħek, iddefinixxi l-ġeometrija espliċitament. L-AI jimmaniġġja l-estetika, il-materjali u d-dawl.
Aħseb fuqha bħala li tiġbed pjanta ta' art qabel ma tistaqsi lil designer tal-interni biex jiddekoraw. Il-kontroll fuq ir-relazzjonijiet spazjali jibqa' tiegħek.
Formati ta' Export u Kompatibilità
Id-dinjiet iġġenerati jesportaw fi tliet formati:
| Format | Każ tal-Użu |
|---|---|
| Gaussian Splats | Rendering f'ħin reali, veduti ġodda |
| Meshes | Muturi tal-logħob, integrazzjoni CAD |
| Vidjows | Ħolqien tal-kontenut, previżwalizzazzjoni |
Id-dinjiet kollha ta' Marble huma kompatibbli VR ma' headsets Vision Pro u Quest 3 mill-bidu.
Struttura tal-Prezzijiet
World Labs toffri erba' livelli:
| Livell | Prezz | Ġenerazzjonijiet | Karatteristiċi Ewlenin |
|---|---|---|---|
| Ħieles | $0 | 4/xahar | Input ta' test, immaġni jew panorama |
| Standard | $20/xahar | 12/xahar | Input multi-immaġni/vidjo, editjar avvanzat |
| Pro | $35/xahar | 25/xahar | Espansjoni tax-xena, drittijiet kummerċjali |
| Max | $95/xahar | 75/xahar | Il-karatteristiċi kollha, ġenerazzjonijiet massimi |
Il-livell ħieles jippermettilek tevalwa t-teknoloġija. Għal xogħol ta' produzzjoni li jeħtieġ drittijiet kummerċjali, il-livell Pro f'$35/xahar jirrappreżenta prezz ta' dħul raġonevoli għal kapaċità daqshekk ġdida.
Għaliex l-Intelliġenza Spazjali Timporta
"L-intelliġenza spazjali hija l-isfida li tiddefinixxi d-deċennju li ġej." - Fei-Fei Li
Li targumenta li l-AI attwali għandha limitazzjoni fundamentali: tirraġuna ħażin dwar l-ispazju 3D. Il-mudelli tal-lingwa jaħluċinaw il-fiżika. Il-mudelli tal-vidjo joħolqu ġeometriji impossibbli. Il-ġeneraturi tal-immaġini jitħabtu ma' relazzjonijiet spazjali konsistenti.
Għar-robotika, dan jimporta ħafna. Robot li jinaviga f'kċina jeħtieġ fehim spazjali, mhux tbassir ta' frames. Għall-effetti viżwali, id-diretturi jeħtieġu ambjenti esplorabli, mhux trajettorji fissi tal-kamera.
Każijiet tal-Użu qed Jiffurmaw
Gaming Iġġenera ambjenti ambjentali u spazji ta' sfond. L-iżviluppaturi indipendenti jistgħu joħolqu żoni ta' esplorazzjoni li jkunu jeħtieġu xhur ta' produzzjoni artістika tradizzjonali.
Effetti Viżwali Il-previżwalizzazzjoni ssir interattiva. Abbozza xena spazjalment, imbagħad esplora angoli tal-kamera qabel timpenjak ruħek għal shots.
Arkitettura Ikkonverti pjanti ta' art fi walkthrough esplorabli. Il-klijenti jesperjenżaw spazji qabel ma tinbeda l-kostruzzjoni.
Edukazzjoni Li jimmaġina studenti jimxu ġewwa ċellula, kirurgi jipprattikaw ġewwa simulazzjonijiet anatomiċi.
Espansjoni tad-Dinja u Modalità Composer
Żewġ karatteristiċi jindirizzaw limitazzjonijiet ta' skala:
L-Espansjoni tad-Dinja tippermettik testendi dinja ġġenerata darba, żżid dettalji għar-reġjuni periferali fejn il-kwalità tipikament tiddegrada. Dan jimbotta l-limiti tal-ispazju esplorabbli lil hinn mil-limiti inizjali ta' ġenerazzjoni.
Il-Modalità Composer tgħaqqad diversi dinjiet f'ambjenti akbar. Iġġenera kmamar individwali, imbagħad oħrojhom f'bini sħiħ.
Dawn l-għodod jirrikonoxxu l-kostrizzjonijiet attwali filwaqt li jipprovdu soluzzjonijiet prattiċi.
Il-Pajsaġġ tal-Kompetizzjoni
Marble jidħol f'qasam mixħun:
| Prodott | Approċċ | Differenzjatur |
|---|---|---|
| Decart Oasis | Ġenerazzjoni tal-logħba f'ħin reali | Interattiv, iżda d-dinjiet jinbidlu waqt l-esplorazzjoni |
| Google Genie | Ġenerazzjoni tad-dinja tal-logħba | Tbassir ta' frames mingħajr 3D veru |
| Odyssey | Mudelli tad-dinja persistenti | Fokus enterprise |
| World Labs Marble | Ġenerazzjoni 3D statika | Downloadable, editjabbli, VR-ready |
Il-kompromess huwa ċar. Il-mudelli f'ħin reali bħal Oasis joffru immedjatezza iżda instabbiltà. Marble jipprijoritizza l-persistenza u l-editjabbiltà fuq l-interattività.
Konnessjoni mal-Ġenerazzjoni tal-Vidjo
Għal kuntest dwar l-arkitetturi ta' diffużjoni użati fl-AI spazjali, ara l-ħarsa ġenerali teknika tagħna tat-trasformaturi ta' diffużjoni.
Kif tiġġenera dinjiet 3D tirrelata mal-vidjo? Jaqsmu fundamenti matematiċi fil-mudelli ta' diffużjoni, iżda jsolvu problemi differenti.
Il-ġenerazzjoni tal-vidjo toħloq sekwenzi temporali, frame wara frame. L-AI spazjali toħloq rappreżentazzjonijiet ġeometriċi, uċuħ u volumi. Il-vidjo jwieġeb "x'jiġri wara?" L-AI spazjali jwieġeb "x'jeżisti hawn?"
Il-punt ta' konverġenza: vidjo navigabbli. Iġġenera dinja 3D, imbagħad irrendja l-vidjo waqt li timxi permezz tagħha. Dan l-approċċ joffri kontroll tal-kamera impossibbli bil-ġenerazzjoni tal-vidjo pura.
Limitazzjonijiet li Għandhom Jitqiesu
Marble mhux soluzzjoni kompluta:
- ○L-ebda karattri animati jew elementi dinamiċi
- ○Il-caps tal-ġenerazzjoni jistgħu jillimitaw il-workflows ta' produzzjoni
- ○Id-degradazzjoni tal-limiti teħtieġ passi ta' espansjoni
- ○Ambjenti statiċi biss
Għal kontenut animat, għad għandek bżonn mudelli ta' ġenerazzjoni tal-vidjo. Marble jeċċella fl-ambjenti u l-ispazji, mhux fl-atturi jew l-azzjonijiet.
Il-Kwadru l-Kbir
Fei-Fei Li tara l-intelliġenza spazjali bħala essenzjali għall-progress tal-AI:
"Naħseb li lkoll għandna responsabbiltà li nmexxu l-AI lejn stat aħjar hekk kif isir aktar qawwi. Lkoll għandna nixtiequ li l-umanità tipprevali u tiffjorixxi."
Il-viżjoni tagħha testendi lil hinn mill-intratteniment. Simulazzjonijiet mediċi fejn l-istudenti jesploraw l-anatomija. Viżwalizzazzjonijiet xjentifiċi fejn ir-riċerkaturi jnavigaw strutturi molekulari. Ambjenti ta' taħriġ robotiku ġġenerati fuq talba.
Marble huwa l-ewwel pass, prova ta' kunċett kummerċjali. Ir-riċerka tkompli lejn ġenerazzjoni tad-dinja aktar dinamika, interattiva u fiżikament preċiża.
Kif Tibda
World Labs toffri livell ħieles b'4 ġenerazzjonijiet fix-xahar. Biżżejjed biex tevalwa t-teknoloġija u tifhem il-kostrizzjonijiet tagħha.
Għall-kreaturi li diġà jaħdmu fi 3D, il-kapaċità ta' export tal-mesh tintegra mal-pipelines eżistenti. Għall-produtturi tal-vidjo, l-export tal-vidjo jipprovdi kapaċitajiet ta' previżwalizzazzjoni mhux disponibbli x'imkien ieħor.
Qari relatat: Il-gwida tagħna dwar il-konsistenza tal-karattri fil-vidjo AI tkopri tekniki biex tinżamm il-koerenza fil-kontenut iġġenerat, sfida li Marble tindirizza permezz tar-rappreżentazzjoni 3D persistenti.
It-tranżizzjoni mill-ġenerazzjoni 2D għall-ħolqien ta' dinjiet 3D tirrappreżenta bidla fundamentali f'dak li l-AI tista' tipproduċi. Marble jagħmel din il-bidla aċċessibbli.
Dan l-artiklu kien utli?

Alexis
Inġinier AIInġinier AI minn Lausanne li jgħaqqad riċerka profonda ma' innovazzjoni prattika. Jaqsam iż-żmien bejn arkitetturi tal-mudelli u l-qċaċet Alpini.
Artikli Relatati
Kompli esplora b'dawn il-postijiet relatati

Runway GWM-1: Il-Mudell Dinji Ġenerali li Jissimula r-Realtà f'Ħin Reali
Il-GWM-1 ta' Runway jimarka bidla paradiġmatika mill-ġenerazzjoni ta' videos għas-simulazzjoni ta' dinjiet. Esplora kif dan il-mudell awtoregressiv joħloq ambjenti esplorabbli, avatars fotorealistiċi u simulazzjonijiet ta' taħriġ għar-robots.

YouTube Iġib Veo 3 Fast għal Shorts: Ġenerazzjoni ta' Video bl-IA B'xejn għal 2.5 Biljun Utent
Google tintegra l-mudell Veo 3 Fast direttament f'YouTube Shorts, toffri ġenerazzjoni ta' video mit-test għall-awdjo b'xejn għall-kreaturi madwar id-dinja. Dan hu x'ifisser għall-pjattaforma u l-aċċessibbiltà tal-video bl-IA.

Mudelli tal-Lingwa tal-Vidjo: Il-Fruntiera li Jmiss Wara LLMs u Agenti AI
Il-mudelli tad-dinja qeghdin jghallmu lill-AI biex jifhem ir-realta fizika, u b'hekk jippermettu lir-robots jippjanaw azzjonijiet u jsimmulaw rizultati qabel ma jcaqalqu anke attwatur wiehed.