Meta Pixel
AlexisAlexis
6 min read
1104 kelmiet

World Labs Marble: Il-Viżjoni ta' Fei-Fei Li għall-Intelliġenza Spazjali

Il-pijuniera tal-AI Fei-Fei Li tniedi Marble, pjattaforma kummerċjali li tiġġenera dinjiet 3D esplorabli minn test u immaġini, u timmarkja fruntiera ġdida fl-AI spazjali.

World Labs Marble: Il-Viżjoni ta' Fei-Fei Li għall-Intelliġenza Spazjali
Ir-riċerkatriċi li tat lill-magni l-kapaċità li jaraw qed tgħallimhom issa jimmaġinaw dinjiet sħaħ. B'World Labs Marble, Fei-Fei Li tieħu l-pass li jmiss lil hinn mill-ġenerazzjoni tal-vidjo lejn ambjenti 3D persistenti u esplorabli.

Minn ImageNet għal Mudelli tad-Dinja

💡

Għal kuntest dwar kif il-mudelli tad-dinja jidħlu fl-evoluzzjoni tal-vidjo AI, ara l-ħarsa ġenerali tagħna tal-mudelli tad-dinja bħala l-fruntiera li jmiss.

Fei-Fei Li rivoluzzjonat il-viżjoni tal-kompjuter b'ImageNet, is-sett tad-data li għamel possibbli t-tagħlim profond modern. Issa, wara sena libniet World Labs b'$230 miljun f'finanzjament, hi nediet Marble, l-ewwel prodott kummerċjali tal-kumpanija.

It-teżi hija sempliċi: l-AI rebħet it-test, imbagħad l-immaġini, imbagħad il-vidjo. Il-fruntiera li jmiss hija l-intelliġenza spazjali, il-kapaċità li tipperċepi, tiġġenera u tinteraġixxi ma' dinjiet 3D.

$230M
Finanzjament Miġbur
4
Livelli ta' Prezzijiet
3D
Output Nattiv

X'Jagħmel Marble

Marble jiġġenera ambjenti 3D persistenti u downloadable minn diversi tipi ta' input:

  • Prompts tat-test
  • Immaġini waħdanin
  • Vidjows
  • Panorami
  • Layouts 3D

B'differenza mill-mudelli tad-dinja f'ħin reali tal-kompetizzjoni bħal Oasis ta' Decart jew Genie ta' Google, Marble joħloq dinjiet stabbli b'morphing minimu. Tiġġenera darba, imbagħad tesplora liberament mingħajr ma l-AI "tinsa" dak li ħolqot.

L-Editur Chisel

🔨

Editjar 3D Nattiv AI

Chisel jissepara l-istruttura spazjali mill-istil viżwali. L-ewwel abbozza l-layout tiegħek, imbagħad applika gwida ta' stil ibbażata fuq test.

Dan l-approċċ ibridu jiddistingwi Marble mill-mudelli test-għal-xena. Minflok ma tittama li l-AI jifhem l-intenzjoni spazjali tiegħek, iddefinixxi l-ġeometrija espliċitament. L-AI jimmaniġġja l-estetika, il-materjali u d-dawl.

Aħseb fuqha bħala li tiġbed pjanta ta' art qabel ma tistaqsi lil designer tal-interni biex jiddekoraw. Il-kontroll fuq ir-relazzjonijiet spazjali jibqa' tiegħek.

Formati ta' Export u Kompatibilità

Id-dinjiet iġġenerati jesportaw fi tliet formati:

FormatKaż tal-Użu
Gaussian SplatsRendering f'ħin reali, veduti ġodda
MeshesMuturi tal-logħob, integrazzjoni CAD
VidjowsĦolqien tal-kontenut, previżwalizzazzjoni
💡

Id-dinjiet kollha ta' Marble huma kompatibbli VR ma' headsets Vision Pro u Quest 3 mill-bidu.

Struttura tal-Prezzijiet

World Labs toffri erba' livelli:

LivellPrezzĠenerazzjonijietKaratteristiċi Ewlenin
Ħieles$04/xaharInput ta' test, immaġni jew panorama
Standard$20/xahar12/xaharInput multi-immaġni/vidjo, editjar avvanzat
Pro$35/xahar25/xaharEspansjoni tax-xena, drittijiet kummerċjali
Max$95/xahar75/xaharIl-karatteristiċi kollha, ġenerazzjonijiet massimi

Il-livell ħieles jippermettilek tevalwa t-teknoloġija. Għal xogħol ta' produzzjoni li jeħtieġ drittijiet kummerċjali, il-livell Pro f'$35/xahar jirrappreżenta prezz ta' dħul raġonevoli għal kapaċità daqshekk ġdida.

Għaliex l-Intelliġenza Spazjali Timporta

"L-intelliġenza spazjali hija l-isfida li tiddefinixxi d-deċennju li ġej." - Fei-Fei Li

Li targumenta li l-AI attwali għandha limitazzjoni fundamentali: tirraġuna ħażin dwar l-ispazju 3D. Il-mudelli tal-lingwa jaħluċinaw il-fiżika. Il-mudelli tal-vidjo joħolqu ġeometriji impossibbli. Il-ġeneraturi tal-immaġini jitħabtu ma' relazzjonijiet spazjali konsistenti.

Approċċi Attwali
Il-mudelli tal-vidjo jiġġeneraw sekwenzi ta' frames mingħajr fehim 3D vera. Il-movimenti tal-kamera jiżvelaw inkonsistenzi. L-oġġetti jbiddlu pożizzjoni jew jisparixxi.
Intelliġenza Spazjali
Ir-rappreżentazzjoni 3D nattiva tippermetti dinjiet fiżikament konsistenti. Mexxi l-kamera liberament. L-ambjent jippersisti għaliex jeżisti bħala ġeometrija, mhux bħala pixels.

Għar-robotika, dan jimporta ħafna. Robot li jinaviga f'kċina jeħtieġ fehim spazjali, mhux tbassir ta' frames. Għall-effetti viżwali, id-diretturi jeħtieġu ambjenti esplorabli, mhux trajettorji fissi tal-kamera.

Każijiet tal-Użu qed Jiffurmaw

Gaming Iġġenera ambjenti ambjentali u spazji ta' sfond. L-iżviluppaturi indipendenti jistgħu joħolqu żoni ta' esplorazzjoni li jkunu jeħtieġu xhur ta' produzzjoni artістika tradizzjonali.

Effetti Viżwali Il-previżwalizzazzjoni ssir interattiva. Abbozza xena spazjalment, imbagħad esplora angoli tal-kamera qabel timpenjak ruħek għal shots.

Arkitettura Ikkonverti pjanti ta' art fi walkthrough esplorabli. Il-klijenti jesperjenżaw spazji qabel ma tinbeda l-kostruzzjoni.

Edukazzjoni Li jimmaġina studenti jimxu ġewwa ċellula, kirurgi jipprattikaw ġewwa simulazzjonijiet anatomiċi.

Espansjoni tad-Dinja u Modalità Composer

Żewġ karatteristiċi jindirizzaw limitazzjonijiet ta' skala:

L-Espansjoni tad-Dinja tippermettik testendi dinja ġġenerata darba, żżid dettalji għar-reġjuni periferali fejn il-kwalità tipikament tiddegrada. Dan jimbotta l-limiti tal-ispazju esplorabbli lil hinn mil-limiti inizjali ta' ġenerazzjoni.

Il-Modalità Composer tgħaqqad diversi dinjiet f'ambjenti akbar. Iġġenera kmamar individwali, imbagħad oħrojhom f'bini sħiħ.

Dawn l-għodod jirrikonoxxu l-kostrizzjonijiet attwali filwaqt li jipprovdu soluzzjonijiet prattiċi.

Il-Pajsaġġ tal-Kompetizzjoni

Marble jidħol f'qasam mixħun:

ProdottApproċċDifferenzjatur
Decart OasisĠenerazzjoni tal-logħba f'ħin realiInterattiv, iżda d-dinjiet jinbidlu waqt l-esplorazzjoni
Google GenieĠenerazzjoni tad-dinja tal-logħbaTbassir ta' frames mingħajr 3D veru
OdysseyMudelli tad-dinja persistentiFokus enterprise
World Labs MarbleĠenerazzjoni 3D statikaDownloadable, editjabbli, VR-ready

Il-kompromess huwa ċar. Il-mudelli f'ħin reali bħal Oasis joffru immedjatezza iżda instabbiltà. Marble jipprijoritizza l-persistenza u l-editjabbiltà fuq l-interattività.

Konnessjoni mal-Ġenerazzjoni tal-Vidjo

💡

Għal kuntest dwar l-arkitetturi ta' diffużjoni użati fl-AI spazjali, ara l-ħarsa ġenerali teknika tagħna tat-trasformaturi ta' diffużjoni.

Kif tiġġenera dinjiet 3D tirrelata mal-vidjo? Jaqsmu fundamenti matematiċi fil-mudelli ta' diffużjoni, iżda jsolvu problemi differenti.

Il-ġenerazzjoni tal-vidjo toħloq sekwenzi temporali, frame wara frame. L-AI spazjali toħloq rappreżentazzjonijiet ġeometriċi, uċuħ u volumi. Il-vidjo jwieġeb "x'jiġri wara?" L-AI spazjali jwieġeb "x'jeżisti hawn?"

Il-punt ta' konverġenza: vidjo navigabbli. Iġġenera dinja 3D, imbagħad irrendja l-vidjo waqt li timxi permezz tagħha. Dan l-approċċ joffri kontroll tal-kamera impossibbli bil-ġenerazzjoni tal-vidjo pura.

Limitazzjonijiet li Għandhom Jitqiesu

Marble mhux soluzzjoni kompluta:

  • L-ebda karattri animati jew elementi dinamiċi
  • Il-caps tal-ġenerazzjoni jistgħu jillimitaw il-workflows ta' produzzjoni
  • Id-degradazzjoni tal-limiti teħtieġ passi ta' espansjoni
  • Ambjenti statiċi biss

Għal kontenut animat, għad għandek bżonn mudelli ta' ġenerazzjoni tal-vidjo. Marble jeċċella fl-ambjenti u l-ispazji, mhux fl-atturi jew l-azzjonijiet.

Il-Kwadru l-Kbir

Fei-Fei Li tara l-intelliġenza spazjali bħala essenzjali għall-progress tal-AI:

"Naħseb li lkoll għandna responsabbiltà li nmexxu l-AI lejn stat aħjar hekk kif isir aktar qawwi. Lkoll għandna nixtiequ li l-umanità tipprevali u tiffjorixxi."

Il-viżjoni tagħha testendi lil hinn mill-intratteniment. Simulazzjonijiet mediċi fejn l-istudenti jesploraw l-anatomija. Viżwalizzazzjonijiet xjentifiċi fejn ir-riċerkaturi jnavigaw strutturi molekulari. Ambjenti ta' taħriġ robotiku ġġenerati fuq talba.

Marble huwa l-ewwel pass, prova ta' kunċett kummerċjali. Ir-riċerka tkompli lejn ġenerazzjoni tad-dinja aktar dinamika, interattiva u fiżikament preċiża.

Kif Tibda

World Labs toffri livell ħieles b'4 ġenerazzjonijiet fix-xahar. Biżżejjed biex tevalwa t-teknoloġija u tifhem il-kostrizzjonijiet tagħha.

Għall-kreaturi li diġà jaħdmu fi 3D, il-kapaċità ta' export tal-mesh tintegra mal-pipelines eżistenti. Għall-produtturi tal-vidjo, l-export tal-vidjo jipprovdi kapaċitajiet ta' previżwalizzazzjoni mhux disponibbli x'imkien ieħor.

💡

Qari relatat: Il-gwida tagħna dwar il-konsistenza tal-karattri fil-vidjo AI tkopri tekniki biex tinżamm il-koerenza fil-kontenut iġġenerat, sfida li Marble tindirizza permezz tar-rappreżentazzjoni 3D persistenti.

It-tranżizzjoni mill-ġenerazzjoni 2D għall-ħolqien ta' dinjiet 3D tirrappreżenta bidla fundamentali f'dak li l-AI tista' tipproduċi. Marble jagħmel din il-bidla aċċessibbli.

Dan l-artiklu kien utli?

Alexis

Alexis

Inġinier AI

Inġinier AI minn Lausanne li jgħaqqad riċerka profonda ma' innovazzjoni prattika. Jaqsam iż-żmien bejn arkitetturi tal-mudelli u l-qċaċet Alpini.

Artikli Relatati

Kompli esplora b'dawn il-postijiet relatati

Għoġbok dan l-artiklu?

Skopri aktar għarfien u żomm ruħek aġġornat bl-aħħar kontenut tagħna.

World Labs Marble: Il-Viżjoni ta' Fei-Fei Li għall-Intelliġenza Spazjali