Heimssenningar Umfram Myndum: Hvers Vegna Leikir og Vélvirkja eru Sönn Prófarsvæði fyrir AGI

Næsta byltingin í gervigreind mun ekki koma frá tungumálalíkönum. Hún mun koma frá kerfum sem skilja líkamlega heiminn, og fyrsti bardagasvæðið er ekki rannsóknarlöb heldur tölvuleikir.

Þegar Yann LeCun tilkynnti brottför sína frá Meta til að stofna AMI Labs með €500 milljónum í fjármögnun, áréttu hann það sem margir vísindamenn höfðu þögult trúað í mörg ár. Stór tungumálalíkön, þrátt fyrir glæsilega getu, tákna blindgötu á leið til gervigreinar. Þeir spá um tákn án þess að skilja veruleika.

Hvað er valkosturinn? Heimssenningar. Kerfi sem læra að líkja eftir því hvernig líkamlegi heimurinn virkar.

Grundvallar takmörkun tungumálalíkana

💡

Heimssenningar læra að spá fyrir um hvað gerist næst í sjónrænum umhverfi, ekki bara hvaða orð koma næst í texta. Þetta krefst skilnings á eðlisfræði, hlutvarðveislufræði og orsakasamhengi.

Tungumálalíkön skara fram úr í mynstri sem passar í texta. Þau geta skrifað ljóð, villuleitat kóða og haldið samtölum sem virðast ótrúlega mannleg. En spurðu GPT-4 um hvað gerist þegar þú sleppir balli, og það treystir á minni lýsingar frekar en ósvikin eðlisfræðilegur innsýn.

Þetta skiptir máli vegna þess að greind, eins og við upplifum hana í líffræðilegum heimi, er grundvallarstæð í líkamlegri veruleika. Lítill börnungur sem lærir að stafla kubbum þróar óbeinan skilning á þyngdarafli, jafnvægi og efnilegum eiginleikum löngu áður en tungumál er lært. Þessi innkörpuð hugsun, þessi tilfinningu fyrir því hvernig heimurinn virkar, táknar einmitt það sem núverandi AI-kerfi skorta.

Heimssenningar miða að því að fylla þessa gat. Í stað þess að spá fyrir um næsta tákn spá þeir fyrir um næsta ramma, næsta líkamlega stöðu, næstu afleiðingu aðgerðar.

Þrír aðilar að skilningi á heiminum

Kappinn um að byggja heimskilnings-gervigreind hefur skiptst í þrjá aðskilda hugsunarskipulag, hver með mismunandi styrkleika.

✓Myndbendingarlíkön

Æfðu á gríðarstórum myndböndum til að læra óbeinan eðlisfræði. Dæmi eru Sora og Veo. Góðir við að búa til líklegar framhaldanir en glíma við gagnvirk atriði.

✗Hermun-byggð líkön

Byggðu beinleinis eðlisfræðiherjun og æfu AI til að sigra þau. Krefst dýrra handvirkrar framkvæmdar umhverfis en gefur nákvæman eðlisfræðilegan nákvæmni.

Sá þriðji aðili, og kannski sá most-ætlaðasti, sameinar bæði: að læra heimsdynamikk frá myndbandi á meðan geta til að hafa samskipti við og stjórna umhverfinu. Þetta er þar sem leikir verða nauðsynlegir.

Leikir, fullkominn æfingarstaður

Tölvuleikir bjóða upp á eitthvað einstakt: gagnvirk umhverfi með samkvæmum eðlisfræðireglum, óendanlegum frávika og skýrum árangurskaxi. Ólíkt raunverulegri vélvirkju, sem krefst dýrra vélbúnaðar og setur öryggisáhyggjur, bjóða leikir ótakmarkaðri bilun án afleiðinga.

$500B+

Leikjaiðnaðurinn árið 2030

€500M

AMI Labs fjármögnun

12%

Árleg vaxtarhlutfall

DeepMind viðurkenndi þennan möguleika snemma. Genie-kerfi þeirra getur búið til alveg nýjar leikjanlegar umhverfi úr einni mynd. Gefðu henni skissu af pallborðsleik, og það skapar heim með samkvæmum eðlisfræði þar sem persónur geta stökkt, fallið og haft samskipti við hluti á viðeigandi hátt.

Það sem gerir Genie ótrúlegt er ekki bara framboð heldur skilningur. Kerfið lærir almenna eðlisfræðihugmyndir sem flytjast á milli mismunandi sjónræns stíla og leikategundar. Líkan sem æft er á Mario-stíl pallborðsleikim þróar hverfiflokk um þyngdarafl og árekstur sem eiga jafnt við handteikaða indie-leiki og raunverulega 3D-umhverfi.

Frá leikim til vélvirkja

Leiks-til-vélvirkju-leiðslóð er ekki fræðileg. Fyrirtæki nota hana nú þegar.

2024

Hermun bilun auðkennd

Rannsóknir sýna að líkön sem þjálfuð eru eingöngu í hermun glíma við raunverulega óreiðu: mismunandi birtu, ófullkominir skynjarar, óvænt hlutir.

2025

Blönduð nálgun kemur fram

Liðir sameina leikæft heimssenningarlíkön með takmörkuðu raunheimaleimum, sem dregur í gríðarstærð úr gögnum sem nauðsynleg eru fyrir vélvirkjuæfingu.

2026

Verslunarútsteypa hefst

Fyrstu vöruhúsavélvirkjar með heimssenningarbakgrúnni koma til framleiðslu og meðhöndla nýja hluti án beinna forrita.

Aðlögunin sem knýr þessa breytingu er einföld: eðlisfræði er eðlisfræði. Líkan sem raunverulega skilur hvernig hlutir falla, renna og rekast í tölvuleik ættu, með viðeigandi breytingum, að skilja sömu meginreglur í raunverulegum heimi. Sjónræna birtingarmyndin breytist, en undirliggjandi gangverk helst stöðug.

Tesla hefur fylgt útgáfu þessarar stefnu með Optimus-vélvirkjum sínum, æfði fyrst í hermun áður en dreift var til stýrðra verksmiðjuumhverfis. Takmarkandi þáttur hefur alltaf verið bilið milli hermunnar og raunverulegrar eðlisfræði. Heimssenningar æft á margvíslegum myndböndum gætu loks brúað það bil.

AMI Labs veðmálið

Nýja framtakið fyrir Yann LeCun, AMI Labs, táknar stærstu einstaka fjárfestingu í heimssenningaöðlun fram til þessa. Með €500 milljónum í evrópskri fjármögnun og liði sem ráðinn var frá Meta, DeepMind og akademískum rannsóknarstofu eru þeir að sækjast eftir því sem LeCun kallar "markmiðs-knúin gervigreind."

💡

Ólíkt LLM sem spá fyrir um tákn, beinist nálgun AMI að því að læra framsetningar á heiminum sem gera ætlunarvægi og rökstuðning um líkamlegar afleiðingar kleift.

Tæknilega undirstaðan byggist á Joint Embedding Predictive Architecture (JEPA), ramma sem LeCun hefur styrkstu fyrir mörg ár. Frekar en að búa til pixla-stig spádóma, sem krefst gríðarstærðra reiknikrafts, lærir JEPA óhlutbundnar framsetningar sem fanga verulega skipan á eðlisfræðilegum kerfum.

Hugsaðu um það svona: manneskja sem horfir á bolta sem rúlla í átt að brekku hermir ekki hvern pixla fjöll af bolta. Í staðinn, við kannist við óhlutbundna stöðu (bolti, brún, þyngdarafl) og spáðu um niðurstöðu (fall). JEPA miðar að því að ná þessari skilvirkri, óhlutbundinni rökstuðningi.

Afleiðingar fyrir AI myndbandakynslóðun

Þessi rannsóknarleiðslóð skiptir miklu máli fyrir skapandi forrit. Núverandi AI myndbandastofar framleiða glæsilega niðurstöðu en berjast við tímabundna ósamhverfu. Persónur breytast, eðlisfræði brotna og hlutir birtast og hverfa.

Heimssenningar bjóða hugsanlega lausn. Myndalambi sem raunverulega skilur eðlisfræði ætti að framleiða myndböndum þar sem hlutir hlýða samkvæmum reglum, þar sem fallnir hlutir falla fyrirsjáanlegir, þar sem endurkast hegrar rétt.

✗Núverandi staða

Líkön búa til sjónræna líkleg ramma án þess að framfylgja eðlisfræðilegum samræmi. Virkar fyrir stutt klipp en slitnar yfir lengri lengdir.

✓Heimssenningaframtíð

Eðlisfræðilegur samræmi kemur fram frá lærðum heimsdynamikk. Lengri, samsvörunari myndböndum verða möguleg vegna þess að líkanið heldur innri stöðu heimsins.

Við sjáum nú þegar snemma merki um þessa breytingu. GWM-1 Runway táknar veðmál hans á heimssenningum, og bættur eðlisfræðihermi Veo 3.1 gefur til kynna að Google sé að fella inn svipaðar meginreglur.

AGI tengingin

Hvers vegna skiptir allt þetta máli fyrir gervigreind? Vegna þess að ósvikin greind krefst meira en tungumálameðferðar. Það krefst skilnings á orsökum og afleiðingum, spá fyrir um afleiðingar og áætlanagerð um aðgerðir í líkamlegum heimi.

🧠

Innkörpuð hugsun

Sannarlega greind gæti þurft að sitja fast í líkamlegri veruleika, ekki bara tölfræðilegum mynstri í texta.

🎮

Gagnvirk nám

Leikir gefa fullkomna prófarsvæðið: auðug eðlisfræði, skýr endurgjöf, óendanleg endurtekning.

🤖

Vélvirkju-forrit

Heimssenningar æft í leikim gætu flutt til raunverulegrar vélvirkju með lágmarksbreytingum.

Vísindamenn sem knýja þessa vinnu eru varfærnir um að halda fram að þeir byggi AGI. En þeir rökstuðja sannfærandi að án heimskilnings, getum við ekki byggt kerfi sem raunverulega hugsa frekar en bara sjálf-ful-endirnar.

Hvað kemur næst

Næstu tvö ár verða mikilvæg. Nokkrar þróun sem á að fylgjast með:

○AMI Labs fyrstu opinberu sýningar (búist við mitt-2026)
○Samþætting heimssenninganna inn í helstu myndbandastofana
○Leik-motor-fyrirtæki (Unity, Unreal) bætir heimssenningum við API
○Fyrstu neytenda-vélvirkjar sem nota leik-æft heimssenningum

Leikjaiðnaðurinn, spáð að fara yfir 500 milljarð dala árið 2030, táknar frjóa plöntun fyrir dreifingu heimssenninganna. Fjárfestar sjá heimssenningar ekki bara sem rannsóknara furðu heldur sem undirstöðu tækni fyrir gagnvirka skemmtun, hermun og vélvirkju.

Þögul byltingin

Ólíkt háværu hátíðnum við ChatGPT, felur heimssenningabyltingin sig þögult í rannsóknarlöbum og leikjastofu. Engar viral-sýningar, engar dagblöð sem frétta um nýjustu skerpingu.

En afleiðingarnar gætu verið dýpri. Tungumálalíkön breyttu því hvernig við höfum samskipti við texta. Heimssenningar gætu breytt því hvernig AI hefur samskipti við veruleika.

Fyrir þá okkar sem unnir eru með AI myndbandakynslóðun táknar þetta rannsóknir bæði hættu og tækifæri. Núverandi verkfæri okkar gætu virðast frumstæð í afturbliki, eins og snemmbær CGI miðað við nútímaleg sjón áhrif. En undirliggjandi meginregla, myndunarinnihald með lærðum líkönum, mun aðeins verða öflugri eftir því sem þessi líkön byrja að raunverulega skilja heimina sem þau búa til.

💡

Frekari lesning: Kannaðu hvernig diffusion transformers veita arkitektúrlegna undirstöðu fyrir marga heimssenningum, eða lærðu um rauntíma gagnvirka kynslóðun sem byggir á heimssenningareglum.

Leiðslóðin frá tölvuleik eðlisfræði til gervigreinar gæti virst kringlótt. En greind, hvar sem við finnum hana, kemur fram úr kerfum sem skilja umhverfi sitt og geta spáð fyrir um afleiðingu aðgerða þeirra. Leikir gefa okkur öruggt rými til að byggja og prófa slík kerfi. Vélvirkjarnir, skapandi verkfæri og kannski ósvikin véla-skilningur munu fylgja.

Heimssenningar Umfram Myndum: Hvers Vegna Leikir og Vélvirkja eru Sönn Prófarsvæði fyrir AGI

Grundvallar takmörkun tungumálalíkana

Þrír aðilar að skilningi á heiminum

Leikir, fullkominn æfingarstaður

Frá leikim til vélvirkja

Hermun bilun auðkennd

Blönduð nálgun kemur fram

Verslunarútsteypa hefst

AMI Labs veðmálið

Afleiðingar fyrir AI myndbandakynslóðun

AGI tengingin

Innkörpuð hugsun

Gagnvirk nám

Vélvirkju-forrit

Hvað kemur næst

Þögul byltingin

Alexis

Like what you read?

Tengdar greinar

Yann LeCun Yfirgefur Meta og Veðjar 3,5 Milljörðum Evra á World Models

Runway GWM-1: Almennt heimslíkan sem hermir veruleikann í rauntíma

Myndbandslengdarlikan: Naesti arangur eftir LLM og gervigreppahjalpara

Líkaði þér þessi grein?