Meta Pixel
AlexisAlexis
8 min read
1494 зборови

Световни Модели Надвор од Видео: Зошто Игрите и Роботиката се Вистински Докази Терена за AGI

Од DeepMind Genie до AMI Labs, световните модели тивко стануваат основа за AI која вистински разбира физика. Пазарот на видеоигри од 500 милијарди долари може да биде местото каде што прво се докажуваат.

Световни Модели Надвор од Видео: Зошто Игрите и Роботиката се Вистински Докази Терена за AGI

Ready to create your own AI videos?

Join thousands of creators using Bonega.ai

Следната револуција во вештачката интелигенција нема да дојде од јазичните модели. Таа ќе дојде од системи кои го разбираат физичкиот свет, и првото поле на боја не е истражувачки лабораторииму туку видеоигри.

Кога Jann LeCun најави своја заминување од Meta за да ја основа AMI Labs со 500 милиони евра финансирање, тој го артикулираше она во што многу истражувачи тивко веруваа години. Големите јазични модели, и покрај нивната импресивна способност, претставуваат сак-улица на патот кон вештачката генерална интелигенција. Тие спектулираат на жетони без разбирање на реалност.

Која е алтернатива? Световни модели. Системи кои учат да симулираат како функционира физичкиот свет.

Фундаментално ограничување на јазичните модели

💡

Световни модели учат да спектулираат што се случува во следното во визуелни околини, не само кои зборови доаѓаат следно во текст. Ова бара разбирање на физика, трајност на објектите и каузалност.

Јазичните модели се одличес при усогласување на шеми во текст. Тие можат да напишат поезија, да отстранат грешки код и да водат разговори кои изгледаат неверојатно човечки. Но прашајте GPT-4 што се случува кога паѓаш топка, и тој се потпира на запамтени описи наместо вистинска физичка интуиција.

Ова е важно затоа што интелигенцијата, онака како што је доживуваме во биолошкиот свет, е фундаментално утемелена во физичката реалност. Мало дете кое учи да стекува блокови развива интуитивно разбирање на гравитација, баланс и материјални својства долго пред да научи јазик. Ова вградена когниција, овој осет за тоа како функционира светот, го претставува токму она што на тековните AI системи им недостасува.

Световни модели се стремат да го исполнат овој јаз. Наместо да спектулираат на следниот жетон, тие спектулираат на следниот кадар, следната физичка состојба, следната последица од дејност.

Три пристапа за разбирање на светот

Трката да се изградат AI системи за разбирање на светот е поделена на три различни парадигми, секоја со различни јачини.

Видео Прогнозни Модели

Обучени на масивни збирки видеа за да научат имплицитна физика. Примеrite се Sora и Veo. Добри при генерирање на веродостојни продолжеток но се борат со интерактивни сценарија.

Симулацион-базирани модели

Изградете експлицитни физички мотори и обучете AI да ги навигира. Бара скапо рачно конструирање на околини но нуди прецизна физичка точност.

Третиот пристап, и можеби најнадеж, ги комбинира обете: учи динамика на светот од видео додека ја задржува способност да се интерактира со окружувањето и да го манипулира. Ова е каде игрите стануваат суштински.

Игри, Совршено Полиште за Обука

Видеоигрите нудат нешто уникатно: интерактивни околини со кохерентни физички правила, бесконечна варијација и јасни метрики за успех. За разлика од реалната роботика, која бара скапа хардверска и поставува безбедносни прашања, игрите нудаат неограничена неуспеха без последици.

$500B+
Пазарот на игри до 2030
€500M
AMI Labs финансирање
12%
Годишна стапка на раст

DeepMind го препознаа овој потенцијал рано. Нивниот Genie систем може да генерира целосно нови играви околини од една слика. Дајте му скица на платформа ниво, и тој создава свет со кохерентна физика каде ликови можат да скачаат, паѓаат и да имаат интеракција со предметите на соодветен начин.

Она што го прави Genie неверојатно е не само генерирање туку компрехензија. Системот учи генерализирани физички концепти кои се преносат на различни визуелни стилови и видови игри. Модел обучен на platformer стилови на Mario развива интуиција за гравитација и судир кои еквивалентно се применуваат на рачно нацртани независни игри и реалистични 3D околини.

Од игри до робота

Олуката од игри до роботика не е теоретска. Компаниите веќе ја користат.

2024

Идентификувана е пропаста на симулација

Истражувањето покажува дека модели обучени чисто во симулација се борат со вистинска нерамнотежа во светот: варијабилно осветлување, несовршени сензори, неочекувани предмети.

2025

Се појавуваат хибридни пристапи

Тимовите комбинираат световни модели обучени во игри со ограничено лајнирање во вистинскиот свет, драматично намалувајќи ги податоците потребни за обука на робота.

2026

Почнува комерцијална развивање

Првите складишни робота со основи за световни модели влегуваат во производство, рачејќи нови предмети без експлицитно програмирање.

Увидот кој ја управува оваа транзиција е едноставен: физика е физика. Модел кој вистински разбира како предметите паѓаат, лизгаат и судираат во видеоигра, требаше, со соодветна адаптација, да разбере исти принципи во вистинскиот свет. Визуелниот изглед се менува, но основната динамика остануваа константна.

Tesla го следа верзијата на оваа стратегија со нивните Optimus робота, прво обучувајќи во симулација пред развивање во контролирана фабричка средина. Ограничувачкиот фактор секогаш бил зазорот помеѓу симулирана и вистинска физика. Световни модели обучени на разновидни видеа почетни конечно би можеле да го премостат тој јаз.

AMI Labs Opklada

Новата авантура на Yann LeCun, AMI Labs, претставува вистинскиот единствен инвестирање во истражување на световни модели досега. Со 500 милиони евра европско финансирање и тимот рекрутиран од Meta, DeepMind и академски лабораторииmu, тие го следат она што LeCun ја нарекува "целна-врзана вештачка интелигенција."

💡

За разлика од LLM кои спектулираат на жетони, пристапот на AMI се фокусира на учење на репрезентации на светот кои омогућуваат планирање и расудување за физички последици.

Техничката основа е изградена на Joint Embedding Predictive Architecture, рамка што LeCun ја промовира години. Наместо да генерира прогнози на ниво на пиксел, кои бараат огромна компутерска моќ, JEPA учи апстрактни претстави кои го фаќаат суштинскиот редослед на физички системи.

Размислете за тоа вака: човек кој гледа топка да се котрла кон граница не симулира секој пиксел од траекторијата на топката. Наместо тоа, ние го препознаваме апстрактната ситуација (топка, раб, гравитација) и спектулираме на резултат (паѓање). JEPA се стреми да ја улови оваа ефикасна, апстрактна расудување.

Импликации за генерирање видео на вештачка интелигенција

Оваа траекторија на истражување е длабоко значајна за креативни апликации. Тековните генератори на видео со вештачка интелигенција произведуваат импресивни резултати но страдаат од временска неконзистентност. Ликовите се трансформираат, физиката се скрива, а предметите се појавуваат и исчезнуваат.

Световни модели нудаат потенцијално решение. Генератор кој вистински разбира физика требаше да произведе видеа каде предметите почитуваат конзистентни правила, каде падналите предмети паѓаат предвидливо, каде рефлексиите се однесуваат правилно.

Тека состојба

Модели генерираат визуелно веродостојни кадри без наметување на физичка конзистентност. Функционира за кратки исечоци но се скршува над подолги трајања.

Световни Модели Иден

Физичката конзистентност се јавува од научена динамика на светот. Подолги, поконзистентни видеа стануваат можни бидејќи моделот одржува внатрешна состојба на светот.

Веќе видиме рани знаци на оваа транзиција. GWM-1 на Runway го претставува нивната opklada на световни модели, а подобрената физичка симулација на Veo 3.1 сугерира дека Google ги вклучува сличните принципи.

AGI поврзоста

Зошто се важни сите овие за вештачка генерална интелигенција? Затоа што вистинска интелигенција бара повеќе од манипулација на јазици. Таа бара разбирање на каузалност, спектулација на последици и планирање на дејности во физичкиот свет.

🧠

Вградена позната

Вистинската интелигенција може да бара утемелување во физичката реалност, не само статистички обрасци во текст.

🎮

Интерактивно учење

Игрите нудаат совршено поле за тестирање: богата физика, јасна повратна информација, бесконечно повторување.

🤖

Роботска апликација

Svetovni modeli obučeni u igrama bi mogli da se prenesu na roboiku u stvarnom svetu sa minimalnom adaptacijom.

Истражувачите кои ја водат оваа работа се опрезни при пресметување дека ја градат AGI. Но тие убедливо аргументираат дека без разбирање на светот, не можеме да градиме системи кои вистински мислат наместо едноставно авто-комплетирајќи.

Што долага следно

Следниве две години ќе бидат критични. Неколку развои да се контролираат:

  • AMI Labs први јавни демонстрации (очекувано средина-2026)
  • Интеграција на svetovnih modela u glavnim generatorima videa
  • Kompaniji za video-igre motore (Unity, Unreal) dodajući API-je za svetovne modele
  • Prvi roboti za potrošače koji koriste svetovne modele obučene u igrama

Пазарот на видеоигри, спектулиран да го надмине 500 milijardi dolara do 2030, представува плодна прстем за развој на световни модели. Инвеститори го гледаат световни модели не само како научни радозналости туку како фундаментална технологија за интерактивна забава, симулација и роботика.

Тивката революција

За разлика од експлозивниот hype okolоко ChatGPT, revolucija svetovnih modela se odvija tiho u istražuvačkim laboratorijama i igre studije. Nema viralnih demoa, nema dnevnih vesti o sledećem proboju.

Ali implikacije mogu biti dublje. Jazzni modeli su promenili kako komuniciramo sa tekstom. Svetovni modeli bi mogli da promene kako AI komunicira sa realnošću.

Za one od nas koji rade na generisanju videa sa veštačkom inteligencom, ovo istraživanje predstavlja i prijetnju i priliku. Naši trenutni alati mogu izgledati primitivno u retrospektivi, kao rana CGI u poređenju sa modernim vizuelnim efektima. Ali osnovni princip, generisanje vizuelnog sadržaja kroz naučene modele, postaje samo moćniji kako ovi modeli počinju da zaista razumeju svetove koje kreiraju.

💡

Dalje čitanje: Istražite kako Diffusion Transformers pružaju arhitekturnu osnovu za mnoge svetovne modele, ili saznajte o generisanju u realnom vremenu interaktivno što gradi na principima svetovnog modela.

Putanja od fizike videoigre do vještačke opće inteligencije može izgledati okretno. Ali inteligencija, gdje god je nalazimo, proizilazi iz sistema koji razumiju svoje okruženje i mogu da predvide posledice svojih radnji. Igre nam daju sigurno mesto da gradimo i testiramo takve sisteme. Roboti, kreativni alati i možda pravi mašinski razum će pratiti.

Дали оваа статија беше корисна?

Alexis

Alexis

Инженер за вештачка интелигенција

Инженер за вештачка интелигенција од Лозана кој ја комбинира длабочината на истражувањето со практична иновација. Го дели времето помеѓу архитектури на модели и алпски врвови.

Like what you read?

Turn your ideas into unlimited-length AI videos in minutes.

Поврзани статии

Продолжете со истражување со овие поврзани објави

Јан ЛеКун ја напушта Мета за да вложи 3,5 милијарди долари во светски модели
World ModelsAMI Labs

Јан ЛеКун ја напушта Мета за да вложи 3,5 милијарди долари во светски модели

Добитникот на Тјурингова награда го лансира AMI Labs, нов стартап фокусиран на светски модели наместо LLM, со цел на роботика, здравство и разбирање на видео.

Read
Runway GWM-1: Општиот модел на светот што ја симулира реалноста во реално време
RunwayWorld Models

Runway GWM-1: Општиот модел на светот што ја симулира реалноста во реално време

Runway-евиот GWM-1 означува преломна точка, премин од генерирање видеа кон симулација на светови. Истражете како овој авторегресивен модел создава средини што можете да ги истражувате, фотореалистички аватари и симулации за тренирање роботи.

Read
Видео јазични модели: Следната граница по LLM и AI агентите
World ModelsVideo Language Models

Видео јазични модели: Следната граница по LLM и AI агентите

Светските модели ја учат вештачката интелигенција да ја разбира физичката реалност, овозможувајќи им на роботите да планираат акции и симулираат исходи пред да поместат еден актуатор.

Read

Ви се допадна оваа статија?

Дознајте повеќе и бидете во тек со нашата најнова содржина.

Световни Модели Надвор од Видео: Зошто Игрите и Роботиката се Вистински Докази Терена за AGI