Meta Mango: Innsýn í leynilega gervigreindar myndbandslíkanið sem stefnir að því að yfirtaka OpenAI og Google
Meta kynnir Mango, nýtt gervigreindar myndbands- og myndlíkan sem stefnir á útgáfu árið 2026. Með Alexandr Wang, meðstofnanda Scale AI, við stjórnvölinn, getur Meta loks náð öðrum í gervigreindarsamkeppninni?

Eftir marga mánuði af því að reyna að ná öðrum í gervigreindarsamkeppninni hefur Meta nú gefið út upplýsingar um metnaðarfyllsta verkefnið sitt hingað til: gervigreindar myndbands- og myndlíkan með dulkóðunarnafninu Mango. Líkanið er fyrirhugað til útgáfu á fyrri hluta ársins 2026 og táknar djarfasta veðmálið sem samfélagsmiðlarisinn hefur lagt í sjónræna gervigreind.
Tilkynningin sem skók dalinn
Fréttirnar komu fram á innri spurninga- og svarafundi hjá Meta á fimmtudaginn 19. desember. Chris Cox, vöruframkvæmdastjóri, og Alexandr Wang, meðstofnandi Scale AI sem nú leiðir Superintelligence Labs hjá Meta, kynntu vegvísi sem vakti mikla athygli starfsmanna.
Tvö líkön. Tvö dulkóðunarnöfn. Ein gríðarleg markmið.
Á meðan Avocado einbeitir sér að texta, rökhugsun og bættum kóðunarmöguleikum er Mango sjónræna kraftaverkið. Samkvæmt innri heimildum er Meta að kanna "heimslíkön sem skilja sjónrænar upplýsingar og geta hugsað, skipulagt og brugðist við án þess að þurfa að vera þjálfuð fyrir öllum möguleikum."
Þetta er ekki bara myndbandsgerð. Þetta nálgast frekar eitthvað eins og myndbandsskilning.
Hvers vegna Meta þarf þennan sigur
Við skulum vera hreinskilin: Meta hefur átt erfitt með að fylgja í gervigreindarsamkeppninni.
Á meðan OpenAI fangaði ímyndunarafl heimsins með ChatGPT og nú eðlisfræðilega nákvæma myndbandagerð Sora 2, og Google þróaði áfram með Veo 3 og innfædda hljóðmyndun, hefur gervigreindaraðstoðarmaður Meta haldist... ásættanlegur. Hagnýtur. En ekki byltingarkenndur.
Gervigreindaraðstoðarmaður Meta nær til milljarða í gegnum Facebook, Instagram og WhatsApp. En dreifing er ekki það sama og nýsköpun. Fyrirtækið þarf byltingarkennda vöru, ekki bara vel dreifða meðalvöru.
Tímasetning þróunar Mango er ekki tilviljun. Á sumrinu fór Meta í gegnum umtalsverða endurskipulagningu á gervigreindasviði. Wang tók við stjórn á nýstofnuðu Meta Superintelligence Labs (MSL), og fyrirtækið hefur verið á harðri ráðningarherferð og ráðið yfir 20 fræðimenn frá OpenAI og stækkað með yfir 50 nýjum gervigreindasérfræðingum.
Alexandr Wang þátturinn
Ef þú þekkir ekki Alexandr Wang, þá ættir þú að gera það. Hann stofnaði Scale AI 19 ára gamall og breytti því í 13 milljarða dollara fyrirtæki sem knýr gagnagerð á bak við nokkur af fullkomnustu gervigreindarkerfi heimsins. Að hafa hann til að leiða MSL gefur til kynna að Meta sé ekki bara að kasta peningum í vandamálið. Þeir eru að fá inn einhvern sem skilur alla gervigreindarferlið, frá gagnamerkingu til virkjunar líkana.
Afrekaskrá Scale AI
Scale AI hefur unnið með OpenAI, Google og varnarráðuneyti Bandaríkjanna. Wang skilur hvað þarf til að byggja líkön sem virka í stórum stíl.
Sú staðreynd að Meta fékk utanaðkomandi mann frekar en að efla innanhúss segir mikið um brýnt ástand þeirra. Þetta er ekki eins og venjulega. Þetta er endurstilling.
Hvað Mango gæti þýtt fyrir höfunda
Hér verður þetta áhugavert fyrir okkur sem erum í raun að búa til efni.
Instagram og Facebook eru nú þegar yfirgnæfð af stuttu og löngu myndbandssniði. Meta hefur dreifingarráðin. Það sem þeim vantar eru sköpunarverkfærin sem keppinautar keppast við að byggja. Ímyndaðu þér:
- Gervigreindaraðstoðuð myndbandsklipping beint í Instagram
- Sjálfvirk sjónræn áhrif fyrir Reels
- Texti-í-myndband fyrir auglýsingagerð
- Stílsamræmd efnisgerð á milli færslna
- Eftirlitsvinna með efni í stórum stíl
- Aðgreining á gervigreindarefni frá mannlegu efni
- Mótmæli höfunda vegna áreiðanleika
- Traustsvandamál á vettvangi
Ef Mango uppfyllir loforð sitt um "heimslíkan", þá erum við að horfa á gervigreind sem gerir ekki bara myndbandskjái. Hún skilur hvað er að gerast í senunni, getur hugsað um eðlisfræði og hluti, og getur meðhöndlað sjónrænt efni með raunverulegum skilningi.
Það er stór ef. En möguleikinn er gríðarlegur.
Samkeppnisumhverfið árið 2026
Þegar Mango kemur út á fyrri hluta 2026 mun gervigreindar myndbandsumhverfið líta mjög öðruvísi út en í dag.
| Fyrirtæki | Líkan | Helsti styrkur |
|---|---|---|
| OpenAI | Sora 2 | Eðlisfræðihermigerð, Disney persónur |
| Veo 3 | Innfædd hljóð, Flow klippitól | |
| Runway | Gen-4.5 | Sjónræn gæði, Adobe samþætting |
| Meta | Mango | Dreifing, samfélagssamþætting |
Kostur Meta er ekki tæknileg yfirburði. Ekki ennþá að minnsta kosti. Það er sú staðreynd að 3 milljarðar manna nota vettvanginn daglega. Ef Mango getur jafnast á við gæði Runway Gen-4.5 eða Veo 3, verður dreifingarforskotið eyðileggjandi fyrir keppinauta.
Hið raunverulega spurning: Getur Meta byggt líkan í bestu flokki, eða munu þeir sætta sig við "nógu gott" og treysta á dreifingu? Saga bendir til þess síðarnefnda. En þátttaka Wang gefur til kynna hærri markmið.
Brotthvarf Yann LeCun
Það er fíll í herberginu. Yann LeCun, goðsagnakenndur aðalvísindamaður Meta í gervigreind og einn af "föðurum djúpnáms," tilkynnti nýlega um brotthvarf sitt til að stofna eigið sprotafyrirtæki.
LeCun hefur verið hávær um efasemdir sínar um stór tungumálalíkön og trú sína á aðrar nálganir við gervigreind. Brotthvarf hans vekur spurningar um stefnu gervigreindarannsókna Meta. Er Mango í samræmi við sýn LeCun, eða táknar það frávik frá henni?
Við vitum það ekki ennþá. En tímasetningin er áberandi.
Hvað á að fylgjast með
Þegar við förum inn í árið 2026, hér eru helstu spurningarnar:
- ○Mun Mango innihalda innfædda hljóðmyndun eins og Kling og Veo 3?
- ○Hvernig mun Meta meðhöndla eftirlitsvinna með efni fyrir gervigreindar-myndböndum?
- ○Verða höfundarverkfæri samþætt beint í Instagram?
- ○Getur MSL haldið hæfileikafólki eftir brotthvarf LeCun?
Okkar skoðun
Tilkynning Meta um Mango er mikilvæg ekki vegna þess sem hún lofar, heldur vegna þess sem hún sýnir um hugarfar fyrirtækisins. Þeir eru búnir að vera hraðir fylgjendur. Þeir eru að byggja frá grunni, með alvarlega forystu, og miða á útgáfuglugga sem gefur þeim tíma til að gera þetta rétt.
Mun Mango yfirtaka Sora 2 eða Veo 3? Líklega ekki á fyrsta degi. En með 3 milljarða notenda og úrræðum til að endurtaka hratt þarf Meta bara að komast nálægt. Dreifingin gerir afganginn.
Gervigreindar myndbandskeppnin varð bara miklu áhugaverðari.
Tengd lesning: Til að setja í samhengi núverandi stöðu gervigreindar myndbanda, skoðaðu Sora 2 vs Runway vs Veo 3 samanburðinn okkar og djúpa greininguna okkar á heimslíkönum í gervigreindar myndbandsgerð.
Var þessi grein gagnleg?

Henry
Skapandi tæknimaðurSkapandi tæknimaður frá Lausanne sem kannar þar sem gervigreind hittir listir. Tilraunir með framleiðandi líkön á milli rafeindatónleikaþátta.
Tengdar greinar
Haltu áfram að kanna með þessum tengdu færslum

Ósýnilegir skjöldir: Hvernig vatnsmerking gervigreindarmyndbanda er að leysa höfundarréttarkreppuna 2025
Þegar gervigreindarmynduð myndbönd verða óaðgreinanleg frá raunverulegri upptöku birtist ósýnileg vatnsmerking sem mikilvæg innviði fyrir verndun höfundaréttar. Við skoðum nýja nálgun Meta, SynthID frá Google og tæknilegar áskoranir við að fella greiningarmerki inn í stórum stíl.

YouTube setur Veo 3 Fast inn i Shorts: Opin gervigreind-myndbandagerð fyrir 2,5 milljarða notenda
Google samhefur Veo 3 Fast gerð sina beint inn i YouTube Shorts og býður upp á opin texta-til-myndbands myndun með hljóði fyrir myndbandshöfunda um allan heim. Hér er hvað þetta þýðir fyrir vettvanginn og aðgengi að gervigreind-myndböndum.

Kling 2.6: Raddklonun og hreyfistjornun breyta skopmyndaskapnaoi med gervigreind
Nyasta uppfaersla Kuaishou kynnir samtimis hljod- og myndframleidslu, sersnidin raddthjolfun og narkvaema hreyfistokkun sem gaeti breytt thvi hvernig hofundar nalgas AI-myndbandaskapnad.