YouTube setur Veo 3 Fast inn i Shorts: Opin gervigreind-myndbandagerð fyrir 2,5 milljarða notenda
Google samhefur Veo 3 Fast gerð sina beint inn i YouTube Shorts og býður upp á opin texta-til-myndbands myndun með hljóði fyrir myndbandshöfunda um allan heim. Hér er hvað þetta þýðir fyrir vettvanginn og aðgengi að gervigreind-myndböndum.

Vettvangsstefnan
Þegar Google DeepMind kynnti Veo 3 fyrr á þessu ári voru kynningarnar glæsilegar en aðgangur var takmarkaður. Nú, með samstarfi við YouTube, er sérsniðin útgáfa sem heitir Veo 3 Fast að koma út til Shorts höfunda í Bandaríkjunum, Bretlandi, Kanada, Ástralíu og Nýja-Sjálandi.
Nálgunin er bein: ýttu á búa til hnappinn, leitaðu að glitramerkinu, skrifaðu leiðbeiningar og gervigreindin býr til stutta myndbandsklippu. Lykilmunurinn frá öðrum vettvangsverkfærum: búnar klippur innihalda samstillt hljóð, sem er fyrsti göngunum fyrir innfædda gervigreind-myndbandagerð á vettvangi.
Hvernig Veo 3 Fast virkar
Sérsniðna gerðin er aðlöguð fyrir farsímaverkflæði. Upplausn er takmörkuð við 480p til að halda biðtíma lágum og gerðartíma hentugum fyrir notkun í tækinu. Þetta er ekki fullt Veo 3 sem þú fengjir aðgang að í gegnum Google API, heldur tilgangsbyggð útgáfa fyrir hraða efnisgerð.
Hvað þú færð
- Texta-til-myndbands gerð
- Samstillt hljóð meðfylgjandi
- 8 sekúndna hámarksklippur
- Enginn kostnaður, engin inneign
- SynthID vatnsmerki
Hvað þú færð ekki
- Háupplausn úttak
- Lengri myndbandsklippur
- Nákvæm stjórn
- Sérsniðin gerðarstilling
- API aðgang
Málamiðlunin er viljandi. YouTube vill að höfundar tilraunasetji gervigreind-myndbandagerð, ekki að þeir byggi upp framleiðslukeðjur. Fyrir fágaðara, lengra efni henta verkfæri eins og Runway Gen-4.5 eða Sora 2 betur.
Fyrir samanburð á fullbúnum gervigreind-myndbandsgerðum, sjá greiningu okkar á Sora 2 vs Runway vs Veo 3.
Þrír nýir hreyfieiginleikar (væntanlegir)
YouTube er að prófa viðbótar Veo getu umfram texta-til-myndbands:
Bæta við hreyfingu
Flytja hreyfimunstur úr einu myndbandi í annað. Notaðu dans, íþróttahreyfingu eða bendingu á viðfang þitt með því að vísa til fyrirliggjandi klippu.
Stílbrigða
Notaðu sjónrænar breytingar eins og poplist, origami eða aðra listræna stíla á allt myndbandið þitt með einni skipun.
Bæta við hlutum
Settu inn persónur, hluti eða áhrif í senuna þína með textaskilgreiningum. Þarftu dreka sem fljúgur í bakgrunninum? Bara biðja.
Þessir eiginleikar eru enn í prófun, en þeir gefa til kynna hvert vettvangurinn stefnir: Shorts höfundar fá aðgang að áhrifum sem áður kröfðust sérstaks hugbúnaðar og umtalsverðrar tæknikunnáttu.
Breyta með gervigreind: Vanmetni eiginleikinn
Þó Veo 3 Fast fái fyrirsagnirnar gæti Breyta með gervigreind eiginleikinn verið nytsamlegri í reynd fyrir flesta höfunda. Hann greinir hrátt myndavélarúllumyndefni þitt og býr til fyrsta drög með því að:
- Finna og raða bestu stundunum þínum
- Bæta við viðeigandi tónlist og breytingum
- Búa til samhengisfulla talsetningu
Breyta með gervigreind styður núna ensku og hindí talsetningu sem bregst við því sem gerist í myndbandinu þínu. Fleiri tungumál koma.
Fyrir höfunda sem taka upp mikið af efni en eiga í erfiðleikum með breytingafasann fjarlægir þetta upphaflegu núninguna. Þú stjórnar enn lokaniðurstöðunni, en gervigreindin sér um leiðinlegt fyrsta umferðina af flokkun og röðun.
Öryggi og merkingar
Hver klippa sem búin er til með Veo 3 í Shorts er sjálfkrafa:
- Merkt með "Gervigreind-búið til" merki sem sýnilegt er áhorfendum
- Innfelld með SynthID ósýnilegu vatnsmerki
Google veðjar á gagnsæi frekar en hömlur. Hver sem er getur notað verkfærið, en úttakið ber varanlega merki sem auðkenna þau sem gervigreind-búin til. Þessi nálgun samræmist breiðari iðnaðarhvöt í átt að gervigreind-myndbandsvatnsmerki og efnisvottun.
Dreifingarávinningurinn
Það sem gerir þessa útgáfu merkilega er ekki tæknin, heldur dreifingin. YouTube Shorts hefur nú þegar höfundana og áhorfendurna. Með því að setja gervigreind-myndbandagerð beint inn í vettvanginn fjarlægir Google allar hindranir:
Ekkert sérstakt forrit til að hlaða niður. Engar inneignir til að kaupa. Engin námsferill umfram að skrifa leiðbeiningar. Höfundar geta tilraunasett gervigreind-myndbandagerð án þess að yfirgefa núverandi verkflæði.
Læsing á vettvang þýðir að þú getur ekki flutt þessar klippur annað. 8 sekúndna, 480p takmörkunin heldur þessu verkfæri í "tilraunaflokknum" frekar en "framleiðslu."
Tal í lag: Bónuseiginleikinn
YouTube tilkynnti einnig Tal í lag, knúið af Google DeepMind Lyria 2 tónlistargerð. Þetta verkfæri breytir samtölum úr viðurkenndum myndböndum í tónlistarstykki með sérhannaðar stemmingar (rólegur, dansanlegur, skemmtilegur).
Þó þetta sé hliðstætt myndbandagerð endurspeglar það sömu stefnu: taka gervigreindgetu sem áður þurfti sérhæfð verkfæri og setja þau beint inn í höfundaverkflæðið.
Hvað þetta þýðir fyrir höfunda
Ef þú ert Shorts höfundur, prófaðu þetta í dag. Hindrunin við að byrja er í raun engin, og námsreynslan af því að spila með texta-til-myndbands leiðbeiningum mun flytjast til öflugri verkfæra þegar þú þarft á þeim að halda.
Veo 3 Fast
Grunnlegur texta-til-myndbands með hljóði á studdum svæðum. Gott fyrir tilraunir og skjótar efnishugmyndir.
Hreyfieiginleikar
Bæta við hreyfingu, Stílbrigða og Bæta við hlutum útvíkka hvað er hægt án viðbótarverkfæra.
Gæðabætingar
Búast við að upplausnar- og tímalengdartakmörk aukist þegar farsímabúnaður og gerðarhagkvæmni batna.
Fyrir faglegra höfunda sem þurfa hærri gæði og lengri tímalengd er þetta forsýning á hvert vettvangurinn stefnir. Tilraunir dagsins verða staðlaðir eiginleikar morgundagsins.
Landslag gervigreind-myndbandagerðar breyttist rétt. Með dreifingu YouTube munu milljónir höfunda fá sína fyrstu praktísku reynslu af texta-til-myndbands. Sú útsetning ein mun flýta fyrir upptöku um alla iðnaðinn.
Aðalatriðið
YouTube Veo 3 Fast er ekki framleiðsluverkfæri. Það er kynning. Með því að setja gervigreind-myndbandagerð fyrir framan 2,5 milljarða notenda með engri núningu veðjar Google á að þekking muni knýja áfram langtímaupptöku.
8 sekúndna klippurnar og 480p upplausnin halda væntingum á jörðu. En fyrir höfunda sem hafa verið forvitnir um gervigreind-myndbandagerð án þess að vilja vafra um nýja vettvanga eða verðlagningarlíkön er biðin búin. Ýttu á glitramerkið og byrjaðu að tilraunasetja.
Verkfærin verða bara betri héðan.
Var þessi grein gagnleg?

Damien
GervigreindarforritariGervigreindarforritari frá Lyon sem elskar að breyta flóknum ML hugmyndum í einfaldar uppskriftir. Þegar hann er ekki að kemba villur úr líkönum finnurðu hann á hjólinu í gegnum Rhône dalinn.
Tengdar greinar
Haltu áfram að kanna með þessum tengdu færslum

Þögla tímabilið endar: Samþætt hljóðmyndun breytir gervigreindarmyndböndum til frambúðar
Gervigreindarútbúnaður fyrir myndbönd hefur þróast frá þögnum kvikmyndum yfir í hljóðmyndir. Kynntu þér hvernig samþætt hljóð- og myndsamsetning er að móta vinnuferla skapandi fólks, með samstilltum samtölum, umhverfishljóðum og hljóðbragðum sem verða til samhliða myndefninu.

Kling 2.6: Raddklonun og hreyfistjornun breyta skopmyndaskapnaoi med gervigreind
Nyasta uppfaersla Kuaishou kynnir samtimis hljod- og myndframleidslu, sersnidin raddthjolfun og narkvaema hreyfistokkun sem gaeti breytt thvi hvernig hofundar nalgas AI-myndbandaskapnad.

MiniMax Hailuo 02: Kína fjárhagslegur AI myndbandsaðili ögrar risabænum
MiniMax Hailuo 02 skilar samkeppnisflíkri myndbandsgildi fyrir brot af verðinu. Tíu myndböndum fyrir verð einn Veo 3 klipp. Hér er það sem gerir þennan kínverska ögurinn ábótavn.