Meta Pixel
DamienDamien
6 min read
1015 sõna

AWS ja Decart ehitavad esimese reaalajas AI video infrastruktuuri

Amazon Web Services teeb koostööd AI idufirmaga Decart, et luua ettevõttetaseme infrastruktuur madala latentsusega AI video genereerimiseks, märkides ülemineku mudeli sõdadest infrastruktuuri domineerimisele.

AWS ja Decart ehitavad esimese reaalajas AI video infrastruktuuri

Kui kõik arutlevad, kas Runway või Sora genereerib paremaid plahvatusi, muutis AWS vaikselt mängu. Nende koostöö Decartiga ei käsitle ilusamate videote tegemist. See käsitleb AI video genereerimise muutmist piisavalt kiireks, et see oleks oluline ettevõtte rakendustele.

Infrastruktuurikiht ärkab

AI video genereerimise valdkond on olnud kinnisideeks ühest küsimusest: milline mudel toodab kõige fotorealistlikuma tulemuse? Oleme kajastanud Runway Gen-4.5 võitu Video Arenal, Sora 2 läbimurret ja avatud lähtekoodiga alternatiive, mis väljakutsuvad suletud hiiglasi.

Aga siin on see, millest keegi ei rääkinud: latentsus.

💡

10-sekundilise video genereerimine 2 minutiga on muljetavaldav loominguliseks demoks. See on kasutu otseülekandeks, interaktiivseks rakenduseks või ettevõtte töövooks, mis töötleb tuhandeid videoid päevas.

AWS ja Decart avaldasid oma koostöö AWS re:Invent 2025 üritusel ja see kujutab endast põhimõttelist muutust selles, kuidas peaksime mõtlema AI video infrastruktuurist.

Mida Decart lauale toob

Decart ei ole tuntud nimi nagu Runway või OpenAI. Nad on vaikselt ehitanud midagi teistsugust: AI mudeleid, mis on optimeeritud reaalajas järeldamiseks, mitte maksimaalse kvaliteedi saavutamiseks hinna eest.

10x
Latentsuse vähendamine
≤40ms
Esimene kaader
Ettevõte
Skaala fookus

Jõudlusmõõdikud AWS re:Invent 2025 koostöö teadaandest

Nende lähenemine seab esikohale:

  • Madala latentsusega genereerimine: Alla sekundi vastusajad video kaadritele
  • Kõrge läbilaskevõime: Tuhandete päringute samaaegne töötlemine
  • Ennustatav jõudlus: Järjepidev latentsus erinevate koormuste korral

See on igav, aga oluline töö, mis muudab AI video praktiliseks tootmissüsteemide jaoks.

AWS Trainium: kohandatud räni video AI jaoks

Koostöö kasutab AWS Trainium kiipe, Amazoni kohandatud AI kiirendeid. Erinevalt üldotstarbelistest GPU-dest on Trainium ehitatud spetsiaalselt masinõppe töökoormuste jaoks.

Traditsiooniline GPU lähenemine

Üldotstarbelised riistvarad, kõrgem latentsus, muutuv jõudlus koormuse all, kallis suures mahus

AWS Trainium lähenemine

Otstarbeliselt ehitatud räni, optimeeritud mälu ribalaius, ennustatav latentsus, kuluefektiivne ettevõtte mahus

Video genereerimise puhul käsitleb Trainiumi arhitektuur mälu ribalaiuse kitsaskohta, mis vaevab transformerpõhiseid video mudeleid. Massiivste tensorite liigutamine mälu ja arvutuse vahel on sageli järeldamise aeglaseim osa ja kohandatud räni saab neid andmeteid optimeerida viisidel, mida üldine riistvara ei saa.

Amazon Bedrock integratsioon

Tehniline alus töötab läbi Amazon Bedrocki, AWS-i hallatud teenuse põhimudelite jaoks. See tähendab, et ettevõtted saavad:

  • Ühe API mitme AI video võimekuse jaoks
  • Sisseehitatud skaleerimine ja koormusjaotus
  • Ettevõtte turvalisus ja vastavus (SOC 2, HIPAA jne)
  • Kasutuspõhine hinnakujundus ilma infrastruktuuri haldamiseta

Bedrocki integratsioon on oluline, sest see vähendab barjääri ettevõtetele, kes juba kasutavad AWS-i. Pole uusi tarnija suhteid, eraldi arveldust ega täiendavaid turvalisuse ülevaatusi.

Miks reaalaeg on oluline

Lubage mul kirjeldada, mida reaalajas AI video võimaldab:

Otseülekanded

  • Reaalajas graafika genereerimine
  • Dünaamiline stseeni täiendamine
  • Kohese korduse täiustamine

Interaktiivsed rakendused

  • Mängu vaheseisud genereeritud nõudmisel
  • Isikupärastatud video vastused
  • Otse video redigeerimise abi

Ettevõtte töövood

  • Automatiseeritud video tootmise torujuhtmed
  • Partii töötlemine mahus
  • Integreerimine olemasolevate meediasüsteemidega

E-kaubandus

  • Toote videod genereeritud piltidest
  • Isikupärastatud turunduse sisu
  • A/B testimine video mahus

Ükski neist kasutusjuhtudest ei tööta 2-minutiliste genereerimisaegadega. Need nõuavad vastuseid millisekunditest sekunditeni.

Ettevõtte käik

See koostöö märgib AWS-i strateegiat: lasta idufirmadel võidelda selle üle, kes teeb ilusamaid demosid, samal ajal kui Amazon hõivab infrastruktuuri kihi.

💡

AI kullapalavik, AWS müüb kirku. Ja labidaid. Ja maaõigusi. Ja kontrolliametit.

Vaadake majandust:

LähenemineKes maksabTulumudel
Tarbija AI videoÜksikud loojadTellimus ($20-50/kuu)
API juurdepääsArendajadGenereerimise kohta ($0.01-0.10)
InfrastruktuurEttevõttedArvutustunnid ($tuhanded/kuu)

AWS ei konkuree Runwayga teie $20/kuu pärast. Nad positsioneerivad ennast hõivama ettevõtte eelarvet, mis käibivad tarbija tellimusi.

Mida see tähendab turule

2024

Mudeli sõjad algavad

Sora teadaanne käivitab võidujooksu parima genereerimise kvaliteedi nimel

Varane 2025

Kvaliteedi ühinemine

Tippu mudelid saavutavad sarnase kvaliteedi tasemed, diferentseerimine muutub raskemaks

Hiline 2025

Infrastruktuuri fookus

AWS/Decart koostöö märgib üleminekut juurutamisele ja skaalaale

2026

Ettevõtte vastuvõtt

Reaalajas võimekused võimaldavad uusi tootmise kasutusjuhte

Me siseneme AI video "igavasse, kuid olulisse" faasi. Silmatorkavad mudeli võrdlused jätkuvad, kuid tegelik raha voolab infrastruktuuri, mis muudab AI video praktiliseks äri jaoks.

Tehnilised tagajärjed

Arendajatele ja ML inseneridele soovitab see koostöö mitut trendi:

1. Optimeerimine üle arhitektuuri

Järgmine innovatsioonilaine keskendub olemasolevate arhitektuuride kiiremaks muutmisele, mitte uute leiutamisele. Tehnikad nagu:

  • Spekulatiivne dekodeerimine video transformerite jaoks
  • Kvantiseerimise teadlik treening järeldamise efektiivsuse jaoks
  • Suurte mudelite destilleerimine juurutatavate versioonideks

2. Hübriidsed juurutamise mudelid

Oodake rohkem lahendusi, mis ühendavad:

  • Pilve infrastruktuur võimsuse jaoks
  • Servajuurutus latentsuse kriitiliste radade jaoks
  • Astmeline kvaliteet kasutusjuhtude nõuete põhjal

3. Standardiseerimine

Ettevõtte vastuvõtt nõuab ennustatavaid liideseid. Jälgige:

  • Ühised API-d erinevate tarnijate vahel
  • Standardiseeritud kvaliteedi mõõdikud
  • Koostalitlusvõime platvormide vahel

Konkurentsi maastik

AWS ei ole ainus, kes seda võimalust tunnistab:

🔵

Google Cloud

Vertex AI pakub juba video genereerimist, tõenäoliselt teatab sarnastest reaalajas võimalustest

🟠

Azure

Microsofti OpenAI koostöö võiks laieneda ettevõtte video infrastruktuurile

🟢

NVIDIA

Nende järeldamise platvorm (TensorRT, Triton) jääb vaikimisi ise majutatud juurutuste jaoks

Infrastruktuuri sõda on alles algamas. AWS tulistas esimese lasu Decart koostööga, kuid oodake kiireid vastuseid konkurentidelt.

Praktilised järeldused

Ettevõtte meeskondadele:

  • Hinda oma AI video latentsuse nõudeid nüüd
  • Kaalu Bedrocki, kui oled juba AWS-is
  • Planeeri reaalajas võimekusi oma tegevuskavas

Arendajatele:

  • Õpi järeldamise optimeerimise tehnikaid
  • Mõista Trainiumi ja kohandatud räni kompromisse
  • Ehita latentsuse eelarvetega silmas pidades

AI video idufirmadele:

  • Infrastruktuuri diferentseerimine võib olla olulisem kui mudeli kvaliteet
  • Koostöö võimalused pilve tarnijatega avanevad
  • Ettevõtte müügitsüklid algavad

Vaadates edasi

AWS/Decart koostöö ei ole selle nädala silmapaistvam AI video uudis. Runway just väitis esikohta Video Arenal. Hiina laborid avaldasid võimsaid avatud lähtekoodiga mudeleid. Need lood saavad rohkem klikke.

Kuid infrastruktuur on see, kus tööstus tegelikult skaleerub. Üleminek "muljetavaldavast demost" "tootmissüsteemiks" nõuab täpselt seda, mida AWS ja Decart ehitavad: usaldusväärseid, kiireid, ettevõttetaseme aluseid.

💡

Seotud lugemine:

Mudeli sõjad tegid AI video võimalikuks. Infrastruktuur teeb selle praktiliseks.

Kas see artikkel oli kasulik?

Damien

Damien

Tehisintellekti arendaja

Tehisintellekti arendaja Lyonist, kes armastab keerulisi masinõppe kontseptsioone lihtsateks retseptideks muuta. Kui ta parasjagu mudeleid ei siluta, leiab teda Rhône'i oru kaudu jalgrattaga sõitmast.

Seotud artiklid

Jätkake uurimist nende seotud postitustega

Kas see artikkel meeldis teile?

Avastage rohkem põnevaid teadmisi ja püsige kursis meie uusima sisuga.

AWS ja Decart ehitavad esimese reaalajas AI video infrastruktuuri