Meta Pixel
DamienDamien
6 min read
1065 vārdi

AWS un Decart izveido pirmo reāllaika AI video infrastruktūru

Amazon Web Services sadarbojas ar AI jaunuzņēmumu Decart, lai izveidotu uzņēmuma līmeņa infrastruktūru AI video ģenerēšanai ar zemu latentumu, iezīmējot pāreju no modeļu konkurences uz infrastruktūras dominēšanu.

AWS un Decart izveido pirmo reāllaika AI video infrastruktūru

Kamēr visi debatē, vai Runway vai Sora ģenerē labākas sprādzienus, AWS klusi nomainīja spēles noteikumus. Viņu partnerība ar Decart nav par skaistāku video veidošanu. Tā ir par AI video ģenerēšanas paātrināšanu līdz ātrumam, kas ir nozīmīgs uzņēmumu lietojumprogrammām.

Infrastruktūras slāņa atmoda

AI video ģenerēšanas joma ir bijusi apsēsta ar vienu jautājumu: kurš modelis rada visfotoreālistiskāko rezultātu? Mēs esam aprakstījuši Runway Gen-4.5 uzvaru Video Arena, Sora 2 izrāvienu un atvērtā koda alternatīvas, kas izaicina īpašumtiesību gigantus.

Bet ir tas, par ko neviens nerunāja: latentums.

💡

10 sekunžu video ģenerēšana 2 minūtēs ir iespaidīga radošai demonstrācijai. Tā ir bezjēdzīga tiešraidei, interaktīvai lietojumprogrammai vai uzņēmuma darba plūsmai, kas apstrādā tūkstošiem video katru dienu.

AWS un Decart paziņoja par savu partnerību AWS re:Invent 2025, un tā pārstāv fundamentālu maiņu veidu, kā mums vajadzētu domāt par AI video infrastruktūru.

Ko Decart piedāvā

Decart nav mājsaimniecības vārds kā Runway vai OpenAI. Viņi ir klusi būvējuši kaut ko citu: AI modeļus, kas optimizēti reāllaika secinājumiem, nevis maksimālai kvalitātei par jebkuru cenu.

10x
Latentuma samazinājums
≤40ms
Pirmais kadrs
Uzņēmums
Mēroga fokuss

Veiktspējas rādītāji no AWS re:Invent 2025 partnerības paziņojuma

Viņu pieeja prioritizē:

  • Zems latentums ģenerēšanai: Sekundes daļu reakcijas laiki video kadriem
  • Augsts caurlaides ātrums: Tūkstošu pieprasījumu apstrāde vienlaicīgi
  • Prognozējama veiktspēja: Konsekvents latentums mainīgās slodzēs

Šis ir garlaicīgais, būtiskais darbs, kas padara AI video praktisku produkcijas sistēmām.

AWS Trainium: Pielāgots silīcijs video AI

Partnerība izmanto AWS Trainium čipus, Amazon pielāgotus AI paātrinātājus. Atšķirībā no vispārēja lietojuma GPU, Trainium ir būvēts īpaši mašīnmācīšanās darba slodzēm.

Tradicionālā GPU pieeja

Vispārēja lietojuma aparatūra, augstāks latentums, mainīga veiktspēja slodzes apstākļos, dārga lielā mērogā

AWS Trainium pieeja

Mērķtiecīgi būvēts silīcijs, optimizēta atmiņas joslas platums, prognozējams latentums, izmaksu efektīvs uzņēmuma mērogā

Īpaši video ģenerēšanai Trainium arhitektūra risina atmiņas joslas platuma problēmu, kas nomoka uz transformatoru balstītus video modeļus. Masīvu tenzoru pārvietošana starp atmiņu un skaitļošanu bieži ir lēnākā secinājumu daļa, un pielāgots silīcijs var optimizēt šos datu ceļus veidā, kā vispārēja aparatūra nevar.

Amazon Bedrock integrācija

Tehniskais pamats darbojas caur Amazon Bedrock, AWS pārvaldīto pakalpojumu pamata modeļiem. Tas nozīmē, ka uzņēmumi saņem:

  • Vienu API vairākām AI video iespējām
  • Iebūvētu mērogošanu un slodzes līdzsvarošanu
  • Uzņēmuma drošību un atbilstību (SOC 2, HIPAA, utt.)
  • Maksā par lietošanu cenas bez infrastruktūras pārvaldības

Bedrock integrācija ir nozīmīga, jo tā samazina barjeru uzņēmumiem, kas jau izmanto AWS. Nav jaunu piegādātāju attiecību, nav atsevišķu rēķinu, nav papildu drošības pārskatīšanu.

Kāpēc reāllaiks ir svarīgs

Ļaujiet man uzzīmēt ainu par to, ko iespējo reāllaika AI video:

Tiešraides pārraides

  • Reāllaika grafiku ģenerēšana
  • Dinamiskas ainas paplašināšana
  • Tūlītēja atkārtojuma uzlabošana

Interaktīvas lietojumprogrammas

  • Spēļu starpainas ģenerētas pēc pieprasījuma
  • Personalizētas video atbildes
  • Reāllaika video rediģēšanas palīdzība

Uzņēmuma darba plūsmas

  • Automatizētas video produkcijas konveijeri
  • Pakešu apstrāde mērogā
  • Integrācija ar esošajām mediju sistēmām

E-komercija

  • Produktu video ģenerēti no attēliem
  • Personalizēts mārketinga saturs
  • A/B testēšana video mērogā

Neviens no šiem lietojuma gadījumiem nedarbojas ar 2 minūšu ģenerēšanas laikiem. Tiem ir nepieciešamas atbildes milisekundēs līdz sekundēm.

Uzņēmuma spēle

Šī partnerība signalizē AWS stratēģiju: ļaujiet jaunuzņēmumiem cīnīties par to, kurš veido skaistākās demonstrācijas, kamēr Amazon pārņem infrastruktūras slāni.

💡

AI zelta drudzī AWS pārdod ķīļus. Un lāpstas. Un zemes tiesības. Un analīzes biroju.

Apsveriet ekonomiku:

PieejaKas maksāIeņēmumu modelis
Patērētāju AI videoIndividuālie veidotājiAbonements ($20-50/mēnesī)
API piekļuveIzstrādātājiPar ģenerēšanu ($0.01-0.10)
InfrastruktūraUzņēmumiSkaitļošanas stundas ($tūkstoši/mēnesī)

AWS nekonkurē ar Runway par jūsu $20/mēnesī. Viņi pozicionējas, lai pārņemtu uzņēmumu budžetus, kas pārspēj patērētāju abonementus.

Ko tas nozīmē tirgum

2024

Modeļu kari sākas

Sora paziņojums izraisa sacīkstes par labāko ģenerēšanas kvalitāti

2025. gada sākums

Kvalitātes konverģence

Labākie modeļi sasniedz līdzīgus kvalitātes līmeņus, diferenciācija kļūst grūtāka

2025. gada beigas

Infrastruktūras fokuss

AWS/Decart partnerība signalizē pāreju uz izvietošanu un mērogu

2026

Uzņēmumu ieviešana

Reāllaika spējas iespējo jaunus produkcijas lietojuma gadījumus

Mēs ienākam AI video "garlaicīgajā, bet būtiskajā" fāzē. Krāšņie modeļu salīdzinājumi turpināsies, bet īstā nauda plūdīs uz infrastruktūru, kas padara AI video praktisku biznesam.

Tehniskās sekas

Izstrādātājiem un ML inženieriem šī partnerība norāda uz vairākām tendencēm:

1. Optimizācija pār arhitektūru

Nākamais inovāciju vilnis koncentrēsies uz esošo arhitektūru paātrināšanu, nevis jaunu izgudrojumu. Tehnikas kā:

  • Spekulatīvā dekodēšana video transformatoriem
  • Kvantizācijas apzināta apmācība secinājumu efektivitātei
  • Lielu modeļu destilācija izvietošanai draudzīgās versijās

2. Hibrīdie izvietošanas modeļi

Sagaidiet vairāk risinājumu, kas kombinē:

  • Mākoņa infrastruktūra sprādziena kapacitātei
  • Malas izvietošana latentumam kritisku ceļu
  • Pakāpeniska kvalitāte, pamatojoties uz lietojuma gadījuma prasībām

3. Standartizācija

Uzņēmumu ieviešana prasa prognozējamas saskarnes. Sekojiet:

  • Kopīgas API pāri piegādātājiem
  • Standartizēti kvalitātes rādītāji
  • Savstarpēja saderība starp platformām

Konkurences ainava

AWS nav vienīgais, kas atpazīst šo iespēju:

🔵

Google Cloud

Vertex AI jau piedāvā video ģenerēšanu, iespējams, paziņos līdzīgas reāllaika spējas

🟠

Azure

Microsoft OpenAI partnerība varētu paplašināties uz uzņēmumu video infrastruktūru

🟢

NVIDIA

Viņu secinājumu platforma (TensorRT, Triton) paliek noklusējums pašu izvietotiem izvietojumiem

Infrastruktūras karš tikai sākas. AWS izšāva pirmo šāvienu ar Decart partnerību, bet sagaidiet ātras atbildes no konkurentiem.

Praktiskie secinājumi

Uzņēmumu komandām:

  • Novērtējiet savas AI video latentuma prasības tagad
  • Apsveriet Bedrock, ja jau lietojat AWS
  • Plānojiet reāllaika spējas savā ceļa kartē

Izstrādātājiem:

  • Apgūstiet secinājumu optimizācijas tehniku
  • Saprotiet Trainium un pielāgota silīcija kompromisus
  • Veidojiet ar latentuma budžetiem prātā

AI video jaunuzņēmumiem:

  • Infrastruktūras diferenciācija var būt svarīgāka nekā modeļa kvalitāte
  • Partnerības iespējas ar mākoņa piegādātājiem atveras
  • Uzņēmumu pārdošanas cikli sākas

Skats uz priekšu

AWS/Decart partnerība nav krāšņākā AI video ziņa šonedēļ. Runway tikko pieprasīja augstāko vietu Video Arena. Ķīniešu laboratorijas izlaida spēcīgus atvērtā koda modeļus. Tie stāsti saņem vairāk klikšķu.

Bet infrastruktūra ir vieta, kur nozare faktiski mērogās. Pāreja no "iespaidīgas demonstrācijas" uz "produkcijas sistēmu" prasa tieši to, ko AWS un Decart būvē: uzticamus, ātrus, uzņēmuma līmeņa pamatus.

💡

Saistītā literatūra:

Modeļu kari padarīja AI video iespējamu. Infrastruktūra to padarīs praktisku.

Vai šis raksts bija noderīgs?

Damien

Damien

MI Izstrādātājs

MI izstrādātājs no Lionas, kurš mīl pārvērst sarežģītus mašīnmācības jēdzienus vienkāršās receptēs. Kad neatkļūdo modeļus, viņu var atrast braucot ar velosipēdu caur Ronas ieleju.

Saistītie raksti

Turpiniet izpēti ar šiem saistītajiem rakstiem

Vai jums patika šis raksts?

Atklājiet vairāk ieskatu un sekojiet līdzi mūsu jaunākajam saturam.

AWS un Decart izveido pirmo reāllaika AI video infrastruktūru