A Runway Gen-4.5 az NVIDIA Rubinon: Az AI videók jövője itt van
A Runway partneri viszonyba kerül az NVIDIA-val a Gen-4.5 futtatásához a Rubin platformon, új előzmények teremtve az AI videók minőségében, sebességében és natív hanggenerálásában.

A partnerség, amellyel senki sem számított
- január 5-én a Runway bejelentett valami példátlant: a zászlóshajó Gen-4.5 modell az első AI videó generátor lenne, amely natívan működik az NVIDIA Rubin platformján. Nem optimalizálva. Nem kompatibilis. Natívan.
Mit jelent ez a tartalomkészítőknek? Mindent.
A Rubin NVL72 az NVIDIA válasza az AI infrastruktúra szűk keresztmetszetére. Miközben a versenytársak arra próbálnak összpontosítani, hogy a meglévő hardverből kinyerjenek teljesítményt, a Runway túlugrott az egész beszélgetésen. A Gen-4.5 most egy perces videókat generál natív hanggal, szövegkonzisztenciával a jeleneteken keresztül, és fizikai szimulációval, amely végre megbecsüli a gravitációt.
Miért számít ez jobban, mint egy újabb benchmark
Láttuk a benchmark háborúkat. Pár havonta valaki igényt követel, csak hogy néhány hét múlva lecsupaszított legyen. A Gen-4.5 Elo pontja 1,247 az Artificial Analysis-on számít, persze. De a "hogyan" még jobban számít.
A Runway ezt úgy érte el, hogy három problémát egyszerre oldott meg:
Natív hang-videó szintézis, nincs szükség külön munkafolyamatra. Multi-jelenet jelenetei állandó karakter identitással. Fizika, amely úgy viselkedik, ahogy a fizikának kellene.
A hang utólag kerül hozzáadásra. Karakter sodródás a vágások között. Objektumok, amelyek lebegnek, átmennek a falakon, vagy teleportálódnak.
A natív hanggenerálás kitűnik. Az előző modellek néma videót generáltak, így a tartalomkészítőknek vagy jingles zene hozzáadása vagy külön hangtörlési eszközök használata maradt. A Gen-4.5 párbeszédet, hangeffektusokat és környezeti hangot generál ugyanaz a diffúziós folyamat részeként. Az ajak szinkronizálása működik. A lépések egyeznek. Az esőzés úgy hangzik, mint az eső.
Az NVIDIA Rubin tényező
Hadd legyek kicsit technikai, mivel a hardver történet magyarázza a teljesítmény történetét.
A Rubin NVL72 nem csak "gyorsabb". Architekturálisan különbözik. A platform dedikált számítási útvonalakat szentel az időbeli koherenciának, amely az a oka annak, hogy az AI videók történelmileg olyan láz álmaiul néznek ki, ahol objektumok véletlenszerűen átalakulnak. Azzal, hogy a Gen-4.5-öt natív módon futtat a Rubinon, a Runway dedikált szilíciumot kap pontosan azokra a műveletre, amelyek a videót "jó" nézzék ki.
Az NVIDIA partnerség az árképzésre is magyarázatot ad. 25 kredit/másodpercnél a Gen-4.5 nem olcsó. De az infrastruktúra költsége valós idejű fizikai szimulációs futtatásnak a következő generációs hardveren sem olcsó. A Runway azt fogadja, hogy a minőség indokolja a prémiumot.
Hogyan áll a versennyel szemben
Az AI videó táj 2026 elején semmit sem hasonlít a 2025-hez. A Google frissítette a Veót a 3.1-re natív 4K és függőleges videóval. Az OpenAI a Sorát közösségi alkalmazássá alakította. A kínai versenytársak, mint a Kling, áron alatta licitálnak mindenkit.
De a Runway más fogadást tett: infrastruktúra az iteráció helyett.
| Model | Max felbontás | Natív hang | Karakter konzisztencia | Fizika minősége |
|---|---|---|---|---|
| Runway Gen-4.5 | 4K | Teljes | Kiváló | Kiváló |
| Google Veo 3.1 | 4K | Teljes | Jó | Jó |
| OpenAI Sora 2 | 1080p | Részleges | Jó | Jó |
| Kling 2.6 | 1080p | Teljes | Jó | Mérsékelt |
A felbontás és hang paritása a Veó 3.1-gyel ezt kétlovas versennyé teszi a prémium szinten. De figyeld meg azokat a fizika és karakter konzisztencia oszlopokat. Ott mutat meg az erősséget a Rubin partnerség.
A kreatív következmények
Az elmúlt héten mindent generáltam a zenevideoktól a termékinformációkig a Gen-4.5-tel. Íme, ami megváltoztatta az én munkafolyamatomat:
A multi-jelenet koherencia most valódi. Generálhatok egy karaktert az első jelenetben, vághat különbözik szögben a második jelenetben, és ugyanaz a személy megjelenik. Nem hasonló személy. Ugyanaz a személy. Ez nyilvánvalónak hangzik, de hat hónapja lehetetlen volt.
A hangdesign automatikusan történik. Amikor generálok egy jelenet valamit sétálók keresztül egy városban, kapok lépéseket, forgalmat, tömeg mormolákat és szelet. Nem tökéletesen kevert, de használható kiindulópontként. Korábban órákat töltöttem a foley-n. Most perceket töltök a beállításon.
A fizika egyszerűen működik. Az eldobott objektumok leesnek. Az eldobott objektumok ívet rajzolnak. A víz lefelé folyik. Az AI videó egy olyan fizika-opcionális univerzumban élt eddig.
Az oktatóanyagokért arról, hogy a legtöbbet hozza ki a Gen-4.5 prompt mérnökségéből, nézd meg az AI videó prompt teljes útmutatóját. Az elvek még mindig érvényesek, de a Gen-4.5 szignifikánsan jobb a komplex irányok értelmezésében.
A piaci elmozdulás
Ez a partnerség valamit nagyobbnál jelent, mint egyetlen termék frissítésénél. Az NVIDIA most közvetlenül befektetett a videó modell teljesítménye iránt. Ez megváltoztatja a verseny dinamikát az egész iparban.
Runway-NVIDIA partnerség
A partnerség bejelentésre kerül, a Gen-4.5 az első modell a Rubin platformon
Veo 3.1 válasz
A Google siet a 4K és függőleges videó frissítéssel a Veóhoz
Árnyomás
A kínai versenytársak 15-20%-os árcsokkentésre válaszul süllyednek
A vállalati elfogadás hullám, amely 2025-ben kezdődött, felgyorsul. Amikor egy 100 fős csapat felülmúlhatja billió dolláros vállalatokat videó minőségben, a régi szabályok az első eszközök építésérél már nem érvényesek.
Mi következik
A Runway elkötelezödé a negyedéves frissítésekért a Rubin platformon. Az ütemterv valós idejű generálást utal, amely még a következő generációs hardverrel sem lehetséges. De az alap már olyan szilárd, hogy ezt egy amikor kérdéssé teszi, nem ha kérdéssé.
A szélesebb trend egyértelmű. Az AI videó két piaci ágra hasad: prémium eszközök a professzionális tartalomkészítőkért, akiknek minőségre és irányításra van szükségük, és költségvetési eszközök mindenkinek másnak. A Runway az összes farmot a prémium piacra fogadja. A Gen-4.5 alapján ez az alap egyre okosabbnak tűnik.
A lényeg: A Runway Gen-4.5 az NVIDIA Rubinon az első AI videó rendszer, amely úgy tűnik, mintha a komolyabb kreatív munkára tervezték volna. A natív hang, fizikai szimulációs és karakter konzisztencia végre egyezik azzal, amit a professzionális munkafolyamatok igényelnek. 25 kredit/másodpercnél nem alkalmas a alkalmi felhasználók számára. De olyan tartalomkészítőknek, akiknek olyan eredményre van szükségük, amely úgy néz ki, mint eredmények, ez az új teljesítménycél.
Az AI videó néma korszaka véglegesen véget ért. Üdvözöljük a beszélgetéseket.
Hasznos volt ez a cikk?

Henry
Kreatív TechnológusKreatív technológus Lausanne-ból, aki azt kutatja, hol találkozik az AI a művészettel. Generatív modellekkel kísérletezik elektronikus zenei szesszióik között.
Kapcsolódó cikkek
Fedezd fel ezeket a kapcsolódó bejegyzéseket

Az Adobe és a Runway egyesíti erőit: mit jelent a Gen-4.5 partnerség a videókészítők számára
Az Adobe most tette a Runway Gen-4.5-öt az AI-videó alapjává a Firefly-ban. Ez a stratégiai szövetség újraformálja a professzionális munkafolyamatokat világszerte.

World Models: A következő határ az AI videógenerálásban
Miért alakítja át az AI videót a képkocka-generálásról a világ-szimulációra való áttérés, és mit árul el nekünk a Runway GWM-1-je arról, hogy hová tart ez a technológia.

Runway Gen-4.5 az 1. helyen: Hogyan előzte meg 100 mérnök a Google-t és az OpenAI-t
A Runway most szerezte meg az első helyet a Video Arenán a Gen-4.5-del, bebizonyítva, hogy egy kis csapat is felülmúlhatja a trillió dolláros óriásokat az AI videogenerálásban.