Meta Pixel
HenryHenry
8 min read
1489 từ

Runway Gen-4.5 trên NVIDIA Rubin: Tương lai của AI video đã đến

Runway hợp tác với NVIDIA để chạy Gen-4.5 trên nền tảng Rubin thế hệ tiếp theo, thiết lập những tiêu chuẩn mới cho chất lượng video AI, tốc độ và tạo âm thanh gốc.

Runway Gen-4.5 trên NVIDIA Rubin: Tương lai của AI video đã đến

Ready to create your own AI videos?

Join thousands of creators using Bonega.ai

Runway vừa thay đổi luật chơi. Bằng cách hợp tác với NVIDIA để chạy Gen-4.5 trên nền tảng Rubin NVL72, họ đã tạo ra mô hình video AI đầu tiên không giống như một công cụ mà giống như một người cộng tác viên.

Sự hợp tác mà không ai dự đoán được

Vào ngày 5 tháng 1 năm 2026, Runway đã công bố điều chưa từng có: mô hình Gen-4.5 hàng đầu của họ sẽ là trình tạo video AI đầu tiên chạy trên nền tảng Rubin của NVIDIA. Không phải tối ưu hóa. Không phải tương thích. Mà là gốc.

Điều này có nghĩa gì đối với những người sáng tạo? Mọi thứ.

Rubin NVL72 là câu trả lời của NVIDIA với tình trạng tắc nghẽn cơ sở hạ tầng AI. Trong khi các đối thủ cạnh tranh cố gắng nén hiệu suất từ phần cứng hiện tại, Runway đã vượt qua toàn bộ cuộc trò chuyện. Gen-4.5 hiện tạo các video dài một phút với âm thanh gốc, tính nhất quán của nhân vật giữa các cảnh, và mô phỏng vật lý cuối cùng tôn trọng trọng lực.

1,247
Điểm Elo (Video Arena)
60 giây
Độ dài video tối đa
4K
Độ phân giải gốc

Tại sao điều này quan trọng hơn một tiêu chuẩn khác

Chúng ta đã thấy những cuộc chiến tiêu chuẩn. Cứ sau vài tháng, ai đó tuyên bố ngôi vương, rồi bị lật đổ vài tuần sau. Điểm Elo 1,247 của Gen-4.5 trên Artificial Analysis rất quan trọng. Nhưng cách thực hiện lại quan trọng hơn.

Runway đã đạt được điều này bằng cách giải quyết ba vấn đề đồng thời:

Những gì Gen-4.5 cung cấp

Tổng hợp âm thanh video gốc, không cần quy trình riêng biệt. Cảnh đa cảnh với nhận dạng nhân vật liên tục. Vật lý hoạt động như vật lý nên hoạt động.

Những gì các đối thủ vẫn đang vật lộn

Âm thanh được thêm vào sau. Nhân vật trôi dạt giữa các lần cắt. Các đối tượng nổi, xuyên qua tường hoặc dịch chuyển tức thời.

Tạo âm thanh gốc nổi bật. Các mô hình trước đây tạo video im lặng, buộc những người sáng tạo phải thêm nhạc kho hoặc sử dụng các công cụ âm thanh riêng biệt. Gen-4.5 tạo ra các đối thoại, hiệu ứng âm thanh và âm thanh xung quanh như một phần của quá trình khuếch tán tương tự. Ghép môi hoạt động. Bước chân phù hợp. Mưa nghe như mưa.

Yếu tố NVIDIA Rubin

Hãy để tôi vào một chút kỹ thuật ở đây, bởi vì câu chuyện phần cứng giải thích câu chuyện hiệu suất.

Rubin NVL72 không chỉ là "nhanh hơn". Nó khác nhau về mặt kiến trúc. Nền tảng dành riêng các đường tính toán cụ thể cho sự liên kết theo thời gian, lý do tại sao các video AI theo lịch sử trông giống như những giấc mơ sốt cao nơi các vật thể biến đổi một cách ngẫu nhiên. Bằng cách xây dựng Gen-4.5 để chạy gốc trên Rubin, Runway nhận được phần cứng dành riêng cho các hoạt động chính xác làm cho video trông tốt.

💡

Sự hợp tác của NVIDIA cũng giải thích về định giá. Với 25 tín dụng mỗi giây, Gen-4.5 không rẻ. Nhưng chi phí cơ sở hạ tầng để chạy mô phỏng vật lý thời gian thực trên phần cứng thế hệ tiếp theo cũng không rẻ. Runway đang cược rằng chất lượng sẽ biện minh cho giá cao hơn.

So sánh với các đối thủ

Bối cảnh video AI vào đầu năm 2026 trông hoàn toàn khác năm 2025. Google nâng cấp Veo lên 3.1 với 4K gốc và video dọc. OpenAI biến Sora thành một ứng dụng xã hội. Các đối thủ từ Trung Quốc như Kling đang cạnh tranh chiếc vương miện về giá cả.

Nhưng Runway đã đặt cược khác: cơ sở hạ tầng thay vì lặp lại.

Mô hìnhĐộ phân giải tối đaÂm thanh gốcTính nhất quán nhân vậtChất lượng vật lý
Runway Gen-4.54KToàn bộXuất sắcXuất sắc
Google Veo 3.14KToàn bộTốtTốt
OpenAI Sora 21080pMột phầnTốtTốt
Kling 2.61080pToàn bộTốtKhá

Sự ngang nhau về độ phân giải và âm thanh với Veo 3.1 biến nó thành cuộc đua của hai mã. Nhưng hãy chú ý đến các cột vật lý và tính nhất quán của nhân vật. Đó là nơi sự hợp tác Rubin thể hiện giá trị của nó.

Những hàm ý sáng tạo

Tôi đã dành cả tuần qua tạo mọi thứ từ video âm nhạc đến bản demo sản phẩm với Gen-4.5. Đây là những gì thay đổi quy trình làm việc của tôi:

**Sự liên kết đa cảnh hiện nay là thực. ** Tôi có thể tạo một nhân vật trong cảnh một, cắt sang một góc khác trong cảnh hai, và cùng một người xuất hiện. Không phải một người tương tự. Cùng một người. Nghe có vẻ hiển nhiên, nhưng điều này là không thể sáu tháng trước.

Thiết kế âm thanh diễn ra tự động. Khi tôi tạo một cảnh của ai đó đi qua thành phố, tôi nghe thấy bước chân, giao thông, tiếng gọi của đám đông và gió. Không hoàn toàn trộn, nhưng có thể sử dụng được như một điểm bắt đầu. Tôi từng dành hàng giờ để làm việc Foley. Bây giờ tôi dành vài phút để điều chỉnh.

Vật lý chỉ hoạt động. Các vật thể thả xuống dưới. Các vật thể ném tạo thành cung. Nước chảy xuống dốc. Video AI đã sống trong một vũ trụ nơi vật lý là tùy chọn cho đến bây giờ.

💡

Để tìm các hướng dẫn về cách tận dụng tối đa kỹ thuật nhắc nhở với Gen-4.5, hãy xem hướng dẫn hoàn chỉnh về nhắc nhở video AI của chúng tôi. Các nguyên tắc vẫn áp dụng, nhưng Gen-4.5 tốt hơn đáng kể trong việc diễn giải các hướng dẫn phức tạp.

Sự thay đổi của thị trường

Sự hợp tác này báo hiệu điều lớn hơn một bản cập nhật sản phẩm. NVIDIA hiện đang đầu tư trực tiếp vào hiệu suất mô hình video. Điều đó thay đổi động lực cạnh tranh trên toàn bộ ngành.

5 tháng 1 năm 2026

Sự hợp tác Runway-NVIDIA

Sự hợp tác được công bố, Gen-4.5 trở thành mô hình đầu tiên trên nền tảng Rubin

13 tháng 1 năm 2026

Phản ứng Veo 3.1

Google vội vàng cập nhật 4K và video dọc cho Veo

Tháng 1 năm 2026

Áp lực giá

Các đối thủ từ Trung Quốc giảm giá 15-20% để đối phó

Làn sóng áp dụng doanh nghiệp bắt đầu từ năm 2025 sẽ tăng tốc. Khi một đội 100 người có thể vượt trội hơn các công ty trị giá hàng tỷ đô la về chất lượng video, các quy tắc cũ về ai xây dựng các công cụ sáng tạo sẽ không còn áp dụng.

Những gì sẽ đến tiếp theo

Runway đã cam kết cập nhật hàng quý trên nền tảng Rubin. Lộ trình gợi ý tạo thời gian thực, hiện tại không thể thực hiện ngay cả với phần cứng thế hệ tiếp theo. Nhưng nền tảng hiện đã đủ vững chắc để thay đổi nó từ câu hỏi "nếu" thành "khi nào".

Xu hướng rộng hơn là rõ ràng. Video AI được chia thành hai thị trường: các công cụ cao cấp cho những người sáng tạo chuyên nghiệp cần chất lượng và kiểm soát, và các công cụ ngân sách cho mọi người khác. Runway đang cược mọi thứ vào thị trường cao cấp. Dựa trên Gen-4.5, cược đó trông ngày càng thông minh hơn.

Kết luận: Runway Gen-4.5 trên NVIDIA Rubin là hệ thống video AI đầu tiên trông giống như nó được thiết kế cho công việc sáng tạo nghiêm túc. Âm thanh gốc, mô phỏng vật lý và tính nhất quán của nhân vật cuối cùng phù hợp với những gì quy trình làm việc chuyên nghiệp yêu cầu. Với 25 tín dụng mỗi giây, nó không phải cho những người dùng bình thường. Nhưng đối với những người sáng tạo cần kết quả trông giống như kết quả, đây là tiêu chuẩn mới.

Thời kỳ im lặng của video AI đã kết thúc rõ ràng. Chào mừng bạn đến với thời kỳ phim nói.

Bài viết này có hữu ích không?

Henry

Henry

Chuyên gia Công nghệ Sáng tạo

Chuyên gia công nghệ sáng tạo đến từ Lausanne, khám phá nơi AI gặp gỡ nghệ thuật. Thử nghiệm với các mô hình sinh tạo giữa những buổi làm nhạc điện tử.

Like what you read?

Turn your ideas into unlimited-length AI videos in minutes.

Bài viết liên quan

Tiếp tục khám phá với những bài viết liên quan

Bạn có thích bài viết này không?

Khám phá thêm thông tin chi tiết và cập nhật những nội dung mới nhất của chúng tôi.

Runway Gen-4.5 trên NVIDIA Rubin: Tương lai của AI video đã đến