Runway Gen-4.5 đạt vị trí số 1: 100 kỹ sư vượt qua Google và OpenAI

Một startup 100 người vừa giành ngôi vương từ Google và OpenAI. Model Gen-4.5 của Runway đã đạt vị trí số 1 trên bảng xếp hạng Video Arena tuần này, và ý nghĩa của điều này thật đáng chú ý.

Chiến thắng của kẻ yếu thế không nên xảy ra

Hãy để chúng tôi mô tả bối cảnh. Một bên: Google DeepMind với Veo 3, được hỗ trợ bởi nguồn tài nguyên tính toán khổng lồ và một trong những bộ dữ liệu video lớn nhất hành tinh (YouTube). Bên kia: OpenAI với Sora 2, đang tận dụng đà từ sự thống trị của ChatGPT và hàng tỷ đô la nguồn vốn. Và ở đâu đó giữa: Runway, với đội ngũ cốt lõi khoảng 100 kỹ sư làm việc trên Gen-4.5 và chỉ một phần nhỏ nguồn lực.

Đoán xem ai đang ở vị trí đầu?

Xếp hạng Video Arena

~100

Đội ngũ Gen-4.5

$1T+

Vốn hóa đối thủ

CEO Runway Cristóbal Valenzuela đã nói thẳng thắn: "Chúng tôi đã cạnh tranh thành công với các công ty nghìn tỷ đô la bằng đội ngũ 100 người." Đó không phải là lời quảng cáo. Đó là sự thật từ bảng xếp hạng Video Arena.

Video Arena thực sự cho chúng ta biết điều gì

💡

Video Arena sử dụng đánh giá của con người một cách khách quan, nơi các giám khảo so sánh video mà không biết model nào tạo ra chúng. Đây là thước đo khách quan nhất chúng ta có cho chất lượng tạo video AI.

Bảng xếp hạng quan trọng vì nó loại bỏ yếu tố marketing khỏi phương trình. Không có demo được chọn lọc kỹ càng. Không có ví dụ được sắp xếp cẩn thận. Chỉ có các kết quả ẩn danh, đặt cạnh nhau, được đánh giá bởi hàng nghìn người.

Và Gen-4.5 đứng ở vị trí đầu.

Điều đặc biệt thú vị là Sora 2 Pro của OpenAI đứng ở đâu: vị trí thứ 7. Đó là model từ một công ty có nguồn lực gấp 30 lần, rơi xuống vị trí thứ 7. Khoảng cách giữa sự cường điệu và hiệu suất chưa bao giờ rõ ràng hơn thế.

Gen-4.5 thực sự mang lại điều gì

Hãy để chúng tôi phân tích những gì Runway đã phát hành với bản cập nhật này:

🎯

Cải thiện việc tuân theo prompt

Model hiểu các hướng dẫn phức tạp, nhiều phần tốt hơn các phiên bản trước. Chỉ định chuyển động camera, tâm trạng ánh sáng và hành động nhân vật trong một prompt, và nó thực sự thực hiện cả ba.

🎨

Nâng cao chất lượng hình ảnh

Chi tiết sắc nét hơn, tính nhất quán thời gian tốt hơn, ít lỗi hơn. Những điều thường thấy cho bất kỳ bản cập nhật lớn nào, nhưng sự cải thiện đáng chú ý trong thử nghiệm thực tế.

⚡

Tạo nhanh hơn

Thời gian tạo giảm đáng kể so với Gen-4. Đối với quy trình sản xuất nơi tốc độ lặp lại quan trọng, điều này nhanh chóng tích lũy.

✓Điểm mạnh Gen-4.5

Chất lượng hình ảnh xếp hạng cao nhất trong các bài kiểm tra mù
Cải thiện vật lý và tính nhất quán chuyển động
Xử lý tốt hơn các cảnh phức tạp
Tính nhất quán nhân vật mạnh mẽ qua các cảnh quay

✗Đánh đổi

Vẫn chưa có âm thanh gốc (lợi thế của Sora 2)
Độ dài clip tối đa không thay đổi
Giá cao cấp cho người dùng nhiều

Khoảng cách âm thanh gốc vẫn còn. Sora 2 tạo âm thanh đồng bộ trong một lần, trong khi người dùng Runway vẫn cần quy trình âm thanh riêng. Với một số nhà sáng tạo, đây là điều không thể chấp nhận. Với những người khác đang làm việc trong quy trình hậu kỳ, lợi thế chất lượng hình ảnh quan trọng hơn.

Tại sao đội ngũ nhỏ chiến thắng

Đây có thể là điều đã xảy ra, với những ý nghĩa vượt ra ngoài AI video.

Các tổ chức lớn tối ưu hóa cho những thứ khác với các tổ chức nhỏ. Google và OpenAI đang xây dựng nền tảng, quản lý cơ sở hạ tầng khổng lồ, điều hướng chính trị nội bộ và phát hành đồng thời trên hàng chục dòng sản phẩm. Runway đang xây dựng một thứ: model tạo video tốt nhất họ có thể làm.

💡

Sự tập trung thắng nguồn lực khi vấn đề được xác định rõ ràng. Tạo video AI vẫn là một thách thức kỹ thuật tập trung, không phải một cuộc chơi hệ sinh thái rộng lớn.

Runway cũng đã ở trong lĩnh vực cụ thể này lâu hơn bất kỳ ai. Họ phát hành Gen-1 trước khi Sora tồn tại. Kiến thức tổ chức đó, sự hiểu biết tích lũy về những gì làm cho tạo video hoạt động, tích lũy theo thời gian.

Phản ứng của thị trường

Thị trường tạo video AI dự kiến sẽ tăng từ 716,8 triệu đô la vào năm 2025 lên 2,56 tỷ đô la vào năm 2032, tốc độ tăng trưởng kép hàng năm 20%. Sự tăng trưởng đó giả định cạnh tranh tiếp tục thúc đẩy đổi mới.

Bối cảnh hiện tại (tháng 12 năm 2025):

Runway Gen-4.5: Số 1 trên Video Arena, mạnh cho công việc thương mại/sáng tạo
Sora 2: Lợi thế âm thanh gốc, nhưng chất lượng hình ảnh ở vị trí thứ 7
Veo 3: Chuyển động con người tốt nhất, tích hợp với hệ sinh thái Google
Pika 2.5: Tùy chọn giá trị tốt nhất, chế độ turbo nhanh
Kling AI: Bắt chuyển động mạnh mẽ, tạo âm thanh tích hợp

Những gì đã thay đổi từ một tuần trước là sự rõ ràng của bảng xếp hạng. Trước Gen-4.5, bạn có thể lập luận bất kỳ trong ba hàng đầu là "tốt nhất" tùy thuộc vào tiêu chí của bạn. Bây giờ có một nhà lãnh đạo benchmark rõ ràng, ngay cả khi những người khác có lợi thế về tính năng.

Điều này có ý nghĩa gì với các nhà sáng tạo

Nếu bạn đang chọn công cụ AI video chính ngay bây giờ, đây là quan điểm cập nhật của tôi:

✓Chất lượng hình ảnh là ưu tiên? Runway Gen-4.5
✓Cần âm thanh tích hợp? Sora 2 (vẫn vậy)
✓Chuyển động con người thực tế? Veo 3
✓Hạn chế ngân sách? Pika 2.5 Turbo

Công cụ "tốt nhất" vẫn phụ thuộc vào quy trình cụ thể của bạn. Nhưng nếu ai đó hỏi tôi model nào tạo ra video chất lượng cao nhất ngay bây giờ, câu trả lời rõ ràng hơn tháng trước.

Bức tranh toàn cảnh

⚠️

Cạnh tranh là tốt. Khi các công ty nghìn tỷ đô la không thể dựa vào nguồn lực của họ, mọi người đều hưởng lợi từ đổi mới nhanh hơn.

Điều khiến tôi phấn khích về kết quả này không chỉ là Runway chiến thắng. Đó là bằng chứng cho thấy không gian AI video chưa được hợp nhất. Một đội ngũ nhỏ, tập trung vẫn có thể cạnh tranh ở cấp độ cao nhất. Điều đó có nghĩa là chúng ta có thể sẽ thấy sự đổi mới mạnh mẽ liên tục từ tất cả các bên thay vì thị trường bị chi phối bởi người có nhiều GPU nhất.

Vài tháng tới sẽ thú vị. Google và OpenAI sẽ không chấp nhận vị trí thứ 7 một cách lặng lẽ. Runway sẽ cần tiếp tục phấn đấu. Và ở đâu đó, một đội ngũ nhỏ khác có thể đang xây dựng điều gì đó sẽ làm tất cả mọi người ngạc nhiên.

Dự đoán của tôi

Đến giữa năm 2026, chúng ta sẽ nhìn lại tháng 12 năm 2025 như là khoảnh khắc tạo video AI thực sự trở nên cạnh tranh. Không phải theo nghĩa "ba tùy chọn tốt", mà theo nghĩa "nhiều công ty thúc đẩy nhau phát hành sản phẩm tốt hơn nhanh hơn".

Những gì sắp đến:

Âm thanh gốc từ nhiều model hơn
Thời lượng clip dài hơn
Mô phỏng vật lý tốt hơn
Tạo thời gian thực

Những gì không thay đổi:

Cạnh tranh thúc đẩy đổi mới
Đội ngũ nhỏ đấm trên sức nặng
Tính đặc thù trường hợp sử dụng quan trọng

Các công cụ phát hành vào cuối năm 2026 sẽ làm cho Gen-4.5 trông nguyên thủy. Nhưng ngay bây giờ, cho khoảnh khắc này trong tháng 12 năm 2025, Runway giữ vương miện. Và đó là một câu chuyện đáng kể: đội ngũ 100 người vượt qua những gã khổng lồ.

Nếu bạn đang xây dựng với AI video, đây là thời điểm tốt nhất để thử nghiệm. Các công cụ đủ tốt để hữu ích, đủ cạnh tranh để tiếp tục cải thiện, và đủ dễ tiếp cận để bạn có thể thử tất cả. Chọn công cụ phù hợp với quy trình của bạn và bắt đầu sáng tạo.

Tương lai của video đang được viết ngay bây giờ, từng thế hệ một.