Meta Mango: Bên Trong Mô Hình AI Video Bí Mật Nhằm Vượt Qua OpenAI và Google
Meta công bố Mango, một mô hình AI video và hình ảnh mới nhắm đến việc phát hành vào năm 2026. Với Alexandr Wang, đồng sáng lập Scale AI đứng đầu, liệu Meta có thể bắt kịp trong cuộc đua AI sinh tạo?

Sau nhiều tháng đuổi theo trong cuộc đua AI sinh tạo, Meta vừa tiết lộ dự án tham vọng nhất của mình: một mô hình AI video và hình ảnh có tên mã là Mango. Dự kiến phát hành vào nửa đầu năm 2026, đây là cú đặt cược táo bạo nhất của gã khổng lồ truyền thông xã hội vào AI thị giác cho đến nay.
Thông Báo Gây Chấn Động Thung Lũng Silicon
Tin tức được công bố trong buổi hỏi đáp nội bộ tại Meta vào thứ Năm, ngày 19 tháng 12. Giám đốc Sản phẩm Chris Cox và Alexandr Wang, đồng sáng lập Scale AI hiện đang lãnh đạo Phòng thí nghiệm Siêu Trí tuệ của Meta, đã công bố lộ trình khiến các nhân viên phấn khích.
Hai mô hình. Hai tên mã. Một tham vọng khổng lồ.
Trong khi Avocado tập trung vào văn bản, lý luận và khả năng lập trình được cải thiện, Mango là trung tâm sức mạnh về thị giác. Theo các nguồn tin nội bộ, Meta đang khám phá "các mô hình thế giới hiểu thông tin thị giác và có thể lý luận, lập kế hoạch và hành động mà không cần được đào tạo về mọi khả năng".
Đó không chỉ là tạo video. Đó là tiếp cận điều gì đó giống như hiểu biết video hơn.
Tại Sao Meta Cần Chiến Thắng Này
Hãy thành thật: Meta đã gặp khó khăn trong cuộc đua AI.
Trong khi OpenAI thu hút trí tưởng tượng của thế giới với ChatGPT và hiện nay là tạo video chính xác về vật lý của Sora 2, và Google tiến lên với Veo 3 và tổng hợp âm thanh gốc, trợ lý AI của Meta vẫn ở mức ổn. Có chức năng. Nhưng không mang tính cách mạng.
Trợ lý AI của Meta tiếp cận hàng tỷ người thông qua Facebook, Instagram và WhatsApp. Nhưng phân phối không giống với đổi mới. Công ty cần một sản phẩm đột phá, không chỉ là một sản phẩm tầm thường được phân phối rộng rãi.
Thời điểm phát triển Mango không phải là ngẫu nhiên. Vào mùa hè, Meta đã trải qua một cuộc tái cấu trúc AI đáng kể. Wang nắm quyền điều hành Phòng thí nghiệm Siêu Trí tuệ Meta (MSL) mới được thành lập, và công ty đã có chiến dịch tuyển dụng mạnh mẽ, mang đến hơn 20 nhà nghiên cứu từ OpenAI và mở rộng với hơn 50 chuyên gia AI mới.
Yếu Tố Alexandr Wang
Nếu bạn không biết Alexandr Wang, bạn nên biết. Anh ấy đồng sáng lập Scale AI khi 19 tuổi và biến nó thành một công ty trị giá 13 tỷ đô la cung cấp cơ sở hạ tầng dữ liệu đằng sau một số hệ thống AI tiên tiến nhất thế giới. Việc anh ấy lãnh đạo MSL cho thấy Meta không chỉ đơn thuần là ném tiền vào vấn đề. Họ đang đưa vào một người hiểu toàn bộ quy trình AI, từ gắn nhãn dữ liệu đến triển khai mô hình.
Thành Tích của Scale AI
Scale AI đã làm việc với OpenAI, Google và Bộ Quốc phòng Hoa Kỳ. Wang hiểu những gì cần thiết để xây dựng các mô hình hoạt động ở quy mô lớn.
Việc Meta chọn người ngoài thay vì thăng chức từ bên trong nói lên rất nhiều về sự cấp bách của họ. Đây không phải là công việc như thường lệ. Đây là một sự khởi động lại.
Mango Có Thể Có Ý Nghĩa Gì Với Người Sáng Tạo
Đây là nơi mọi thứ trở nên thú vị đối với những người chúng ta thực sự tạo nội dung.
Instagram và Facebook đã bị video dạng ngắn và dạng dài chiếm ưu thế. Meta có khả năng phân phối. Những gì họ thiếu là các công cụ sáng tạo mà các đối thủ cạnh tranh đang chạy đua để xây dựng. Hãy tưởng tượng:
- Chỉnh sửa video hỗ trợ AI trực tiếp trong Instagram
- Hiệu ứng hình ảnh tự động cho Reels
- Tạo video từ văn bản cho việc tạo quảng cáo
- Tạo nội dung nhất quán về phong cách trên các bài đăng
- Kiểm duyệt nội dung ở quy mô lớn
- Phân biệt nội dung AI với con người
- Phản ứng dữ dội của người sáng tạo về tính xác thực
- Vấn đề niềm tin nền tảng
Nếu Mango thực hiện lời hứa "mô hình thế giới" của mình, chúng ta đang nhìn vào AI không chỉ tạo khung hình video. Nó hiểu điều gì đang xảy ra trong một cảnh, có thể lý luận về vật lý và đối tượng, và có thể thao tác nội dung thị giác với sự hiểu biết thực sự.
Đó là một điều kiện lớn. Nhưng tiềm năng là rất lớn.
Bối Cảnh Cạnh Tranh Năm 2026
Vào thời điểm Mango phát hành vào nửa đầu năm 2026, bối cảnh video AI sẽ trông rất khác so với ngày hôm nay.
| Công ty | Mô hình | Điểm Mạnh Chính |
|---|---|---|
| OpenAI | Sora 2 | Mô phỏng vật lý, nhân vật Disney |
| Veo 3 | Âm thanh gốc, công cụ chỉnh sửa Flow | |
| Runway | Gen-4.5 | Chất lượng hình ảnh, tích hợp Adobe |
| Meta | Mango | Phân phối, tích hợp xã hội |
Lợi thế của Meta không phải là sự vượt trội về kỹ thuật. Ít nhất là chưa phải. Đó là thực tế rằng 3 tỷ người sử dụng nền tảng của họ hàng ngày. Nếu Mango có thể phù hợp với chất lượng của Runway Gen-4.5 hoặc Veo 3, lợi thế phân phối sẽ trở nên tàn phá đối với các đối thủ cạnh tranh.
Câu hỏi thực sự: Meta có thể xây dựng một mô hình tốt nhất trong lớp, hay họ sẽ hài lòng với "đủ tốt" và dựa vào phân phối? Lịch sử cho thấy điều sau. Nhưng sự tham gia của Wang gợi ý những tham vọng cao hơn.
Sự Ra Đi Của Yann LeCun
Có một con voi trong phòng. Yann LeCun, nhà khoa học AI trưởng huyền thoại của Meta và là một trong những "cha đẻ của học sâu", gần đây đã thông báo rời đi để khởi động công ty khởi nghiệp của riêng mình.
LeCun đã lên tiếng về sự hoài nghi của mình đối với các mô hình ngôn ngữ lớn và niềm tin của ông vào các cách tiếp cận thay thế cho AI. Sự ra đi của ông đặt ra câu hỏi về hướng đi của nghiên cứu AI của Meta. Mango có phù hợp với tầm nhìn của LeCun không, hay nó đại diện cho sự khác biệt với nó?
Chúng ta chưa biết. Nhưng thời điểm đáng chú ý.
Những Điều Cần Theo Dõi
Khi chúng ta bước vào năm 2026, đây là những câu hỏi chính:
- ○Mango có bao gồm tạo âm thanh gốc như Kling và Veo 3 không?
- ○Meta sẽ xử lý kiểm duyệt nội dung cho video do AI tạo ra như thế nào?
- ○Các công cụ người sáng tạo sẽ được tích hợp trực tiếp vào Instagram?
- ○MSL có thể giữ chân nhân tài sau khi LeCun ra đi không?
Quan Điểm Của Chúng Tôi
Thông báo của Meta về Mango là quan trọng không phải vì những gì nó hứa hẹn, mà vì những gì nó tiết lộ về tư duy của công ty. Họ đã xong việc là người theo sau nhanh. Họ đang xây dựng từ đầu, với lãnh đạo nghiêm túc, và nhắm đến cửa sổ phát hành mang lại cho họ thời gian để làm đúng.
Mango có thể vượt qua Sora 2 hoặc Veo 3 không? Có lẽ không phải vào ngày đầu tiên. Nhưng với 3 tỷ người dùng và nguồn lực để lặp lại nhanh chóng, Meta chỉ cần đến gần. Phân phối làm phần còn lại.
Cuộc đua video AI vừa trở nên thú vị hơn rất nhiều.
Đọc Liên Quan: Để hiểu bối cảnh về tình trạng hiện tại của video AI, hãy xem so sánh Sora 2 vs Runway vs Veo 3 của chúng tôi và phân tích sâu về mô hình thế giới trong tạo video AI.
Bài viết này có hữu ích không?

Henry
Chuyên gia Công nghệ Sáng tạoChuyên gia công nghệ sáng tạo đến từ Lausanne, khám phá nơi AI gặp gỡ nghệ thuật. Thử nghiệm với các mô hình sinh tạo giữa những buổi làm nhạc điện tử.
Bài viết liên quan
Tiếp tục khám phá với những bài viết liên quan

Lá Chắn Vô Hình: Cách Đánh Dấu Nước Video AI Đang Giải Quyết Khủng Hoảng Bản Quyền Năm 2025
Khi video do AI tạo ra trở nên không thể phân biệt với cảnh quay thật, đánh dấu nước vô hình xuất hiện như cơ sở hạ tầng quan trọng để bảo vệ bản quyền. Chúng tôi khám phá phương pháp mới của Meta, SynthID của Google và các thách thức kỹ thuật của việc nhúng tín hiệu phát hiện ở quy mô lớn.

Kling 2.6: Sao chép giọng nói và kiểm soát chuyển động định nghĩa lại video AI
Bản cập nhật mới nhất của Kuaishou giới thiệu khả năng tạo âm thanh và hình ảnh đồng thời, huấn luyện giọng nói tùy chỉnh và chụp chuyển động chính xác, có thể thay đổi cách các nhà sáng tạo tiếp cận sản xuất video AI.

Pika 2.5: Đại chúng hóa Video AI thông qua Tốc độ, Giá cả và Công cụ Sáng tạo
Pika Labs phát hành phiên bản 2.5, kết hợp tốc độ tạo nhanh hơn, vật lý nâng cao và các công cụ sáng tạo như Pikaframes và Pikaffects để làm cho video AI có thể tiếp cận được với mọi người.