Meta Mango: Bên Trong Mô Hình AI Video Bí Mật Nhằm Vượt Qua OpenAI và Google

Sau nhiều tháng đuổi theo trong cuộc đua AI sinh tạo, Meta vừa tiết lộ dự án tham vọng nhất của mình: một mô hình AI video và hình ảnh có tên mã là Mango. Dự kiến phát hành vào nửa đầu năm 2026, đây là cú đặt cược táo bạo nhất của gã khổng lồ truyền thông xã hội vào AI thị giác cho đến nay.

Thông Báo Gây Chấn Động Thung Lũng Silicon

Tin tức được công bố trong buổi hỏi đáp nội bộ tại Meta vào thứ Năm, ngày 19 tháng 12. Giám đốc Sản phẩm Chris Cox và Alexandr Wang, đồng sáng lập Scale AI hiện đang lãnh đạo Phòng thí nghiệm Siêu Trí tuệ của Meta, đã công bố lộ trình khiến các nhân viên phấn khích.

Hai mô hình. Hai tên mã. Một tham vọng khổng lồ.

Mango

Mô hình Hình ảnh & Video

Avocado

Mô hình Văn bản & Lý luận

Nửa đầu 2026

Mục tiêu Phát hành

Trong khi Avocado tập trung vào văn bản, lý luận và khả năng lập trình được cải thiện, Mango là trung tâm sức mạnh về thị giác. Theo các nguồn tin nội bộ, Meta đang khám phá "các mô hình thế giới hiểu thông tin thị giác và có thể lý luận, lập kế hoạch và hành động mà không cần được đào tạo về mọi khả năng".

Đó không chỉ là tạo video. Đó là tiếp cận điều gì đó giống như hiểu biết video hơn.

Tại Sao Meta Cần Chiến Thắng Này

Hãy thành thật: Meta đã gặp khó khăn trong cuộc đua AI.

Trong khi OpenAI thu hút trí tưởng tượng của thế giới với ChatGPT và hiện nay là tạo video chính xác về vật lý của Sora 2, và Google tiến lên với Veo 3 và tổng hợp âm thanh gốc, trợ lý AI của Meta vẫn ở mức ổn. Có chức năng. Nhưng không mang tính cách mạng.

💡

Trợ lý AI của Meta tiếp cận hàng tỷ người thông qua Facebook, Instagram và WhatsApp. Nhưng phân phối không giống với đổi mới. Công ty cần một sản phẩm đột phá, không chỉ là một sản phẩm tầm thường được phân phối rộng rãi.

Thời điểm phát triển Mango không phải là ngẫu nhiên. Vào mùa hè, Meta đã trải qua một cuộc tái cấu trúc AI đáng kể. Wang nắm quyền điều hành Phòng thí nghiệm Siêu Trí tuệ Meta (MSL) mới được thành lập, và công ty đã có chiến dịch tuyển dụng mạnh mẽ, mang đến hơn 20 nhà nghiên cứu từ OpenAI và mở rộng với hơn 50 chuyên gia AI mới.

Yếu Tố Alexandr Wang

Nếu bạn không biết Alexandr Wang, bạn nên biết. Anh ấy đồng sáng lập Scale AI khi 19 tuổi và biến nó thành một công ty trị giá 13 tỷ đô la cung cấp cơ sở hạ tầng dữ liệu đằng sau một số hệ thống AI tiên tiến nhất thế giới. Việc anh ấy lãnh đạo MSL cho thấy Meta không chỉ đơn thuần là ném tiền vào vấn đề. Họ đang đưa vào một người hiểu toàn bộ quy trình AI, từ gắn nhãn dữ liệu đến triển khai mô hình.

📊

Thành Tích của Scale AI

Scale AI đã làm việc với OpenAI, Google và Bộ Quốc phòng Hoa Kỳ. Wang hiểu những gì cần thiết để xây dựng các mô hình hoạt động ở quy mô lớn.

Việc Meta chọn người ngoài thay vì thăng chức từ bên trong nói lên rất nhiều về sự cấp bách của họ. Đây không phải là công việc như thường lệ. Đây là một sự khởi động lại.

Mango Có Thể Có Ý Nghĩa Gì Với Người Sáng Tạo

Đây là nơi mọi thứ trở nên thú vị đối với những người chúng ta thực sự tạo nội dung.

Instagram và Facebook đã bị video dạng ngắn và dạng dài chiếm ưu thế. Meta có khả năng phân phối. Những gì họ thiếu là các công cụ sáng tạo mà các đối thủ cạnh tranh đang chạy đua để xây dựng. Hãy tưởng tượng:

✓Công Cụ Người Sáng Tạo Tiềm Năng

Chỉnh sửa video hỗ trợ AI trực tiếp trong Instagram
Hiệu ứng hình ảnh tự động cho Reels
Tạo video từ văn bản cho việc tạo quảng cáo
Tạo nội dung nhất quán về phong cách trên các bài đăng

✗Thách Thức Tiềm Năng

Kiểm duyệt nội dung ở quy mô lớn
Phân biệt nội dung AI với con người
Phản ứng dữ dội của người sáng tạo về tính xác thực
Vấn đề niềm tin nền tảng

Nếu Mango thực hiện lời hứa "mô hình thế giới" của mình, chúng ta đang nhìn vào AI không chỉ tạo khung hình video. Nó hiểu điều gì đang xảy ra trong một cảnh, có thể lý luận về vật lý và đối tượng, và có thể thao tác nội dung thị giác với sự hiểu biết thực sự.

Đó là một điều kiện lớn. Nhưng tiềm năng là rất lớn.

Bối Cảnh Cạnh Tranh Năm 2026

Vào thời điểm Mango phát hành vào nửa đầu năm 2026, bối cảnh video AI sẽ trông rất khác so với ngày hôm nay.

Công ty	Mô hình	Điểm Mạnh Chính
OpenAI	Sora 2	Mô phỏng vật lý, nhân vật Disney
Google	Veo 3	Âm thanh gốc, công cụ chỉnh sửa Flow
Runway	Gen-4.5	Chất lượng hình ảnh, tích hợp Adobe
Meta	Mango	Phân phối, tích hợp xã hội

Lợi thế của Meta không phải là sự vượt trội về kỹ thuật. Ít nhất là chưa phải. Đó là thực tế rằng 3 tỷ người sử dụng nền tảng của họ hàng ngày. Nếu Mango có thể phù hợp với chất lượng của Runway Gen-4.5 hoặc Veo 3, lợi thế phân phối sẽ trở nên tàn phá đối với các đối thủ cạnh tranh.

⚠️

Câu hỏi thực sự: Meta có thể xây dựng một mô hình tốt nhất trong lớp, hay họ sẽ hài lòng với "đủ tốt" và dựa vào phân phối? Lịch sử cho thấy điều sau. Nhưng sự tham gia của Wang gợi ý những tham vọng cao hơn.

Sự Ra Đi Của Yann LeCun

Có một con voi trong phòng. Yann LeCun, nhà khoa học AI trưởng huyền thoại của Meta và là một trong những "cha đẻ của học sâu", gần đây đã thông báo rời đi để khởi động công ty khởi nghiệp của riêng mình.

LeCun đã lên tiếng về sự hoài nghi của mình đối với các mô hình ngôn ngữ lớn và niềm tin của ông vào các cách tiếp cận thay thế cho AI. Sự ra đi của ông đặt ra câu hỏi về hướng đi của nghiên cứu AI của Meta. Mango có phù hợp với tầm nhìn của LeCun không, hay nó đại diện cho sự khác biệt với nó?

Chúng ta chưa biết. Nhưng thời điểm đáng chú ý.

Những Điều Cần Theo Dõi

Khi chúng ta bước vào năm 2026, đây là những câu hỏi chính:

○Mango có bao gồm tạo âm thanh gốc như Kling và Veo 3 không?
○Meta sẽ xử lý kiểm duyệt nội dung cho video do AI tạo ra như thế nào?
○Các công cụ người sáng tạo sẽ được tích hợp trực tiếp vào Instagram?
○MSL có thể giữ chân nhân tài sau khi LeCun ra đi không?

Quan Điểm Của Chúng Tôi

Thông báo của Meta về Mango là quan trọng không phải vì những gì nó hứa hẹn, mà vì những gì nó tiết lộ về tư duy của công ty. Họ đã xong việc là người theo sau nhanh. Họ đang xây dựng từ đầu, với lãnh đạo nghiêm túc, và nhắm đến cửa sổ phát hành mang lại cho họ thời gian để làm đúng.

Mango có thể vượt qua Sora 2 hoặc Veo 3 không? Có lẽ không phải vào ngày đầu tiên. Nhưng với 3 tỷ người dùng và nguồn lực để lặp lại nhanh chóng, Meta chỉ cần đến gần. Phân phối làm phần còn lại.

Cuộc đua video AI vừa trở nên thú vị hơn rất nhiều.

💡

Đọc Liên Quan: Để hiểu bối cảnh về tình trạng hiện tại của video AI, hãy xem so sánh Sora 2 vs Runway vs Veo 3 của chúng tôi và phân tích sâu về mô hình thế giới trong tạo video AI.