Yann LeCun rời Meta, đặt cược 3,5 tỷ đô la vào Mô hình Thế giới
Người đoạt giải Turing thành lập AMI Labs, một startup mới tập trung vào mô hình thế giới thay vì mô hình ngôn ngữ lớn, hướng đến các lĩnh vực robot, chăm sóc sức khỏe và hiểu video.

Khoản đặt cược 3,5 tỷ đô la
Khi một người có uy tín như LeCun huy động được 500 triệu euro với định giá 3 tỷ euro trước khi chính thức ra mắt, cả ngành công nghiệp đều chú ý. AMI Labs (Advanced Machine Intelligence) chính thức khởi động vào tháng 1 năm 2026 với một luận điểm đơn giản nhưng mang tính cách mạng: mô hình ngôn ngữ lớn là ngõ cụt trên con đường đến trí tuệ thực sự.
LeCun đã nói điều này trong nhiều năm, nhưng giờ đây ông đang đặt cược sự nghiệp của mình vào niềm tin đó. Tại hội nghị AI-Pulse ở Paris, ông nói thẳng: "Silicon Valley hoàn toàn bị mê hoặc bởi các mô hình sinh tạo. Bạn phải thực hiện loại công việc này bên ngoài Silicon Valley."
Tại sao mô hình ngôn ngữ lớn chưa đủ
Đây là lập luận cốt lõi, và nó đơn giản đến bất ngờ. Mô hình ngôn ngữ lớn dự đoán token tiếp theo. Chỉ vậy thôi. Chúng không hiểu vật lý. Chúng không duy trì được bộ nhớ liên tục giữa các phiên làm việc. Chúng không thể lên kế hoạch cho các hành động nhiều bước trong thế giới thực.
Dự đoán token tiếp theo mà không hiểu hậu quả. Tạo ra ảo giác vì thiếu nền tảng trong thực tế vật lý. Bộ nhớ được đặt lại sau mỗi phiên.
Mô phỏng các mối quan hệ nhân quả. Học từ video, âm thanh và dữ liệu cảm biến. Có thể dự đoán kết quả của hành động trước khi thực hiện.
LeCun cho rằng hạn chế cơ bản này có nghĩa là mô hình ngôn ngữ lớn sẽ không bao giờ đạt được loại hiểu biết ngữ cảnh mà con người coi là điều đương nhiên. Một đứa trẻ mới biết đi chưa từng nhìn thấy một vật thể cụ thể vẫn có thể dự đoán rằng thả nó xuống sẽ khiến nó rơi. Mô hình ngôn ngữ lớn, mặc dù được huấn luyện trên toàn bộ internet, không thể đưa ra suy luận đó một cách đáng tin cậy.
Vậy mô hình thế giới thực sự là gì?
Nếu bạn đã theo dõi sự phát triển của mô hình thế giới trong video AI, bạn đã thấy những hình ảnh đầu tiên của công nghệ này. GWM-1 của Runway và Marble của World Labs là những nỗ lực ban đầu trong việc xây dựng AI hiểu các mối quan hệ không gian và vật lý.
Mô hình thế giới học từ video, âm thanh và dữ liệu cảm biến để xây dựng các mô phỏng nội bộ về cách thế giới vận hành. Thay vì dự đoán từ tiếp theo, chúng dự đoán điều gì sẽ xảy ra tiếp theo trong không gian vật lý.
Nhưng AMI Labs đang tiến xa hơn. Tầm nhìn của LeCun không chỉ là tạo video tốt hơn, mặc dù đó chắc chắn là một phần. Mục tiêu là các hệ thống AI có thể:
- ✓Quan sát và tương tác với môi trường vật lý
- ✓Mô phỏng các kịch bản "nếu như" trước khi hành động
- ✓Duy trì ngữ cảnh xuyên suốt các nhiệm vụ phức tạp, nhiều bước
- ✓Chuyển giao kiến thức giữa các lĩnh vực khác nhau
Hãy nghĩ về điều này như việc trao cho AI khả năng tưởng tượng. Không phải theo nghĩa sáng tạo, mà theo nghĩa dự đoán. Điều gì sẽ xảy ra nếu tôi nhấn nút này? Điều gì sẽ xảy ra nếu tôi rẽ trái thay vì rẽ phải? Điều gì sẽ xảy ra nếu tôi trộn hai chất hóa học này?
Ứng dụng đầu tiên: Chăm sóc sức khỏe
AMI Labs không bắt đầu với robot hay xe tự lái, mặc dù những lĩnh vực này rõ ràng nằm trong lộ trình. Triển khai đầu tiên của họ sẽ là trong lĩnh vực chăm sóc sức khỏe thông qua quan hệ đối tác với Nabla, startup chuyên về chép văn bản y tế mà CEO Alex LeBrun hiện đang lãnh đạo AMI Labs.
Trợ lý AI Y tế
Sản phẩm ban đầu được thiết kế để xử lý lịch hẹn, tài liệu và thanh toán trong khi duy trì ngữ cảnh xuyên suốt toàn bộ quy trình chăm sóc bệnh nhân, điều mà AI hiện tại gặp khó khăn.
Đây là một định vị thông minh. Chăm sóc sức khỏe có vấn đề chuyển đổi ngữ cảnh nghiêm trọng. Hành trình của một bệnh nhân liên quan đến hàng chục điểm tiếp xúc, mỗi điểm được xử lý bởi các hệ thống khác nhau. Nếu mô hình thế giới có thể duy trì sự hiểu biết nhất quán xuyên suốt hành trình đó, nó chứng minh công nghệ hoạt động trong các môi trường có rủi ro cao.
Bối cảnh cạnh tranh
AMI Labs bước vào một lĩnh vực cạnh tranh khốc liệt, nhưng với người sáng lập có uy tín cao nhất:
| Công ty | Phương pháp | Trọng tâm |
|---|---|---|
| AMI Labs | Mô hình thế giới | Chăm sóc sức khỏe, robot, AI tổng quát |
| World Labs (Fei-Fei Li) | Trí tuệ không gian | Thế giới 3D, hiểu video |
| Google DeepMind | Phương pháp lai | Video, robot, trò chơi |
| Wayve | Mô hình thế giới hiện thân | Lái xe tự động |
| Meta | Mô hình "Mango" | Tạo video |
Điều khiến phương pháp của LeCun khác biệt là sự từ chối rõ ràng giả thuyết mở rộng quy mô mô hình ngôn ngữ lớn. Trong khi OpenAI và Anthropic đổ nguồn lực vào việc làm cho mô hình ngôn ngữ lớn lớn hơn, LeCun đặt cược vào đổi mới kiến trúc. Ông tin rằng đột phá sẽ đến từ cách mô hình học, không phải từ số lượng tham số.
Điều này có ý nghĩa gì với video AI
Đối với những người theo dõi lĩnh vực video AI như chúng tôi, AMI Labs đại diện cho điều quan trọng. Những cải tiến mô phỏng vật lý mà chúng ta thấy trong các mô hình gần đây là những bước đi đầu tiên hướng tới mô hình thế giới.
Vật lý tốt hơn trong tạo video không chỉ là nước và vải thực tế hơn. Đó là về AI thực sự hiểu cách thế giới vật lý hoạt động, mở ra cánh cửa cho thao tác video tương tác, thời gian thực.
Hãy tưởng tượng tạo một video và có thể nói "bây giờ hãy để nhân vật nhặt vật thể đó lên" và AI mô phỏng chính xác vật lý của tương tác đó. Đó là nơi mô hình thế giới đưa chúng ta đến.
Chúng ta đã thấy dấu hiệu của điều này trong tạo video thời gian thực của TurboDiffusion và các thí nghiệm video tương tác của Runway. Nhưng về cơ bản đó vẫn là các mô hình khuếch tán với vật lý được thêm vào trên cùng. Mô hình thế giới thực sự sẽ đảo ngược mô hình: vật lý trước, hình ảnh sau.
Yếu tố Paris
Một chi tiết thu hút sự chú ý của tôi: LeCun cố ý xây dựng AMI Labs bên ngoài Silicon Valley, với sự hiện diện mạnh mẽ tại châu Âu, tập trung ở Paris.
Có một lý do thực tế: tài năng AI châu Âu đẳng cấp thế giới nhưng thường bị các công ty Mỹ bỏ qua. Nhưng cũng có một lý do triết học. LeCun dường như tin rằng tư duy tập thể xung quanh mô hình ngôn ngữ lớn ở Bay Area quá mạnh, đổi mới thực sự cần khoảng cách địa lý.
"Silicon Valley hoàn toàn bị mê hoặc bởi các mô hình sinh tạo, vì vậy bạn phải làm loại công việc này bên ngoài Silicon Valley, ở Paris."
Đối với AI châu Âu, đây là sự công nhận. Một trong những nhà nghiên cứu được đánh giá cao nhất trong lĩnh vực này đang đặt cược rằng đột phá tiếp theo sẽ đến từ đây, không phải Palo Alto.
Điều gì sẽ xảy ra tiếp theo
AMI Labs mới chỉ bắt đầu, nhưng ý nghĩa của nó rất quan trọng. Nếu LeCun đúng, chúng ta sắp chứng kiến sự thay đổi mô hình trong cách xây dựng hệ thống AI.
AMI Labs được thành lập
LeCun rời Meta, công bố startup với định giá 3 tỷ euro
Ra mắt chính thức
Công ty bắt đầu hoạt động với trọng tâm chăm sóc sức khỏe
Mở rộng
Robot, hệ thống tự động và các ứng dụng mô hình thế giới rộng hơn
Câu hỏi lớn nhất là thời điểm. Mô hình thế giới hấp dẫn về mặt lý thuyết, nhưng liệu chúng có thể mang lại kết quả thực tế đủ nhanh không? Mô hình ngôn ngữ lớn có thể hạn chế, nhưng chúng hữu ích ngay bây giờ. OpenAI và Anthropic đang xây dựng đế chế dựa trên tính hữu ích đó.
LeCun đặt cược rằng trần của mô hình ngôn ngữ lớn thấp hơn người ta nghĩ, và khi người dùng chạm đến nó, họ sẽ tìm kiếm các giải pháp thay thế. AMI Labs muốn sẵn sàng cho điều đó.
Bức tranh lớn hơn
Điều khiến tôi hào hứng về động thái này không chỉ là công nghệ. Mà là ý nghĩa của nó đối với văn hóa nghiên cứu AI. Trong thời gian dài, chúng ta đã có một văn hóa đơn nhất xung quanh kiến trúc transformer và tư duy "quy mô là tất cả". LeCun bắt đầu AMI Labs là sự ủng hộ công khai cho các phương pháp thay thế.
Đọc thêm: Để biết thêm về cách mô hình thế giới đang định hình lại video AI, xem bài viết của chúng tôi về GWM-1 của Runway và Marble của World Labs.
Dù mô hình thế giới có được chứng minh là con đường đến AGI hay không, việc Yann LeCun cam kết hoàn toàn với phương pháp này có nghĩa là nó sẽ có một nỗ lực nghiêm túc, được tài trợ tốt. Và đó là điều tốt cho tất cả những ai tin rằng nghiên cứu AI được hưởng lợi từ sự đa dạng trong tư duy.
Những năm tới sẽ rất thú vị để theo dõi.
Bài viết này có hữu ích không?

Henry
Chuyên gia Công nghệ Sáng tạoChuyên gia công nghệ sáng tạo đến từ Lausanne, khám phá nơi AI gặp gỡ nghệ thuật. Thử nghiệm với các mô hình sinh tạo giữa những buổi làm nhạc điện tử.
Bài viết liên quan
Tiếp tục khám phá với những bài viết liên quan

PixVerse R1: Bình minh của Sinh video AI Tương tác Thời gian Thực
PixVerse được hỗ trợ bởi Alibaba công bố R1, mô hình thế giới đầu tiên có khả năng tạo video 1080p phản ứng ngay tức thì với đầu vào của người dùng, mở ra cánh cửa cho trò chơi vô hạn và rạp chiếu phim tương tác.

Nền tảng kể chuyện video AI: Cách nội dung theo chuỗi đang thay đổi mọi thứ vào năm 2026
Từ các clip đơn lẻ đến các loạt phim hoàn chỉnh, video AI đang phát triển từ công cụ tạo thành động cơ kể chuyện. Hãy gặp các nền tảng đang thúc đẩy điều này xảy ra.

Vượt qua Video, Mô hình Thế giới: Tại sao Trò chơi và Robotics là Bằng chứng Thực của AGI
Từ Genie của DeepMind đến AMI Labs, các mô hình thế giới đang từng bước trở thành nền tảng cho AI thực sự hiểu được vật lý. Thị trường trò chơi 500 tỷ đô la có thể là nơi chúng chứng minh giá trị của mình trước tiên.