ヤン・ルカン氏、Metaを離れ35億ドルを世界モデルに投資
チューリング賞受賞者がAMI Labsを設立。大規模言語モデルではなく世界モデルに焦点を当て、ロボティクス、ヘルスケア、動画理解を目指す新しいスタートアップです。

35億ドルの賭け
ルカン氏ほどの経歴を持つ人物が、事業開始前に30億ユーロの評価額で5億ユーロを調達すると、業界全体が注目します。AMI Labs(Advanced Machine Intelligence)は2026年1月に正式に発足し、シンプルながら革新的な理念を掲げています。それは、大規模言語モデルは真の知能への道としては行き止まりである、というものです。
ルカン氏は長年このことを主張してきましたが、今回は自らのキャリアを賭けてその信念を実践しています。パリのAI-Pulseカンファレンスでは、はっきりとこう述べました。「シリコンバレーは生成モデルに完全に魅了されています。この種の研究はシリコンバレーの外で行う必要があります。」
なぜ大規模言語モデルでは不十分なのか
核心となる主張は、意外なほどシンプルです。大規模言語モデルは次のトークンを予測するだけです。それだけなのです。物理法則を理解しません。セッション間で持続的な記憶を維持できません。現実世界で複数ステップの行動を計画することもできません。
結果を理解せずに次のトークンを予測します。物理的な現実に根ざしていないため、ハルシネーションが発生します。セッションごとに記憶がリセットされます。
因果関係をシミュレートします。動画、音声、センサーデータから学習します。行動を起こす前に結果を予測できます。
ルカン氏は、この根本的な制限により、大規模言語モデルは人間が当たり前に持つような文脈理解能力を決して獲得できないと主張しています。特定の物体を見たことがない幼児でも、それを落とせば落下すると予測できます。しかし、大規模言語モデルはインターネット全体で訓練されているにもかかわらず、そのような推論を確実に行うことができません。
世界モデルとは実際に何なのか
AI動画における世界モデルの進化をご覧になっていれば、この技術の萌芽をすでに目にされていることでしょう。RunwayのGWM-1やWorld LabsのMarbleは、空間関係と物理法則を理解するAIを構築する初期の試みです。
世界モデルは動画、音声、センサーデータから学習し、世界がどのように機能するかについての内部シミュレーションを構築します。次の単語を予測するのではなく、物理空間で次に何が起こるかを予測します。
しかし、AMI Labsはさらに先を見据えています。ルカン氏のビジョンは、より良い動画生成だけにとどまりません(もちろんそれも含まれていますが)。以下のことができるAIシステムを目指しています。
- ✓物理環境を観察し、相互作用する
- ✓行動を起こす前に「もし~したら」というシナリオをシミュレートする
- ✓複雑な複数ステップのタスク全体で文脈を維持する
- ✓異なる領域間で知識を転移する
これは、AIに想像する能力を与えることと考えられます。創造的な意味での想像ではなく、予測的な意味での想像です。このボタンを押したらどうなるか?左ではなく右に曲がったらどうなるか?この2つの化学物質を混ぜたらどうなるか?
最初のアプリケーション:ヘルスケア
AMI Labsはロボティクスや自動運転車からスタートするわけではありません(ロードマップには明らかに含まれていますが)。最初の展開はヘルスケア分野で、医療文字起こしスタートアップのNablaとのパートナーシップを通じて行われます。NablaのCEOであるAlex LeBrun氏が現在AMI Labsを率いています。
ヘルスケアAIエージェント
初期製品は、予約、文書作成、請求処理を、患者のワークフロー全体を通じて文脈を維持しながら処理するよう設計されています。これは現在のAIが苦手とするところです。
これは巧みなポジショニングです。ヘルスケアには深刻な文脈切り替えの問題があります。患者の医療体験には数十のタッチポイントが含まれ、それぞれが異なるシステムで処理されます。世界モデルがその過程全体で一貫した理解を維持できれば、この技術がハイリスクな環境でも機能することが証明されます。
競合環境
AMI Labsは競争の激しい分野に参入しますが、おそらく最も信頼できる創業者を擁しています。
| プレイヤー | アプローチ | フォーカス |
|---|---|---|
| AMI Labs | 世界モデル | ヘルスケア、ロボティクス、汎用AI |
| World Labs(李飛飛) | 空間インテリジェンス | 3D世界、動画理解 |
| Google DeepMind | ハイブリッドアプローチ | 動画、ロボティクス、ゲーム |
| Wayve | 具現化された世界モデル | 自動運転 |
| Meta | "Mango"モデル | 動画生成 |
ルカン氏のアプローチが異なる点は、大規模言語モデルのスケーリング仮説を明確に否定していることです。OpenAIやAnthropicが大規模言語モデルをより大きくすることにリソースを投入している間、ルカン氏はアーキテクチャのイノベーションに賭けています。ブレークスルーはモデルがどのように学習するかから生まれるのであって、パラメータの数からではないと考えているのです。
AI動画にとっての意味
AI動画の分野を注視している私たちにとって、AMI Labsは重要なものを象徴しています。最近のモデルで見られた物理シミュレーションの改善は、世界モデルへの第一歩です。
動画生成におけるより良い物理演算は、単により現実的な水や布の表現にとどまりません。それは物理世界がどのように機能するかを本当に理解するAIについてであり、インタラクティブでリアルタイムの動画操作への扉を開きます。
動画を生成した後で「今度はキャラクターにあの物体を拾わせて」と言えて、AIがその相互作用の物理演算を正しくシミュレートできることを想像してみてください。それが世界モデルがもたらすものです。
TurboDiffusionのリアルタイム生成やRunwayのインタラクティブ動画の実験で、すでにその兆しを見てきました。しかし、それらは根本的には物理を上から振りかけた拡散モデルのままです。真の世界モデルはパラダイムを転換します。物理が先、見た目は後です。
パリ要因
私の注意を引いた詳細があります。ルカン氏は意図的にシリコンバレーの外でAMI Labsを構築し、パリを中心に強力なヨーロッパのプレゼンスを確立しています。
これには実利的な理由があります。ヨーロッパのAI人材は世界クラスですが、アメリカの企業にはしばしば見過ごされています。しかし、哲学的な理由もあります。ルカン氏は、ベイエリアでの大規模言語モデルに対する集団思考があまりにも強いため、真のイノベーションには地理的な距離が必要だと考えているようです。
「シリコンバレーは生成モデルに完全に魅了されています。だからこの種の仕事はシリコンバレーの外、パリで行う必要があるのです。」
ヨーロッパのAIにとって、これは認証です。この分野で最も高く評価されている研究者の一人が、次のブレークスルーはパロアルトではなくここから生まれると賭けているのです。
次に何が起こるか
AMI Labsは始まったばかりですが、その意味は重大です。もしルカン氏が正しければ、AIシステムの構築方法においてパラダイムシフトが起ころうとしています。
AMI Labs設立
ルカン氏がMetaを離れ、30億ユーロの評価額でスタートアップを発表
正式ローンチ
ヘルスケアに焦点を当てて事業開始
拡大
ロボティクス、自律システム、およびより広範な世界モデルアプリケーション
最大の問題はタイミングです。世界モデルは理論的には説得力がありますが、実用的な成果を十分に早く出せるでしょうか?大規模言語モデルには限界があるかもしれませんが、今役に立っています。OpenAIとAnthropicはその有用性の上に帝国を築いています。
ルカン氏は、大規模言語モデルの天井は人々が考えているよりも低く、ユーザーがその天井にぶつかったとき、代替案を探すようになると賭けています。AMI Labsはその準備をしておきたいと考えています。
より大きな視点
この動きで私がワクワクするのは技術だけではありません。AI研究文化にとって何を意味するかということです。長い間、Transformerアーキテクチャとスケーリングこそがすべてという考え方を中心としたモノカルチャーがありました。ルカン氏がAMI Labsを立ち上げることは、代替アプローチに対する注目度の高い支持表明です。
関連記事: 世界モデルがAI動画をどのように再形成しているかについて詳しくは、RunwayのGWM-1とWorld LabsのMarbleに関する記事をご覧ください。
世界モデルがAGIへの道であると証明されるかどうかにかかわらず、ヤン・ルカン氏がこのアプローチに全力を注ぐことで、真剣で資金力のある試みが行われることになります。そしてそれは、AI研究が思想の多様性から恩恵を受けると信じるすべての人にとって良いことです。
今後数年間は非常に興味深いものになるでしょう。
この記事は役に立ちましたか?

Henry
クリエイティブ・テクノロジストローザンヌ出身のクリエイティブ・テクノロジストで、AIとアートが交わる場所を探求しています。エレクトロニック・ミュージックのセッションの合間に生成モデルで実験しています。
関連記事
これらの関連投稿で探索を続けてください

PixVerse R1:リアルタイム対話型AI動画の夜明け
アリババが支援するPixVerseがR1を発表。これは1080p動画をリアルタイムで生成し、ユーザー入力に即座に対応する最初の世界モデルであり、無限のゲームとインタラクティブシネマへの扉を開きます。

AI動画ストーリーテリングプラットフォーム:シリーズ化コンテンツが2026年のすべてを変える方法
単一のクリップから完全なシリーズまで、AI動画は生成ツールからストーリーテリングエンジンへと進化しています。この変革を実現するプラットフォームをご紹介します。

ビデオを超えた世界モデル:ゲームとロボットがAGIの真の実験場である理由
DeepMindのGenieからAMI Labsまで、世界モデルは物理を真に理解するAIの基礎として静かに台頭している。5000億ドルのゲーム市場が、それらが最初に自分たちの価値を証明する場所かもしれない。