یان لی کن ورلڈ ماڈلز پر 3.5 بلین ڈالر کی شرط لگانے کے لیے میٹا چھوڑ گئے
ٹیورنگ ایوارڈ یافتہ نے AMI Labs قائم کی، ایک نیا سٹارٹ اپ جو LLMs کی بجائے ورلڈ ماڈلز پر توجہ مرکوز کرتا ہے، روبوٹکس، صحت کی دیکھ بھال اور ویڈیو کی سمجھ کو ہدف بنا رہا ہے۔

3.5 بلین ڈالر کا جوا
جب لی کن جیسی شخصیت لانچ سے پہلے ہی 3 بلین یورو کی قدر پر 500 ملین یورو جمع کرتی ہے، تو پوری صنعت توجہ دیتی ہے۔ AMI Labs (ایڈوانسڈ مشین انٹیلی جنس) نے جنوری 2026 میں ایک سادہ لیکن انقلابی مفروضے کے ساتھ باضابطہ آغاز کیا: LLMs حقیقی ذہانت کے لیے ایک بند گلی ہیں۔
لی کن برسوں سے یہ بات کہہ رہے ہیں، لیکن اب وہ اپنا کیریئر داؤ پر لگا رہے ہیں۔ پیرس میں AI-Pulse کانفرنس میں انہوں نے صاف الفاظ میں کہا: "سلیکون ویلی جنریٹو ماڈلز سے مکمل طور پر سحر زدہ ہے۔ آپ کو اس قسم کا کام سلیکون ویلی سے باہر کرنا ہوگا۔"
LLMs کافی کیوں نہیں
یہ بنیادی دلیل ہے، اور یہ حیرت انگیز طور پر سادہ ہے۔ LLMs اگلے ٹوکن کی پیشگوئی کرتے ہیں۔ بس۔ وہ فزکس نہیں سمجھتے۔ وہ سیشنز کے دوران مستقل یادداشت برقرار نہیں رکھتے۔ وہ حقیقی دنیا میں کئی مراحل پر مشتمل اقدامات کی منصوبہ بندی نہیں کر سکتے۔
نتائج سمجھے بغیر اگلے ٹوکنز کی پیشگوئی کرتے ہیں۔ فریب دینے والے ہیں کیونکہ ان کی جسمانی حقیقت سے کوئی بنیاد نہیں۔ ہر سیشن میں یادداشت دوبارہ شروع ہو جاتی ہے۔
وجہ اور نتیجے کے تعلقات کی نقل کرتے ہیں۔ ویڈیو، آواز اور سینسر ڈیٹا سے سیکھتے ہیں۔ اقدامات کرنے سے پہلے ان کے نتائج کی پیشگوئی کر سکتے ہیں۔
لی کن کا کہنا ہے کہ یہ بنیادی حد کا مطلب ہے کہ LLMs کبھی بھی اس قسم کی سیاق و سباق کی سمجھ حاصل نہیں کریں گے جو انسان قدرتی سمجھتے ہیں۔ ایک چھوٹا بچہ جس نے کبھی کوئی خاص چیز نہیں دیکھی، پھر بھی پیشگوئی کر سکتا ہے کہ اسے گرانے سے یہ گرے گی۔ LLMs، پورے انٹرنیٹ پر تربیت یافتہ ہونے کے باوجود، قابل اعتماد طریقے سے یہ استنباط نہیں کر سکتے۔
ورلڈ ماڈلز اصل میں کیا ہیں؟
اگر آپ AI ویڈیو میں ورلڈ ماڈلز کے ارتقاء کو فالو کر رہے ہیں، تو آپ نے اس ٹیکنالوجی کی جھلکیاں دیکھی ہیں۔ Runway کا GWM-1 اور World Labs کا Marble مقامی تعلقات اور فزکس کو سمجھنے والی AI بنانے کی ابتدائی کوششیں ہیں۔
ورلڈ ماڈلز ویڈیو، آڈیو اور سینسر ڈیٹا سے سیکھتے ہیں تاکہ دنیا کے کام کرنے کے طریقے کی اندرونی نقلیں بنائیں۔ اگلے لفظ کی پیشگوئی کرنے کی بجائے، وہ پیشگوئی کرتے ہیں کہ جسمانی جگہ میں آگے کیا ہوگا۔
لیکن AMI Labs اس سے آگے جا رہی ہے۔ لی کن کا وژن صرف بہتر ویڈیو جنریشن کے بارے میں نہیں ہے، حالانکہ یہ یقیناً اس کا حصہ ہے۔ یہ AI سسٹمز کے بارے میں ہے جو یہ کر سکتے ہیں:
- ✓جسمانی ماحول کا مشاہدہ کرنا اور ان کے ساتھ تعامل کرنا
- ✓عمل کرنے سے پہلے "کیا ہو گا اگر" منظرناموں کی نقل کرنا
- ✓پیچیدہ، کئی مراحل والے کاموں میں سیاق و سباق برقرار رکھنا
- ✓مختلف شعبوں کے درمیان علم کی منتقلی
اسے AI کو تصور کرنے کی صلاحیت دینے کے طور پر سوچیں۔ تخلیقی معنوں میں نہیں، بلکہ پیشگوئی کے معنوں میں۔ اگر میں یہ بٹن دباؤں تو کیا ہوگا؟ اگر میں دائیں کی بجائے بائیں مڑوں تو کیا ہوگا؟ اگر میں ان دو کیمیکلز کو ملاؤں تو کیا ہوگا؟
پہلی ایپلی کیشن: صحت کی دیکھ بھال
AMI Labs روبوٹکس یا خود مختار گاڑیوں سے شروع نہیں کر رہی، حالانکہ یہ واضح طور پر روڈ میپ پر ہیں۔ ان کی پہلی تعیناتی صحت کی دیکھ بھال میں ہوگی Nabla کے ساتھ شراکت داری کے ذریعے، وہ میڈیکل ٹرانسکرپشن سٹارٹ اپ جس کے CEO، الیکس لی برون، اب AMI Labs کی قیادت کر رہے ہیں۔
صحت کی دیکھ بھال کے AI ایجنٹس
ابتدائی پروڈکٹ شیڈولنگ، دستاویزات اور بلنگ کو سنبھالنے کے لیے ڈیزائن کی گئی ہے جبکہ پورے مریض کے ورک فلو میں سیاق و سباق برقرار رکھتی ہے، جو موجودہ AI کے لیے مشکل ہے۔
یہ سمجھداری سے پوزیشننگ ہے۔ صحت کی دیکھ بھال میں سیاق و سباق بدلنے کے بڑے مسائل ہیں۔ مریض کا سفر درجنوں رابطہ پوائنٹس پر مشتمل ہوتا ہے، ہر ایک کو مختلف سسٹمز سنبھالتے ہیں۔ اگر ورلڈ ماڈلز اس سفر میں مربوط سمجھ برقرار رکھ سکتے ہیں، تو یہ ثابت کرتا ہے کہ ٹیکنالوجی زیادہ خطرے والے ماحول میں کام کرتی ہے۔
مسابقتی منظر نامہ
AMI Labs ایک بھیڑ والے میدان میں داخل ہو رہی ہے، لیکن شاید سب سے زیادہ قابل اعتماد بانی کے ساتھ:
| کھلاڑی | نقطہ نظر | توجہ |
|---|---|---|
| AMI Labs | ورلڈ ماڈلز | صحت کی دیکھ بھال، روبوٹکس، عام AI |
| World Labs (فے فے لی) | مقامی ذہانت | 3D دنیائیں، ویڈیو کی سمجھ |
| Google DeepMind | ہائبرڈ نقطہ نظر | ویڈیو، روبوٹکس، گیمز |
| Wayve | مجسم ورلڈ ماڈلز | خود مختار ڈرائیونگ |
| Meta | "Mango" ماڈل | ویڈیو جنریشن |
لی کن کے نقطہ نظر کو جو مختلف بناتا ہے وہ LLM اسکیلنگ مفروضے کا واضح رد ہے۔ جبکہ OpenAI اور Anthropic LLMs کو بڑا کرنے پر وسائل خرچ کر رہے ہیں، لی کن تعمیراتی جدت پر شرط لگا رہے ہیں۔ ان کا ماننا ہے کہ پیش رفت اس بات سے آئے گی کہ ماڈلز کیسے سیکھتے ہیں، نہ کہ ان کے کتنے پیرامیٹرز ہیں۔
AI ویڈیو کے لیے یہ کیوں اہم ہے
ہم میں سے جو AI ویڈیو کی جگہ دیکھ رہے ہیں، ان کے لیے AMI Labs کچھ اہم نمائندگی کرتی ہے۔ حالیہ ماڈلز میں جو فزکس سمولیشن کی بہتری ہم نے دیکھی ہے وہ ورلڈ ماڈلز کی طرف بچوں کے قدم ہیں۔
ویڈیو جنریشن میں بہتر فزکس صرف زیادہ حقیقت پسندانہ پانی اور کپڑے کے بارے میں نہیں ہے۔ یہ AI کے بارے میں ہے جو واقعی سمجھتی ہے کہ جسمانی دنیا کیسے کام کرتی ہے، جو انٹرایکٹو، ریئل ٹائم ویڈیو ہیرا پھیری کے دروازے کھولتی ہے۔
تصور کریں کہ آپ ویڈیو بنا رہے ہیں اور کہہ سکتے ہیں "اب کردار کو وہ چیز اٹھانے دیں" اور AI اس تعامل کی فزکس کو صحیح طریقے سے نقل کرتا ہے۔ ورلڈ ماڈلز ہمیں وہاں لے جاتے ہیں۔
ہم نے پہلے ہی TurboDiffusion کی ریئل ٹائم جنریشن اور Runway کے انٹرایکٹو ویڈیو کے تجربات میں اس کے اشارے دیکھے ہیں۔ لیکن وہ ابھی بھی بنیادی طور پر ڈفیوژن ماڈلز ہیں جن پر فزکس چھڑکی گئی ہے۔ حقیقی ورلڈ ماڈلز پیراڈائم کو الٹ دیں گے: پہلے فزکس، پھر ظاہری شکل۔
پیرس کا عنصر
ایک تفصیل جس نے میری توجہ حاصل کی: لی کن جان بوجھ کر سلیکون ویلی سے باہر AMI Labs بنا رہے ہیں، پیرس میں مرکوز مضبوط یورپی موجودگی کے ساتھ۔
ایک عملی وجہ ہے: یورپی AI ٹیلنٹ عالمی معیار کی ہے لیکن امریکی کمپنیاں اکثر اسے نظر انداز کرتی ہیں۔ لیکن ایک فلسفیانہ وجہ بھی ہے۔ ایسا لگتا ہے کہ لی کن کا ماننا ہے کہ بے ایریا میں LLMs کے ارد گرد گروپ تھنک اتنی مضبوط ہے کہ حقیقی جدت کو جغرافیائی فاصلے کی ضرورت ہے۔
"سلیکون ویلی جنریٹو ماڈلز سے مکمل طور پر سحر زدہ ہے، اور اس لیے آپ کو اس قسم کا کام سلیکون ویلی سے باہر، پیرس میں کرنا ہوگا۔"
یورپی AI کے لیے، یہ توثیق ہے۔ اس شعبے کے سب سے زیادہ اعزاز یافتہ محققین میں سے ایک شرط لگا رہے ہیں کہ اگلی پیش رفت یہاں سے آئے گی، پالو آلٹو سے نہیں۔
آگے کیا ہے
AMI Labs ابھی شروع ہو رہی ہے، لیکن مضمرات اہم ہیں۔ اگر لی کن درست ہیں، تو ہم AI سسٹمز کی تعمیر کے طریقے میں ایک پیراڈائم شفٹ دیکھنے والے ہیں۔
AMI Labs کی بنیاد
لی کن میٹا چھوڑتے ہیں، 3 بلین یورو کی قیمت والے سٹارٹ اپ کا اعلان
باضابطہ لانچ
کمپنی صحت کی دیکھ بھال پر توجہ کے ساتھ کام شروع کرتی ہے
توسیع
روبوٹکس، خود مختار نظام، اور وسیع تر ورلڈ ماڈل ایپلی کیشنز
سب سے بڑا سوال ٹائمنگ ہے۔ ورلڈ ماڈلز نظری طور پر قائل کرنے والے ہیں، لیکن کیا وہ اتنی جلدی عملی نتائج فراہم کر سکتے ہیں کہ اہمیت رکھیں؟ LLMs محدود ہو سکتے ہیں، لیکن وہ ابھی مفید ہیں۔ OpenAI اور Anthropic اس افادیت پر سلطنتیں بنا رہے ہیں۔
لی کن شرط لگا رہے ہیں کہ LLM کی حد لوگوں کے خیال سے کم ہے، اور جب صارفین اس سے ٹکرائیں گے، تو وہ متبادل تلاش کریں گے۔ AMI Labs تیار رہنا چاہتی ہے۔
بڑی تصویر
اس اقدام کے بارے میں جو مجھے دلچسپ لگتا ہے وہ صرف ٹیکنالوجی نہیں ہے۔ یہ AI ریسرچ کلچر کے لیے کیا نمائندگی کرتا ہے۔ بہت عرصے سے، ہمارے پاس ٹرانسفارمر آرکیٹیکچرز اور سکیل ہی سب کچھ ہے کی سوچ کے ارد گرد ایک یک ثقافت رہی ہے۔ لی کن کا AMI Labs شروع کرنا متبادل نقطہ نظر کی اعلیٰ سطحی تائید ہے۔
متعلقہ مطالعہ: ورلڈ ماڈلز AI ویڈیو کو کیسے نئی شکل دے رہے ہیں اس کے بارے میں مزید جاننے کے لیے، Runway کا GWM-1 اور World Labs کا Marble پر ہماری کوریج دیکھیں۔
چاہے ورلڈ ماڈلز AGI کا راستہ ثابت ہوں یا نہیں، یان لی کن کا اس نقطہ نظر کے لیے مکمل عہد کا مطلب ہے کہ اسے ایک سنجیدہ، اچھی طرح سے فنڈڈ کوشش ملے گی۔ اور یہ ہر اس شخص کے لیے اچھا ہے جو یقین رکھتا ہے کہ AI ریسرچ خیالات کے تنوع سے فائدہ اٹھاتی ہے۔
اگلے چند سال دیکھنے کے لیے دلچسپ ہوں گے۔
کیا یہ مضمون مددگار تھا؟

Henry
تخلیقی ٹیکنالوجسٹلوزان سے تعلق رکھنے والے تخلیقی ٹیکنالوجسٹ جو اے آئی اور فن کے سنگم کو تلاش کرتے ہیں۔ الیکٹرانک موسیقی کے سیشنز کے درمیان جنریٹو ماڈلز کے ساتھ تجربات کرتے ہیں۔
متعلقہ مضامین
ان متعلقہ پوسٹس کے ساتھ مزید دریافت کریں

Video Language Models: LLMs اور AI Agents کے بعد اگلی سرحد
World models مصنوعی ذہانت کو جسمانی حقیقت سمجھنا سکھا رہے ہیں، روبوٹس کو ایک بھی actuator حرکت دیے بغیر اعمال کی منصوبہ بندی اور نتائج کی تخمین لگانے کے قابل بنا رہے ہیں۔

ویڈیو سے آگے عالمی ماڈلز: گیمنگ اور روبوٹکس AGI کے لیے حقیقی ثابت ہونے کے میدان کیوں ہیں
DeepMind کے Genie سے لے کر AMI Labs تک، عالمی ماڈلز خاموشی سے AI کی بنیاد بن رہے ہیں جو اصل میں فزکس سمجھتے ہیں۔ 500 بلین ڈالر کی گیمنگ مارکیٹ وہ جگہ ہو سکتی ہے جہاں وہ پہلے خود کو ثابت کریں۔

Runway GWM-1: وہ جنرل ورلڈ ماڈل جو حقیقت کو ریئل ٹائم میں سمیولیٹ کرتا ہے
Runway کا GWM-1 ویڈیوز تیار کرنے سے دنیاؤں کے سمیولیشن تک ایک پیراڈائم شفٹ کو ظاہر کرتا ہے۔ دریافت کریں کہ یہ آٹوریگریسیو ماڈل کس طرح قابل دریافت ماحول، فوٹوریلسٹک اوتار، اور روبوٹ ٹریننگ سمیولیشنز تخلیق کرتا ہے۔