মেটা ম্যাংগো: OpenAI এবং Google-কে পরাজিত করার লক্ষ্যে গোপনীয় AI ভিডিও মডেল
মেটা ম্যাংগো প্রকাশ করেছে, একটি নতুন AI ভিডিও এবং ইমেজ মডেল যা ২০২৬ সালে রিলিজের লক্ষ্যমাত্রা রাখছে। Scale AI-এর সহ-প্রতিষ্ঠাতা আলেকজান্ডার ওয়াং-এর নেতৃত্বে, মেটা কি অবশেষে জেনারেটিভ AI প্রতিযোগিতায় এগিয়ে যেতে পারবে?

জেনারেটিভ AI প্রতিযোগিতায় মাসের পর মাস পিছিয়ে থাকার পর, মেটা তার সবচেয়ে উচ্চাভিলাষী প্রজেক্ট প্রকাশ করেছে: একটি AI ভিডিও এবং ইমেজ মডেল যার কোডনাম ম্যাংগো। ২০২৬ সালের প্রথমার্ধে রিলিজের জন্য নির্ধারিত, এটি সোশ্যাল মিডিয়া দৈত্যের ভিজুয়াল AI-তে সবচেয়ে সাহসী বাজি।
যে ঘোষণা ভ্যালিকে নাড়িয়ে দিয়েছে
খবরটি বৃহস্পতিবার, ১৯ ডিসেম্বর মেটার একটি অভ্যন্তরীণ Q&A সেশনে প্রকাশিত হয়। চিফ প্রোডাক্ট অফিসার ক্রিস কক্স এবং আলেকজান্ডার ওয়াং, Scale AI-এর সহ-প্রতিষ্ঠাতা যিনি এখন মেটার সুপারইন্টেলিজেন্স ল্যাবস পরিচালনা করছেন, এমন একটি রোডম্যাপ উন্মোচন করেছেন যা কর্মচারীদের আলোচনায় মাতিয়ে রেখেছে।
দুটি মডেল। দুটি কোডনাম। একটি বিশাল উচ্চাভিলাষ।
যেখানে অ্যাভোকাডো টেক্সট, রিজনিং এবং উন্নত কোডিং ক্ষমতায় মনোনিবেশ করছে, ম্যাংগো হলো ভিজুয়াল পাওয়ারহাউস। অভ্যন্তরীণ সূত্র অনুযায়ী, মেটা "ওয়ার্ল্ড মডেল যা ভিজুয়াল তথ্য বুঝতে পারে এবং প্রতিটি সম্ভাবনায় প্রশিক্ষিত না হয়েও যুক্তি, পরিকল্পনা এবং কাজ করতে পারে" তা অন্বেষণ করছে।
এটি শুধুমাত্র ভিডিও জেনারেশন নয়। এটি ভিডিও বোঝার মতো কিছুর কাছাকাছি যাওয়ার চেষ্টা।
কেন মেটার এই জয় প্রয়োজন
সত্যি বলতে, মেটা AI প্রতিযোগিতায় সংগ্রাম করছে।
যেখানে OpenAI ChatGPT দিয়ে বিশ্বের কল্পনা দখল করেছে এবং এখন Sora 2-এর ফিজিক্স-সঠিক ভিডিও জেনারেশন নিয়ে এসেছে, এবং Google Veo 3 এবং নেটিভ অডিও সিনথেসিস নিয়ে এগিয়েছে, মেটার AI সহায়ক রয়ে গেছে... ঠিক আছে। কার্যকর। কিন্তু বিপ্লবী নয়।
মেটার AI সহায়ক Facebook, Instagram এবং WhatsApp-এর মাধ্যমে বিলিয়ন মানুষের কাছে পৌঁছায়। কিন্তু ডিস্ট্রিবিউশন ইনোভেশনের সমান নয়। কোম্পানির একটি যুগান্তকারী পণ্য দরকার, শুধু একটি ভালভাবে বিতরণ করা মাঝারি মানের পণ্য নয়।
ম্যাংগোর ডেভেলপমেন্টের সময় কোনো কাকতালীয় নয়। গ্রীষ্মে, মেটা একটি উল্লেখযোগ্য AI পুনর্গঠন করেছে। ওয়াং নতুন তৈরি মেটা সুপারইন্টেলিজেন্স ল্যাবস (MSL)-এর দায়িত্ব নিয়েছেন, এবং কোম্পানি আক্রমণাত্মক রিক্রুটমেন্ট প্রচেষ্টায় রয়েছে, OpenAI থেকে ২০ জনেরও বেশি গবেষক নিয়ে এসেছে এবং ৫০+ নতুন AI বিশেষজ্ঞ যুক্ত করেছে।
আলেকজান্ডার ওয়াং ফ্যাক্টর
আপনি যদি আলেকজান্ডার ওয়াংকে না চেনেন, তাহলে চেনা উচিত। তিনি ১৯ বছর বয়সে Scale AI সহ-প্রতিষ্ঠা করেছিলেন এবং এটিকে $১৩ বিলিয়ন মূল্যের কোম্পানিতে রূপান্তরিত করেছেন যা বিশ্বের সবচেয়ে উন্নত AI সিস্টেমগুলির পিছনে ডেটা অবকাঠামোকে শক্তি জোগায়। তাকে MSL-এর নেতৃত্ব দেওয়ার সংকেত দেয় যে মেটা শুধু সমস্যায় টাকা ছুড়ছে না। তারা এমন কাউকে নিয়ে আসছে যিনি সম্পূর্ণ AI পাইপলাইন বোঝেন, ডেটা লেবেলিং থেকে মডেল ডিপ্লয়মেন্ট পর্যন্ত।
Scale AI-এর ট্র্যাক রেকর্ড
Scale AI OpenAI, Google এবং মার্কিন প্রতিরক্ষা বিভাগের সাথে কাজ করেছে। ওয়াং বুঝতে পারেন যে স্কেলে কাজ করে এমন মডেল তৈরি করতে কী লাগে।
মেটা যে অভ্যন্তর থেকে পদোন্নতি না দিয়ে একজন বহিরাগতকে নিয়োগ দিয়েছে তা তাদের জরুরিতা সম্পর্কে অনেক কিছু বলে। এটি স্বাভাবিক ব্যবসা নয়। এটি একটি রিসেট।
সৃষ্টিকর্তাদের জন্য ম্যাংগো কী অর্থ হতে পারে
যারা আসলে কন্টেন্ট তৈরি করছি তাদের জন্য এখানেই বিষয়টি আকর্ষণীয় হয়ে ওঠে।
Instagram এবং Facebook ইতিমধ্যে শর্ট-ফর্ম এবং লং-ফর্ম ভিডিও দ্বারা আধিপত্য করছে। মেটার ডিস্ট্রিবিউশন রয়েছে। যা তাদের নেই তা হলো ক্রিয়েশন টুলস যা প্রতিযোগীরা তৈরি করতে দৌড়াচ্ছে। কল্পনা করুন:
- Instagram-এ সরাসরি AI-সহায়ক ভিডিও এডিটিং
- Reels-এর জন্য স্বয়ংক্রিয় ভিজুয়াল ইফেক্ট
- বিজ্ঞাপন তৈরির জন্য টেক্সট-টু-ভিডিও জেনারেশন
- পোস্ট জুড়ে স্টাইল-সামঞ্জস্যপূর্ণ কন্টেন্ট জেনারেশন
- স্কেলে কন্টেন্ট মডারেশন
- AI এবং মানব কন্টেন্ট আলাদা করা
- সত্যতা নিয়ে ক্রিয়েটর প্রতিক্রিয়া
- প্ল্যাটফর্ম বিশ্বাসের সমস্যা
যদি ম্যাংগো তার "ওয়ার্ল্ড মডেল" প্রতিশ্রুতি পূরণ করে, আমরা এমন AI দেখছি যা শুধু ভিডিও ফ্রেম জেনারেট করে না। এটি একটি দৃশ্যে কী ঘটছে তা বোঝে, ফিজিক্স এবং অবজেক্ট সম্পর্কে যুক্তি করতে পারে, এবং প্রকৃত বোঝাপড়ার সাথে ভিজুয়াল কন্টেন্ট ম্যানিপুলেট করতে পারে।
এটি একটি বড় যদি। কিন্তু সম্ভাবনা বিশাল।
২০২৬ সালে প্রতিযোগিতামূলক ল্যান্ডস্কেপ
যখন ম্যাংগো ২০২৬ সালের H1-এ রিলিজ হবে, তখন AI ভিডিও ল্যান্ডস্কেপ আজকের চেয়ে অনেক ভিন্ন দেখাবে।
| কোম্পানি | মডেল | মূল শক্তি |
|---|---|---|
| OpenAI | Sora 2 | ফিজিক্স সিমুলেশন, ডিজনি চরিত্র |
| Veo 3 | নেটিভ অডিও, Flow এডিটিং টুলস | |
| Runway | Gen-4.5 | ভিজুয়াল কোয়ালিটি, Adobe ইন্টিগ্রেশন |
| Meta | Mango | ডিস্ট্রিবিউশন, সোশ্যাল ইন্টিগ্রেশন |
মেটার সুবিধা প্রযুক্তিগত শ্রেষ্ঠত্ব নয়। অন্তত এখনো নয়। এটি হলো যে ৩ বিলিয়ন মানুষ প্রতিদিন তাদের প্ল্যাটফর্ম ব্যবহার করে। যদি ম্যাংগো Runway Gen-4.5 বা Veo 3-এর গুণমান মেলাতে পারে, তাহলে ডিস্ট্রিবিউশন সুবিধা প্রতিযোগীদের জন্য ধ্বংসাত্মক হয়ে ওঠে।
আসল প্রশ্ন: মেটা কি একটি বেস্ট-ইন-ক্লাস মডেল তৈরি করতে পারবে, নাকি তারা "যথেষ্ট ভাল" এ সন্তুষ্ট হবে এবং ডিস্ট্রিবিউশনের উপর নির্ভর করবে? ইতিহাস পরবর্তীটির পরামর্শ দেয়। কিন্তু ওয়াং-এর সম্পৃক্ততা উচ্চতর উচ্চাভিলাষের ইঙ্গিত দেয়।
ইয়ান লেকুনের প্রস্থান
একটি হাতি ঘরে আছে। ইয়ান লেকুন, মেটার কিংবদন্তি চিফ AI বিজ্ঞানী এবং "ডিপ লার্নিংয়ের গডফাদার"-দের একজন, সম্প্রতি তার নিজের স্টার্টআপ চালু করতে প্রস্থানের ঘোষণা দিয়েছেন।
লেকুন লার্জ ল্যাঙ্গুয়েজ মডেল সম্পর্কে তার সন্দেহবাদ এবং AI-এর বিকল্প পদ্ধতিতে তার বিশ্বাস সম্পর্কে সোচ্চার ছিলেন। তার প্রস্থান মেটার AI গবেষণার দিকনির্দেশনা নিয়ে প্রশ্ন উত্থাপন করে। ম্যাংগো কি লেকুনের দৃষ্টিভঙ্গির সাথে সারিবদ্ধ, নাকি এটি তা থেকে প্রস্থান প্রতিনিধিত্ব করে?
আমরা এখনো জানি না। কিন্তু সময়টি উল্লেখযোগ্য।
কী লক্ষ্য করবেন
যখন আমরা ২০২৬ সালের দিকে যাচ্ছি, এখানে মূল প্রশ্নগুলি:
- ○ম্যাংগো কি Kling এবং Veo 3-এর মতো নেটিভ অডিও জেনারেশন অন্তর্ভুক্ত করবে?
- ○মেটা AI-জেনারেট করা ভিডিওর জন্য কন্টেন্ট মডারেশন কীভাবে পরিচালনা করবে?
- ○ক্রিয়েটর টুলস কি সরাসরি Instagram-এ ইন্টিগ্রেট করা হবে?
- ○লেকুনের প্রস্থানের পর MSL প্রতিভা ধরে রাখতে পারবে?
আমাদের মতামত
মেটার ম্যাংগো ঘোষণা গুরুত্বপূর্ণ কারণ এটি যা প্রতিশ্রুতি দেয় তার জন্য নয়, বরং এটি কোম্পানির মানসিকতা সম্পর্কে যা প্রকাশ করে তার জন্য। তারা দ্রুত অনুসরণকারী হওয়া শেষ করেছে। তারা শূন্য থেকে তৈরি করছে, গুরুতর নেতৃত্বের সাথে, এবং এমন একটি রিলিজ উইন্ডো লক্ষ্য করছে যা তাদের সঠিকভাবে করার সময় দেয়।
ম্যাংগো কি Sora 2 বা Veo 3-কে পরাজিত করবে? সম্ভবত প্রথম দিনে নয়। কিন্তু ৩ বিলিয়ন ব্যবহারকারী এবং দ্রুত পুনরাবৃত্তি করার সম্পদ নিয়ে, মেটার শুধু কাছাকাছি যেতে হবে। ডিস্ট্রিবিউশন বাকিটা করে দেয়।
AI ভিডিও প্রতিযোগিতা অনেক বেশি আকর্ষণীয় হয়ে উঠেছে।
সম্পর্কিত পড়া: AI ভিডিওর বর্তমান অবস্থার প্রেক্ষাপটের জন্য, আমাদের Sora 2 বনাম Runway বনাম Veo 3 তুলনা এবং আমাদের AI ভিডিও জেনারেশনে ওয়ার্ল্ড মডেল-এ গভীর অন্বেষণ দেখুন।
এই নিবন্ধটি কি সহায়ক ছিল?

Henry
ক্রিয়েটিভ টেকনোলজিস্টলোজান থেকে আসা ক্রিয়েটিভ টেকনোলজিস্ট যিনি এআই এবং শিল্পের সংযোগস্থল অন্বেষণ করেন। ইলেকট্রনিক মিউজিক সেশনের মধ্যে জেনারেটিভ মডেল নিয়ে পরীক্ষা করেন।
সম্পর্কিত নিবন্ধসমূহ
এই সম্পর্কিত পোস্টগুলির সাথে অন্বেষণ চালিয়ে যান

অদৃশ্য ঢাল: কীভাবে AI ভিডিও ওয়াটারমার্কিং 2025 সালে কপিরাইট সংকট সমাধান করছে
যেমন AI-জেনারেটেড ভিডিও বাস্তব ফুটেজ থেকে আলাদা করা যায় না হয়ে উঠছে, অদৃশ্য ওয়াটারমার্কিং কপিরাইট সুরক্ষার জন্য গুরুত্বপূর্ণ অবকাঠামো হিসেবে আবির্ভূত হচ্ছে। আমরা Meta-র নতুন পদ্ধতি, Google-এর SynthID এবং স্কেলে detection signal এম্বেড করার প্রযুক্তিগত চ্যালেঞ্জগুলো অন্বেষণ করি।

YouTube Shorts-এ Veo 3 Fast: ২.৫ বিলিয়ন ব্যবহারকারীর জন্য বিনামূল্যে AI ভিডিও তৈরি
Google তার Veo 3 Fast মডেল সরাসরি YouTube Shorts-এ সংযুক্ত করেছে, বিশ্বজুড়ে ক্রিয়েটরদের জন্য অডিও সহ বিনামূল্যে টেক্সট-টু-ভিডিও জেনারেশন অফার করছে। প্ল্যাটফর্ম এবং AI ভিডিও অ্যাক্সেসিবিলিটির জন্য এর অর্থ কী তা জানুন।

Kling 2.6: ভয়েস ক্লোনিং এবং মোশন কন্ট্রোল AI ভিডিও তৈরিকে নতুন রূপ দিচ্ছে
Kuaishou-এর সাম্প্রতিক আপডেটে এসেছে একযোগে অডিও-ভিজ্যুয়াল জেনারেশন, কাস্টম ভয়েস ট্রেনিং এবং নির্ভুল মোশন ক্যাপচার, যা সৃষ্টিকর্তাদের AI ভিডিও প্রযোজনার পদ্ধতি বদলে দিতে পারে।