Mirelo AI ভিডিওর নীরব সমস্যা সমাধানে $41M সংগ্রহ করেছে
বার্লিন স্টার্টআপ Mirelo সবেমাত্র Index Ventures এবং a16z থেকে $41 মিলিয়ন সুরক্ষিত করেছে AI-উৎপন্ন সাউন্ড ইফেক্ট ভিডিওতে আনতে। Mistral এবং Hugging Face এর নির্বাহীদের সমর্থনে, তারা তৈরি করছে যা শিল্পের মরিয়া প্রয়োজন: নীরব ভিডিও বিপ্লবের জন্য বুদ্ধিমান অডিও।

যখনই আমি একটি AI ভিডিও তৈরি করি, একই ঘটনা ঘটে। ভিজ্যুয়াল আমাকে অবাক করে দেয়। মোশন তরল। আলো সিনেমাটিক। তারপর আমি প্লে চাপি এবং... কিছুই না। নীরবতা। আমরা একটি নীরব চলচ্চিত্র যুগে বাস করছি, এবং এখন পর্যন্ত আমি এটা বুঝতে পারিনি।
সাউন্ডে $41 মিলিয়ন বাজি
Mirelo, একটি বার্লিন-ভিত্তিক স্টার্টআপ যা AI গবেষকদের দ্বারা প্রতিষ্ঠিত যারা সংগীতশিল্পীও, সবেমাত্র $41 মিলিয়ন সিড রাউন্ড বন্ধ করেছে। Index Ventures এবং Andreessen Horowitz বিনিয়োগের নেতৃত্ব দিয়েছে। এটি অডিওতে একটি ছোট বাজি নয়।
Mirelo-র মোট তহবিল এখন $44 মিলিয়ন, Atlantic থেকে আগের প্রি-সিড সহায়তা সহ। এঞ্জেল তালিকা AI হল অফ ফেমের মতো দেখায়: Arthur Mensch (Mistral CEO), Thomas Wolf (Hugging Face চিফ সায়েন্স অফিসার), এবং Burkay Gur (Fal.ai সহ-প্রতিষ্ঠাতা)।
পিচটি মার্জিত: আপনি একটি ভিডিও আপলোড করেন, তাদের AI এটি দেখে, এবং সম্পূর্ণভাবে সিঙ্ক্রোনাইজড সাউন্ড ইফেক্ট তৈরি করে। সাধারণ ব্যাকগ্রাউন্ড মিউজিক নয়। প্রকৃত foley-স্টাইল অডিও যা স্ক্রিনে যা ঘটছে তার সাথে মিলে যায়।
এখন এটি কেন গুরুত্বপূর্ণ
ডিসেম্বর 2025-এ AI ভিডিও ল্যান্ডস্কেপ সম্পর্কে চিন্তা করুন:
- Runway Gen-4.5 অত্যাশ্চর্য ভিজ্যুয়াল তৈরি করে কিন্তু কোনো নেটিভ অডিও নেই
- Sora 2 90-সেকেন্ড পর্যন্ত ক্লিপ তৈরি করে—সব নীরব
- Veo 3.1 সবেমাত্র অডিও যোগ করেছে, কিন্তু শুধুমাত্র নির্দিষ্ট বৈশিষ্ট্যের জন্য
শিল্পটি ফটোরিয়ালিস্টিক জেনারেশনের দিকে দৌড়াচ্ছে যখন অর্ধেক সংবেদনশীল অভিজ্ঞতা পিছনে ফেলে রাখছে। Mirelo সেই ফাঁক পূরণ করছে।
Mirelo SFX কীভাবে কাজ করে
তাদের প্রধান মডেলটিকে Mirelo SFX v1.5 বলা হয়। আমি তাদের API ডকুমেন্টেশন এবং ডেমো থেকে যা সংগ্রহ করতে পারি:
- দৃশ্য বিশ্লেষণ: মডেল আপনার ভিডিও দেখে এবং বস্তু, ক্রিয়া এবং পরিবেশগত প্রসঙ্গ চিহ্নিত করে
- টেম্পোরাল ম্যাপিং: এটি খুঁজে বের করে কখন ইভেন্ট ঘটে—একটি দরজা বন্ধ হওয়া, পদক্ষেপ, কাচ ভাঙা
- সাউন্ড জেনারেশন: AI অডিও তৈরি করে যা ভিজ্যুয়াল টাইমিং এবং অ্যাকোস্টিক বৈশিষ্ট্যের সাথে মেলে
- মিক্সিং: সবকিছু উপযুক্ত লেভেল এবং স্পেশিয়াল পজিশনিং সহ একসাথে স্তরযুক্ত হয়
ফলাফল শুধু ভিডিওতে লাগানো সাউন্ড ইফেক্ট নয়। এটি এমন অডিও যা অনুভব করে যে এটি সেখানে থাকার জন্য।
ইনপুট: জানালায় বৃষ্টি পড়ার AI-উৎপন্ন ভিডিও
আউটপুট: বিভিন্ন তীব্রতার বৃষ্টির ফোঁটা, কাচের অনুরণন, পরিবেষ্টিত ঘরের টোন
ফলাফল: ভিডিও হঠাৎ বাস্তব মনে হয়সংগীতশিল্পী প্রতিষ্ঠাতারা
CJ Simon-Gabriel এবং Florian Wenzel উভয়েই AI গবেষক এবং সংগীতশিল্পী। সেই সংমিশ্রণটি আপনার ভাবনার চেয়ে বেশি গুরুত্বপূর্ণ।
সংগীতশিল্পীরা অডিও সম্পর্কে এমন কিছু বোঝেন যা বিশুদ্ধ ML ইঞ্জিনিয়াররা মিস করতে পারে: টাইমিং সবকিছু। একটি সাউন্ড ইফেক্ট যা 50 মিলিসেকেন্ড দেরিতে আসে ভুল মনে হয় এমনকি যদি আপনি সচেতনভাবে চিহ্নিত করতে না পারেন কেন। অডিওর মানসিক প্রভাব মাইক্রোস্কোপিক সিঙ্ক্রোনাইজেশনের উপর নির্ভর করে।
তাদের দ্বৈত পটভূমি পণ্যে দেখায়। Mirelo শুধু শব্দ তৈরি করে না—এটি সঙ্গীতময়তার সাথে তৈরি করে।
বিতরণ কৌশল
Mirelo বাজারে একটি স্মার্ট পদ্ধতি নিচ্ছে:
| চ্যানেল | উদ্দেশ্য | স্ট্যাটাস |
|---|---|---|
| Mirelo Studio | সরাসরি ক্রিয়েটর ওয়ার্কস্পেস | উপলব্ধ |
| Fal.ai | ডেভেলপারদের জন্য API | লাইভ |
| Replicate | বিকল্প API অ্যাক্সেস | লাইভ |
| Freemium | €20/মাস ক্রিয়েটর প্ল্যান | উপলব্ধ |
Fal.ai এবং Replicate-এর মাধ্যমে বিতরণ করে, তারা ডেভেলপারদের সাথে দেখা করছে যেখানে তারা ইতিমধ্যে তৈরি করছে। আপনি যদি একটি AI ভিডিও পাইপলাইন তৈরি করছেন, আপনি সবকিছু পুনর্নির্মাণ না করে আপনার স্ট্যাকে Mirelo ড্রপ করতে পারেন।
প্রতিযোগিতা আসছে
Mirelo শূন্যস্থানে কাজ করছে না:
| Company | Strength | Weakness |
|---|---|---|
| Mirelo | বিশেষায়িত ফোকাস + সংগীতশিল্পী প্রতিষ্ঠাতা | স্টার্টআপ স্কেল |
| ElevenLabs | ভয়েস আধিপত্য | কম SFX ফোকাস |
| Kling AI (Kuaishou) | সমন্বিত ভিডিও প্ল্যাটফর্ম | কম অডিও বিশেষীকরণ |
Sony, Tencent, এবং ElevenLabs সবাই সংলগ্ন স্পেসে খেলছে। কিন্তু Mirelo-র ভিডিওর জন্য সাউন্ড ইফেক্টে লেজার ফোকাস তাদের একটি প্রান্ত দেয়। তারা সবকিছু হওয়ার চেষ্টা করছে না—তারা একটি জিনিসে উৎকর্ষ হওয়ার চেষ্টা করছে।
প্রশিক্ষণ ডেটার নৈতিকতা
একটি বিবরণ আমার কাছে আলাদা হয়েছিল: Mirelo পাবলিক এবং ক্রয়কৃত সাউন্ড লাইব্রেরি থেকে প্রশিক্ষণ ডেটা উৎস করে, শিল্পী অধিকার সম্মান করে এমন রাজস্ব-শেয়ারিং পার্টনারশিপ সহ।
এটি গুরুত্বপূর্ণ। AI শিল্প প্রশিক্ষণ ডেটা অনুশীলনের উপর ক্রমবর্ধমান তদন্তের মুখোমুখি। Mirelo শুরু থেকেই নৈতিকভাবে নির্মাণ করছে বলে মনে হচ্ছে, যা নিয়মকানুন কঠোর হওয়ার সাথে সাথে একটি প্রতিযোগিতামূলক সুবিধা হয়ে উঠতে পারে।
ক্রিয়েটরদের জন্য এর অর্থ কী
আপনি যদি আজ AI ভিডিও তৈরি করছেন, আপনার ওয়ার্কফ্লো সম্ভবত এরকম দেখাচ্ছে:
- Sora/Runway/Veo দিয়ে ভিজ্যুয়াল তৈরি করুন
- সম্পাদনা সফ্টওয়্যারে এক্সপোর্ট করুন
- লাইব্রেরি থেকে ম্যানুয়ালি সাউন্ড ইফেক্ট যোগ করুন
- ভিডিওর সাথে অডিও সিঙ্ক করুন
- লেভেল এবং টাইমিং সামঞ্জস্য করুন
- চূড়ান্ত ভিডিও এক্সপোর্ট করুন
Mirelo-র সাথে, ধাপ 3-5 একটি API কলে ভেঙে পড়ে। সময় সাশ্রয় দ্রুত বৃদ্ধি পায় যখন আপনি ভলিউম উৎপাদন করছেন।
AI মিউজিকের রাস্তা
Mirelo তাদের রোডম্যাপে AI মিউজিক জেনারেশন রয়েছে। সাউন্ড ইফেক্ট মডেল শুধু শুরু।
একটি ভিডিও তৈরির কল্পনা করুন:
- AI-উৎপন্ন ভিজ্যুয়াল
- AI-উৎপন্ন সংলাপ (ElevenLabs)
- AI-উৎপন্ন সাউন্ড ইফেক্ট (Mirelo)
- AI-উৎপন্ন সাউন্ডট্র্যাক (ভবিষ্যত Mirelo)
আমরা সম্পূর্ণ সিন্থেটিক মিডিয়ার জন্য টুকরো একত্র করছি। এটি আপনাকে উত্তেজিত বা ভীত করে সম্ভবত নির্ভর করে আপনি জীবিকার জন্য কী তৈরি করেন।
মূল্য এবং অ্যাক্সেস
Mirelo চেষ্টা করতে ইচ্ছুক ক্রিয়েটরদের জন্য:
- ফ্রি টায়ার: প্ল্যাটফর্ম পরীক্ষা করতে সীমিত জেনারেশন
- ক্রিয়েটর প্ল্যান: €20/মাস (~$23.50) প্রস্তাবিত ব্যবহারের জন্য
- API: Fal.ai এবং Replicate-এর মাধ্যমে প্রতি-ব্যবহার পেমেন্ট
- এন্টারপ্রাইজ: স্কেলের জন্য কাস্টম মূল্য
প্রযুক্তির পরিপ্রেক্ষিতে ক্রিয়েটর প্ল্যান আশ্চর্যজনকভাবে সাশ্রয়ী। একজন foley শিল্পী নিয়োগ বা পেশাদার সাউন্ড লাইব্রেরি লাইসেন্সিংয়ের সাথে তুলনা করুন।
আমার মতামত
আমরা AI ভিডিও আরও ভাল দেখাতে এতটাই মনোনিবেশ করেছি যে আমরা ভুলে গেছি ভিডিও একটি মাল্টি-সেন্সরি মাধ্যম। Mirelo সেই তদারকি সংশোধন করছে।
আপনার AI-উৎপন্ন ভিডিওগুলির একটি Mirelo-র প্ল্যাটফর্মে আপলোড করার চেষ্টা করুন। আগে এবং পরের মধ্যে পার্থক্য হল ডেমো এবং ডেলিভারেবলের মধ্যে পার্থক্য।
$41 মিলিয়ন তহবিল পরামর্শ দেয় বিনিয়োগকারীরা একই সুযোগ দেখছেন। অডিও একটি নাইস-টু-হ্যাভ বৈশিষ্ট্য নয়—এটি ভিডিওকে আকর্ষণীয় করে তোলে তার অর্ধেক।
নীরব চলচ্চিত্র যুগ 1927 সালে The Jazz Singer দিয়ে শেষ হয়েছিল। প্রায় একশ বছর পরে, AI ভিডিও তার নিজস্ব "টকিজ" মুহূর্ত পাচ্ছে।
Mirelo বাজি ধরছে যে তারা এই নতুন যুগের শব্দ হতে পারে। তাদের প্রযুক্তি, দল এবং টাইমিংয়ের উপর ভিত্তি করে, সেই বাজি ক্রমবর্ধমান স্মার্ট দেখাচ্ছে।
শুরু করা
- প্ল্যাটফর্ম অন্বেষণ করতে mirelo.io পরিদর্শন করুন
- একটি নীরব AI ভিডিও আপলোড করুন
- Mirelo-কে সিঙ্ক্রোনাইজড অডিও তৈরি করতে দিন
- আপনার ম্যানুয়াল অডিও কাজের সাথে তুলনা করুন
- সিদ্ধান্ত নিন অটোমেশন আপনার ওয়ার্কফ্লোর জন্য প্রস্তুত কিনা
প্রবেশের বাধা কম। সম্ভাব্য সময় সাশ্রয় বেশি। এবং প্রযুক্তি শুধুমাত্র উন্নত হবে যখন সেই $41 মিলিয়ন মোতায়েন করা হয়।
সাউন্ড অবশেষে AI ভিডিও টেবিলে একটি আসন পেয়েছে।
এই নিবন্ধটি কি সহায়ক ছিল?

Henry
ক্রিয়েটিভ টেকনোলজিস্টলোজান থেকে আসা ক্রিয়েটিভ টেকনোলজিস্ট যিনি এআই এবং শিল্পের সংযোগস্থল অন্বেষণ করেন। ইলেকট্রনিক মিউজিক সেশনের মধ্যে জেনারেটিভ মডেল নিয়ে পরীক্ষা করেন।
সম্পর্কিত নিবন্ধসমূহ
এই সম্পর্কিত পোস্টগুলির সাথে অন্বেষণ চালিয়ে যান

Pika 2.5: দ্রুততা, মূল্য এবং সৃজনশীল সরঞ্জামের মাধ্যমে AI ভিডিওকে সবার জন্য উপলব্ধ করা
Pika Labs সংস্করণ 2.5 প্রকাশ করেছে, যা দ্রুততর উৎপাদন, উন্নত পদার্থবিদ্যা এবং Pikaframes এবং Pikaffects এর মতো সৃজনশীল সরঞ্জাম একত্রিত করে AI ভিডিওকে সবার জন্য সহজলভ্য করে তোলে।
গুগল এআই অ্যাভাটার রেসে প্রবেশ করছে: ভিও ৩.১ গুগল ভিডসে নতুন অ্যাভাটার চালিত করছে
গুগল ভিও ৩.১ দ্বারা চালিত অ্যাভাটার দিয়ে ভিডস আপগ্রেড করছে, এন্টারপ্রাইজ ব্যবহারকারীদের জন্য প্রতিযোগীদের চেয়ে পাঁচগুণ ভাল পছন্দের প্রতিশ্রুতি দিচ্ছে। এটি সিনথেসিয়া এবং হেইজেনের সাথে কীভাবে তুলনা করে?

২০২৫ সালে AI ভিডিও Prompt Engineering-এর সম্পূর্ণ গাইড
চমৎকার AI-জেনারেটেড ভিডিও তৈরি করার জন্য prompt তৈরির শিল্প আয়ত্ত করুন। ছয়-স্তর framework, সিনেমাটিক পরিভাষা, এবং platform-নির্দিষ্ট কৌশল শিখুন।