Mirelo Mengumpulkan $41 Juta untuk Mengatasi Masalah Video AI yang Sunyi
Startup Berlin Mirelo baru saja mengamankan $41 juta dari Index Ventures dan a16z untuk menghadirkan efek suara yang dihasilkan AI ke video. Dengan dukungan dari eksekutif Mistral dan Hugging Face, mereka sedang membangun apa yang sangat dibutuhkan industri: audio cerdas untuk revolusi video yang sunyi.

Setiap kali saya membuat video AI, hal yang sama terjadi. Visualnya membuat saya takjub. Gerakannya halus. Pencahayaannya sinematik. Lalu saya menekan putar dan... tidak ada apa-apa. Sunyi. Kita telah hidup dalam era film bisu, dan saya bahkan tidak menyadarinya sampai sekarang.
Taruhan $41 Juta pada Suara
Mirelo, startup yang berbasis di Berlin yang didirikan oleh peneliti AI yang kebetulan adalah musisi, baru saja menutup putaran seed sebesar $41 juta. Index Ventures dan Andreessen Horowitz memimpin investasi tersebut. Ini bukan taruhan kecil pada audio.
Total pendanaan Mirelo sekarang mencapai $44 juta, termasuk dukungan pre-seed sebelumnya dari Atlantic. Daftar angel investor terlihat seperti hall of fame AI: Arthur Mensch (CEO Mistral), Thomas Wolf (chief science officer Hugging Face), dan Burkay Gur (co-founder Fal.ai).
Pitchnya elegan: Anda mengunggah video, AI mereka menontonnya, dan menghasilkan efek suara yang disinkronkan sempurna. Bukan musik latar generik. Audio gaya foley yang sebenarnya yang cocok dengan apa yang terjadi di layar.
Mengapa Ini Penting Sekarang
Mari kita pikirkan tentang lanskap video AI pada Desember 2025:
- Runway Gen-4.5 menghasilkan visual yang menakjubkan tetapi tidak ada audio asli
- Sora 2 menghasilkan klip hingga 90 detik—semuanya sunyi
- Veo 3.1 baru saja menambahkan audio, tetapi hanya untuk fitur tertentu
Industri ini telah berlari kencang menuju generasi yang fotorealistik sambil meninggalkan setengah pengalaman sensorik. Mirelo mengisi kesenjangan itu.
Cara Kerja Mirelo SFX
Model unggulan mereka disebut Mirelo SFX v1.5. Dari apa yang dapat saya pahami dari dokumentasi API dan demo mereka:
- Analisis Adegan: Model menonton video Anda dan mengidentifikasi objek, tindakan, dan konteks lingkungan
- Pemetaan Temporal: Ia mencari tahu kapan peristiwa terjadi—pintu tertutup, langkah kaki, kaca pecah
- Generasi Suara: AI membuat audio yang cocok dengan waktu visual dan properti akustik
- Mixing: Semuanya dilapisi bersama dengan level yang sesuai dan posisi spasial
Hasilnya bukan hanya efek suara yang ditempelkan pada video. Ini adalah audio yang terasa seperti miliknya.
Input: Video yang dihasilkan AI tentang hujan mengenai jendela
Output: Tetesan hujan dengan intensitas yang bervariasi, resonansi kaca, nada ruangan ambient
Hasil: Video tiba-tiba terasa nyataPara Pendiri yang Musisi
CJ Simon-Gabriel dan Florian Wenzel keduanya adalah peneliti AI dan musisi. Kombinasi itu lebih penting dari yang Anda kira.
Musisi memahami sesuatu tentang audio yang mungkin terlewatkan oleh insinyur ML murni: waktu adalah segalanya. Efek suara yang terlambat 50 milidetik terasa salah bahkan jika Anda tidak dapat mengidentifikasi mengapa secara sadar. Dampak emosional audio bergantung pada sinkronisasi mikroskopis.
Latar belakang ganda mereka terlihat dalam produk. Mirelo tidak hanya menghasilkan suara—ia menghasilkannya dengan musikalitas.
Strategi Distribusi
Mirelo mengambil pendekatan yang cerdas terhadap pasar:
| Saluran | Tujuan | Status |
|---|---|---|
| Mirelo Studio | Ruang kerja creator langsung | Tersedia |
| Fal.ai | API untuk developer | Aktif |
| Replicate | Akses API alternatif | Aktif |
| Freemium | Paket creator €20/bulan | Tersedia |
Dengan mendistribusikan melalui Fal.ai dan Replicate, mereka bertemu dengan developer di tempat mereka sudah membangun. Jika Anda membuat pipeline video AI, Anda dapat memasukkan Mirelo ke dalam stack Anda tanpa membangun ulang semuanya.
Kompetisi Akan Datang
Mirelo tidak beroperasi dalam ruang hampa:
| Company | Strength | Weakness |
|---|---|---|
| Mirelo | Fokus Khusus + Pendiri Musisi | Skala Startup |
| ElevenLabs | Dominasi Suara | Kurang Fokus SFX |
| Kling AI (Kuaishou) | Platform Video Terintegrasi | Kurang Spesialisasi Audio |
Sony, Tencent, dan ElevenLabs semuanya bermain di ruang yang berdekatan. Tetapi fokus laser Mirelo pada efek suara untuk video memberi mereka keunggulan. Mereka tidak mencoba menjadi segalanya—mereka mencoba menjadi sangat baik dalam satu hal.
Etika Data Pelatihan
Satu detail yang menonjol bagi saya: Mirelo mendapatkan data pelatihan dari perpustakaan suara publik dan yang dibeli, dengan kemitraan berbagi pendapatan yang menghormati hak artis.
Ini penting. Industri AI menghadapi pengawasan yang meningkat atas praktik data pelatihan. Mirelo tampaknya membangun secara etis dari awal, yang bisa menjadi keunggulan kompetitif saat regulasi diperketat.
Apa Artinya Ini untuk Creator
Jika Anda membuat video AI hari ini, alur kerja Anda mungkin terlihat seperti ini:
- Hasilkan visual dengan Sora/Runway/Veo
- Ekspor ke software editing
- Tambahkan efek suara secara manual dari perpustakaan
- Sinkronkan audio dengan video
- Sesuaikan level dan waktu
- Ekspor video final
Dengan Mirelo, langkah 3-5 runtuh menjadi satu panggilan API. Penghematan waktu bertambah cepat saat Anda memproduksi volume.
Jalan Menuju Musik AI
Mirelo memiliki generasi musik AI dalam roadmap mereka. Model efek suara hanyalah awal.
Bayangkan membuat video dengan:
- Visual yang dihasilkan AI
- Dialog yang dihasilkan AI (ElevenLabs)
- Efek suara yang dihasilkan AI (Mirelo)
- Soundtrack yang dihasilkan AI (Mirelo masa depan)
Kita sedang merakit bagian-bagian untuk media yang sepenuhnya sintetis. Apakah itu membuat Anda bersemangat atau ketakutan mungkin tergantung pada apa yang Anda buat untuk mencari nafkah.
Harga dan Akses
Untuk creator yang ingin mencoba Mirelo:
- Tier gratis: Generasi terbatas untuk menguji platform
- Paket creator: €20/bulan (~$23.50) untuk penggunaan yang direkomendasikan
- API: Bayar per penggunaan melalui Fal.ai dan Replicate
- Enterprise: Harga khusus untuk skala
Paket creator sangat terjangkau mengingat teknologinya. Bandingkan dengan menyewa artis foley atau melisensikan perpustakaan suara profesional.
Pendapat Saya
Kita sangat fokus membuat video AI terlihat lebih baik sehingga kita lupa video adalah media multi-sensorik. Mirelo memperbaiki kelalaian itu.
Cobalah mengunggah salah satu video yang dihasilkan AI Anda ke platform Mirelo. Perbedaan antara sebelum dan sesudah adalah perbedaan antara demo dan deliverable.
Pendanaan $41 juta menunjukkan investor melihat peluang yang sama. Audio bukan fitur yang bagus untuk dimiliki—itu adalah setengah dari apa yang membuat video menarik.
Era film bisu berakhir pada tahun 1927 dengan The Jazz Singer. Hampir satu abad kemudian, video AI mengalami momen "talkies"-nya sendiri.
Mirelo bertaruh mereka bisa menjadi suara dari era baru ini. Berdasarkan teknologi, tim, dan waktu mereka, taruhan itu terlihat semakin cerdas.
Memulai
- Kunjungi mirelo.io untuk menjelajahi platform
- Unggah video AI yang sunyi
- Biarkan Mirelo menghasilkan audio yang disinkronkan
- Bandingkan dengan pekerjaan audio manual Anda
- Putuskan apakah otomasi siap untuk alur kerja Anda
Hambatan untuk masuk rendah. Potensi penghematan waktu tinggi. Dan teknologi hanya akan meningkat saat $41 juta itu digunakan.
Suara akhirnya memiliki tempat di meja video AI.
Apakah artikel ini bermanfaat?

Henry
Teknolog KreatifTeknolog kreatif dari Lausanne yang mengeksplorasi pertemuan antara AI dan seni. Bereksperimen dengan model generatif di antara sesi musik elektronik.
Artikel Terkait
Lanjutkan eksplorasi dengan postingan terkait ini

Pika 2.5: Mendemokratisasi Video AI Melalui Kecepatan, Harga, dan Alat Kreatif
Pika Labs merilis versi 2.5, menggabungkan generasi lebih cepat, fisika yang ditingkatkan, dan alat kreatif seperti Pikaframes dan Pikaffects untuk membuat video AI dapat diakses oleh semua orang.
Google Memasuki Kompetisi Avatar AI: Avatar Bertenaga Veo 3.1 di Google Vids
Google meningkatkan avatar AI di Google Vids dengan Veo 3.1, menjanjikan bahwa pengguna lebih menyukai avatar ini lima kali lebih banyak daripada pesaing. Bagaimana ini dibandingkan dengan Synthesia dan HeyGen?

Panduan Lengkap Prompt Engineering untuk Video AI di Tahun 2025
Mari pelajari seni merancang prompt yang menghasilkan video AI yang memukau. Temukan kerangka kerja enam lapis, terminologi sinematik, dan teknik khusus untuk setiap platform.