AWS dan Decart: Penjanaan Video AI Masa Nyata pada Infrastruktur Awan
AWS mengumumkan perkongsian dengan Decart AI untuk membawa penjanaan video masa nyata ke infrastruktur awan, menjanjikan video berasaskan teks dengan latensi sub-saat.

Penjanaan video AI sedia ada berfungsi secara kelompok: anda hantar permintaan, tunggu, dapatkan hasil. AWS dan Decart mahu mengubah itu menjadi pengalaman masa nyata, menstrim video dijana AI semasa ia dicipta.
Mengapa Masa Nyata Penting
Perbezaan antara penjanaan kelompok dan masa nyata bukan hanya kelajuan. Ia adalah perubahan asas dalam cara manusia berinteraksi dengan AI:
Penjanaan Kelompok (Semasa):
- Hantar prompt
- Tunggu 30 saat hingga beberapa minit
- Terima hasil siap
- Jika tidak suka, ulang dari awal
- Gelung maklum balas perlahan
Penjanaan Masa Nyata (Visi Decart):
- Mula menaip prompt
- Lihat video mula terbentuk serta-merta
- Laraskan sambil menonton
- Maklum balas berterusan
- Pengalaman penciptaan interaktif
Fikirkan perbezaan antara menaip dalam dokumen berbanding menghantar surat. Satu adalah perbualan. Satu lagi adalah pertukaran. Decart mahu penjanaan video terasa seperti perbualan.
Apa yang Decart Bawa ke Meja
Decart AI telah membina infrastruktur yang dioptimumkan untuk penjanaan video latensi rendah. Model "Oasis" mereka menunjukkan keupayaan ini pada awal 2025:
Oasis menarik perhatian sebagai "model dunia" yang boleh menjana persekitaran video interaktif. Kini infrastruktur itu datang ke AWS.
Model dunia Oasis berbeza daripada penjana video tradisional kerana ia boleh bertindak balas kepada input. Daripada menjana klip tetap, ia menjana bingkai seterusnya berdasarkan apa yang "berlaku" dalam persekitaran maya.
Komponen Infrastruktur AWS
Perkongsian ini memanfaatkan beberapa keupayaan AWS:
- ✓EC2 dengan GPU Khusus: Pengiraan akselerasi untuk inferens model
- ✓Integrasi Bedrock: Akses API ke model Decart
- ✓Rangkaian Latensi Rendah: Infrastruktur dioptimumkan untuk penstriman
- ✓Penyepaduan Tepi: Penggunaan berdekatan dengan pengguna akhir
Arsitektur ini bertujuan untuk meminimumkan setiap milisaat latensi. Bukan hanya tentang membuat model lebih pantas. Ia tentang mengoptimumkan keseluruhan laluan dari prompt pengguna ke bingkai yang dipaparkan.
Cabaran Teknikal
Penjanaan video masa nyata menghadapi halangan yang tidak wujud dalam pemprosesan kelompok:
- Masa inferens model (50-100ms sasaran)
- Latensi rangkaian (10-50ms bergantung pada lokasi)
- Penyanggaan penstriman (100-200ms untuk kelancaran)
- Kelewatan paparan klien (16ms pada 60fps)
- Pengiraan edge mengurangkan perjalanan rangkaian
- Penstriman spekulatif bermula sebelum selesai
- Pengkompilasi model khusus untuk kelajuan
- Protokol penstriman dioptimumkan
Jumlah sasaran di bawah satu saat adalah bercita-cita tinggi. Untuk konteks, perbualan manusia terasa semula jadi dengan kelewatan di bawah 200ms. Decart menyasarkan keseluruhan penjanaan video dalam masa itu.
Aplikasi Praktikal
Di manakah penjanaan video masa nyata benar-benar masuk akal?
Permainan Interaktif
Dunia permainan yang dijana sambil anda bermain. Bukan pra-dirender atau diprosedur, tetapi benar-benar dijana oleh model AI berdasarkan tindakan pemain.
Pratonton Kreatif
Pengarah melihat keputusan prompt dalam masa nyata, melaraskan parameter seperti pencahayaan, mood, atau aksi sambil menonton output berubah.
Strim Langsung
Elemen video dijana AI yang bertindak balas kepada peristiwa masa nyata. Bayangkan pelaporan berita dengan visualisasi dijana seketika.
Avatar Interaktif
Respons video yang dijana semasa perbualan, bukan hanya animasi lip-sync yang diprakompil.
Bagaimana Ini Berbanding dengan Penyelesaian Semasa
Landskap penjanaan video AI semasa:
| Platform | Masa Penjanaan | Mod Interaktif | Infrastruktur |
|---|---|---|---|
| Sora 2 | 30-60 saat | Tidak | Awan OpenAI |
| Runway Gen-4.5 | 20-40 saat | Tidak | Awan Runway |
| Veo 3 | 15-30 saat | Tidak | Awan Google |
| Model Tempatan | 2-10 minit | Tidak | GPU Tempatan |
| Decart (Sasaran) | ≤1 saat | Ya | AWS |
Perbezaan dua tertib magnitud dalam kelajuan membolehkan paradigma interaksi yang berbeza secara fundamental.
Pertimbangan untuk Pembangun
Jika anda membina dengan video AI, mulakan merancang untuk dunia masa nyata sekarang, walaupun keupayaan belum tersedia sepenuhnya.
Keputusan seni bina yang penting:
- Mampukah antara muka anda mengendalikan penstriman dan bukannya respons satu tangkapan?
- Adakah logik aplikasi anda berfungsi dengan keputusan separa?
- Bagaimana pengguna akan berinteraksi dengan kandungan yang masih dijana?
- Apakah gelung maklum balas yang anda boleh cipta dengan latensi yang lebih rendah?
Peralihan dari kelompok ke masa nyata bukan hanya peningkatan prestasi. Ia adalah perubahan pengalaman pengguna yang memerlukan reka bentuk antara muka dan aliran kerja yang berbeza.
Garis Masa dan Ketersediaan
Berdasarkan pengumuman AWS:
Demo Oasis
Decart menunjukkan keupayaan model dunia dengan penjanaan masa nyata
Pengumuman Perkongsian AWS
Infrastruktur untuk penjanaan video masa nyata diumumkan
Akses Awam
Ketersediaan dijangka melalui AWS Bedrock dan EC2
Implikasi yang Lebih Luas
Perkongsian AWS-Decart menandakan perubahan dalam cara industri memikirkan penjanaan video AI. Selama bertahun-tahun, fokus adalah pada kualiti dan keupayaan. Sekarang latensi muncul sebagai dimensi persaingan seterusnya.
Harapkan pesaing utama mengumumkan inisiatif penjanaan masa nyata mereka sendiri dalam bulan-bulan akan datang. Google, Microsoft, dan lain-lain tidak akan membiarkan AWS memiliki ruang ini tanpa pertandingan.
Bagi pencipta dan platform yang bekerja dengan video AI, trajektori jelas: hari ini kita menjana klip dan menunggu. Esok kita akan menjana secara berterusan, berinteraksi dengan kandungan AI dengan kelancaran yang sama seperti berinteraksi dengan perisian lain.
Infrastruktur untuk masa depan itu sedang dibina sekarang. Soalannya bukan sama ada penjanaan video masa nyata akan tiba, tetapi siapa yang akan menggunakannya dengan paling berkesan apabila ia tiba.
Adakah artikel ini membantu?

Henry
Teknologis KreatifTeknologis kreatif dari Lausanne yang meneroka pertemuan antara AI dan seni. Bereksperimen dengan model generatif di antara sesi muzik elektronik.
Artikel Berkaitan
Teruskan penerokaan dengan siaran berkaitan ini

YouTube Membawa Veo 3 Fast ke Shorts: Penjanaan Video AI Percuma untuk 2.5 Bilion Pengguna
Google mengintegrasikan model Veo 3 Fast terus ke YouTube Shorts, menawarkan penjanaan video daripada teks dengan audio secara percuma untuk pencipta di seluruh dunia. Inilah maknanya untuk platform dan kebolehcapaian video AI.

Kling 2.6: Pengklonan Suara dan Kawalan Gerakan Mentakrifkan Semula Penciptaan Video AI
Kemas kini terbaru Kuaishou memperkenalkan penjanaan audio-visual serentak, latihan suara tersuai dan tangkapan gerakan tepat yang boleh mengubah cara pencipta menghampiri penghasilan video AI.

Pika 2.5: Mendemokratikkan Video AI Melalui Kelajuan, Harga, dan Alat Kreatif
Pika Labs mengeluarkan versi 2.5, menggabungkan penjanaan lebih pantas, fizik yang dipertingkatkan, dan alat kreatif seperti Pikaframes dan Pikaffects untuk menjadikan video AI boleh diakses oleh semua orang.