Meta Pixel
HenryHenry
5 min read
898 perkataan

AWS dan Decart: Penjanaan Video AI Masa Nyata pada Infrastruktur Awan

AWS mengumumkan perkongsian dengan Decart AI untuk membawa penjanaan video masa nyata ke infrastruktur awan, menjanjikan video berasaskan teks dengan latensi sub-saat.

AWS dan Decart: Penjanaan Video AI Masa Nyata pada Infrastruktur Awan

Penjanaan video AI sedia ada berfungsi secara kelompok: anda hantar permintaan, tunggu, dapatkan hasil. AWS dan Decart mahu mengubah itu menjadi pengalaman masa nyata, menstrim video dijana AI semasa ia dicipta.

Mengapa Masa Nyata Penting

Perbezaan antara penjanaan kelompok dan masa nyata bukan hanya kelajuan. Ia adalah perubahan asas dalam cara manusia berinteraksi dengan AI:

Penjanaan Kelompok (Semasa):

  • Hantar prompt
  • Tunggu 30 saat hingga beberapa minit
  • Terima hasil siap
  • Jika tidak suka, ulang dari awal
  • Gelung maklum balas perlahan

Penjanaan Masa Nyata (Visi Decart):

  • Mula menaip prompt
  • Lihat video mula terbentuk serta-merta
  • Laraskan sambil menonton
  • Maklum balas berterusan
  • Pengalaman penciptaan interaktif

Fikirkan perbezaan antara menaip dalam dokumen berbanding menghantar surat. Satu adalah perbualan. Satu lagi adalah pertukaran. Decart mahu penjanaan video terasa seperti perbualan.

Apa yang Decart Bawa ke Meja

Decart AI telah membina infrastruktur yang dioptimumkan untuk penjanaan video latensi rendah. Model "Oasis" mereka menunjukkan keupayaan ini pada awal 2025:

≤1s
Latensi Sasaran
GPU
Cip Khusus
2025
Akses Awam
💡

Oasis menarik perhatian sebagai "model dunia" yang boleh menjana persekitaran video interaktif. Kini infrastruktur itu datang ke AWS.

Model dunia Oasis berbeza daripada penjana video tradisional kerana ia boleh bertindak balas kepada input. Daripada menjana klip tetap, ia menjana bingkai seterusnya berdasarkan apa yang "berlaku" dalam persekitaran maya.

Komponen Infrastruktur AWS

Perkongsian ini memanfaatkan beberapa keupayaan AWS:

  • EC2 dengan GPU Khusus: Pengiraan akselerasi untuk inferens model
  • Integrasi Bedrock: Akses API ke model Decart
  • Rangkaian Latensi Rendah: Infrastruktur dioptimumkan untuk penstriman
  • Penyepaduan Tepi: Penggunaan berdekatan dengan pengguna akhir

Arsitektur ini bertujuan untuk meminimumkan setiap milisaat latensi. Bukan hanya tentang membuat model lebih pantas. Ia tentang mengoptimumkan keseluruhan laluan dari prompt pengguna ke bingkai yang dipaparkan.

Cabaran Teknikal

Penjanaan video masa nyata menghadapi halangan yang tidak wujud dalam pemprosesan kelompok:

Cabaran Latensi
  • Masa inferens model (50-100ms sasaran)
  • Latensi rangkaian (10-50ms bergantung pada lokasi)
  • Penyanggaan penstriman (100-200ms untuk kelancaran)
  • Kelewatan paparan klien (16ms pada 60fps)
Penyelesaian yang Dicadangkan
  • Pengiraan edge mengurangkan perjalanan rangkaian
  • Penstriman spekulatif bermula sebelum selesai
  • Pengkompilasi model khusus untuk kelajuan
  • Protokol penstriman dioptimumkan

Jumlah sasaran di bawah satu saat adalah bercita-cita tinggi. Untuk konteks, perbualan manusia terasa semula jadi dengan kelewatan di bawah 200ms. Decart menyasarkan keseluruhan penjanaan video dalam masa itu.

Aplikasi Praktikal

Di manakah penjanaan video masa nyata benar-benar masuk akal?

🎮

Permainan Interaktif

Dunia permainan yang dijana sambil anda bermain. Bukan pra-dirender atau diprosedur, tetapi benar-benar dijana oleh model AI berdasarkan tindakan pemain.

🎬

Pratonton Kreatif

Pengarah melihat keputusan prompt dalam masa nyata, melaraskan parameter seperti pencahayaan, mood, atau aksi sambil menonton output berubah.

📹

Strim Langsung

Elemen video dijana AI yang bertindak balas kepada peristiwa masa nyata. Bayangkan pelaporan berita dengan visualisasi dijana seketika.

🤖

Avatar Interaktif

Respons video yang dijana semasa perbualan, bukan hanya animasi lip-sync yang diprakompil.

Bagaimana Ini Berbanding dengan Penyelesaian Semasa

Landskap penjanaan video AI semasa:

PlatformMasa PenjanaanMod InteraktifInfrastruktur
Sora 230-60 saatTidakAwan OpenAI
Runway Gen-4.520-40 saatTidakAwan Runway
Veo 315-30 saatTidakAwan Google
Model Tempatan2-10 minitTidakGPU Tempatan
Decart (Sasaran)≤1 saatYaAWS

Perbezaan dua tertib magnitud dalam kelajuan membolehkan paradigma interaksi yang berbeza secara fundamental.

Pertimbangan untuk Pembangun

💡

Jika anda membina dengan video AI, mulakan merancang untuk dunia masa nyata sekarang, walaupun keupayaan belum tersedia sepenuhnya.

Keputusan seni bina yang penting:

  • Mampukah antara muka anda mengendalikan penstriman dan bukannya respons satu tangkapan?
  • Adakah logik aplikasi anda berfungsi dengan keputusan separa?
  • Bagaimana pengguna akan berinteraksi dengan kandungan yang masih dijana?
  • Apakah gelung maklum balas yang anda boleh cipta dengan latensi yang lebih rendah?

Peralihan dari kelompok ke masa nyata bukan hanya peningkatan prestasi. Ia adalah perubahan pengalaman pengguna yang memerlukan reka bentuk antara muka dan aliran kerja yang berbeza.

Garis Masa dan Ketersediaan

Berdasarkan pengumuman AWS:

Awal 2025

Demo Oasis

Decart menunjukkan keupayaan model dunia dengan penjanaan masa nyata

Dis 2025

Pengumuman Perkongsian AWS

Infrastruktur untuk penjanaan video masa nyata diumumkan

2026

Akses Awam

Ketersediaan dijangka melalui AWS Bedrock dan EC2

Implikasi yang Lebih Luas

Perkongsian AWS-Decart menandakan perubahan dalam cara industri memikirkan penjanaan video AI. Selama bertahun-tahun, fokus adalah pada kualiti dan keupayaan. Sekarang latensi muncul sebagai dimensi persaingan seterusnya.

⚠️

Harapkan pesaing utama mengumumkan inisiatif penjanaan masa nyata mereka sendiri dalam bulan-bulan akan datang. Google, Microsoft, dan lain-lain tidak akan membiarkan AWS memiliki ruang ini tanpa pertandingan.

Bagi pencipta dan platform yang bekerja dengan video AI, trajektori jelas: hari ini kita menjana klip dan menunggu. Esok kita akan menjana secara berterusan, berinteraksi dengan kandungan AI dengan kelancaran yang sama seperti berinteraksi dengan perisian lain.

Infrastruktur untuk masa depan itu sedang dibina sekarang. Soalannya bukan sama ada penjanaan video masa nyata akan tiba, tetapi siapa yang akan menggunakannya dengan paling berkesan apabila ia tiba.

Adakah artikel ini membantu?

Henry

Henry

Teknologis Kreatif

Teknologis kreatif dari Lausanne yang meneroka pertemuan antara AI dan seni. Bereksperimen dengan model generatif di antara sesi muzik elektronik.

Artikel Berkaitan

Teruskan penerokaan dengan siaran berkaitan ini

Suka artikel ini?

Temui lebih banyak wawasan dan ikuti kandungan terkini kami.

AWS dan Decart: Penjanaan Video AI Masa Nyata pada Infrastruktur Awan