Panduan Lengkap Prompt Engineering untuk Video AI di Tahun 2025
Mari pelajari seni merancang prompt yang menghasilkan video AI yang memukau. Temukan kerangka kerja enam lapis, terminologi sinematik, dan teknik khusus untuk setiap platform.

Prompt engineering untuk video AI ibarat menyempurnakan resep masakan: bahan yang sama dapat menghasilkan hasil yang sangat berbeda tergantung pada teknik yang digunakan. Setelah menghabiskan banyak waktu membuat video di berbagai platform utama, saya telah merangkum apa yang benar-benar efektif ke dalam sebuah kerangka kerja praktis. Mari kita fokus pada teknik-teknik yang menghasilkan hasil profesional secara konsisten.
Mengapa Prompt Video Berbeda
Jika Anda telah bekerja dengan generator gambar seperti Midjourney atau DALL-E, Anda mungkin berpikir prompt video bekerja dengan cara yang sama. Ternyata tidak. Video menambahkan dimensi temporal—gerakan, tempo, transisi—yang mengubah prompt engineering dari sekadar instruksi tunggal menjadi orkestrasi sebuah urutan.
Bayangkan perbedaan antara memotret foto dan menyutradarai sebuah adegan. Untuk foto, Anda mengatur pengambilan gambar. Untuk video, Anda perlu mengatur koreografi apa yang terjadi seiring waktu:
- Bagaimana kamera bergerak?
- Aksi apa yang berlangsung?
- Berapa lama setiap elemen bertahan?
- Bagaimana alur emosionalnya?
Pertanyaan-pertanyaan ini memerlukan kosakata dan struktur yang melampaui prompt gambar statis.
Kerangka Kerja Enam Lapis
Prompt video profesional mengikuti pendekatan terstruktur. Saya menyebutnya kerangka kerja enam lapis—setiap lapis menambahkan spesifisitas yang membimbing AI menuju visi Anda:
Lapis 1: Subjek dan Aksi
Tentukan fokus Anda dengan presisi. Subjek yang samar menghasilkan hasil yang samar pula.
Lemah: "Seorang wanita di taman" Kuat: "Seorang wanita mengenakan gaun merah yang mengalir berjalan perlahan melewati semak mawar, dengan lembut menyentuh kelopak bunga saat melintas"
Versi yang kuat menentukan pakaian, kecepatan gerakan, dan interaksi dengan lingkungan. Setiap detail membatasi interpretasi AI menuju intensi Anda.
Lapis 2: Jenis Pengambilan dan Framing
Para sinematografer telah menghabiskan satu abad mengembangkan tata bahasa visual. Mari kita gunakan.
| Jenis Shot | Kegunaan |
|---|---|
| Wide shot | Memperkenalkan lokasi, skala |
| Medium shot | Interaksi karakter, dialog |
| Close-up | Emosi, detail, keintiman |
| Extreme close-up | Penekanan dramatis |
Contoh: "Medium tracking shot, kamera diposisikan setinggi pinggang, mengikuti dari samping"
Lapis 3: Gerakan Kamera
Shot statis terkesan amatir. Gerakan menciptakan energi dan memandu perhatian.
| Gerakan | Efek |
|---|---|
| Pan | Mengungkapkan ruang secara horizontal |
| Tilt | Mengungkapkan ruang secara vertikal |
| Dolly/tracking | Menciptakan kedalaman, mengikuti subjek |
| Crane | Membangun skala, drama |
| Handheld | Urgensi, nuansa dokumenter |
| Steadicam | Pengikutan halus, imersi |
Contoh: "Dolly lambat maju melalui pintu, mempertahankan perspektif setinggi mata"
Lapis 4: Pencahayaan dan Atmosfer
Pencahayaan mengatur suasana hati lebih kuat daripada elemen lainnya.
| Istilah | Efek Visual |
|---|---|
| Golden hour | Hangat, romantis, nostalgia |
| Blue hour | Sejuk, kontemplatif, misterius |
| High key | Terang, optimis, bersih |
| Low key | Dramatis, moody, penuh ketegangan |
| Volumetric light | Sinar melalui kabut/debu, ethereal |
| Rim lighting | Pemisahan, drama, tepi siluet |
Contoh: "Pencahayaan golden hour dengan sinar volumetrik menyaring melalui jendela berdebu, color grade hangat"
Lapis 5: Spesifikasi Teknis
Sebutkan parameter teknis spesifik ketika Anda menginginkan kontrol presisi:
- Lensa: 35mm (natural), 50mm (portrait), 85mm (compression), 24mm (wide)
- Depth of field: Shallow (latar belakang bokeh) vs. deep (semua tajam)
- Frame rate: 24fps (sinematik), 60fps (halus), 120fps (slow motion)
- Aspect ratio: 16:9 (standar), 2.39:1 (sinematik), 9:16 (vertikal)
Contoh: "Diambil dengan lensa 85mm, shallow depth of field dengan bokeh yang lembut, sedikit film grain"
Lapis 6: Durasi dan Tempo
Video berlangsung seiring waktu. Tentukan ritmenya:
- Durasi scene (3-10 detik adalah tipikal)
- Gaya transisi (cut, dissolve, wipe)
- Tempo (lambat/kontemplatif vs. cepat/energik)
- Timing beat untuk sinkronisasi musik
Contoh: "Shot 6 detik dengan gerakan lambat dan disengaja, bertahan pada frame terakhir selama 1 detik"
Menggabungkan Semuanya: Contoh Prompt Lengkap
Berikut cara lapis-lapis tersebut bergabung menjadi prompt profesional:
Portrait Sinematik:
Medium close-up wajah nelayan tua yang keriput, blue hour pagi hari,
diambil dengan lensa 85mm dengan shallow depth of field. Gerakan mikro handheld yang lembut,
rim lighting lembut dari belakang menciptakan efek halo pada rambut abu-abunya.
Ekspresi kontemplatif, mata sedikit menatap ke luar kamera.
Color grade sejuk dengan bayangan yang diangkat, durasi 5 detik.Sekuens Aksi:
Wide tracking shot mengikuti atlet parkour berlari melintasi atap urban
saat matahari terbenam. Gerakan steadicam dinamis mempertahankan jarak konsisten,
backlighting golden hour menciptakan siluet dramatis. Gerakan sinematik 24fps,
sedikit slow-motion pada kecepatan 0.8x. Kontras tinggi, color grade teal-orange.
8 detik dengan intensitas yang meningkat.Showcase Produk:
Orbit 360 derajat lambat mengelilingi jam tangan mewah di atas permukaan beludru hitam.
Lensa makro menangkap detail dial yang rumit, pencahayaan studio terkontrol
dengan key light lembut dan fill yang halus. Shallow depth of field mengisolasi
subjek, refleksi lembut pada kristal. Nuansa premium dengan
gerakan kamera lambat dan disengaja. Durasi 10 detik.Negative Prompting: Memberitahu AI Apa yang Harus Dihindari
Yang sama pentingnya adalah menentukan apa yang tidak Anda inginkan. Setiap platform menangani ini dengan cara berbeda:
Negative prompt umum:
- Footage buram, artefak motion blur
- Wajah terdistorsi, kesalahan anatomi
- Watermark, overlay teks
- Gerakan tidak alami, transisi tersendat
- Resolusi rendah, artefak kompresi
Sintaks khusus platform:
| Platform | Metode |
|---|---|
| Veo 3 | Field negative prompt khusus |
| Kling | Sertakan "avoid" atau "without" dalam prompt |
| Runway | Parameter negative prompt terpisah |
| Sora | Eksklusi berbasis bobot |
Contoh: "Hindari: footage buram, fitur wajah terdistorsi, watermark, gerakan kamera tersendat, warna oversaturated"
Style Reference Stacking
Menginginkan estetika yang khas? Gabungkan 2-3 referensi film:
Formula: [Film A] color grading + [Film B] atmosphere + [Film C] camera movement
Contoh:
- "Blade Runner 2049 color grading plus Se7en atmosphere plus Heat camera movement"
- "Wes Anderson symmetry plus Studio Ghibli color palette plus Terrence Malick natural lighting"
- "Mad Max: Fury Road energy plus Roger Deakins lighting plus Spielberg blocking"
Batasi hingga 3 referensi. Lebih banyak menciptakan sinyal yang bertentangan.
Optimasi Khusus Platform
Setiap model memiliki kekuatan. Sesuaikan gaya prompt Anda dengan platformnya:
| Model | Kekuatan | Fokus Prompt |
|---|---|---|
| Kling 2.5 | Gerakan atletik, animasi karakter | Kata kerja aksi, gerakan fisik |
| Sora 2 | Storytelling multi-shot, konsistensi spasial | Transisi scene, alur naratif |
| Veo 3 | Kontrol presisi, format JSON | Spesifikasi teknis, sintaks terstruktur |
| Runway Gen-3 | Stilisasi, interpretasi artistik | Referensi estetika, deskriptor suasana hati |
| WAN 2.5 | Dialog, lip-sync | Aksi bicara, ekspresi wajah |
Contoh JSON Veo 3:
{
"subject": "woman in red dress",
"action": "walking through garden",
"shot_type": "medium tracking",
"camera_movement": "dolly right to left",
"lighting": "golden hour, volumetric",
"lens": "35mm",
"duration": "6 seconds"
}Aturan Optimasi Biaya 5-10-1
Render premium bisa mahal. Gunakan alur kerja ini:
- 5 variasi pada model berbiaya rendah (40-60 kredit masing-masing)
- 10 iterasi menyempurnakan kandidat terbaik
- 1 render akhir pada tier premium (~350 kredit)
Ini mengurangi biaya dari ribuan menjadi sekitar 1.000 kredit sambil mempertahankan kualitas.
Kesalahan Umum yang Harus Dihindari
Setelah meninjau ratusan prompt, kesalahan-kesalahan ini paling sering muncul:
| Kesalahan | Masalah | Perbaikan |
|---|---|---|
| Deskripsi kasual | AI menginterpretasi secara longgar | Gunakan terminologi sinematografi |
| Ketidakcocokan durasi | Aksi tidak sesuai dengan kerangka waktu | Sesuaikan kompleksitas dengan durasi |
| Kelebihan style | Sinyal estetika yang bertentangan | Batasi hingga maksimal 3 referensi |
| Gerakan hilang | Nuansa statis, amatir | Selalu tentukan gerakan kamera |
| Pencahayaan samar | Suasana hati tidak konsisten | Sebutkan setup pencahayaan spesifik |
| Tidak ada negative prompt | Artefak yang tidak diinginkan | Eksplisit kecualikan masalah |
Membangun Library Prompt Anda
Buatlah template untuk skenario umum:
Setup Interview:
Medium shot, subjek diposisikan rule-of-thirds kiri, kamera setinggi mata,
[LIGHTING_SETUP], shallow depth of field mengaburkan latar belakang,
gerakan mikro handheld halus untuk nuansa alami, [DURATION].B-Roll Alam:
[SHOT_TYPE] dari [SUBJECT], pencahayaan [TIME_OF_DAY],
[CAMERA_MOVEMENT] lambat, lensa [LENS]mm, deep focus,
palet [COLOR_GRADE], [DURATION].Hero Produk:
Orbit [ORBIT_DIRECTION] mengelilingi [PRODUCT] di [SURFACE],
pencahayaan studio dengan key [KEY_LIGHT_POSITION] dan fill halus,
momen detail makro, [LENS]mm, refleksi sempurna, [DURATION].Isi tanda kurung untuk kebutuhan spesifik. Bangun library yang diorganisir berdasarkan kasus penggunaan.
Strategi Iterasi
Prompt sempurna muncul melalui penyempurnaan sistematis:
- Mulai sederhana: Hanya subjek dan aksi inti
- Tambahkan satu elemen: Uji penambahan tunggal
- Dokumentasikan apa yang berhasil: Simpan log frasa yang efektif
- A/B test phrasing: Konsep sama, kata berbeda
- Simpan yang menang: Bangun library prompt Anda
Format log:
Prompt: [prompt lengkap]
Model: [platform yang digunakan]
Result: [rating 1-5]
Notes: [apa yang berhasil/tidak]Checklist Review Kualitas
Sebelum menyelesaikan video AI apa pun, verifikasi:
- Konsistensi subjek sepanjang video
- Gerakan alami (tidak tersendat)
- Kontinuitas pencahayaan
- Tidak ada distorsi wajah
- Konsistensi color grade
- Tempo yang sesuai
- Audio bersih (jika berlaku)
- Tidak ada watermark atau artefak
Langkah Selanjutnya
Prompt engineering meningkat dengan latihan. Mulailah dengan shot yang lebih sederhana, kuasai setiap lapis, lalu gabungkan semuanya. Tujuannya bukan menghafal terminologi—tetapi mengembangkan intuisi tentang apa yang membuat video menarik.
Simpanlah log generasi. Tinjau apa yang berhasil. Bangun library Anda. Perbedaan antara video AI amatir dan profesional sering kali bermuara pada presisi prompt.
Kamera Anda sudah menunggu. Mari mulai berkarya.
Apakah artikel ini bermanfaat?

Damien
Pengembang AIPengembang AI dari Lyon yang suka mengubah konsep ML kompleks menjadi resep sederhana. Saat tidak men-debug model, Anda akan menemukannya bersepeda melewati lembah Rhône.
Artikel Terkait
Lanjutkan eksplorasi dengan postingan terkait ini

Pika 2.5: Mendemokratisasi Video AI Melalui Kecepatan, Harga, dan Alat Kreatif
Pika Labs merilis versi 2.5, menggabungkan generasi lebih cepat, fisika yang ditingkatkan, dan alat kreatif seperti Pikaframes dan Pikaffects untuk membuat video AI dapat diakses oleh semua orang.

Kling O1: Kuaishou Bergabung dalam Perlombaan Video Multimodal Terpadu
Kuaishou baru saja meluncurkan Kling O1, sebuah AI multimodal terpadu yang berpikir dalam video, audio, dan teks secara bersamaan. Perlombaan kecerdasan audiovisual semakin memanas.

Runway Gen-4.5 Meraih Peringkat #1: Bagaimana 100 Engineer Mengalahkan Google dan OpenAI
Runway baru saja meraih posisi teratas di Video Arena dengan Gen-4.5, membuktikan bahwa tim kecil dapat bersaing dengan raksasa teknologi bernilai triliunan dolar dalam generasi video AI.