Meta Pixel
DamienDamien
8 min read
1556 শব্দ

২০২৫ সালে AI ভিডিও Prompt Engineering-এর সম্পূর্ণ গাইড

চমৎকার AI-জেনারেটেড ভিডিও তৈরি করার জন্য prompt তৈরির শিল্প আয়ত্ত করুন। ছয়-স্তর framework, সিনেমাটিক পরিভাষা, এবং platform-নির্দিষ্ট কৌশল শিখুন।

২০২৫ সালে AI ভিডিও Prompt Engineering-এর সম্পূর্ণ গাইড

AI ভিডিওর জন্য prompt engineering একটি রেসিপি নিখুঁত করার মতো: একই উপাদান ব্যবহার করেও কৌশলের উপর নির্ভর করে সম্পূর্ণ ভিন্ন ফলাফল পাওয়া যায়। প্রতিটি প্রধান platform-এ অসংখ্য ঘণ্টা ভিডিও তৈরি করার পর, যা সত্যিই কাজ করে তা আমি একটি ব্যবহারিক framework-এ সংক্ষিপ্ত করেছি। চলুন গোলমাল এড়িয়ে এমন কৌশলগুলোতে মনোনিবেশ করি যা ধারাবাহিক, পেশাদার ফলাফল দেয়।

কেন ভিডিও Prompt ভিন্ন

আপনি যদি Midjourney বা DALL-E-এর মতো ইমেজ জেনারেটরের সাথে কাজ করে থাকেন, তাহলে মনে করতে পারেন ভিডিও prompt একইভাবে কাজ করে। তারা তা করে না। ভিডিও একটি temporal dimension যোগ করে—গতিবিধি, pacing, transition—যা prompt engineering-কে একটি একক নির্দেশনা থেকে একটি sequence পরিচালনায় রূপান্তরিত করে।

এটিকে একটি ছবি তোলা এবং একটি দৃশ্য পরিচালনা করার মধ্যে পার্থক্যের মতো ভাবুন। একটি ছবির জন্য, আপনি শট সেট আপ করেন। ভিডিওর জন্য, আপনাকে সময়ের সাথে কী ঘটবে তা choreograph করতে হবে:

  • ক্যামেরা কীভাবে নড়াচড়া করে?
  • কী কী action ঘটে?
  • প্রতিটি element কতক্ষণ স্থায়ী হয়?
  • emotional arc কী?

এই প্রশ্নগুলোর জন্য এমন vocabulary এবং structure প্রয়োজন যা static image prompt-এর বাইরে।

ছয়-স্তরের Framework

পেশাদার ভিডিও prompt একটি সুসংগঠিত পদ্ধতি অনুসরণ করে। আমি এটিকে ছয়-স্তরের framework বলি—প্রতিটি স্তর নির্দিষ্টতা যোগ করে যা AI-কে আপনার দৃষ্টিভঙ্গির দিকে গাইড করে:

স্তর ১: Subject এবং Action

আপনার ফোকাস সঠিকভাবে সংজ্ঞায়িত করুন। অস্পষ্ট subject অস্পষ্ট ফলাফল তৈরি করে।

দুর্বল: "একটি বাগানে একজন মহিলা" শক্তিশালী: "একটি প্রবাহিত লাল পোশাক পরা একজন মহিলা গোলাপ বুশের মধ্য দিয়ে ধীরে ধীরে হেঁটে যাচ্ছে, যাওয়ার সময় আলতো করে পাপড়ি স্পর্শ করছে"

শক্তিশালী সংস্করণটি পোশাক, গতির গতি, এবং পরিবেশের সাথে interaction নির্দিষ্ট করে। প্রতিটি বিস্তারিত AI-এর ব্যাখ্যাকে আপনার উদ্দেশ্যের দিকে সীমাবদ্ধ করে।

স্তর ২: Shot Type এবং Framing

Cinematographer-রা একটি শতাব্দী ধরে visual grammar তৈরি করেছেন। এটি ব্যবহার করুন।

Shot Typeব্যবহার
Wide shotলোকেশন, স্কেল প্রতিষ্ঠা
Medium shotচরিত্রের interaction, সংলাপ
Close-upআবেগ, বিস্তারিত, ঘনিষ্ঠতা
Extreme close-upনাটকীয় জোর

উদাহরণ: "Medium tracking shot, ক্যামেরা কোমরের উচ্চতায় অবস্থিত, পাশ থেকে অনুসরণ করছে"

স্তর ৩: Camera Movement

স্থির শট অপেশাদার মনে হয়। Movement শক্তি তৈরি করে এবং মনোযোগ গাইড করে।

Movementপ্রভাব
Panঅনুভূমিকভাবে স্থান প্রকাশ করে
Tiltউল্লম্বভাবে স্থান প্রকাশ করে
Dolly/trackingগভীরতা তৈরি করে, subject অনুসরণ করে
Craneস্কেল, নাটক প্রতিষ্ঠা করে
Handheldজরুরি, documentary অনুভূতি
Steadicamমসৃণ অনুসরণ, নিমজ্জন

উদাহরণ: "দরজা দিয়ে ধীর dolly forward, চোখের স্তরের দৃষ্টিকোণ বজায় রেখে"

স্তর ৪: Lighting এবং Atmosphere

Lighting অন্য যেকোনো উপাদানের চেয়ে বেশি শক্তিশালীভাবে মেজাজ সেট করে।

পদVisual প্রভাব
Golden hourউষ্ণ, রোমান্টিক, nostalgic
Blue hourশীতল, চিন্তাশীল, রহস্যময়
High keyউজ্জ্বল, আশাবাদী, পরিষ্কার
Low keyনাটকীয়, moody, suspenseful
Volumetric lightকুয়াশা/ধুলোর মধ্য দিয়ে রশ্মি, ethereal
Rim lightingপৃথকীকরণ, নাটক, silhouette edge

উদাহরণ: "ধুলোযুক্ত জানালা দিয়ে ফিল্টার করা volumetric রশ্মি সহ golden hour lighting, উষ্ণ color grade"

স্তর ৫: Technical Specifications

আপনি যখন সুনির্দিষ্ট নিয়ন্ত্রণ চান তখন নির্দিষ্ট technical parameter-এর নাম উল্লেখ করুন:

  • Lens: 35mm (natural), 50mm (portrait), 85mm (compression), 24mm (wide)
  • Depth of field: Shallow (bokeh background) বনাম deep (সবকিছু sharp)
  • Frame rate: 24fps (cinematic), 60fps (smooth), 120fps (slow motion)
  • Aspect ratio: 16:9 (standard), 2.39:1 (cinematic), 9:16 (vertical)

উদাহরণ: "85mm lens-এ শুট করা, creamy bokeh সহ shallow depth of field, সামান্য film grain"

স্তর ৬: Duration এবং Pacing

ভিডিও সময়ের সাথে প্রকাশিত হয়। ছন্দ নির্দিষ্ট করুন:

  • Scene duration (সাধারণত 3-10 সেকেন্ড)
  • Transition style (cut, dissolve, wipe)
  • Pacing (slow/contemplative বনাম fast/energetic)
  • মিউজিক synchronization-এর জন্য beat timing

উদাহরণ: "ধীর, সুচিন্তিত গতিবিধি সহ 6-সেকেন্ডের শট, শেষ frame-এ 1 সেকেন্ড ধরে রাখা"

একসাথে রাখা: সম্পূর্ণ Prompt উদাহরণ

এভাবে স্তরগুলো পেশাদার prompt-এ একত্রিত হয়:

Cinematic Portrait:

একজন অভিজ্ঞ জেলের মুখের medium close-up, ভোরের blue hour,
85mm lens-এ shallow depth of field সহ শুট করা। মৃদু handheld micro-movements,
তার ধূসর চুলে halo প্রভাব তৈরি করে পিছন থেকে soft rim lighting।
চিন্তাশীল অভিব্যক্তি, চোখ সামান্য camera-এর বাইরে তাকিয়ে আছে।
lifted shadow সহ cool color grade, 5 সেকেন্ড duration।

Action Sequence:

সূর্যাস্তে শহুরে ছাদ জুড়ে দৌড়ানো একজন parkour ক্রীড়াবিদকে অনুসরণ করে wide tracking shot।
ধারাবাহিক দূরত্ব বজায় রেখে dynamic steadicam movement,
নাটকীয় silhouette তৈরি করে golden hour backlighting। 24fps cinematic motion,
0.8x গতিতে সামান্য slow-motion। উচ্চ contrast, teal-orange color grade।
ক্রমবর্ধমান intensity সহ 8 সেকেন্ড।

Product Showcase:

কালো velvet surface-এ একটি luxury watch-এর চারপাশে ধীর 360-ডিগ্রি orbit।
জটিল dial বিস্তারিত ক্যাপচার করে macro lens, নিয়ন্ত্রিত studio lighting
soft key light এবং সূক্ষ্ম fill সহ। Subject-কে বিচ্ছিন্ন করে shallow depth of field,
crystal-এ মৃদু reflection। ধীর, সুচিন্তিত camera movement সহ premium অনুভূতি।
10 সেকেন্ড duration।

Negative Prompting: AI-কে কী এড়াতে হবে তা বলা

আপনি কী চান না তা নির্দিষ্ট করা সমান গুরুত্বপূর্ণ। প্রতিটি platform এটি ভিন্নভাবে পরিচালনা করে:

সাধারণ negative prompt:

  • ঝাপসা footage, motion blur artifact
  • বিকৃত মুখ, anatomical ত্রুটি
  • Watermark, টেক্সট overlay
  • অপ্রাকৃতিক গতিবিধি, jerky transition
  • নিম্ন resolution, compression artifact

Platform-নির্দিষ্ট syntax:

Platformপদ্ধতি
Veo 3নিবেদিত negative prompt field
KlingPrompt-এ "avoid" বা "without" অন্তর্ভুক্ত করুন
Runwayপৃথক negative prompt parameter
SoraWeight-ভিত্তিক exclusion

উদাহরণ: "এড়ান: ঝাপসা footage, বিকৃত মুখের বৈশিষ্ট্য, watermark, jerky camera movement, oversaturated রং"

Style Reference Stacking

একটি স্বতন্ত্র aesthetic চান? 2-3 টি ফিল্ম reference একত্রিত করুন:

Formula: [Film A] color grading + [Film B] atmosphere + [Film C] camera movement

উদাহরণ:

  • "Blade Runner 2049 color grading plus Se7en atmosphere plus Heat camera movement"
  • "Wes Anderson symmetry plus Studio Ghibli color palette plus Terrence Malick natural lighting"
  • "Mad Max: Fury Road energy plus Roger Deakins lighting plus Spielberg blocking"

3 টি reference-এ সীমাবদ্ধ করুন। বেশি হলে পরস্পরবিরোধী signal তৈরি হয়।

Platform-নির্দিষ্ট Optimization

প্রতিটি model-এর শক্তি রয়েছে। Platform-এর সাথে আপনার prompt style মেলান:

Modelশক্তিPrompt ফোকাস
Kling 2.5Athletic motion, character animationAction verb, physical movement
Sora 2Multi-shot storytelling, spatial consistencyScene transition, narrative arc
Veo 3Precision control, JSON formattingTechnical specification, structured syntax
Runway Gen-3Stylization, artistic interpretationAesthetic reference, mood descriptor
WAN 2.5Dialogue, lip-syncSpeech action, facial expression

Veo 3 JSON উদাহরণ:

{
  "subject": "লাল পোশাক পরা মহিলা",
  "action": "বাগানের মধ্য দিয়ে হাঁটা",
  "shot_type": "medium tracking",
  "camera_movement": "ডান থেকে বামে dolly",
  "lighting": "golden hour, volumetric",
  "lens": "35mm",
  "duration": "6 সেকেন্ড"
}

5-10-1 খরচ Optimization নিয়ম

Premium render ব্যয়বহুল। এই workflow ব্যবহার করুন:

  1. 5 টি variation নিম্ন-খরচের model-এ (প্রতিটি 40-60 credit)
  2. 10 টি iteration সেরা candidate পরিমার্জন করা
  3. 1 টি final render premium tier-এ (~350 credit)

এটি গুণমান বজায় রেখে হাজার থেকে প্রায় 1,000 credit-এ খরচ কমায়।

এড়ানোর সাধারণ ভুল

শত শত prompt পর্যালোচনা করার পর, এই ত্রুটিগুলো প্রায়শই দেখা যায়:

ভুলসমস্যাসমাধান
Casual বর্ণনাAI আলগাভাবে ব্যাখ্যা করেCinematography পরিভাষা ব্যবহার করুন
Duration অমিলAction timeframe-এ ফিট হয় নাDuration-এর সাথে জটিলতা মেলান
Style ওভারলোডপরস্পরবিরোধী aesthetic signalসর্বোচ্চ 3 টি reference-এ সীমাবদ্ধ করুন
Movement অনুপস্থিতস্থির, অপেশাদার অনুভূতিসবসময় camera motion নির্দিষ্ট করুন
অস্পষ্ট lightingঅসঙ্গত মেজাজনির্দিষ্ট lighting setup-এর নাম দিন
Negative prompt নেইঅবাঞ্ছিত artifactস্পষ্টভাবে সমস্যা exclude করুন

আপনার Prompt Library তৈরি করা

সাধারণ পরিস্থিতির জন্য template তৈরি করুন:

Interview Setup:

Medium shot, subject rule-of-thirds বামে অবস্থিত, চোখের স্তরের camera,
[LIGHTING_SETUP], background ঝাপসা করে shallow depth of field,
প্রাকৃতিক অনুভূতির জন্য সূক্ষ্ম handheld micro-movements, [DURATION]।

B-Roll Nature:

[SUBJECT]-এর [SHOT_TYPE], [TIME_OF_DAY] lighting,
ধীর [CAMERA_MOVEMENT], [LENS]mm lens, deep focus,
[COLOR_GRADE] palette, [DURATION]।

Product Hero:

[SURFACE]-এ [PRODUCT]-এর চারপাশে [ORBIT_DIRECTION] orbit,
[KEY_LIGHT_POSITION] key এবং সূক্ষ্ম fill সহ studio lighting,
macro বিস্তারিত মুহূর্ত, [LENS]mm, pristine reflection, [DURATION]।

নির্দিষ্ট প্রয়োজনের জন্য bracket পূরণ করুন। ব্যবহারের ক্ষেত্র অনুসারে সংগঠিত একটি library তৈরি করুন।

Iteration কৌশল

পদ্ধতিগত পরিমার্জনের মাধ্যমে নিখুঁত prompt উঠে আসে:

  1. সহজভাবে শুরু করুন: শুধুমাত্র মূল subject এবং action
  2. একটি element যোগ করুন: একক সংযোজন পরীক্ষা করুন
  3. যা কাজ করে তা নথিভুক্ত করুন: কার্যকর বাক্যাংশের একটি লগ রাখুন
  4. A/B পরীক্ষা বাক্যাংশ: একই ধারণা, ভিন্ন শব্দ
  5. বিজয়ী সংরক্ষণ করুন: আপনার prompt library তৈরি করুন

লগ format:

Prompt: [সম্পূর্ণ prompt]
Model: [ব্যবহৃত platform]
Result: [1-5 রেটিং]
Notes: [কী কাজ করেছে/করেনি]

Quality পর্যালোচনা Checklist

যেকোনো AI ভিডিও চূড়ান্ত করার আগে, যাচাই করুন:

  • সর্বত্র subject সামঞ্জস্য
  • প্রাকৃতিক গতি (কোন jerkiness নেই)
  • Lighting ধারাবাহিকতা
  • কোন মুখের বিকৃতি নেই
  • Color grade সামঞ্জস্য
  • যথাযথ pacing
  • পরিষ্কার অডিও (প্রযোজ্য হলে)
  • কোন watermark বা artifact নেই

পরবর্তী পদক্ষেপ

অনুশীলনের সাথে prompt engineering উন্নত হয়। সহজ শট দিয়ে শুরু করুন, প্রতিটি স্তর আয়ত্ত করুন, তারপর সেগুলো একত্রিত করুন। লক্ষ্য পরিভাষা মুখস্থ করা নয়—কী ভিডিওকে আকর্ষণীয় করে তার জন্য intuition বিকাশ করা।

একটি generation লগ রাখুন। যা কাজ করেছে তা পর্যালোচনা করুন। আপনার library তৈরি করুন। অপেশাদার এবং পেশাদার AI ভিডিওর মধ্যে পার্থক্য প্রায়শই prompt নির্ভুলতায় নেমে আসে।

আপনার ক্যামেরা অপেক্ষা করছে। ফিল্মিং শুরু করুন।

এই নিবন্ধটি কি সহায়ক ছিল?

Damien

Damien

এআই ডেভেলপার

লিয়ন থেকে আসা এআই ডেভেলপার যিনি জটিল এমএল ধারণাগুলোকে সহজ রেসিপিতে পরিণত করতে ভালোবাসেন। মডেল ডিবাগিং না করার সময়, তাকে রোন উপত্যকা দিয়ে সাইক্লিং করতে দেখা যায়।

সম্পর্কিত নিবন্ধসমূহ

এই সম্পর্কিত পোস্টগুলির সাথে অন্বেষণ চালিয়ে যান

Pika 2.5: দ্রুততা, মূল্য এবং সৃজনশীল সরঞ্জামের মাধ্যমে AI ভিডিওকে সবার জন্য উপলব্ধ করা
AI VideoPika Labs

Pika 2.5: দ্রুততা, মূল্য এবং সৃজনশীল সরঞ্জামের মাধ্যমে AI ভিডিওকে সবার জন্য উপলব্ধ করা

Pika Labs সংস্করণ 2.5 প্রকাশ করেছে, যা দ্রুততর উৎপাদন, উন্নত পদার্থবিদ্যা এবং Pikaframes এবং Pikaffects এর মতো সৃজনশীল সরঞ্জাম একত্রিত করে AI ভিডিওকে সবার জন্য সহজলভ্য করে তোলে।

Read
Kling O1: Kuaishou একীভূত মাল্টিমোডাল ভিডিও প্রতিযোগিতায় যুক্ত হলো
AI VideoKling AI

Kling O1: Kuaishou একীভূত মাল্টিমোডাল ভিডিও প্রতিযোগিতায় যুক্ত হলো

Kuaishou এইমাত্র Kling O1 চালু করেছে, একটি একীভূত মাল্টিমোডাল AI যা ভিডিও, অডিও এবং টেক্সটে একইসাথে চিন্তা করে। অডিওভিজ্যুয়াল বুদ্ধিমত্তার প্রতিযোগিতা উত্তপ্ত হচ্ছে।

Read
Runway Gen-4.5 শীর্ষে: কিভাবে ১০০ জন ইঞ্জিনিয়ার Google এবং OpenAI-কে পেছনে ফেলল
AI VideoRunway

Runway Gen-4.5 শীর্ষে: কিভাবে ১০০ জন ইঞ্জিনিয়ার Google এবং OpenAI-কে পেছনে ফেলল

Runway সবেমাত্র Gen-4.5 দিয়ে Video Arena-তে শীর্ষ স্থান দখল করেছে, প্রমাণ করে যে একটি ছোট দল AI ভিডিও জেনারেশনে ট্রিলিয়ন-ডলার জায়ান্টদের পরাজিত করতে পারে।

Read

এই নিবন্ধটি কি আপনার ভালো লেগেছে?

আরও অন্তর্দৃষ্টি আবিষ্কার করুন এবং আমাদের সর্বশেষ কন্টেন্ট দিয়ে আপডেট থাকুন।

২০২৫ সালে AI ভিডিও Prompt Engineering-এর সম্পূর্ণ গাইড