Meta Pixel
DamienDamien
6 min read
1182 كلمات

أمازون ويب سيرفيسز وديكارت تبنيان أول بنية تحتية للفيديو بالذكاء الاصطناعي في الزمن الفعلي

تتشارك أمازون ويب سيرفيسز مع شركة الذكاء الاصطناعي الناشئة ديكارت لإنشاء بنية تحتية على مستوى المؤسسات لتوليد الفيديو بالذكاء الاصطناعي منخفض الكمون، مما يمثل تحولاً من حروب النماذج إلى الهيمنة على البنية التحتية.

أمازون ويب سيرفيسز وديكارت تبنيان أول بنية تحتية للفيديو بالذكاء الاصطناعي في الزمن الفعلي

بينما يناقش الجميع ما إذا كانت Runway أو Sora تولد انفجارات أفضل، قامت AWS للتو بتغيير قواعد اللعبة بهدوء. شراكتها مع Decart لا تتعلق بصنع مقاطع فيديو أجمل. بل تتعلق بجعل توليد الفيديو بالذكاء الاصطناعي سريعاً بما يكفي لأن يكون ذا أهمية في تطبيقات المؤسسات.

استيقاظ طبقة البنية التحتية

لقد كان مجال توليد الفيديو بالذكاء الاصطناعي مهووساً بسؤال واحد: أي نموذج ينتج المخرجات الأكثر واقعية؟ لقد غطينا انتصار Runway Gen-4.5 على Video Arena، واختراق Sora 2، والبدائل مفتوحة المصدر التي تتحدى العمالقة الاحتكارية.

لكن هذا ما لم يتحدث عنه أحد: الكمون.

💡

توليد فيديو مدته 10 ثوانٍ في دقيقتين أمر مثير للإعجاب بالنسبة لعرض توضيحي إبداعي. لكنه عديم الفائدة للبث المباشر، أو التطبيق التفاعلي، أو سير عمل المؤسسة الذي يعالج آلاف مقاطع الفيديو يومياً.

أعلنت AWS وDecart عن شراكتهما في مؤتمر AWS re:Invent 2025، وهي تمثل تحولاً جوهرياً في كيفية تفكيرنا في البنية التحتية للفيديو بالذكاء الاصطناعي.

ما تقدمه Decart

Decart ليست اسماً مألوفاً مثل Runway أو OpenAI. لقد كانوا يبنون شيئاً مختلفاً بهدوء: نماذج ذكاء اصطناعي محسّنة للاستنتاج في الزمن الفعلي بدلاً من تحقيق أقصى جودة بأي ثمن.

10x
تقليل الكمون
≤40ms
الإطار الأول
Enterprise
التركيز على النطاق

مقاييس الأداء من إعلان الشراكة في مؤتمر AWS re:Invent 2025

يعطي نهجهم الأولوية لـ:

  • التوليد منخفض الكمون: أوقات استجابة أقل من ثانية لإطارات الفيديو
  • الإنتاجية العالية: معالجة آلاف الطلبات بشكل متزامن
  • الأداء القابل للتنبؤ: كمون ثابت تحت أحمال متفاوتة

هذا هو العمل الأساسي الممل الذي يجعل الفيديو بالذكاء الاصطناعي عملياً لأنظمة الإنتاج.

AWS Trainium: السيليكون المخصص للفيديو بالذكاء الاصطناعي

تستفيد الشراكة من شرائح AWS Trainium، معجلات الذكاء الاصطناعي المصممة خصيصاً من أمازون. على عكس وحدات معالجة الرسومات متعددة الأغراض، تم بناء Trainium خصيصاً لأحمال عمل التعلم الآلي.

نهج GPU التقليدي

معدات متعددة الأغراض، كمون أعلى، أداء متغير تحت الحمل، مكلفة على نطاق واسع

نهج AWS Trainium

سيليكون مصمم لغرض محدد، عرض نطاق ذاكرة محسّن، كمون قابل للتنبؤ، فعال من حيث التكلفة على نطاق المؤسسات

بالنسبة لتوليد الفيديو تحديداً، تعالج معمارية Trainium عنق الزجاجة في عرض نطاق الذاكرة الذي يصيب نماذج الفيديو القائمة على المحولات. نقل الموترات الضخمة بين الذاكرة والحوسبة غالباً ما يكون الجزء الأبطأ من الاستنتاج، والسيليكون المخصص يمكنه تحسين مسارات البيانات هذه بطرق لا تستطيعها المعدات العامة.

تكامل Amazon Bedrock

تعمل الأساس التقني من خلال Amazon Bedrock، خدمة AWS المُدارة للنماذج الأساسية. هذا يعني أن المؤسسات تحصل على:

  • واجهة برمجة تطبيقات واحدة لقدرات متعددة للفيديو بالذكاء الاصطناعي
  • توسع مدمج وموازنة الحمل
  • أمان وامتثال على مستوى المؤسسات (SOC 2، HIPAA، إلخ.)
  • تسعير الدفع مقابل الاستخدام دون إدارة البنية التحتية

تكامل Bedrock مهم لأنه يخفض الحاجز أمام المؤسسات التي تستخدم AWS بالفعل. لا علاقات بائعين جديدة، لا فواتير منفصلة، لا مراجعات أمنية إضافية.

لماذا يهم الزمن الفعلي

دعوني أرسم صورة لما يمكّنه الفيديو بالذكاء الاصطناعي في الزمن الفعلي:

البث المباشر

  • توليد الرسومات في الزمن الفعلي
  • تعزيز المشهد الديناميكي
  • تحسين الإعادة الفورية

التطبيقات التفاعلية

  • مشاهد الألعاب المولدة عند الطلب
  • استجابات الفيديو الشخصية
  • مساعدة تحرير الفيديو المباشر

سير عمل المؤسسات

  • خطوط إنتاج الفيديو الآلية
  • المعالجة الدفعية على نطاق واسع
  • التكامل مع أنظمة الوسائط الحالية

التجارة الإلكترونية

  • مقاطع فيديو المنتجات المولدة من الصور
  • محتوى تسويقي مخصص
  • اختبار A/B على نطاق الفيديو

لا تعمل أي من حالات الاستخدام هذه مع أوقات توليد مدتها دقيقتان. إنها تتطلب استجابات في أجزاء من الثانية إلى ثوانٍ.

خطة المؤسسات

تشير هذه الشراكة إلى استراتيجية AWS: دع الشركات الناشئة تتقاتل حول من يصنع أجمل العروض التوضيحية بينما تستحوذ أمازون على طبقة البنية التحتية.

💡

في اندفاع الذهب للذكاء الاصطناعي، تبيع AWS المعاول. والمجارف. وحقوق الأرض. ومكتب التحليل.

دعونا ننظر في الاقتصاديات:

النهجمن يدفعنموذج الإيرادات
فيديو الذكاء الاصطناعي للمستهلكينالمبدعون الأفرادالاشتراك ($20-50/شهر)
الوصول إلى APIالمطورونلكل توليد ($0.01-0.10)
البنية التحتيةالمؤسساتساعات الحوسبة ($آلاف/شهر)

لا تتنافس AWS مع Runway على الـ $20/شهر الخاصة بك. إنهم يضعون أنفسهم للاستحواذ على ميزانيات المؤسسات التي تتقزم اشتراكات المستهلكين.

ماذا يعني هذا للسوق

2024

بداية حروب النماذج

إعلان Sora يطلق سباقاً نحو أفضل جودة توليد

Early 2025

تقارب الجودة

أفضل النماذج تصل إلى مستويات جودة مماثلة، التمايز يصبح أصعب

Late 2025

التركيز على البنية التحتية

شراكة AWS/Decart تشير إلى تحول نحو النشر والتوسع

2026

تبني المؤسسات

قدرات الزمن الفعلي تمكّن حالات استخدام إنتاج جديدة

ندخل المرحلة "الممل لكن الأساسي" من الفيديو بالذكاء الاصطناعي. ستستمر مقارنات النماذج البراقة، لكن الأموال الحقيقية ستتدفق إلى البنية التحتية التي تجعل الفيديو بالذكاء الاصطناعي عملياً للأعمال.

الآثار التقنية

بالنسبة للمطورين ومهندسي التعلم الآلي، تشير هذه الشراكة إلى عدة اتجاهات:

1. التحسين على المعمارية

ستركز الموجة التالية من الابتكار على جعل المعماريات الحالية أسرع، وليس اختراع معماريات جديدة. تقنيات مثل:

  • فك التشفير التخميني لمحولات الفيديو
  • التدريب الواعي بالتكميم لكفاءة الاستنتاج
  • تقطير النماذج الكبيرة إلى إصدارات صديقة للنشر

2. نماذج النشر الهجينة

توقع المزيد من الحلول التي تجمع بين:

  • البنية التحتية السحابية لقدرة الانفجار
  • النشر على الحافة للمسارات الحرجة من حيث الكمون
  • الجودة المتدرجة بناءً على متطلبات حالة الاستخدام

3. التوحيد القياسي

يتطلب تبني المؤسسات واجهات قابلة للتنبؤ. راقب:

  • واجهات برمجة تطبيقات مشتركة عبر مقدمي الخدمات
  • مقاييس جودة موحدة
  • قابلية التشغيل البيني بين المنصات

المشهد التنافسي

AWS ليست وحدها في إدراك هذه الفرصة:

🔵

Google Cloud

يقدم Vertex AI بالفعل توليد الفيديو، من المحتمل أن يعلن عن قدرات مماثلة في الزمن الفعلي

🟠

Azure

يمكن أن تمتد شراكة Microsoft مع OpenAI إلى بنية تحتية للفيديو للمؤسسات

🟢

NVIDIA

تظل منصة الاستنتاج الخاصة بهم (TensorRT، Triton) الافتراضية للنشر المستضاف ذاتياً

حرب البنية التحتية بدأت للتو. أطلقت AWS الطلقة الأولى بشراكة Decart، لكن توقع استجابات سريعة من المنافسين.

دروس عملية

لفرق المؤسسات:

  • قيّم متطلبات كمون الفيديو بالذكاء الاصطناعي الآن
  • ضع في اعتبارك Bedrock إذا كنت تستخدم AWS بالفعل
  • خطط لقدرات الزمن الفعلي في خارطة طريقك

للمطورين:

  • تعلم تقنيات تحسين الاستنتاج
  • افهم Trainium والمقايضات بين السيليكون المخصص
  • ابنِ مع ميزانيات الكمون في الاعتبار

لشركات الفيديو بالذكاء الاصطناعي الناشئة:

  • قد يهم تمايز البنية التحتية أكثر من جودة النموذج
  • فرص الشراكة مع مزودي السحابة تفتح
  • دورات مبيعات المؤسسات بدأت

النظر إلى المستقبل

شراكة AWS/Decart ليست أبرز أخبار الفيديو بالذكاء الاصطناعي هذا الأسبوع. ادعت Runway للتو المركز الأول على Video Arena. أصدرت المختبرات الصينية نماذج مفتوحة المصدر قوية. تلك القصص تحصل على المزيد من النقرات.

لكن البنية التحتية هي المكان الذي تتوسع فيه الصناعة فعلياً. يتطلب الانتقال من "عرض توضيحي مثير للإعجاب" إلى "نظام إنتاج" بالضبط ما تبنيه AWS وDecart: أسس موثوقة وسريعة على مستوى المؤسسات.

💡

قراءة ذات صلة:

جعلت حروب النماذج الفيديو بالذكاء الاصطناعي ممكناً. ستجعله البنية التحتية عملياً.

هل كان هذا المقال مفيداً؟

Damien

Damien

مطور ذكاء اصطناعي

مطور ذكاء اصطناعي من ليون يحب تحويل مفاهيم التعلم الآلي المعقدة إلى وصفات بسيطة. عندما لا يكون منشغلاً في تصحيح النماذج، ستجده يقود الدراجة في وادي الرون.

مقالات ذات صلة

تابع الاستكشاف مع هذه المقالات المرتبطة

هل استمتعت بقراءة هذا المقال؟

اكتشف المزيد من الرؤى والبصائر وابقَ محدثاً مع أحدث محتوياتنا.

أمازون ويب سيرفيسز وديكارت تبنيان أول بنية تحتية للفيديو بالذكاء الاصطناعي في الزمن الفعلي