أمازون ويب سيرفيسز وديكارت تبنيان أول بنية تحتية للفيديو بالذكاء الاصطناعي في الزمن الفعلي
تتشارك أمازون ويب سيرفيسز مع شركة الذكاء الاصطناعي الناشئة ديكارت لإنشاء بنية تحتية على مستوى المؤسسات لتوليد الفيديو بالذكاء الاصطناعي منخفض الكمون، مما يمثل تحولاً من حروب النماذج إلى الهيمنة على البنية التحتية.

بينما يناقش الجميع ما إذا كانت Runway أو Sora تولد انفجارات أفضل، قامت AWS للتو بتغيير قواعد اللعبة بهدوء. شراكتها مع Decart لا تتعلق بصنع مقاطع فيديو أجمل. بل تتعلق بجعل توليد الفيديو بالذكاء الاصطناعي سريعاً بما يكفي لأن يكون ذا أهمية في تطبيقات المؤسسات.
استيقاظ طبقة البنية التحتية
لقد كان مجال توليد الفيديو بالذكاء الاصطناعي مهووساً بسؤال واحد: أي نموذج ينتج المخرجات الأكثر واقعية؟ لقد غطينا انتصار Runway Gen-4.5 على Video Arena، واختراق Sora 2، والبدائل مفتوحة المصدر التي تتحدى العمالقة الاحتكارية.
لكن هذا ما لم يتحدث عنه أحد: الكمون.
توليد فيديو مدته 10 ثوانٍ في دقيقتين أمر مثير للإعجاب بالنسبة لعرض توضيحي إبداعي. لكنه عديم الفائدة للبث المباشر، أو التطبيق التفاعلي، أو سير عمل المؤسسة الذي يعالج آلاف مقاطع الفيديو يومياً.
أعلنت AWS وDecart عن شراكتهما في مؤتمر AWS re:Invent 2025، وهي تمثل تحولاً جوهرياً في كيفية تفكيرنا في البنية التحتية للفيديو بالذكاء الاصطناعي.
ما تقدمه Decart
Decart ليست اسماً مألوفاً مثل Runway أو OpenAI. لقد كانوا يبنون شيئاً مختلفاً بهدوء: نماذج ذكاء اصطناعي محسّنة للاستنتاج في الزمن الفعلي بدلاً من تحقيق أقصى جودة بأي ثمن.
مقاييس الأداء من إعلان الشراكة في مؤتمر AWS re:Invent 2025
يعطي نهجهم الأولوية لـ:
- التوليد منخفض الكمون: أوقات استجابة أقل من ثانية لإطارات الفيديو
- الإنتاجية العالية: معالجة آلاف الطلبات بشكل متزامن
- الأداء القابل للتنبؤ: كمون ثابت تحت أحمال متفاوتة
هذا هو العمل الأساسي الممل الذي يجعل الفيديو بالذكاء الاصطناعي عملياً لأنظمة الإنتاج.
AWS Trainium: السيليكون المخصص للفيديو بالذكاء الاصطناعي
تستفيد الشراكة من شرائح AWS Trainium، معجلات الذكاء الاصطناعي المصممة خصيصاً من أمازون. على عكس وحدات معالجة الرسومات متعددة الأغراض، تم بناء Trainium خصيصاً لأحمال عمل التعلم الآلي.
معدات متعددة الأغراض، كمون أعلى، أداء متغير تحت الحمل، مكلفة على نطاق واسع
سيليكون مصمم لغرض محدد، عرض نطاق ذاكرة محسّن، كمون قابل للتنبؤ، فعال من حيث التكلفة على نطاق المؤسسات
بالنسبة لتوليد الفيديو تحديداً، تعالج معمارية Trainium عنق الزجاجة في عرض نطاق الذاكرة الذي يصيب نماذج الفيديو القائمة على المحولات. نقل الموترات الضخمة بين الذاكرة والحوسبة غالباً ما يكون الجزء الأبطأ من الاستنتاج، والسيليكون المخصص يمكنه تحسين مسارات البيانات هذه بطرق لا تستطيعها المعدات العامة.
تكامل Amazon Bedrock
تعمل الأساس التقني من خلال Amazon Bedrock، خدمة AWS المُدارة للنماذج الأساسية. هذا يعني أن المؤسسات تحصل على:
- ✓واجهة برمجة تطبيقات واحدة لقدرات متعددة للفيديو بالذكاء الاصطناعي
- ✓توسع مدمج وموازنة الحمل
- ✓أمان وامتثال على مستوى المؤسسات (SOC 2، HIPAA، إلخ.)
- ✓تسعير الدفع مقابل الاستخدام دون إدارة البنية التحتية
تكامل Bedrock مهم لأنه يخفض الحاجز أمام المؤسسات التي تستخدم AWS بالفعل. لا علاقات بائعين جديدة، لا فواتير منفصلة، لا مراجعات أمنية إضافية.
لماذا يهم الزمن الفعلي
دعوني أرسم صورة لما يمكّنه الفيديو بالذكاء الاصطناعي في الزمن الفعلي:
البث المباشر
- توليد الرسومات في الزمن الفعلي
- تعزيز المشهد الديناميكي
- تحسين الإعادة الفورية
التطبيقات التفاعلية
- مشاهد الألعاب المولدة عند الطلب
- استجابات الفيديو الشخصية
- مساعدة تحرير الفيديو المباشر
سير عمل المؤسسات
- خطوط إنتاج الفيديو الآلية
- المعالجة الدفعية على نطاق واسع
- التكامل مع أنظمة الوسائط الحالية
التجارة الإلكترونية
- مقاطع فيديو المنتجات المولدة من الصور
- محتوى تسويقي مخصص
- اختبار A/B على نطاق الفيديو
لا تعمل أي من حالات الاستخدام هذه مع أوقات توليد مدتها دقيقتان. إنها تتطلب استجابات في أجزاء من الثانية إلى ثوانٍ.
خطة المؤسسات
تشير هذه الشراكة إلى استراتيجية AWS: دع الشركات الناشئة تتقاتل حول من يصنع أجمل العروض التوضيحية بينما تستحوذ أمازون على طبقة البنية التحتية.
في اندفاع الذهب للذكاء الاصطناعي، تبيع AWS المعاول. والمجارف. وحقوق الأرض. ومكتب التحليل.
دعونا ننظر في الاقتصاديات:
| النهج | من يدفع | نموذج الإيرادات |
|---|---|---|
| فيديو الذكاء الاصطناعي للمستهلكين | المبدعون الأفراد | الاشتراك ($20-50/شهر) |
| الوصول إلى API | المطورون | لكل توليد ($0.01-0.10) |
| البنية التحتية | المؤسسات | ساعات الحوسبة ($آلاف/شهر) |
لا تتنافس AWS مع Runway على الـ $20/شهر الخاصة بك. إنهم يضعون أنفسهم للاستحواذ على ميزانيات المؤسسات التي تتقزم اشتراكات المستهلكين.
ماذا يعني هذا للسوق
بداية حروب النماذج
إعلان Sora يطلق سباقاً نحو أفضل جودة توليد
تقارب الجودة
أفضل النماذج تصل إلى مستويات جودة مماثلة، التمايز يصبح أصعب
التركيز على البنية التحتية
شراكة AWS/Decart تشير إلى تحول نحو النشر والتوسع
تبني المؤسسات
قدرات الزمن الفعلي تمكّن حالات استخدام إنتاج جديدة
ندخل المرحلة "الممل لكن الأساسي" من الفيديو بالذكاء الاصطناعي. ستستمر مقارنات النماذج البراقة، لكن الأموال الحقيقية ستتدفق إلى البنية التحتية التي تجعل الفيديو بالذكاء الاصطناعي عملياً للأعمال.
الآثار التقنية
بالنسبة للمطورين ومهندسي التعلم الآلي، تشير هذه الشراكة إلى عدة اتجاهات:
1. التحسين على المعمارية
ستركز الموجة التالية من الابتكار على جعل المعماريات الحالية أسرع، وليس اختراع معماريات جديدة. تقنيات مثل:
- فك التشفير التخميني لمحولات الفيديو
- التدريب الواعي بالتكميم لكفاءة الاستنتاج
- تقطير النماذج الكبيرة إلى إصدارات صديقة للنشر
2. نماذج النشر الهجينة
توقع المزيد من الحلول التي تجمع بين:
- البنية التحتية السحابية لقدرة الانفجار
- النشر على الحافة للمسارات الحرجة من حيث الكمون
- الجودة المتدرجة بناءً على متطلبات حالة الاستخدام
3. التوحيد القياسي
يتطلب تبني المؤسسات واجهات قابلة للتنبؤ. راقب:
- واجهات برمجة تطبيقات مشتركة عبر مقدمي الخدمات
- مقاييس جودة موحدة
- قابلية التشغيل البيني بين المنصات
المشهد التنافسي
AWS ليست وحدها في إدراك هذه الفرصة:
Google Cloud
يقدم Vertex AI بالفعل توليد الفيديو، من المحتمل أن يعلن عن قدرات مماثلة في الزمن الفعلي
Azure
يمكن أن تمتد شراكة Microsoft مع OpenAI إلى بنية تحتية للفيديو للمؤسسات
NVIDIA
تظل منصة الاستنتاج الخاصة بهم (TensorRT، Triton) الافتراضية للنشر المستضاف ذاتياً
حرب البنية التحتية بدأت للتو. أطلقت AWS الطلقة الأولى بشراكة Decart، لكن توقع استجابات سريعة من المنافسين.
دروس عملية
لفرق المؤسسات:
- قيّم متطلبات كمون الفيديو بالذكاء الاصطناعي الآن
- ضع في اعتبارك Bedrock إذا كنت تستخدم AWS بالفعل
- خطط لقدرات الزمن الفعلي في خارطة طريقك
للمطورين:
- تعلم تقنيات تحسين الاستنتاج
- افهم Trainium والمقايضات بين السيليكون المخصص
- ابنِ مع ميزانيات الكمون في الاعتبار
لشركات الفيديو بالذكاء الاصطناعي الناشئة:
- قد يهم تمايز البنية التحتية أكثر من جودة النموذج
- فرص الشراكة مع مزودي السحابة تفتح
- دورات مبيعات المؤسسات بدأت
النظر إلى المستقبل
شراكة AWS/Decart ليست أبرز أخبار الفيديو بالذكاء الاصطناعي هذا الأسبوع. ادعت Runway للتو المركز الأول على Video Arena. أصدرت المختبرات الصينية نماذج مفتوحة المصدر قوية. تلك القصص تحصل على المزيد من النقرات.
لكن البنية التحتية هي المكان الذي تتوسع فيه الصناعة فعلياً. يتطلب الانتقال من "عرض توضيحي مثير للإعجاب" إلى "نظام إنتاج" بالضبط ما تبنيه AWS وDecart: أسس موثوقة وسريعة على مستوى المؤسسات.
قراءة ذات صلة:
- ثورة الفيديو بالذكاء الاصطناعي مفتوح المصدر: كيف يقارن النشر المحلي بالسحابة
- معمارية محولات الانتشار: الأساس التقني الذي يتم تحسينه
- تحليل Runway Gen-4.5: الوضع الحالي لمنافسة جودة النماذج
جعلت حروب النماذج الفيديو بالذكاء الاصطناعي ممكناً. ستجعله البنية التحتية عملياً.
هل كان هذا المقال مفيداً؟

Damien
مطور ذكاء اصطناعيمطور ذكاء اصطناعي من ليون يحب تحويل مفاهيم التعلم الآلي المعقدة إلى وصفات بسيطة. عندما لا يكون منشغلاً في تصحيح النماذج، ستجده يقود الدراجة في وادي الرون.
مقالات ذات صلة
تابع الاستكشاف مع هذه المقالات المرتبطة

Runway GWM-1: نموذج العالم العام الذي يحاكي الواقع في الزمن الحقيقي
يمثل GWM-1 من Runway نقلة نوعية من توليد مقاطع الفيديو إلى محاكاة العوالم. اكتشف كيف يُنشئ هذا النموذج التسلسلي بيئات قابلة للاستكشاف، وأفاتارات واقعية، ومحاكيات لتدريب الروبوتات.

يوتيوب يدمج Veo 3 Fast في Shorts: توليد فيديوهات بالذكاء الاصطناعي مجاناً لـ 2.5 مليار مستخدم
جوجل تدمج نموذج Veo 3 Fast مباشرة في YouTube Shorts، مقدمة توليد فيديوهات من النص مع الصوت مجاناً للمبدعين حول العالم. إليكم ما يعنيه هذا للمنصة ولإتاحة فيديوهات الذكاء الاصطناعي.

نماذج لغة الفيديو: الحدود الجديدة بعد نماذج اللغة الكبيرة ووكلاء الذكاء الاصطناعي
تُعلّم نماذج العالم الذكاء الاصطناعي فهم الواقع المادي، مما يمكّن الروبوتات من التخطيط للإجراءات ومحاكاة النتائج قبل تحريك أي مشغّل.