PixVerse R1: فجر جيل جديد من فيديو الذكاء الاصطناعي التفاعلي في الوقت الفعلي
تطلق منصة PixVerse التابعة لعملاق علي بابا R1، أول نموذج عالمي قادر على توليد فيديو بدقة 1080p يستجيب فوراً لإدخال المستخدم، مما يفتح أبواباً لعوالم الألعاب والسينما التفاعلية اللامحدودة.

ماذا لو كان الفيديو قادراً على الاستجابة لك أثناء توليده؟ PixVerse جعلت هذا السؤال عفا عليه الزمن بالإجابة عليه.
في 13 يناير 2026، أطلقت شركة PixVerse التابعة لعملاق علي بابا شيئاً يبدو أشبه بنقلة نوعية منه بتحديث منتج عادي. R1 هو أول نموذج عالمي حقيقي قادر على توليد فيديو بدقة 1080p يستجيب فوراً لإدخال المستخدم. ليس على دفعات. ليس بعد ظهور شريط التقدم. الآن فقط، بينما تشاهده.
توليد فيديو الذكاء الاصطناعي في الوقت الفعلي يعني أن الشخصيات يمكنها أن تبكي أو ترقص أو تتجمد أو تتخذ وضعية محددة بأمر، مع حدوث التغييرات فوراً بينما يستمر الفيديو.
من المعالجة الدفعية إلى التدفقات اللامحدودة
توليد الفيديو التقليدي يعمل بهذه الطريقة: تكتب طلباً، تنتظر من ثوان إلى دقائق، وتتلقى مقطع فيديو ثابت الطول. إنه نمط طلب-رد مستعار من الأيام الأولى للنص إلى الصورة. PixVerse R1 يكسر هذا القالب تماماً.
يحول النظام توليد الفيديو إلى ما تسميه الشركة بـ "تدفق بصري مستمر وتفاعلي ولامحدود". لا ينبغي الانتظار. لا نهاية محددة مسبقاً. توجه المشهد بينما ينكشف.
البنية التقنية خلف التوليد في الوقت الفعلي
كيف تجعل نماذج الانتشار سريعة بما يكفي للاستخدام في الوقت الفعلي؟ حلت PixVerse هذه المشكلة من خلال ما يسمونه "طي المسار الزمني".
أخذ عينات الانتشار القياسية يتطلب عشرات الخطوات التكرارية، كل واحدة تحسن الإخراج من الضوضاء نحو فيديو متماسك. R1 يطوي هذه العملية إلى خطوة أو أربع خطوات فقط من خلال التنبؤ المباشر. تتخلى عن بعض مرونة التوليد مقابل السرعة اللازمة للاستخدام التفاعلي.
الاستجابة في الوقت الفعلي تمكن تطبيقات جديدة مستحيلة مع التوليد الدفعي، مثل السرديات التفاعلية والألعاب التي تستخدم الذكاء الاصطناعي بشكل أساسي.
التنبؤ المباشر يوفر تحكماً أقل في التوليد الدقيق مقارنة بأخذ عينات الانتشار الكامل.
النموذج الأساسي هو ما تصفه PixVerse بـ "نموذج أساسي متعدد الأنماط أصلي شامل". بدلاً من توجيه النص والصور والصوت والفيديو من خلال مراحل معالجة منفصلة، تتعامل R1 مع جميع المدخلات كتدفق موحد للرموز. يلغي هذا الاختيار المعماري كمون التسليم الذي يعاني منه الأنظمة متعددة الأنماط التقليدية.
ما الذي يعنيه هذا للمبدعين؟
الآثار تتجاوز المزيد من سرعة العرض. يتيح التوليد في الوقت الفعلي سير عمل إبداعي جديد تماماً.
الألعاب الأصلية بالذكاء الاصطناعي
تخيل ألعاباً حيث تتطور البيئات والسرديات ديناميكياً استجابة لأفعال اللاعب، بدون قصص مصممة مسبقاً، بدون حدود محتوى.
السينما التفاعلية
درامات قصيرة حيث يؤثر المشاهدون على كيفية تطور القصة. ليس اختر مغامرتك الخاصة مع المسارات المتفرعة، بل سردية مستمرة تعيد تشكيل نفسها.
الإخراج المباشر
يمكن للمخرجين تعديل المشاهد في الوقت الفعلي، اختبار نبضات عاطفية مختلفة، تغييرات الإضاءة، أو إجراءات الشخصيات دون انتظار إعادة العرض.
المشهد التنافسي: هيمنة الصين على فيديو الذكاء الاصطناعي
تعزز R1 نمطاً كان يتطور طوال عام 2025: الفرق الصينية تقود في توليد فيديو الذكاء الاصطناعي. وفقاً لشركة قياس الذكاء الاصطناعي Artificial Analysis، سبعة من أفضل ثمانية نماذج توليد فيديو تأتي من شركات صينية. فقط شركة Lightricks الإسرائيلية تكسر هذه السلسلة.
لمزيد من المعلومات التفصيلية عن تأثير الصين المتزايد على فيديو الذكاء الاصطناعي، انظر تحليلنا عن كيف تعيد الشركات الصينية تشكيل المشهد التنافسي.
"Sora لا تزال تحدد سقف الجودة في توليد الفيديو، لكنها مقيدة بوقت التوليد وتكلفة API"، كما تلاحظ Wei Sun، رئيسة المحللين في Counterpoint. PixVerse R1 تهاجم بالضبط هذه القيود، وتقدم قيمة مختلفة: ليست الجودة القصوى، بل أقصى استجابة.
| المقياس | PixVerse R1 | النماذج التقليدية |
|---|---|---|
| وقت الاستجابة | في الوقت الفعلي | ثوان إلى دقائق |
| طول الفيديو | تدفق لامحدود | مقاطع ثابتة (5-30 ثانية) |
| تفاعل المستخدم | مستمر | موجه ثم انتظر |
| الدقة | 1080p | حتى 4K (دفعي) |
عمل توليد الفيديو في الوقت الفعلي
PixVerse لا تبني التكنولوجيا فقط، بل تبني عملاً تجارياً. أبلغت الشركة عن 40 مليون دولار في الإيرادات المتكررة السنوية في أكتوبر 2025 وقد نمت إلى 100 مليون مستخدم مسجل. يهدف الرئيس المؤسس Jaden Xie إلى مضاعفة قاعدة المستخدمين إلى 200 مليون بحلول منتصف 2026.
جمعت الشركة الناشئة أكثر من 60 مليون دولار في خريف الماضي في جولة بقيادة علي بابا، مع مشاركة Antler. يتم نشر هذا رأس المال بقوة: يمكن أن يتضاعف عدد الموظفين تقريباً إلى 200 موظف بحلول نهاية السنة.
تأسيس PixVerse
تطلق الشركة مع التركيز على توليد فيديو الذكاء الاصطناعي.
100 مليون مستخدم
تصل المنصة إلى 100 مليون مستخدم مسجل.
تمويل بقيمة 60 مليون دولار
جولة تمويل بقيادة علي بابا بقيمة 40 مليون دولار ARR.
إطلاق R1
أول نموذج عالمي في الوقت الفعلي يذهب مباشرة.
جربها بنفسك
R1 متاح الآن على realtime.pixverse.ai، لكن الوصول حالياً بدعوة فقط بينما يقوم الفريق بتوسيع البنية التحتية. إذا كنت تتابع تطور النماذج العالمية أو جربت TurboDiffusion، فإن R1 يمثل الخطوة المنطقية التالية: ليس فقط توليد أسرع، بل نموذج تفاعل مختلف بشكل أساسي.
السؤال لم يعد "ما مدى سرعة توليد فيديو الذكاء الاصطناعي؟" السؤال هو "ما الذي يصبح ممكناً عندما يكون توليد الفيديو بدون تأخير محسوس؟" PixVerse بدأت للتو الإجابة على هذا السؤال. البقية منا تلحق بالركب.
ما التالي؟
التوليد في الوقت الفعلي بدقة 1080p مثير للإعجاب، لكن المسار واضح: دقة أعلى، نوافذ سياق أطول، وتكامل متعدد الأنماط أعمق. مع توسع البنية التحتية ونضج تقنيات مثل طي المسار الزمني، قد نرى توليد 4K في الوقت الفعلي يصبح روتينياً.
في الوقت الحالي، R1 هي إثبات مفهوم يعمل بنفس الوقت كنظام إنتاج. فإنها توضح أن الخط بين "توليد الفيديو" و "توجيه الفيديو" يمكن أن يتلاشى حتى يختفي تماماً. هذا ليس إنجازاً تقنياً فقط. إنه إنجاز إبداعي.
قراءة ذات صلة: تعرف على كيفية تحويلات الانتشار تشغيل توليد الفيديو الحديث، أو استكشف نهج Runway نحو النماذج العالمية لوجهة نظر أخرى حول الفيديو التفاعلي.
هل كان هذا المقال مفيداً؟

Henry
متخصص تكنولوجيا إبداعيةمتخصص تكنولوجيا إبداعية من لوزان يستكشف التقاء الذكاء الاصطناعي بالفن. يجري تجارب على النماذج التوليدية بين جلسات الموسيقى الإلكترونية.
مقالات ذات صلة
تابع الاستكشاف مع هذه المقالات المرتبطة

النماذج العالمية: الحدود الجديدة في توليد الفيديو بالذكاء الاصطناعي
لماذا يعيد التحول من توليد الإطارات إلى محاكاة العوالم تشكيل فيديو الذكاء الاصطناعي، وماذا يخبرنا GWM-1 من Runway عن الوجهة المستقبلية لهذه التقنية.

منصات الذكاء الاصطناعي لرواية القصص بالفيديو، كيف يغير المحتوى المسلسل كل شيء في 2026
من المقاطع الفردية إلى السلاسل الكاملة، يتطور فيديو الذكاء الاصطناعي من أداة توليد إلى محرك سرد قصصي. تعرف على المنصات التي تجعل هذا ممكنا.

نماذج العالم بعد الفيديو: لماذا الألعاب والروبوتات هي ساحات الاختبار الحقيقية للذكاء العام
من نظام Genie من DeepMind إلى AMI Labs، أصبحت نماذج العالم بهدوء أساس الذكاء الاصطناعي الذي يفهم الفيزياء حقاً. قد يكون سوق الألعاب بقيمة 500 مليار دولار هو المكان الذي يثبتون فيه أنفسهم أولاً.