AlexisAlexis
6 min read
1040 كلمات

SAM 3D من Meta: من الصور المسطحة إلى نماذج ثلاثية الأبعاد كاملة في ثوانٍ

أصدرت Meta مؤخراً SAM 3 و SAM 3D، حيث يحول الصور الثنائية الأبعاد المفردة إلى شبكات ثلاثية الأبعاد مفصلة في ثوانٍ. نوضح ماذا يعني هذا للمبدعين والمطورين.

SAM 3D من Meta: من الصور المسطحة إلى نماذج ثلاثية الأبعاد كاملة في ثوانٍ

أطلقت Meta تقنية رائدة في 19 نوفمبر 2025. يمكن لـ SAM 3D الآن إنشاء شبكات ثلاثية الأبعاد كاملة من صور ثنائية الأبعاد مفردة في ثوانٍ. ما كان يتطلب ساعات من النمذجة اليدوية أو أجهزة التصوير المجسم المكلفة يحدث الآن بنقرة واحدة فقط.

المشكلة التي يحلها SAM 3D

كان إنشاء الأصول الثلاثية الأبعاد دائماً عقبة رئيسية. سواء كنت تبني لعبة، أو تصمم تصوراً للمنتج، أو تملأ تجربة واقع معزز، فإن العملية تبدو عادةً كما يلي:

التقليدي

النمذجة اليدوية

يقضي الفنان من 4 إلى 8 ساعات في نحت كائن واحد في Blender أو Maya

التصوير المجسم

التقاط متعدد الصور

التقاط 50-200 صورة من جميع الزوايا، المعالجة طوال الليل، تنظيف العيوب يدوياً

SAM 3D

صورة واحدة

تحميل صورة واحدة، استلام شبكة ثلاثية الأبعاد منسوجة في ثوانٍ

الآثار المترتبة على ذلك كبيرة. أصبح إنشاء المحتوى الثلاثي الأبعاد الآن متاحاً لأي شخص لديه كاميرا.

كيف يعمل SAM 3D

يبني SAM 3D على بنية Segment Anything Model من Meta، لكنه يمتد إلى ثلاثة أبعاد. يأتي النظام في نسختين متخصصتين:

SAM 3D Objects

  • محسّن للأشياء والمشاهد
  • يتعامل مع الهندسة المعقدة
  • يعمل مع الأشكال التعسفية
  • الأفضل للمنتجات والأثاث والبيئات

SAM 3D Body

  • متخصص للأشكال البشرية
  • يلتقط نسب الجسم بدقة
  • يتعامل مع الملابس والإكسسوارات
  • الأفضل للصور الرمزية وإنشاء الشخصيات

تستخدم البنية محول تشفير قائم على المحولات (transformer) يتنبأ بالعمق والأسطح العادية والهندسة في وقت واحد. على عكس طرق الثلاثي الأبعاد من صورة واحدة السابقة التي غالباً ما أنتجت أشكالاً غامضة وتقريبية، يحافظ SAM 3D على الحواف الحادة والتفاصيل الهندسية الدقيقة.

💡

ينتج SAM 3D تنسيقات شبكة قياسية متوافقة مع Unity و Unreal Engine و Blender ومعظم برامج الثلاثي الأبعاد. لا يوجد قفل احتكاري.

SAM 3 للفيديو: عزل الكائنات القائم على النص

بينما يتعامل SAM 3D مع التحويل من الثنائي إلى الثلاثي الأبعاد، يركز SAM 3 على تجزئة الفيديو مع ترقية كبيرة: الاستعلامات القائمة على النص.

تطلبت الإصدارات السابقة منك النقر على الكائنات لتحديدها. يتيح لك SAM 3 وصف ما تريد عزله:

  • "حدد جميع السيارات الحمراء"
  • "تتبع الشخص في السترة الزرقاء"
  • "عزل المباني في الخلفية"
47.0
دقة القناع بدون تدريب مسبق
22%
التحسين
100+
الكائنات المتتبعة

يحقق النموذج دقة متوسط قناع بدون تدريب مسبق (zero-shot) تبلغ 47.0، وهو تحسن بنسبة 22٪ على الأنظمة السابقة. والأهم من ذلك، يمكنه معالجة أكثر من 100 كائن في وقت واحد في إطار فيديو واحد.

🎬

التكامل مع Meta Edits

تم دمج SAM 3 بالفعل في تطبيق إنشاء الفيديو Edits من Meta. يمكن للمبدعين تطبيق التأثيرات وتغييرات الألوان والتحولات على كائنات محددة باستخدام أوصاف اللغة الطبيعية بدلاً من الإخفاء اليدوي إطاراً تلو الآخر.

البنية التقنية

بالنسبة لأولئك المهتمين بالتفاصيل، يستخدم SAM 3D بنية متعددة الرؤوس تتنبأ بعدة خصائص في وقت واحد:

رؤوس التنبؤ:

  • خريطة العمق: المسافة من الكاميرا لكل بكسل
  • الأسطح العادية: التوجيه الثلاثي الأبعاد عند كل نقطة
  • التجزئة الدلالية: حدود الكائنات والفئات
  • طوبولوجيا الشبكة: اتصال المثلثات لإخراج الثلاثي الأبعاد

تم تدريب النموذج على مزيج من المسح الثلاثي الأبعاد في العالم الحقيقي والبيانات الاصطناعية. لم تكشف Meta عن حجم مجموعة البيانات بالضبط، لكنها تذكر "ملايين حالات الكائنات" في وثائقها التقنية.

يعالج SAM 3D الصور بدقة متعددة في وقت واحد، مما يسمح له بالتقاط التفاصيل الدقيقة (الأنسجة والحواف) والهيكل العام (الشكل العام والنسب) في تمريرة واحدة للأمام.

التطبيقات العملية

حالات الاستخدام الفوري
  • تصور المنتج للتجارة الإلكترونية
  • تجارب التجربة بالواقع المعزز
  • النماذج الأولية لأصول الألعاب
  • التصور المعماري
  • النماذج التعليمية الثلاثية الأبعاد
القيود التي يجب مراعاتها
  • إعادة البناء من منظر واحد لها غموض متأصل
  • يتم استنتاج الجوانب الخلفية للكائنات، وليس ملاحظتها
  • تكافح الأسطح شديدة الانعكاس أو الشفافة
  • قد لا تعاد بناء الهياكل الرقيقة جداً بشكل جيد

قيد المنظر الواحد أساسي: يمكن للنموذج رؤية جانب واحد فقط من الكائن. يستنتج الهندسة المخفية بناءً على معرفة مسبقة مكتسبة، وهو ما يعمل بشكل جيد للكائنات الشائعة لكن يمكن أن ينتج نتائج غير متوقعة للأشكال غير العادية.

التوفر والوصول

SAM 3D متاح الآن من خلال Segment Anything Playground على موقع Meta الإلكتروني. بالنسبة للمطورين، قامت Roboflow بالفعل ببناء تكامل للضبط الدقيق المخصص على الكائنات الخاصة بالمجال.

  • الساحة على الويب: متاح الآن
  • الوصول إلى API: متاح للمطورين
  • تكامل Roboflow: جاهز للضبط الدقيق
  • النشر المحلي: الأوزان قادمة قريباً

API مجاني للبحث والاستخدام التجاري المحدود. تتطلب التطبيقات التجارية عالية الحجم اتفاقاً منفصلاً مع Meta.

ماذا يعني هذا للصناعة

انخفض الحاجز أمام إنشاء المحتوى الثلاثي الأبعاد بشكل كبير. ضع في اعتبارك الآثار المترتبة:

لمطوري الألعاب: يصبح النموذج الأولي السريع أمراً تافهاً. تصوير الكائنات في العالم الحقيقي، والحصول على أصول ثلاثية الأبعاد قابلة للاستخدام في ثوانٍ، والتكرار من هناك.

للتجارة الإلكترونية: يمكن أن يولد تصوير المنتج تلقائياً نماذج ثلاثية الأبعاد لميزات معاينة الواقع المعزز. لا حاجة لخط إنتاج ثلاثي الأبعاد منفصل.

للمعلمين: يمكن أن تصبح القطع الأثرية التاريخية أو العينات البيولوجية أو المكونات الهندسية نماذج تفاعلية ثلاثية الأبعاد من الصور الموجودة.

لمبدعي الواقع المعزز والافتراضي: لم يعد ملء البيئات الافتراضية بكائنات واقعية يتطلب خبرة واسعة في النمذجة الثلاثية الأبعاد.

💡

يتيح الجمع بين SAM 3 (تجزئة الفيديو) و SAM 3D (إعادة البناء الثلاثي الأبعاد) سير عمل حيث يمكنك تجزئة كائن من لقطات الفيديو، ثم تحويل هذا الكائن المجزأ إلى نموذج ثلاثي الأبعاد. الاستخراج وإعادة البناء في خط أنابيب واحد.

الصورة الأكبر

يمثل SAM 3D اتجاهاً أوسع: يعمل الذكاء الاصطناعي بشكل منهجي على إزالة الاحتكاك من سير العمل الإبداعي. رأينا هذا مع توليد الصور، ثم توليد الفيديو، والآن النمذجة الثلاثية الأبعاد.

التقنية ليست مثالية. المشاهد المعقدة مع الانسدادات أو المواد غير العادية أو الهندسة المعقدة لا تزال تتحدى النظام. لكن القدرة الأساسية، تحويل أي صورة إلى شبكة ثلاثية الأبعاد قابلة للاستخدام، متاحة الآن لأي شخص.

بالنسبة لفناني الثلاثي الأبعاد المحترفين، هذا ليس بديلاً بل أداة. إنشاء شبكة أساسية في ثوانٍ، ثم تحسينها يدوياً. تنضغط مرحلة النمذجة الأولية المملة من ساعات إلى ثوانٍ، مما يترك مزيداً من الوقت للعمل الإبداعي الذي يتطلب فعلاً حكماً بشرياً.

يشير إصدار Meta إلى أن الحاجز بين الثنائي والثلاثي الأبعاد يتهاوى. السؤال الآن ليس ما إذا كان الذكاء الاصطناعي يمكنه إنشاء محتوى ثلاثي الأبعاد من الصور. بل كم من الوقت حتى تصبح هذه القدرة ميزة قياسية في كل أداة إبداعية.

Alexis

Alexis

مهندس ذكاء اصطناعي

مهندس ذكاء اصطناعي من لوزان يجمع بين عمق البحث والابتكار العملي. يقسم وقته بين بنيات النماذج وقمم جبال الألب.

هل استمتعت بقراءة هذا المقال؟

اكتشف المزيد من الرؤى والبصائر وابقَ محدثاً مع أحدث محتوياتنا.

SAM 3D من Meta: من الصور المسطحة إلى نماذج ثلاثية الأبعاد كاملة في ثوانٍ