Meta SAM 3D: מתמונות שטוחות למודלים תלת-ממדיים מלאים תוך שניות
Meta זה עתה השיקה את SAM 3 ו-SAM 3D, שהופכים תמונות 2D בודדות למשטחים תלת-ממדיים מפורטים תוך שניות. אנחנו מפרקים מה זה אומר ליוצרים ולמפתחים.

Meta הפילה משהו משמעותי ב-19 בנובמבר 2025. SAM 3D יכול עכשיו ליצור משטחים תלת-ממדיים שלמים מתמונות 2D בודדות תוך שניות. מה שנהג לדרוש שעות של מידול ידני או ציוד פוטוגרמטריה יקר קורה עכשיו בקליק אחד.
הבעיה ש-SAM 3D פותר
יצירת אסטים תלת-ממדיים תמיד היתה צוואר בקבוק. בין אם אתה בונה משחק, מעצב ויזואליזציה של מוצר, או ממלא חוויית AR, התהליך בדרך כלל נראה כך:
מידול ידני
אמן מבזבז 4-8 שעות על פיסול אובייקט בודד ב-Blender או Maya
צילום רב-תמונות
צילום 50-200 תמונות מכל הזוויות, עיבוד לילה שלם, ניקוי ארטיפקטים ידנית
תמונה בודדת
העלה תמונה אחת, קבל משטח תלת-ממדי עם טקסטורות תוך שניות
ההשלכות משמעותיות. יצירת תוכן תלת-ממדי הפכה נגישה לכל מי שיש לו מצלמה.
איך SAM 3D עובד
SAM 3D בנוי על ארכיטקטורת Segment Anything Model של Meta, אבל מרחיב אותה לשלושה ממדים. המערכת מגיעה בשני וריאנטים מיוחדים:
SAM 3D Objects
- אופטימיזציה לאובייקטים וסצנות
- מטפל בגיאומטריה מורכבת
- עובד עם צורות שרירותיות
- הכי טוב למוצרים, רהיטים, סביבות
SAM 3D Body
- מיוחד לצורות אנושיות
- לוכד פרופורציות גוף במדויק
- מטפל בבגדים ואקססוריז
- הכי טוב לאווטארים, יצירת דמויות
הארכיטקטורה משתמשת ב-encoder מבוסס-transformer שמנבא עומק, נורמלים של משטח וגיאומטריה במקביל. בניגוד לשיטות קודמות של תלת-ממד מתמונה בודדת שלעתים קרובות יצרו צורות מטושטשות ומשוערות, SAM 3D שומר על קצוות חדים ופרטים גיאומטריים עדינים.
SAM 3D מוציא פורמטי משטח סטנדרטיים תואמים ל-Unity, Unreal Engine, Blender ורוב תוכנות התלת-ממד. ללא lock-in קנייני.
SAM 3 לווידאו: בידוד אובייקטים מבוסס טקסט
בעוד SAM 3D מטפל בהמרת 2D-ל-3D, SAM 3 מתמקד בסגמנטציה של וידאו עם שדרוג מרכזי: שאילתות מבוססות טקסט.
גרסאות קודמות דרשו ממך ללחוץ על אובייקטים כדי לבחור אותם. SAM 3 נותן לך לתאר מה אתה רוצה לבודד:
- "בחר את כל המכוניות האדומות"
- "עקוב אחרי האדם במעיל הכחול"
- "בודד את הבניינים ברקע"
המודל משיג 47.0 zero-shot mask average precision, שיפור של 22% על פני מערכות קודמות. חשוב יותר, הוא יכול לעבד מעל 100 אובייקטים במקביל בפריים וידאו בודד.
אינטגרציה עם Meta Edits
SAM 3 כבר משולב באפליקציית Meta Edits ליצירת וידאו. יוצרים יכולים להחיל אפקטים, שינויי צבע וטרנספורמציות על אובייקטים ספציפיים באמצעות תיאורים בשפה טבעית במקום מסקינג ידני פריים אחרי פריים.
ארכיטקטורה טכנית
למי שמעוניין בפרטים, SAM 3D משתמש בארכיטקטורת multi-head שמנבאת מספר מאפיינים במקביל:
Prediction Heads:
- Depth Map: מרחק per-pixel מהמצלמה
- Surface Normals: אוריינטציה תלת-ממדית בכל נקודה
- Semantic Segmentation: גבולות וקטגוריות של אובייקטים
- Mesh Topology: קישוריות משולשים לפלט תלת-ממדי
המודל אומן על שילוב של סריקות תלת-ממד מהעולם האמיתי ודאטה סינתטית. Meta לא חשפה את גודל הדאטהסט המדויק, אבל מזכירה "מיליוני מופעי אובייקטים" בתיעוד הטכני שלהם.
SAM 3D מעבד תמונות ברזולוציות מרובות במקביל, מה שמאפשר לו ללכוד גם פרטים עדינים (טקסטורות, קצוות) וגם מבנה גלובלי (צורה כללית, פרופורציות) במעבר forward בודד.
יישומים מעשיים
- ויזואליזציה של מוצרים לאי-קומרס
- חוויות try-on ב-AR
- פרוטוטייפינג של אסטים למשחקים
- ויזואליזציה ארכיטקטונית
- מודלים תלת-ממדיים חינוכיים
- לרקונסטרוקציה מתצוגה בודדת יש אי-בהירות מובנית
- הצדדים האחוריים של אובייקטים מוסקים, לא נצפים
- משטחים מאוד מחזירי אור או שקופים מתקשים
- מבנים דקים מאוד עשויים לא להשתחזר טוב
המגבלה של תצוגה בודדת היא בסיסית: המודל יכול לראות רק צד אחד של אובייקט. הוא מסיק את הגיאומטריה הנסתרת על בסיס priors שנלמדו, מה שעובד טוב לאובייקטים נפוצים אבל יכול לייצר תוצאות בלתי צפויות לצורות יוצאות דופן.
זמינות וגישה
SAM 3D זמין עכשיו דרך Segment Anything Playground באתר של Meta. למפתחים, Roboflow כבר בנה אינטגרציה ל-fine-tuning מותאם אישית על אובייקטים ספציפיים לדומיין.
- ✓Web playground: זמין עכשיו
- ✓גישת API: זמינה למפתחים
- ✓אינטגרציית Roboflow: מוכן ל-fine-tuning
- ○דיפלוי מקומי: Weights בקרוב
ה-API חינמי למחקר ושימוש מסחרי מוגבל. אפליקציות מסחריות בנפח גבוה דורשות הסכם נפרד עם Meta.
מה זה אומר לתעשייה
המחסום ליצירת תוכן תלת-ממדי רק ירד משמעותית. תחשוב על ההשלכות:
למפתחי משחקים: פרוטוטייפינג מהיר הופך טריוויאלי. צלם אובייקטים מהעולם האמיתי, קבל אסטים תלת-ממדיים שמישים תוך שניות, עבוד איטרטיבית משם.
לאי-קומרס: צילום מוצר יכול לייצר אוטומטית מודלים תלת-ממדיים לפיצ'רים של תצוגה מקדימה ב-AR. אין צורך בפייפליין ייצור תלת-ממדי נפרד.
למחנכים: ארטיפקטים היסטוריים, דגימות ביולוגיות, או רכיבים הנדסיים יכולים להפוך למודלים תלת-ממדיים אינטראקטיביים מתמונות קיימות.
ליוצרי AR/VR: אכלוס סביבות וירטואליות באובייקטים ריאליסטיים לא דורש עוד מומחיות נרחבת במידול תלת-ממדי.
השילוב של SAM 3 (סגמנטציה של וידאו) ו-SAM 3D (רקונסטרוקציה תלת-ממדית) מאפשר זרימות עבודה שבהן אתה יכול לסגמנט אובייקט מצילומי וידאו, ואז להמיר את האובייקט המסוגמנט הזה למודל תלת-ממדי. חילוץ ורקונסטרוקציה בפייפליין אחד.
התמונה הגדולה יותר
SAM 3D מייצג טרנד רחב יותר: AI מסיר באופן שיטתי חיכוך מזרימות עבודה יצירתיות. ראינו את זה עם ייצור תמונות, אחר כך ייצור וידאו, ועכשיו מידול תלת-ממדי.
הטכנולוגיה לא מושלמת. סצנות מורכבות עם חסימות, חומרים יוצאי דופן, או גיאומטריה מורכבת עדיין מאתגרות את המערכת. אבל היכולת הבסיסית, הפיכת כל תמונה למשטח תלת-ממדי שמיש, זמינה עכשיו לכל אחד.
לאמנים תלת-ממדיים מקצועיים, זה לא החלפה אלא כלי. צור משטח בסיס תוך שניות, ואז שפר אותו ידנית. שלב המידול הראשוני המייגע מתכווץ משעות לשניות, מה שמשאיר יותר זמן לעבודה היצירתית שבאמת דורשת שיפוט אנושי.
השקה של Meta מסמנת שהמחסום של 2D-ל-3D מתפורר. השאלה עכשיו היא לא אם AI יכול ליצור תוכן תלת-ממדי מתמונות. זה כמה זמן עד שהיכולת הזו תהפוך פיצ'ר סטנדרטי בכל כלי יצירתי.

Alexis
מהנדס AIמהנדס AI מלוזאן המשלב עומק מחקרי עם חדשנות מעשית. מחלק את זמנו בין ארכיטקטורות מודלים לפסגות האלפים.