Meta SAM 3D: Lapos képekből teljes 3D modellek másodpercek alatt
A Meta most adta ki a SAM 3-at és a SAM 3D-t, amelyek egyetlen 2D képből részletes 3D hálókat hoznak létre másodpercek alatt. Lebontjuk, mit jelent ez az alkotók és fejlesztők számára.

A Meta valami jelentőset dobott 2025. november 19-én. A SAM 3D most már másodpercek alatt képes teljes 3D hálókat generálni egyetlen 2D képből. Ami korábban órákig tartó kézi modellezést vagy drága fotogrammetriás felszerelést igényelt, az most egyetlen kattintással megtörténik.
A probléma, amit a SAM 3D megold
A 3D eszközök létrehozása mindig szűk keresztmetszet volt. Akár játékot készítesz, termék-vizualizációt tervezel, vagy AR élményt töltesz fel, a folyamat jellemzően így néz ki:
Kézi modellezés
A művész 4-8 órát tölt egyetlen objektum megformálásával a Blenderben vagy a Mayában
Több képes rögzítés
Készíts 50-200 fotót minden szögből, feldolgozás egész éjjel, kézi műtermék-tisztítás
Egyetlen kép
Tölts fel egy fotót, kapj textúrázott 3D hálót másodpercek alatt
A következmények jelentősek. A 3D tartalom-létrehozás most bárki számára elérhetővé vált, akinek van kamerája.
Hogyan működik a SAM 3D
A SAM 3D a Meta Segment Anything Model architektúrájára épül, de kiterjeszti azt három dimenzióra. A rendszer két speciális változatban érhető el:
SAM 3D Objects
- Objektumokra és jelenetekre optimalizálva
- Komplex geometriát kezel
- Tetszőleges formákkal működik
- Legjobb termékekhez, bútorokhoz, környezetekhez
SAM 3D Body
- Emberi formákra specializálva
- Pontosan rögzíti a test arányait
- Ruhát és kiegészítőket kezel
- Legjobb avatárokhoz, karakterkészítéshez
Az architektúra egy transzformátor-alapú enkódert használ, amely egyidejűleg jósolja meg a mélységet, a felületi normálisokat és a geometriát. A korábbi egyképes 3D módszerekkel ellentétben, amelyek gyakran homályos, hozzávetőleges formákat produkáltak, a SAM 3D éles széleket és finom geometriai részleteket tart fenn.
A SAM 3D szabványos háló formátumokat ad ki, amelyek kompatibilisek a Unity-vel, az Unreal Engine-nel, a Blenderrel és a legtöbb 3D szoftverrel. Nincs tulajdonosi beszorítás.
SAM 3 videóhoz: szöveg alapú objektum-izoláció
Míg a SAM 3D a 2D-ből 3D-be való konverziót kezeli, addig a SAM 3 a videó-szegmentációra összpontosít egy jelentős fejlesztéssel: szöveg alapú lekérdezések.
A korábbi verziók megkövetelték, hogy rákattints az objektumokra a kiválasztásukhoz. A SAM 3 lehetővé teszi, hogy leírd, mit szeretnél izolálni:
- "Válaszd ki az összes piros autót"
- "Kövesd a kék kabátos személyt"
- "Izoláld a háttér épületeket"
A modell 47.0 zero-shot maszk átlagos pontosságot ér el, 22%-os javulást a korábbi rendszerekhez képest. Még fontosabb, hogy egyetlen videóképkockán egyszerre több mint 100 objektumot tud feldolgozni.
Integráció a Meta Edits alkalmazással
A SAM 3 már integrálva van a Meta Edits videókészítő alkalmazásába. Az alkotók természetes nyelvi leírások használatával alkalmazhatnak effekteket, színváltozásokat és átalakításokat specifikus objektumokra, a kézi képkocka-szintű maszkolás helyett.
Technikai architektúra
Az érdeklődők számára a SAM 3D egy több fejű architektúrát használ, amely egyszerre több tulajdonságot jósol meg:
Prediction Heads:
- Depth Map: Pixelenkénti távolság a kamerától
- Surface Normals: 3D tájolás minden ponton
- Semantic Segmentation: Objektum-határok és kategóriák
- Mesh Topology: Háromszög-kapcsolatok a 3D kimenethez
A modellt valós 3D szkennelések és szintetikus adatok kombinációján képezték ki. A Meta nem hozta nyilvánosságra a pontos adatkészlet méretet, de "objektumpéldányok millióit" említi a technikai dokumentációjában.
A SAM 3D több felbontáson egyszerre dolgozza fel a képeket, lehetővé téve számára, hogy egyetlen előremeneti lépésben rögzítse mind a finom részleteket (textúrák, élek), mind a globális struktúrát (általános forma, arányok).
Gyakorlati alkalmazások
- E-kereskedelmi termék-vizualizáció
- AR próbálkozási élmények
- Játékeszköz prototípuskészítés
- Építészeti vizualizáció
- Oktatási 3D modellek
- Az egyképes rekonstrukciónak inherens kétértelműsége van
- Az objektumok hátsó oldalai következtetettek, nem megfigyeltek
- A nagyon tükröző vagy átlátszó felületek nehézségeket okoznak
- A nagyon vékony struktúrák nem biztos, hogy jól rekonstruálódnak
Az egyképes korlátozás alapvető: a modell csak az objektum egyik oldalát láthatja. A rejtett geometriát tanult prioritások alapján következteti ki, ami jól működik gyakori objektumok esetén, de váratlan eredményeket produkálhat szokatlan formák esetén.
Elérhetőség és hozzáférés
A SAM 3D már elérhető a Segment Anything Playground-on keresztül a Meta weboldalán. A fejlesztők számára a Roboflow már kiépítette az integrációt a domén-specifikus objektumokra való egyéni finomhangoláshoz.
- ✓Web playground: Már elérhető
- ✓API hozzáférés: Fejlesztők számára elérhető
- ✓Roboflow integráció: Készen áll a finomhangolásra
- ○Helyi telepítés: Súlyok hamarosan
Az API ingyenes kutatáshoz és korlátozott kereskedelmi használathoz. A nagy volumenű kereskedelmi alkalmazások külön megállapodást igényelnek a Metával.
Mit jelent ez az ipar számára
A 3D tartalom-létrehozás akadálya éppen jelentősen csökkent. Gondold át a következményeket:
Játékfejlesztők számára: A gyors prototípuskészítés triviálissá válik. Fotografálj valós objektumokat, kapj használható 3D eszközöket másodpercek alatt, onnan iterálj tovább.
E-kereskedelem számára: A termékfotózás automatikusan generálhat 3D modelleket AR előnézeti funkciókhoz. Nincs szükség külön 3D gyártási folyamatra.
Oktatók számára: A történelmi műtárgyak, biológiai minták vagy mérnöki alkatrészek interaktív 3D modellekké válhatnak meglévő fényképekből.
AR/VR alkotók számára: A virtuális környezetek reális objektumokkal való feltöltése már nem igényel kiterjedt 3D modellezési szakértelmet.
A SAM 3 (videó-szegmentáció) és a SAM 3D (3D rekonstrukció) kombinációja olyan munkafolyamatokat tesz lehetővé, ahol egy objektumot szegmentálhatsz videófelvételből, majd azt a szegmentált objektumot 3D modellé alakíthatod. Kivonás és rekonstrukció egy folyamatban.
A nagyobb kép
A SAM 3D egy szélesebb trendet képvisel: az AI szisztematikusan eltávolítja a súrlódást a kreatív munkafolyamatokból. Láttuk ezt a képgenerálással, aztán a videógenerálással, és most a 3D modellezéssel.
A technológia nem tökéletes. A komplex jelenetek zárkózásokkal, szokatlan anyagokkal vagy bonyolult geometriával még mindig kihívást jelentenek a rendszer számára. De az alapvető képesség, bármely fénykép használható 3D hálóvá alakítása, most már bárki számára elérhető.
A professzionális 3D művészek számára ez nem helyettesítés, hanem eszköz. Generálj egy alapvető hálót másodpercek alatt, majd finomítsd kézzel. A fárasztó kezdeti modellezési szakasz órákról másodpercekre csökken, több időt hagyva a kreatív munkára, amely valóban emberi ítélőképességet igényel.
A Meta kiadása jelzi, hogy a 2D-ből 3D-be való akadály omlik. A kérdés most már nem az, hogy az AI tud-e 3D tartalmat létrehozni képekből. Hanem az, hogy mennyi ideig tart, amíg ez a képesség minden kreatív eszköz standard funkciójává válik.

Alexis
AI MérnökAI mérnök Lausanne-ból, aki a kutatás mélységét gyakorlati innovációval ötvözi. Idejét modell architektúrák és alpesi csúcsok között osztja meg.