Meta SAM 3D: Od ravnih slika do potpunih 3D modela u sekundama
Meta je upravo objavio SAM 3 i SAM 3D, koji pretvaraju pojedinačne 2D slike u detaljne 3D mreže u sekundama. Raščlanjujemo što to znači za kreatore i developere.

Meta je izbacio nešto značajno 19. studenog 2025. SAM 3D sada može generirati potpune 3D mreže iz pojedinačnih 2D slika u sekundama. Ono što je prije zahtijevalo sate ručnog modeliranja ili skupu fotogrametriju sada se događa jednim klikom.
Problem koji SAM 3D rješava
Stvaranje 3D resursa oduvijek je bilo usko grlo. Bilo da gradite igru, dizajnirate vizualizaciju proizvoda ili punite AR iskustvo, proces tipično izgleda ovako:
Ručno modeliranje
Artist provodi 4-8 sati modelirajući pojedinačni objekt u Blenderu ili Mayi
Snimanje višestrukih slika
Snimite 50-200 fotografija iz svih kutova, obrađujte cijelu noć, ručno čistite artefakte
Jedna slika
Učitajte jednu fotografiju, dobijte teksturiranu 3D mrežu u sekundama
Implikacije su značajne. Stvaranje 3D sadržaja upravo je postalo dostupno svima koji imaju kameru.
Kako SAM 3D funkcionira
SAM 3D gradi na arhitekturi Meta Segment Anything Model, ali je proširuje u tri dimenzije. Sustav dolazi u dvije specijalizirane varijante:
SAM 3D Objects
- Optimiziran za objekte i scene
- Rukuje kompleksnom geometrijom
- Radi s proizvoljnim oblicima
- Najbolje za proizvode, namještaj, okruženja
SAM 3D Body
- Specijaliziran za ljudske oblike
- Precizno hvata proporcije tijela
- Rukuje odjećom i dodacima
- Najbolje za avatare, kreiranje likova
Arhitektura koristi encoder temeljen na transformeru koji predviđa dubinu, normale površine i geometriju istovremeno. Za razliku od prethodnih metoda 3D iz jedne slike koje su često proizvodile neodređene, približne oblike, SAM 3D održava oštre rubove i fine geometrijske detalje.
SAM 3D ispisuje standardne formate mreže kompatibilne s Unity, Unreal Engine, Blender i većinom 3D softvera. Nema vlasničkog zaključavanja.
SAM 3 za video: izolacija objekata temeljena na tekstu
Dok SAM 3D rukuje konverzijom 2D u 3D, SAM 3 se fokusira na segmentaciju videa s velikim nadogradnjom: upiti temeljeni na tekstu.
Prethodne verzije zahtijevale su da kliknete na objekte da biste ih odabrali. SAM 3 vam omogućava da opišete što želite izolirati:
- "Odaberi sve crvene automobile"
- "Prati osobu u plavoj jakni"
- "Izoliraj pozadinske zgrade"
Model postiže 47.0 zero-shot mask average precision, poboljšanje od 22% u odnosu na prethodne sustave. Još važnije, može obraditi više od 100 objekata istovremeno u jednom video okviru.
Integracija s Meta Edits
SAM 3 je već integriran u Meta aplikaciju Edits za kreiranje videa. Kreatori mogu primjenjivati efekte, promjene boja i transformacije na specifične objekte koristeći opise prirodnim jezikom umjesto ručnog maskiranja okvir po okvir.
Tehnička arhitektura
Za one zainteresirane za detalje, SAM 3D koristi multi-head arhitekturu koja predviđa nekoliko svojstava istovremeno:
Glave za predviđanje:
- Depth Map: Udaljenost od kamere po pikselu
- Surface Normals: 3D orijentacija na svakoj točki
- Semantic Segmentation: Granice i kategorije objekata
- Mesh Topology: Povezanost trokuta za 3D izlaz
Model je treniran na kombinaciji stvarnih 3D skenova i sintetičkih podataka. Meta nije otkrio točnu veličinu skupa podataka, ali spominje "milijune instanci objekata" u svojoj tehničkoj dokumentaciji.
SAM 3D obrađuje slike na više rezolucija istovremeno, omogućavajući mu da uhvati i fine detalje (teksture, rubove) i globalnu strukturu (ukupni oblik, proporcije) u jednom prolazu.
Praktične primjene
- Vizualizacija proizvoda za e-trgovinu
- AR iskustva isprobavanja
- Izrada prototipa igara
- Arhitektonska vizualizacija
- Edukacijski 3D modeli
- Rekonstrukcija iz jednog pogleda ima inherentnu dvosmislenost
- Stražnje strane objekata se zaključuju, ne promatraju
- Visoko reflektirajuće ili prozirne površine imaju problema
- Vrlo tanke strukture možda neće dobro rekonstruirati
Ograničenje jednog pogleda je fundamentalno: model može vidjeti samo jednu stranu objekta. Zaključuje skrivenu geometriju na temelju naučenih prioriteta, što dobro funkcionira za uobičajene objekte, ali može proizvesti neočekivane rezultate za neobične oblike.
Dostupnost i pristup
SAM 3D je dostupan sada kroz Segment Anything Playground na Meta web stranici. Za developere, Roboflow je već izgradio integraciju za prilagođeno fino podešavanje na objektima specifičnim za domenu.
- ✓Web playground: Dostupan sada
- ✓API pristup: Dostupan za developere
- ✓Roboflow integracija: Spremna za fino podešavanje
- ○Lokalna implementacija: Težine uskoro
API je besplatan za istraživanje i ograničenu komercijalnu upotrebu. Komercijalne aplikacije velikog obujma zahtijevaju zaseban sporazum s Metom.
Što ovo znači za industriju
Barijera za stvaranje 3D sadržaja upravo je značajno pala. Razmotrite implikacije:
Za game developere: Brza izrada prototipa postaje trivijalna. Fotografirajte stvarne objekte, dobijte upotrebljive 3D resurse u sekundama, iterirajte odatle.
Za e-trgovinu: Fotografija proizvoda može automatski generirati 3D modele za AR preview značajke. Nije potreban zaseban proizvodni pipeline za 3D.
Za edukatore: Povijesni artefakti, biološki uzorci ili inženjerske komponente mogu postati interaktivni 3D modeli iz postojećih fotografija.
Za AR/VR kreatore: Punjenje virtualnih okruženja realističnim objektima više ne zahtijeva opsežno znanje 3D modeliranja.
Kombinacija SAM 3 (segmentacija videa) i SAM 3D (3D rekonstrukcija) omogućava radne procese gdje možete segmentirati objekt iz video snimke, zatim pretvoriti taj segmentirani objekt u 3D model. Ekstrakcija i rekonstrukcija u jednom cjevovodu.
Šira slika
SAM 3D predstavlja širi trend: AI sustavno uklanja trenje iz kreativnih radnih procesa. Vidjeli smo to s generiranjem slika, zatim generiranjem videa, a sada 3D modeliranjem.
Tehnologija nije savršena. Kompleksne scene s okluzijama, neobični materijali ili složena geometrija još uvijek izazivaju sustav. Ali osnovna sposobnost, pretvaranje bilo koje fotografije u upotrebljivu 3D mrežu, sada je dostupna svima.
Za profesionalne 3D umjetnike, ovo nije zamjena već alat. Generirajte osnovnu mrežu u sekundama, zatim je ručno doradite. Dosadna početna faza modeliranja komprimira se iz sati u sekunde, ostavljajući više vremena za kreativni rad koji zaista zahtijeva ljudsku prosudbu.
Meta objava signalizira da se barijera između 2D i 3D ruši. Pitanje sada nije može li AI stvoriti 3D sadržaj iz slika. Već koliko dugo će trajati dok ova sposobnost ne postane standardna značajka u svakom kreativnom alatu.

Alexis
AI InženjerAI inženjer iz Lausannea koji kombinira dubinu istraživanja s praktičnom inovacijom. Dijeli svoje vrijeme između arhitektura modela i alpskih vrhova.