Meta SAM 3D: Z plochých obrázků na kompletní 3D modely během sekund
Meta právě vydala SAM 3 a SAM 3D, které dokážou z jednoho 2D obrázku vytvořit detailní 3D síť během několika sekund. Ukazujeme, co to znamená pro tvůrce a vývojáře.

Meta 19. listopadu 2025 vydala něco podstatného. SAM 3D nyní dokáže z jednoho 2D obrázku vygenerovat kompletní 3D síť během několika sekund. To, co dříve vyžadovalo hodiny manuálního modelování nebo drahé fotogrammetrické vybavení, se teď stane jediným kliknutím.
Problém, který SAM 3D řeší
Vytváření 3D aktiv vždy představovalo překážku. Ať už vyvíjíte hru, navrhujete vizualizaci produktu nebo vytváříte AR zážitek, proces obvykle vypadá takto:
Ruční modelování
Umělec stráví 4-8 hodin sochařením jediného objektu v Blenderu nebo Maye
Snímání z více úhlů
Pořiďte 50-200 fotek ze všech stran, zpracujte přes noc, ručně vyčistěte artefakty
Jediný obrázek
Nahrajte jednu fotku, obdržíte texturovanou 3D síť během sekund
Důsledky jsou podstatné. Tvorba 3D obsahu se právě stala dostupnou pro každého s fotoaparátem.
Jak SAM 3D funguje
SAM 3D staví na architektuře Segment Anything Model od Mety, ale rozšiřuje ji do tří dimenzí. Systém přichází ve dvou specializovaných variantách:
SAM 3D Objects
- Optimalizováno pro objekty a scény
- Zvládá komplexní geometrii
- Funguje s libovolnými tvary
- Nejlepší pro produkty, nábytek, prostředí
SAM 3D Body
- Specializováno pro lidské postavy
- Přesně zachycuje proporce těla
- Zpracovává oblečení a doplňky
- Nejlepší pro avatary, tvorbu postav
Architektura používá enkodér založený na transformeru, který předpovídá hloubku, normály povrchu a geometrii současně. Na rozdíl od předchozích metod pro 3D z jednoho obrázku, které často vytvářely nepřesné, přibližné tvary, SAM 3D zachovává ostré hrany a jemné geometrické detaily.
SAM 3D vytváří standardní formáty sítí kompatibilní s Unity, Unreal Engine, Blenderem a většinou 3D softwaru. Žádné proprietární uzamčení.
SAM 3 pro video: Izolace objektů na základě textu
Zatímco SAM 3D řeší konverzi z 2D na 3D, SAM 3 se zaměřuje na segmentaci videa s významným vylepšením: dotazy založené na textu.
Předchozí verze vyžadovaly kliknutí na objekty, abyste je vybrali. SAM 3 vám umožňuje popsat, co chcete izolovat:
- "Vyber všechna červená auta"
- "Sleduj osobu v modré bundě"
- "Izoluj budovy na pozadí"
Model dosahuje 47,0 zero-shot průměrné přesnosti masky, což je 22% zlepšení oproti předchozím systémům. Důležitější je, že dokáže zpracovat přes 100 objektů současně v jednom snímku videa.
Integrace s Meta Edits
SAM 3 je již integrován do aplikace Meta Edits pro tvorbu videa. Tvůrci mohou aplikovat efekty, změny barev a transformace na konkrétní objekty pomocí popisů v přirozeném jazyce místo ručního maskování snímek po snímku.
Technická architektura
Pro ty, kdo mají zájem o detaily, SAM 3D používá vícehlávkovou architekturu, která předpovídá několik vlastností současně:
Predikční hlavy:
- Mapa hloubky: Vzdálenost každého pixelu od kamery
- Normály povrchu: 3D orientace v každém bodě
- Sémantická segmentace: Hranice a kategorie objektů
- Topologie sítě: Spojení trojúhelníků pro 3D výstup
Model byl trénován na kombinaci reálných 3D skenů a syntetických dat. Meta nezveřejnila přesnou velikost datasetu, ale zmiňuje "miliony instancí objektů" ve své technické dokumentaci.
SAM 3D zpracovává obrázky na více rozlišeních současně, což mu umožňuje zachytit jak jemné detaily (textury, hrany), tak globální strukturu (celkový tvar, proporce) v jediném průchodu.
Praktické aplikace
- Vizualizace produktů pro e-commerce
- AR zkušenosti s vyzkoušením
- Prototypování herních aktiv
- Architektonická vizualizace
- Vzdělávací 3D modely
- Rekonstrukce z jednoho pohledu má inherentní nejednoznačnost
- Zadní strany objektů jsou odvozené, ne pozorované
- Vysoce reflexní nebo průhledné povrchy mají problémy
- Velmi tenké struktury se nemusí dobře rekonstruovat
Omezení jediného pohledu je zásadní: model vidí pouze jednu stranu objektu. Skrytou geometrii odvozuje na základě naučených priorit, což funguje dobře pro běžné objekty, ale může produkovat neočekávané výsledky u neobvyklých tvarů.
Dostupnost a přístup
SAM 3D je k dispozici nyní prostřednictvím Segment Anything Playground na webu Mety. Pro vývojáře už Roboflow vytvořil integraci pro vlastní doladění na objekty specifické pro doménu.
- ✓Webové hřiště: Dostupné nyní
- ✓Přístup k API: Dostupný pro vývojáře
- ✓Integrace Roboflow: Připravena pro doladění
- ○Lokální nasazení: Váhy brzy k dispozici
API je zdarma pro výzkum a omezené komerční použití. Komerční aplikace s vysokým objemem vyžadují samostatnou dohodu s Metou.
Co to znamená pro odvětví
Bariéra pro tvorbu 3D obsahu právě významně klesla. Uvažte důsledky:
Pro vývojáře her: Rychlé prototypování se stává triviálním. Vyfotíte reálné objekty, získáte použitelná 3D aktiva během sekund, dále iterujete.
Pro e-commerce: Produktová fotografie může automaticky generovat 3D modely pro funkce AR náhledu. Není potřeba samostatná 3D produkční linka.
Pro pedagogy: Historické artefakty, biologické vzorky nebo inženýrské komponenty se mohou stát interaktivními 3D modely z existujících fotografií.
Pro tvůrce AR/VR: Naplnění virtuálních prostředí realistickými objekty již nevyžaduje rozsáhlé znalosti 3D modelování.
Kombinace SAM 3 (segmentace videa) a SAM 3D (3D rekonstrukce) umožňuje pracovní postupy, kde můžete segmentovat objekt z videozáznamu a pak tento segmentovaný objekt převést na 3D model. Extrakce a rekonstrukce v jedné lince.
Širší obraz
SAM 3D představuje širší trend: AI systematicky odstraňuje překážky z tvůrčích pracovních postupů. Viděli jsme to u generování obrázků, pak videa a nyní 3D modelování.
Technologie není dokonalá. Komplexní scény s překrytím, neobvyklé materiály nebo složitá geometrie systém stále kladou výzvy. Ale základní schopnost, převést jakoukoli fotografii na použitelnou 3D síť, je nyní dostupná každému.
Pro profesionální 3D umělce to není náhrada, ale nástroj. Vygenerujte základní síť během sekund, pak ji ručně dolaďte. Nudná počáteční fáze modelování se zmenší z hodin na sekundy, což zanechá více času na tvůrčí práci, která skutečně vyžaduje lidský úsudek.
Vydání od Mety signalizuje, že bariéra mezi 2D a 3D se hroutí. Otázka nyní není, zda AI dokáže vytvářet 3D obsah z obrázků. Je to, jak dlouho potrvá, než se tato schopnost stane standardní funkcí v každém tvůrčím nástroji.

Alexis
AI inženýrAI inženýr z Lausanne kombinující hloubku výzkumu s praktickými inovacemi. Čas dělí mezi architekturami modelů a alpskými vrcholky.