World Labs Marble: A Visão de Fei-Fei Li para Inteligência Espacial
A pioneira de IA Fei-Fei Li lança Marble, uma plataforma comercial que gera mundos 3D exploráveis a partir de texto e imagens, marcando uma nova fronteira na IA espacial.

De ImageNet aos Modelos de Mundo
Para contexto sobre como os modelos de mundo se inserem na evolução do vídeo IA, veja a nossa visão geral dos modelos de mundo como próxima fronteira.
Fei-Fei Li revolucionou a visão computacional com ImageNet, o conjunto de dados que tornou possível o deep learning moderno. Agora, após um ano a construir World Labs com 230 milhões de dólares em financiamento, ela lançou Marble, o primeiro produto comercial da empresa.
A tese é simples: a IA conquistou o texto, depois as imagens, depois o vídeo. A próxima fronteira é a inteligência espacial, a capacidade de perceber, gerar e interagir com mundos 3D.
O que o Marble Faz
Marble gera ambientes 3D persistentes e descarregáveis a partir de vários tipos de entrada:
- ✓Prompts de texto
- ✓Imagens individuais
- ✓Vídeos
- ✓Panoramas
- ✓Layouts 3D
Ao contrário dos modelos de mundo em tempo real de concorrentes como Oasis da Decart ou Genie da Google, Marble cria mundos estáveis com morphing mínimo. Você gera uma vez, depois explora livremente sem que a IA "esqueça" o que criou.
O Editor Chisel
Edição 3D Nativa IA
Chisel desacopla a estrutura espacial do estilo visual. Esboce primeiro o seu layout, depois aplique orientações de estilo baseadas em texto.
Esta abordagem híbrida distingue Marble dos modelos texto-para-cena. Em vez de esperar que a IA entenda a sua intenção espacial, você define explicitamente a geometria. A IA trata da estética, materiais e iluminação.
Pense nisso como desenhar uma planta baixa antes de pedir a um designer de interiores para decorar. O controlo sobre as relações espaciais permanece seu.
Formatos de Exportação e Compatibilidade
Os mundos gerados exportam em três formatos:
| Formato | Caso de Uso |
|---|---|
| Gaussian Splats | Renderização em tempo real, novas vistas |
| Malhas | Motores de jogo, integração CAD |
| Vídeos | Criação de conteúdo, pré-visualização |
Todos os mundos Marble são compatíveis com VR com headsets Vision Pro e Quest 3 desde o início.
Estrutura de Preços
World Labs oferece quatro níveis:
| Nível | Preço | Gerações | Características Principais |
|---|---|---|---|
| Gratuito | $0 | 4/mês | Entrada de texto, imagem ou panorama |
| Standard | $20/mês | 12/mês | Entrada multi-imagem/vídeo, edição avançada |
| Pro | $35/mês | 25/mês | Expansão de cena, direitos comerciais |
| Max | $95/mês | 75/mês | Todas as funcionalidades, gerações máximas |
O nível gratuito permite avaliar a tecnologia. Para trabalho de produção que requer direitos comerciais, o nível Pro a $35/mês representa um preço de entrada razoável para uma capacidade tão inovadora.
Por que a Inteligência Espacial Importa
"A inteligência espacial é o desafio definidor da próxima década." - Fei-Fei Li
Li argumenta que a IA atual tem uma limitação fundamental: raciocina mal sobre o espaço 3D. Os modelos de linguagem alucinam física. Os modelos de vídeo criam geometrias impossíveis. Os geradores de imagens têm dificuldade com relações espaciais consistentes.
Para a robótica, isso importa enormemente. Um robô a navegar numa cozinha precisa de compreensão espacial, não de previsão de frames. Para efeitos visuais, os realizadores precisam de ambientes exploráveis, não de trajetórias de câmera fixas.
Casos de Uso em Formação
Jogos Gere ambientes de atmosfera e espaços de fundo. Desenvolvedores indie podem criar áreas de exploração que exigiriam meses de produção artística tradicional.
Efeitos Visuais A pré-visualização torna-se interativa. Esboce uma cena espacialmente, depois explore ângulos de câmera antes de se comprometer com planos.
Arquitetura Converta plantas baixas em passeios exploráveis. Os clientes experimentam espaços antes do início da construção.
Educação Li imagina estudantes a caminhar dentro de uma célula, cirurgiões a praticar dentro de simulações anatómicas.
Expansão de Mundo e Modo Composer
Duas funcionalidades abordam limitações de escala:
A Expansão de Mundo permite estender um mundo gerado uma vez, adicionando detalhes às regiões periféricas onde a qualidade tipicamente degrada. Isso empurra os limites do espaço explorável além dos limites iniciais de geração.
O Modo Composer combina múltiplos mundos em ambientes maiores. Gere salas individuais, depois costure-as num edifício completo.
Estas ferramentas reconhecem as restrições atuais enquanto fornecem soluções práticas.
O Cenário Competitivo
Marble entra num campo lotado:
| Produto | Abordagem | Diferenciador |
|---|---|---|
| Decart Oasis | Geração de jogo em tempo real | Interativo, mas os mundos mudam durante a exploração |
| Google Genie | Geração de mundo de jogo | Previsão de frames sem verdadeiro 3D |
| Odyssey | Modelos de mundo persistentes | Foco empresarial |
| World Labs Marble | Geração 3D estática | Descarregável, editável, VR-ready |
O compromisso é claro. Modelos em tempo real como Oasis oferecem imediatismo mas instabilidade. Marble prioriza persistência e editabilidade sobre interatividade.
Conexão à Geração de Vídeo
Para contexto sobre arquiteturas de difusão usadas na IA espacial, veja a nossa visão geral técnica dos transformers de difusão.
Como é que a geração de mundos 3D se relaciona com o vídeo? Partilham fundações matemáticas nos modelos de difusão, mas resolvem problemas diferentes.
A geração de vídeo cria sequências temporais, frame após frame. A IA espacial cria representações geométricas, superfícies e volumes. O vídeo responde "o que acontece a seguir?" A IA espacial responde "o que existe aqui?"
O ponto de convergência: vídeo navegável. Gere um mundo 3D, depois renderize o vídeo enquanto se move através dele. Esta abordagem oferece controlo de câmera impossível com geração de vídeo pura.
Limitações a Considerar
Marble não é uma solução completa:
- ○Sem personagens animados ou elementos dinâmicos
- ○Os limites de geração podem limitar fluxos de produção
- ○A degradação nas bordas requer passagens de expansão
- ○Apenas ambientes estáticos
Para conteúdo animado, ainda precisa de modelos de geração de vídeo. Marble excele em ambientes e espaços, não em atores ou ações.
O Quadro Geral
Fei-Fei Li vê a inteligência espacial como essencial para o progresso da IA:
"Penso que todos temos a responsabilidade de conduzir a IA a um estado melhor à medida que se torna mais poderosa. Todos devemos querer que a humanidade prevaleça e prospere."
A sua visão estende-se além do entretenimento. Simulações médicas onde os estudantes exploram a anatomia. Visualizações científicas onde os investigadores navegam estruturas moleculares. Ambientes de treino robótico gerados a pedido.
Marble é o primeiro passo, uma prova de conceito comercial. A investigação continua em direção a uma geração de mundos mais dinâmica, interativa e fisicamente precisa.
Como Começar
World Labs oferece um nível gratuito com 4 gerações por mês. Suficiente para avaliar a tecnologia e compreender as suas restrições.
Para criadores que já trabalham em 3D, a capacidade de exportação de malha integra-se com pipelines existentes. Para produtores de vídeo, a exportação de vídeo fornece capacidades de pré-visualização indisponíveis noutros lugares.
Leitura relacionada: O nosso guia sobre consistência de personagens em vídeo IA cobre técnicas para manter a coerência em conteúdo gerado, um desafio que Marble aborda através da representação 3D persistente.
A transição da geração 2D para a criação de mundos 3D representa uma mudança fundamental no que a IA pode produzir. Marble torna essa mudança acessível.
Este artigo foi útil?

Alexis
Engenheiro de IAEngenheiro de IA de Lausanne que combina profundidade de investigação com inovação prática. Divide o seu tempo entre arquiteturas de modelos e picos alpinos.
Artigos Relacionados
Continue a explorar com estes artigos relacionados

Runway GWM-1: O modelo mundial geral que simula a realidade em tempo real
O GWM-1 da Runway marca uma mudança de paradigma da geração de vídeos para a simulação de mundos. Descubra como este modelo autorregressivo cria ambientes exploráveis, avatares fotorrealistas e simulações de treino robótico.

YouTube traz Veo 3 Fast para Shorts: geração de vídeo com IA grátis para 2,5 bilhões de usuários
O Google integra seu modelo Veo 3 Fast diretamente no YouTube Shorts, oferecendo geração de vídeo a partir de texto com áudio para criadores do mundo todo, de graça. Veja o que isso significa para a plataforma e a acessibilidade do vídeo com IA.

Video Language Models: A Nova Fronteira Depois dos LLMs e Agentes de IA
Os world models estão ensinando a IA a compreender a realidade física, permitindo que robôs planejem ações e simulem resultados antes de mover um único atuador.