World Labs Marble: Fei-Fei Li'nin Uzamsal Zeka Vizyonu
Yapay zeka öncüsü Fei-Fei Li, metin ve görsellerden keşfedilebilir 3D dünyalar üreten ticari bir platform olan Marble'ı piyasaya sürerek uzamsal yapay zekada yeni bir sınır belirliyor.

ImageNet'ten Dünya Modellerine
Dünya modellerinin yapay zeka video evrimindeki yerine dair bağlam için, dünya modellerinin bir sonraki sınır olarak incelememizi görebilirsiniz.
Fei-Fei Li, modern derin öğrenmeyi mümkün kılan veri seti ImageNet ile bilgisayarlı görüde devrim yarattı. Şimdi, 230 milyon dolar fon ile World Labs'i bir yıl boyunca inşa ettikten sonra, şirketin ilk ticari ürünü olan Marble'ı piyasaya sürdü.
Tez basit: Yapay zeka önce metni, sonra görselleri, ardından videoyu fethetti. Bir sonraki sınır, 3D dünyaları algılama, üretme ve onlarla etkileşim kurma yeteneği olan uzamsal zekadır.
Marble Ne Yapar
Marble, birden fazla girdi türünden kalıcı, indirilebilir 3D ortamlar üretir:
- ✓Metin komutları
- ✓Tek görüntüler
- ✓Videolar
- ✓Panoramalar
- ✓3D düzenler
Decart'ın Oasis'i veya Google'ın Genie'si gibi rakiplerden gelen gerçek zamanlı dünya modellerinin aksine, Marble minimum dönüşüm ile kararlı dünyalar yaratır. Bir kez üretirsiniz, sonra yapay zekanın yarattığını "unutmadan" özgürce keşfedersiniz.
Chisel Editörü
Yapay Zeka Tabanlı 3D Düzenleme
Chisel, uzamsal yapıyı görsel stilden ayırır. Önce düzeninizi bloklayın, sonra metin tabanlı stil rehberliği uygulayın.
Bu hibrit yaklaşım, Marble'ı metin-sahne modellerinden ayırır. Yapay zekanın uzamsal niyetinizi anlamasını ummak yerine, geometriyi açıkça tanımlarsınız. Yapay zeka estetik, malzemeler ve aydınlatmayı halleder.
Bunu, bir iç mimar ile dekorasyon konuşmadan önce bir kat planı çizmek gibi düşünün. Uzamsal ilişkiler üzerindeki kontrol sizde kalır.
Dışa Aktarım Formatları ve Uyumluluk
Oluşturulan dünyalar üç formatta dışa aktarılır:
| Format | Kullanım Alanı |
|---|---|
| Gaussian Splats | Gerçek zamanlı render, yeni görünümler |
| Meshes | Oyun motorları, CAD entegrasyonu |
| Videolar | İçerik oluşturma, ön görselleştirme |
Tüm Marble dünyaları, Vision Pro ve Quest 3 başlıkları ile kutudan çıktığı gibi VR uyumludur.
Fiyatlandırma Yapısı
World Labs dört katman sunar:
| Katman | Fiyat | Üretim Sayısı | Ana Özellikler |
|---|---|---|---|
| Ücretsiz | 0$ | 4/ay | Metin, görüntü veya panorama girdisi |
| Standart | 20$/ay | 12/ay | Çoklu görüntü/video girdisi, gelişmiş düzenleme |
| Pro | 35$/ay | 25/ay | Sahne genişletme, ticari haklar |
| Max | 95$/ay | 75/ay | Tüm özellikler, maksimum üretim |
Ücretsiz katman, teknolojiyi değerlendirmenize olanak tanır. Ticari haklar gerektiren üretim çalışmaları için, ayda 35$ olan Pro katmanı, bu kadar yeni bir yetenek için makul bir giriş fiyatı temsil eder.
Uzamsal Zeka Neden Önemli
"Uzamsal zeka, önümüzdeki on yılın belirleyici zorluğudur." - Fei-Fei Li
Li, mevcut yapay zekanın temel bir sınırlaması olduğunu savunuyor: 3D uzay hakkında kötü akıl yürütüyor. Dil modelleri fizik hakkında halüsinasyon görüyor. Video modelleri imkansız geometriler yaratıyor. Görüntü oluşturucular tutarlı uzamsal ilişkilerle mücadele ediyor.
Robotik için bu son derece önemlidir. Bir mutfakta gezinen bir robot, kare tahminine değil uzamsal anlayışa ihtiyaç duyar. VFX için, yönetmenler sabit kamera yolları değil keşfedilebilir ortamlara ihtiyaç duyar.
Şekillenen Kullanım Alanları
Oyun Ortam atmosferleri ve arka plan alanları üretin. Bağımsız geliştiriciler, geleneksel sanat üretiminde aylar gerektiren keşif alanları yaratabilir.
Görsel Efektler Ön görselleştirme etkileşimli hale gelir. Bir sahneyi uzamsal olarak bloklayın, sonra çekimlere karar vermeden önce kamera açılarını keşfedin.
Mimarlık Kat planlarını keşfedilebilir turlamalara dönüştürün. Müşteriler inşaat başlamadan önce mekanları deneyimler.
Eğitim Li, öğrencilerin bir hücrenin içinde yürüdüğünü, cerrahların anatomik simülasyonlar içinde pratik yaptığını öngörüyor.
Dünya Genişletme ve Composer Modu
İki özellik ölçek sınırlamalarını ele alır:
Dünya Genişletme, oluşturulan bir dünyayı bir kez genişletmenize, kalitenin tipik olarak düştüğü kenar bölgelerine detay eklemenize olanak tanır. Bu, keşfedilebilir alanın sınırlarını ilk üretim limitlerinin ötesine iter.
Composer Modu, birden fazla dünyayı daha büyük ortamlara birleştirir. Bireysel odalar üretin, sonra bunları tam bir binaya dikişleyin.
Bu araçlar mevcut kısıtlamaları kabul ederken pratik çözümler sağlar.
Rekabet Ortamı
Marble kalabalık bir alana giriyor:
| Ürün | Yaklaşım | Ayırt Edici Özellik |
|---|---|---|
| Decart Oasis | Gerçek zamanlı oyun üretimi | Etkileşimli, ancak dünyalar keşif sırasında kayıyor |
| Google Genie | Oyun dünyası üretimi | Gerçek 3D olmadan kare tahmini |
| Odyssey | Kalıcı dünya modelleri | Kurumsal odak |
| World Labs Marble | Statik 3D üretimi | İndirilebilir, düzenlenebilir, VR hazır |
Değiş tokuş açık. Oasis gibi gerçek zamanlı modeller aciliyet ama istikrarsızlık sunar. Marble, etkileşim yerine kalıcılık ve düzenlenebilirliğe öncelik verir.
Video Üretimine Bağlantı
Uzamsal yapay zekada kullanılan difüzyon mimarileri hakkında arka plan için, difüzyon transformatörleri teknik incelememizi görebilirsiniz.
3D dünya üretimi video ile nasıl ilişkilidir? Difüzyon modellerinde matematiksel temelleri paylaşırlar, ancak farklı problemleri çözerler.
Video üretimi zamansal diziler yaratır, kare kare. Uzamsal yapay zeka geometrik temsillar yaratır, yüzeyler ve hacimler. Video "sırada ne olur?" sorusunu yanıtlar. Uzamsal yapay zeka "burada ne var?" sorusunu yanıtlar.
Yakınsama noktası: gezinilebilir video. Bir 3D dünya üretin, sonra içinde hareket ederken video render edin. Bu yaklaşım, saf video üretimi ile imkansız kamera kontrolü sunar.
Dikkate Alınması Gereken Sınırlamalar
Marble tam bir çözüm değil:
- ○Animasyonlu karakterler veya dinamik elementler yok
- ○Üretim limitleri üretim iş akışlarını sınırlayabilir
- ○Kenar bozulması genişletme geçişleri gerektirir
- ○Yalnızca statik ortamlar
Animasyonlu içerik için hala video üretim modellerine ihtiyacınız var. Marble ortamlarda ve mekanlarda mükemmeldir, aktörlerde veya eylemlerde değil.
Daha Büyük Resim
Fei-Fei Li, uzamsal zekayı yapay zeka ilerlemesi için gerekli görüyor:
"Bence hepimizin, yapay zeka daha güçlü hale geldikçe onu daha iyi bir duruma yönlendirmede sorumluluğumuz var. Hepimiz insanlığın galip gelmesini ve gelişmesini istemelidir."
Vizyonu eğlencenin ötesine uzanıyor. Öğrencilerin anatomiyi keşfettiği tıbbi simülasyonlar. Araştırmacıların moleküler yapılarda gezindiği bilimsel görselleştirmeler. Talep üzerine üretilen robotik eğitim ortamları.
Marble birinci adım, ticari bir kavram kanıtı. Araştırma, daha dinamik, etkileşimli ve fiziksel olarak doğru dünya üretimine doğru devam ediyor.
Başlarken
World Labs, ayda 4 üretim ile ücretsiz bir katman sunar. Teknolojiyi değerlendirmek ve sınırlamalarını anlamak için yeterli.
Halihazırda 3D ile çalışan yaratıcılar için, mesh dışa aktarım yeteneği mevcut iş akışlarıyla entegre olur. Video yapımcıları için, video dışa aktarımı başka yerde mevcut olmayan ön görselleştirme yetenekleri sağlar.
İlgili okuma: Yapay zeka video karakter tutarlılığı kılavuzumuz, Marble'ın kalıcı 3D temsil ile ele aldığı bir zorluk olan, üretilen içerik genelinde tutarlılığı koruma tekniklerini kapsar.
2D üretimden 3D dünya yaratımına geçiş, yapay zekanın üretebileceği şeylerde temel bir değişimi temsil eder. Marble bu değişimi erişilebilir kılar.
Bu makale faydalı oldu mu?

Alexis
Yapay Zeka MühendisiLausanne'dan araştırma derinliğini pratik yenilikle birleştiren bir yapay zeka mühendisi. Zamanını model mimarileri ve alp zirveleri arasında paylaşıyor.
İlgili Makaleler
İlgili yazılarla keşfetmeye devam edin

Runway GWM-1: Gerçekliği Gerçek Zamanlı Simüle Eden Genel Dünya Modeli
Runway'in GWM-1'i, video üretmekten dünyaları simüle etmeye doğru bir paradigma kaymasını temsil ediyor. Bu otoregresif modelin keşfedilebilir ortamlar, fotorealistik avatarlar ve robot eğitim simülasyonları nasıl oluşturduğunu keşfedin.

YouTube, Veo 3 Fast'i Shorts'a Getiriyor: 2,5 Milyar Kullanıcı için Ücretsiz Yapay Zeka Video Üretimi
Google, Veo 3 Fast modelini doğrudan YouTube Shorts'a entegre ediyor ve dünya genelindeki içerik üreticilerine sesli metin-video üretimi sunuyor. Bu gelişmenin platform ve yapay zeka video erişilebilirliği için ne anlama geldiğini inceliyoruz.

Video Dil Modelleri: LLM'ler ve Yapay Zeka Ajanlarından Sonraki Sınır
Dünya modelleri, yapay zekaya fiziksel gerçekliği anlamayı öğretiyor. Robotlar artık tek bir aktüatörü hareket ettirmeden önce eylemleri planlayıp sonuçları simüle edebiliyor.