LTX-2: Nativno 4K AI generiranje videa na consumer GPU-ovima kroz open source
Lightricks objavljuje LTX-2 s nativnim 4K generiranjem videa i sinkroniziranim zvukom, nudeći open-source pristup na consumer hardveru dok konkurenti ostaju zaključani u API-ju, iako s važnim kompromisima performansi.

LTX-2: Nativno 4K AI generiranje videa na consumer GPU-ovima kroz open source
Lightricks je objavio LTX-2 u listopadu 2025., uvodeći nativno 4K generiranje videa sa sinkroniziranim zvukom koje radi na consumer GPU-ovima. Dok OpenAI-jev Sora 2 i Googleov Veo 3.1 ostaju zaključani iza API pristupa, LTX-2 ide drugim putem s planovima za potpuno open-source izdanje.
Model gradi na originalnom LTX Video iz studenog 2024. i 13-milijardnom parametarskom LTXV modelu iz svibnja 2025., stvarajući obitelj alata za generiranje videa pristupačnih individualnim kreatorima.
Evolucija LTX obitelji modela
Originalni LTX Video
Pet sekundi generiranja videa u dvije sekunde na high-end hardveru. Bazični model pri rezoluciji 768×512.
LTXV 13B
13-milijardni parametarski model s poboljšanom kvalitetom i mogućnostima
LTX-2 izdanje
Nativna 4K rezolucija pri do 50 FPS sa sinkroniziranim generiranjem zvuka
Očuvanje detalja je superiorno—nativno generiranje održava konzistentnu kvalitetu kroz cijeli pokret. Bez artefakata umjetnog izoštrenja koji progone upscaliranu snimku.
10-sekundni 4K klip zahtijeva 9-12 minuta na RTX 4090, u usporedbi s 20-25 minuta na RTX 3090. Vremena generiranja se značajno povećavaju pri višim rezolucijama.
# Specifikacije LTX obitelji modela
ltx_video_original = {
"resolution": "768x512", # Bazični model
"max_duration": 5, # sekundi
"fps": range(24, 31), # 24-30 FPS
"diffusion_steps": 20,
"h100_time": "4 sekunde za 5-sekundni video",
"rtx4090_time": "11 sekundi za 5-sekundni video"
}
ltx2_capabilities = {
"resolution": "do 3840x2160", # Nativni 4K
"max_duration": 10, # sekundi potvrđeno, 60s eksperimentalno
"fps": "do 50",
"synchronized_audio": True,
"rtx4090_4k_time": "9-12 minuta za 10 sekundi"
}Tehnička arhitektura: Diffusion Transformeri u praksi
Unificiran okvir
LTX-Video implementira Diffusion Transformers (DiT) za generiranje videa, integrirajući više mogućnosti—tekst-u-video, slika-u-video i produženje videa—unutar jednog okvira. Arhitektura obrađuje temporalne informacije dvosmjerno, pomažući održati konzistentnost preko video sekvenci.
Optimizirana difuzija
Model operira s 8-20 difuzijskih koraka ovisno o zahtjevima kvalitete. Manje koraka (8) omogućava brže generiranje za skice, dok 20-30 koraka proizvodi veću kvalitetu. Nije potrebno classifier-free guidance—smanjujući memoriju i računanje.
Multi-modalno kondicioniranje
Podržava više vrsta ulaza istovremeno: tekstualne upite, slike za stil transfer, više ključnih kadrova za kontroliranu animaciju, i postojeće videe za produženje.
Open source strategija i pristupačnost
LTX-2-ov razvoj reflektira namjernu strategiju demokratizacije video AI-a. Dok konkurenti ograničavaju pristup kroz API-je, Lightricks pruža više putova pristupa.
- ✓GitHub repozitorij: Potpuni implementacijski kod
- ✓Hugging Face Hub: Težine modela kompatibilne s Diffusers bibliotekom
- ✓Platformske integracije: Podrška za Fal.ai, Replicate, ComfyUI
- ✓LTX Studio: Direktan pristup kroz preglednik za eksperimentiranje
Etički podaci za trening
Modeli su trenirani na licenciranim setovima podataka od Getty Images i Shutterstock, osiguravajući komercijalnu podobnost—važna distinkcija od modela treniranih na web-scraped podacima s nejasnim statusom autorskih prava.
# Korištenje LTX-Video s Diffusers bibliotekom
from diffusers import LTXVideoPipeline
import torch
# Inicijaliziraj s optimizacijom memorije
pipe = LTXVideoPipeline.from_pretrained(
"Lightricks/LTX-Video",
torch_dtype=torch.float16
).to("cuda")
# Generiraj s konfigurabilnim koracima
video = pipe(
prompt="Aerial view of mountain landscape at sunrise",
num_inference_steps=8, # Brzi draft mode
height=704,
width=1216,
num_frames=121, # ~4 sekunde pri 30fps
guidance_scale=1.0 # Nije potreban CFG
).framesHardverski zahtjevi i performanse u stvarnom svijetu
Stvarna performansa ovisi značajno o konfiguraciji hardvera. Odaberite svoj setup na osnovu specifičnih potreba i budžeta.
GPU-ovi: RTX 3060, RTX 4060
- Mogućnost: 720p-1080p skice pri 24-30 FPS
- Slučaj upotrebe: Prototipiranje, sadržaj društvenih mreža
- Ograničenja: Ne može rukovati 4K generiranjem
GPU-ovi: RTX 4090, A100
- Mogućnost: Nativni 4K bez kompromisa
- Performansa: 10-sekundni 4K u 9-12 minuta
- Slučaj upotrebe: Produkcijski rad koji zahtijeva maksimalnu kvalitetu
Provjera stvarnosti performansi▼
- 768×512 baseline: 11 sekundi na RTX 4090 (u usporedbi s 4 sekunde na H100)
- 4K generiranje: Zahtijeva pažljivo upravljanje memorijom čak i na high-end karticama
- Kvaliteta vs brzina: Korisnici moraju birati između brze niske rezolucije ili spore visoke rezolucije
Napredne značajke za kreatore sadržaja
Mogućnosti produženja videa
LTX-2 podržava dvosmjerno produženje videa, vrijedno za platforme fokusirane na manipulaciju sadržaja:
# Produkcijski pipeline za produženje videa
from ltx_video import LTXPipeline
pipeline = LTXPipeline(model="ltx-2", device="cuda")
# Generiraj početni segment
initial = pipeline.generate(
prompt="Robot exploring ancient ruins",
resolution=(1920, 1080),
duration=5
)
# Produži s vođenjem ključnog kadra
extended = pipeline.extend_video(
video=initial,
direction="forward",
keyframes=[
{"frame": 150, "prompt": "Robot discovers artifact"},
{"frame": 300, "prompt": "Artifact activates"}
]
)Ova mogućnost produženja dobro se slaže s platformama za manipulaciju videa poput Bonega.ai, omogućavajući ekspanziju sadržaja uz održavanje vizualne konzistentnosti.
LTX-2 generira zvuk tijekom kreiranja videa umjesto kao post-processing. Model usklađuje zvuk s vizualnim pokretom—brzi pokreti pokreću odgovarajuće audio akcente, stvarajući prirodne audiovizualne odnose bez ručne sinkronizacije.
Analiza trenutne konkurencije (Studeni 2025.)
- Jedini open-source model s nativnim 4K-om
- Radi na consumer hardveru—bez API naknada
- Potpuna lokalna kontrola i privatnost
- Prilagodljiv za specifične tokove rada
- Sporija vremena generiranja od cloud rješenja
- Niža bazična rezolucija (768×512) od konkurenata
- Zahtijeva značajnu lokalnu GPU investiciju
- Kvaliteta pri 1080p ne odgovara Sora 2
OpenAI Sora 2
Izdano: 30. rujna 2025.
- 25-sekundni videi sa zvukom
- 1080p nativno, izvrsni detalji
- ChatGPT Pro pretplata
- Samo cloud obrada
SoulGen 2.0
Izdano: 23. studenog 2025.
- Preciznost pokreta: MPJPE 42.3mm
- Vizualna kvaliteta: SSIM 0.947
- Zahtijeva cloud obradu
Google Veo 3.1
Izdano: Listopad 2025.
- 8s osnova, proširivo do 60s+
- Visoka kvaliteta na TPU infrastrukturi
- API pristup s limitima
LTX-2
Izdano: Listopad 2025.
- Nativni 4K pri 50 FPS
- Open source, radi lokalno
- 10s osnova, eksperimentalno 60s
Praktična razmatranja implementacije
- Privatnost-kritične aplikacije koje zahtijevaju lokalnu obradu
- Neograničeno generiranje bez troškova po upotrebi
- Prilagođeni tokovi rada koji trebaju modifikaciju modela
- Istraživanje i eksperimentiranje
- Dugoročna produkcija s velikim potrebama volumena
- Vremenska osjetljiva produkcija koja zahtijeva brzi obrat
- Projekti koji trebaju konzistentnu 1080p+ kvalitetu
- Ograničeni lokalni GPU resursi
- Jednokratna generiranja gdje su API troškovi prihvatljivi
- Potreba za trenutnom enterprise podrškom
Utjecaj Open Source ekosustava
Inovacija zajednice
LTX modeli potaknuli su opsežna razvojana zajednice, demonstrirajući moć open-source AI-a.
- ✓ComfyUI nodovi za vizualno kreiranje tijeka rada
- ✓Fine-tuned varijante za specifične stilove i slučajeve upotrebe
- ✓Optimizacijski projekti za AMD i Apple Silicon
- ✓Integracijske biblioteke za različite programske jezike
Ovaj rast ekosustava demonstrira vrijednost open-source izdanja, čak i dok pune LTX-2 težine čekaju javnu dostupnost (vremenski okvir čeka službenu objavu).
Budući razvoji i putokaz
Puno izdanje težina
Potpune LTX-2 težine modela za upotrebu zajednice (datum nespecificiran)
Proširene mogućnosti
Generiranje preko 10 sekundi s poboljšanom učinkovitošću memorije za consumer GPU-ove
Evolucija vođena zajednicom
Mobilna optimizacija, pregledi u realnom vremenu, poboljšane kontrole i specijalizirane varijante
Zaključak: Razumijevanje kompromisa
LTX-2 nudi različit pristup AI generiranju videa, prioritetizirajući pristupačnost nad vrhunskom performansom. Za kreatore i platforme koje rade s produženjem i manipulacijom videa, pruža vrijedne mogućnosti unatoč ograničenjima.
- Potpuna lokalna kontrola i privatnost
- Bez limita upotrebe ili povratnih troškova
- Prilagodljiv za specifične tokove rada
- Mogućnost nativnog 4K generiranja
- Open-source fleksibilnost
- Vremena generiranja mjerena u minutama, ne sekundama
- Bazična rezolucija niža od konkurenata
- Visoki VRAM zahtjevi za 4K
- Kvaliteta pri 1080p ne odgovara Sora 2 ili Veo 3.1
Donošenje izbora
Izbor između LTX modela i vlasničkih alternativa ovisi o specifičnim prioritetima. Za eksperimentalni rad, privatno osjetljivi sadržaj ili neograničene potrebe generiranja, LTX-2 pruža neusporedivu vrijednost. Za vremenski kritičnu produkciju koja zahtijeva maksimalnu kvalitetu pri 1080p, cloud API-ji mogu biti prikladniji.
Kako AI generiranje videa sazrijeva u 2025., vidimo pojavu zdravog ekosustava s i otvorenim i zatvorenim rješenjima. LTX-2-ov doprinos nije u premašivanju vlasničkih modela u svakoj metrici, već u osiguravanju da profesionalni alati za generiranje videa ostanu pristupačni svim kreatorima, bez obzira na budžet ili API pristup. Ova demokratizacija, čak i s kompromisima, proširuje mogućnosti kreativnog izražavanja i tehničke inovacije u video AI-u.
Je li vam ovaj članak bio koristan?

Damien
AI ProgramerAI programer iz Lyona koji voli pretvarati složene ML koncepte u jednostavne recepte. Kada ne otklanja greške u modelima, možete ga naći kako vozi bicikl kroz dolinu Rhône.
Povezani članci
Nastavite istraživati s ovim povezanim objavama

PixVerse R1: Zora videa AI u stvarnom vremenu interaktivnog
Tvrtka PixVerse s potporom Alibabe otkriva R1, prvi svjetski model sposoban generiranja videa 1080p, koji se odmah reaguje na unos korisnika, otvarajući vrata beskonačnim igrama i interaktivnoj kinematografiji.

NVIDIA CES 2026: 4K AI generiranje videa za potrošače konačno je stiglo
NVIDIA najavljuje 4K AI generiranje videa s RTX podrškom na CES 2026, donoseći mogućnosti profesionalne razine potrošačkim GPU-ovima uz 3x brže renderiranje i 60% manje VRAM-a.

AI video modeli otvorenog koda konačno sustižu
Wan 2.2, HunyuanVideo 1.5 i Open-Sora 2.0 smanjuju jaz s vlasničkim divovima. Evo što to znači za kreatore i poduzeća.