LTX-2: Innfædd 4K gervigreindarmyndmyndun á notendavélar í gegnum opinn hugbúnað
Lightricks gefur út LTX-2 með innfæddri 4K myndmyndun og samstilltu hljóði og býður upp á opinn hugbúnaðaraðgang á notendavélbúnaði á meðan keppinautar haldast API-læstir þó með mikilvægum afkastavigtum.

LTX-2: Innfædd 4K gervigreindarmyndmyndun á notendavélar í gegnum opinn hugbúnað
Lightricks gaf út LTX-2 í október 2025 og kynnti innfædda 4K myndmyndun með samstilltu hljóði sem keyrir á notendavélum. Á meðan Sora 2 frá OpenAI og Veo 3.1 frá Google haldast læst á bak við API aðgang tekur LTX-2 aðra leið með áætlunum um fulla opinn hugbúnaðarútgáfu.
Líkanið byggir á upprunalegu LTX Video frá nóvember 2024 og 13 milljarða breytu LTXV líkaninu frá maí 2025 og býr til fjölskyldu af myndmyndunarverkfærum sem eru aðgengileg einstökum skaparum.
Þróun LTX líkanafjölskyldunnar
Upprunalegt LTX Video
Fimm sekúndur af myndmyndun á tveimur sekúndum á hágæða vélbúnaði. Grunnlíkan við 768×512 upplausn.
LTXV 13B
13 milljarða breytu líkan með auknum gæðum og getu
LTX-2 útgáfa
Innfædd 4K upplausn við allt að 50 FPS með samstilltri hljóðmyndun
Smáatriðavarðveisla er betri—innfædd myndun heldur samræmdum gæðum í gegnum hreyfingu. Engin gervi skerptaðgalla sem plága uppfærða upptöku.
10 sekúndna 4K klippi krefst 9-12 mínútna á RTX 4090 samanborið við 20-25 mínútur á RTX 3090. Myndunarstími eykst verulega við hærri upplausnir.
# LTX líkanafjölskylduforskriftir
ltx_video_original = {
"resolution": "768x512", # Grunnlíkan
"max_duration": 5, # sekúndur
"fps": range(24, 31), # 24-30 FPS
"diffusion_steps": 20,
"h100_time": "4 sekúndur fyrir 5 sekúndna myndband",
"rtx4090_time": "11 sekúndur fyrir 5 sekúndna myndband"
}
ltx2_capabilities = {
"resolution": "allt að 3840x2160", # Innfædd 4K
"max_duration": 10, # sekúndur staðfestar, 60s tilraunakennt
"fps": "allt að 50",
"synchronized_audio": True,
"rtx4090_4k_time": "9-12 mínútur fyrir 10 sekúndur"
}Tæknileg uppbyggin: Dreifingaummyndarar í framkvæmd
Sameinaður rammi
LTX-Video innleiðir Dreifingaummyndara (DiT) fyrir myndmyndun og samþættir margar getu—texti-til-myndbands, mynd-til-myndbands og myndbandslenging—innan eins ramma. Uppbyggingin vinnur úr tímabundnum upplýsingum tvíátta og hjálpar til við að viðhalda samræmi yfir myndbandsrunur.
Bestaður dreifing
Líkanið starfar með 8-20 dreifingaþrep eftir gæðakröfum. Færri þrep (8) gera hraðari myndun fyrir drög á meðan 20-30 þrep framleiða hærri gæði framleiðslu. Engin flokkandi-laus leiðbeining nauðsynleg—minnkar minni og reikning.
Margeiginleikaleg skilyrðing
Styður margar inntaksgerðir samtímis: textalýsingar, myndinntak fyrir stílflutning, margar lykil ramma fyrir stýrða hreyfimynd og núverandi myndband fyrir lenging.
Opinn hugbúnaðarstefna og aðgengi
Þróun LTX-2 endurspeglar vísvitna stefnu til að lýðræðisstýra myndbandsgervigreind. Á meðan keppinautar takmarka aðgang í gegnum API veitir Lightricks margar aðgangssleiðir.
- ✓GitHub geymsla: Heildar útfærslukóði
- ✓Hugging Face Hub: Líkansvigt samhæfð með Diffusers safni
- ✓Pallsamþættingar: Fal.ai, Replicate, ComfyUI stuðningur
- ✓LTX Studio: Beinn vafraraðgangur fyrir tilraunir
Siðferðileg þjálfunargögn
Líkönin voru þjálfuð á leyfisveittum gagnasöfnum frá Getty Images og Shutterstock og tryggja viðskiptahæfni—mikilvæg aðgreining frá líkönum þjálfuðum á vefskröpuðum gögnum með óskýrri höfundarréttarstöðu.
# Nota LTX-Video með Diffusers safni
from diffusers import LTXVideoPipeline
import torch
# Byrja með minnisbestun
pipe = LTXVideoPipeline.from_pretrained(
"Lightricks/LTX-Video",
torch_dtype=torch.float16
).to("cuda")
# Mynda með stillanlegum þrepum
video = pipe(
prompt="Loftmynd af fjallalandi við sólarupprás",
num_inference_steps=8, # Hraður drögunarhamur
height=704,
width=1216,
num_frames=121, # ~4 sekúndur við 30fps
guidance_scale=1.0 # Engin CFG nauðsynleg
).framesVélbúnaðarkröfur og raunverulegar afköst
Raunveruleg afköst fara mjög eftir vélbúnaðarstillingu. Veldu uppsetningu þína út frá sérstökum þörfum þínum og fjárhagsáætlun.
GPUs: RTX 3060, RTX 4060
- Geta: 720p-1080p drög við 24-30 FPS
- Notkunartilvik: Frumgerðir, samfélagsmiðlaefni
- Takmarkanir: Getur ekki höndlað 4K myndun
GPUs: RTX 4090, A100
- Geta: Innfædd 4K án málamiðlana
- Afköst: 10 sekúndna 4K á 9-12 mínútum
- Notkunartilvik: Framleiðsluvinna sem krefst hámarksgæða
Afkastaveruleikakannun▼
- 768×512 grunnlína: 11 sekúndur á RTX 4090 (samanborið við 4 sekúndur á H100)
- 4K myndun: Krefst vandlegrar minnisstjórnunar jafnvel á hágæða spjöldum
- Gæði gegn hraða: Notendur verða að velja milli hraðs lággæða eða hægs hágæða framleiðslu
Háþróaðir eiginleikar fyrir efnisskaparafólk
Myndbandslengingarget
LTX-2 styður tvíátta myndbandslenging sem er verðmæt fyrir palla sem einbeita sér að efnismeðhöndlun:
# Framleiðsluferli fyrir myndbandslenging
from ltx_video import LTXPipeline
pipeline = LTXPipeline(model="ltx-2", device="cuda")
# Mynda upphafshluta
initial = pipeline.generate(
prompt="Vélmenni að kanna fornar rústir",
resolution=(1920, 1080),
duration=5
)
# Lengja með lykil rammaleiðbeining
extended = pipeline.extend_video(
video=initial,
direction="forward",
keyframes=[
{"frame": 150, "prompt": "Vélmenni uppgötvar forngrip"},
{"frame": 300, "prompt": "Forngrip virkjast"}
]
)Þessi lengingarget passar vel við myndbandsmeðferðarpalla eins og Bonega.ai og gerir efnisútvíkkun kleifa á meðan hún heldur myndrænu samræmi.
LTX-2 myndar hljóð við myndbandasköpun frekar en sem eftirvinnslu. Líkanið samræmir hljóð við myndræna hreyfingu—hraðar hreyfingar kveikja á samsvarandi hljóðáherslu og búa til náttúruleg hljóð- og myndsambönd án handvirkrar samstillingar.
Núverandi keppnisgreining (nóvember 2025)
- Eina opinn hugbúnaðarlíkan með innfædda 4K
- Keyrir á notendavélbúnaði—engin API gjöld
- Alger staðbundin stjórn og friðhelgi
- Sérsniðanlegt fyrir sérstaka vinnuferla
- Hægari myndunarstími en skýjalausnir
- Lægri grunnupplausn (768×512) en keppinautar
- Krefst verulegrar staðbundinnar GPU fjárfestingar
- Gæði við 1080p passa ekki við Sora 2
OpenAI Sora 2
Útgefið: 30. september 2025
- 25 sekúndna myndbönd með hljóði
- 1080p innfædd, framúrskarandi smáatriði
- ChatGPT Pro áskrift
- Aðeins skýjavinnsla
SoulGen 2.0
Útgefið: 23. nóvember 2025
- Hreyfinganákvæmni: MPJPE 42.3mm
- Myndgæði: SSIM 0.947
- Skýjavinnsla nauðsynleg
Google Veo 3.1
Útgefið: október 2025
- 8s grunn, lengjanlegur í 60s+
- Há gæði á TPU innviðum
- API aðgangur með takmörkunum
LTX-2
Útgefið: október 2025
- Innfædd 4K við 50 FPS
- Opinn hugbúnaður, keyrir staðbundið
- 10s grunn, tilraunakennt 60s
Hagnýt innleiðingarsjónarmið
- Friðhelmismikilleg forrit sem krefjast staðbundinnar vinnslu
- Ótakmörkuð myndun án notkunargjalda
- Sérsniðnir vinnuferlar sem þurfa líkanbreytingu
- Rannsóknir og tilraunir
- Langtímaframleiðsla með mikla umfangþörf
- Tímanæm framleiðsla sem krefst hraðrar afgreiðslu
- Verkefni sem þurfa samræmd 1080p+ gæði
- Takmarkað staðbundið GPU úrræði
- Einskiptismyndanir þar sem API kostnaður er viðunandi
- Þörf fyrir tafarlausan fyrirtækjastuðning
Áhrif opins hugbúnaðarvistkerfi
Samfélagsnýjung
LTX líkönin hafa vakið víðtæka samfélagsþróun og sýnt kraft opins hugbúnaðar gervigreindar.
- ✓ComfyUI hnútar fyrir sjónræna vinnuflæðissköpun
- ✓Fínstillt afbrigði fyrir sérstaka stíla og notkunartilvik
- ✓Bestunarverkefni fyrir AMD og Apple Silicon
- ✓Samþættingarsöfn fyrir ýmis forritunarmál
Þessi vistkerfisþróun sýnir gildi opins hugbúnaðarútgáfu jafnvel þegar full LTX-2 vægi bíða opinbers framboðs (tímalína bíður opinberrar tilkynningar).
Framtíðarþróun og vegvísir
Full vægiútgáfa
Heildar LTX-2 líkansvægi fyrir samfélagsnotkun (dagsetning óskráð)
Aukin geta
Myndun fyrir utan 10 sekúndur með bættri minniskunnugleika fyrir notendavélar
Samfélagsdrifin þróun
Farsímabelstun, rauntíma forskoðanir, auknar stjórnir og sérhæfð afbrigði
Niðurstaða: Skilningur á vigtum
LTX-2 býður upp á aðgreinda nálgun við gervigreindarmyndmyndun og setur aðgengi fram yfir hámarks afköst. Fyrir skaparafólk og palla sem vinna með myndbandslenging og meðferð veitir það verðmæta getu þrátt fyrir takmarkanir.
- Algert staðbundið stjórn og friðhelgi
- Engin notkunartakmörk eða endurtekinn kostnaður
- Sérsniðanlegt fyrir sérstaka vinnuferla
- Innfædd 4K myndunarget
- Opinn hugbúnaðarsveigjanleiki
- Myndunarstími mælist í mínútum, ekki sekúndum
- Grunnupplausn lægri en keppinautar
- Háar VRAM kröfur fyrir 4K
- Gæði við 1080p passa ekki við Sora 2 eða Veo 3.1
Að velja
Valið milli LTX líkana og séreigandi valkosta fer eftir sérstökum forgangsröðunum. Fyrir tilraunakennda vinnu, friðhelmisviðkvæmt efni eða ótakmarkaða myndunarþörf veitir LTX-2 óviðjafnanlegt gildi. Fyrir tímamikillu framleiðslu sem krefst hámarks gæða við 1080p gætu skýja API verið viðeigandi.
Þegar gervigreindarmyndmyndun þroskast árið 2025 sjáum við hollt vistkerfis koma upp með bæði opnum og lokuðum lausnum. Framlag LTX-2 liggur ekki í því að fara fram úr séreigandi líkönum í öllum mælikvarða heldur að tryggja að faglega myndmyndunarverkfæri haldist aðgengileg öllum skaparum óháð fjárhagsáætlun eða API aðgangi. Þessi lýðræðisvæðing, jafnvel með vigtum, víkkar möguleika fyrir skapandi tjáningu og tæknilega nýjung í myndbandsgervigreind.
Var þessi grein gagnleg?

Damien
GervigreindarforritariGervigreindarforritari frá Lyon sem elskar að breyta flóknum ML hugmyndum í einfaldar uppskriftir. Þegar hann er ekki að kemba villur úr líkönum finnurðu hann á hjólinu í gegnum Rhône dalinn.
Tengdar greinar
Haltu áfram að kanna með þessum tengdu færslum

PixVerse R1: Gry AI-vídeó sem svarar rauntíma
Alibaba-studd PixVerse sýnir R1, fyrsta heimsrédla sem myndar 1080p myndbandið og bregst strax við innslagi notanda, og opnar dyr að óendanlegum leikjum og gagnvirkri kvikmynd.

NVIDIA CES 2026: 4K gervigreindar myndbandsgerð loksins aðgengileg neytendum
NVIDIA tilkynnir RTX-knúna 4K gervigreindar myndbandsgerð á CES 2026, sem færir faglegri getu til neytendaskjákorta með 3x hraðari myndgerð og 60% minni VRAM notkun.

Opinn hugbúnaður fyrir gervigreindarmyndbönd er loksins að ná í
Wan 2.2, HunyuanVideo 1.5 og Open-Sora 2.0 eru að minnka bilið til eignarleyfisbundinna risa. Hér er hvað það þýðir fyrir skapandi fólk og fyrirtæki.