Lightricks LTXV AI do generowania wideo open source

Lightricks LTXV to pierwszy open-source model AI do generowania wideo, zasilany mocą Google Cloud. Otwarta technologia, nieskończone możliwości twórcze video za darmo.

Lightricks LTXV (LTX Video) to otwartoźródłowy model generowania wideo oparty na sztucznej inteligencji, opracowany przez Lightricks, firmę znaną z narzędzi kreatywnych takich jak Facetune czy LTX Studio. Został wprowadzony 22 listopada 2024 roku i wyróżnia się szybkością oraz wydajnością, umożliwiając generowanie wysokiej jakości klipów wideo w czasie rzeczywistym. Model ten jest oparty na architekturze Diffusion Transformer (DiT) i ma 2 miliardy parametrów, co czyni go relatywnie lekkim w porównaniu do konkurencji, przy zachowaniu imponujących rezultatów.

Kluczowe cechy LTXV:

  1. Szybkość: Na GPU Nvidia H100 generuje 5-sekundowe wideo (24 FPS, 768×512 px) w zaledwie 4 sekundy – szybciej niż czas odtwarzania. Na konsumenckich kartach, jak RTX 4090, proces trwa ok. 8-10 sekund.
  2. Rozdzielczość i jakość: W wersji 0.9.5 (marzec 2025) obsługuje wyższe rozdzielczości (do 720×1280 px) i dłuższe sekwencje, z mniejszą liczbą artefaktów oraz lepszą spójnością ruchu.
  3. Wszechstronność: Obsługuje generowanie wideo z tekstu (text-to-video), obrazu (image-to-video) oraz rozszerzanie istniejących klipów (video-to-video), z opcjami kluczowych klatek (keyframes).
  4. Wymagania sprzętowe: Działa na GPU z 8 GB VRAM (np. RTX 3060), choć dla najlepszych rezultatów zaleca się 16 GB+ (np. RTX 4090).
  5. Dostępność open-source: Kod i wagi modelu są dostępne na GitHubie (Lightricks/LTX-Video) oraz Hugging Face, pod licencją OpenRail, co pozwala na komercyjne i osobiste wykorzystanie.

Lightricks LTXV

Najnowsza wersja (0.9.5, marzec 2025):

  • Licencja komercyjna: Umożliwia legalne użycie w projektach zarobkowych.
  • Kondycjonowanie klatek: Wspiera interpolację między klatkami i rozszerzanie wideo w przód/tył.
  • Ulepszenia: Lepsza jakość, mniej artefaktów, wsparcie dla dłuższych sekwencji.
  • Integracja z ComfyUI: Natywna obsługa w popularnym interfejsie graficznym do generowania AI.

Jak używać:

  • Instalacja: Pobierz model (np. ltx-video-2b-v0.9.5.safetensors) z Hugging Face i umieść w folderze ComfyUI (checkpoints). Wymagany jest też enkoder tekstu, np. T5-XXL.
  • Promptowanie: Kluczowe są szczegółowe, chronologiczne opisy (np. „Kamera zbliża się do kobiety w czarnej sukni, stojącej na klifie, wiatr porusza jej włosami, zachód słońca oświetla scenę”).
  • Uruchomienie: Działa lokalnie przez ComfyUI, Diffusers lub skrypty Python (inference.py).

Zastosowania:

LTXV jest idealny dla twórców treści, filmowców i artystów, umożliwiając szybkie tworzenie klipów reklamowych, animacji czy wizualizacji koncepcji. Współpraca z Shutterstock (od grudnia 2024) wzbogaciła model o dane HD/4K, podnosząc jakość wyjściową.

Porównanie z konkurencją:

W porównaniu do Runway Gen-3 czy Sora, LTXV oferuje lepszą wydajność na słabszym sprzęcie i otwartoźródłowy dostęp, choć ustępuje im w szczegółowości przy dłuższych klipach. Jego szybkość i niskie wymagania czynią go przełomowym dla lokalnego generowania wideo.

Lightricks LTXV to potężne narzędzie, które demokratyzuje tworzenie wideo AI, łącząc prędkość, jakość i dostępność dla szerokiego grona użytkowników.

Oficjalna strona https://www.lightricks.com/