Google Veo 2 to zaawansowany model generowania wideo oparty na sztucznej inteligencji, opracowany przez Google DeepMind. Jest to następca wcześniejszego modelu Veo, który zadebiutował w maju 2024 roku podczas Google I/O. Veo 2 został oficjalnie ogłoszony 16 grudnia 2024 roku i wyróżnia się zdolnością do tworzenia wysokiej jakości, realistycznych klipów wideo na podstawie tekstowych lub obrazkowych podpowiedzi (promptów). Model ten jest odpowiedzią Google na konkurencyjne narzędzia, takie jak Sora od OpenAI, i według twórców przewyższa je pod względem szczegółowości, realizmu i zgodności z instrukcjami.
Kluczowe cechy Veo 2:
- Wysoka rozdzielczość: Veo 2 potrafi generować wideo w rozdzielczości do 4K, choć obecnie w narzędziu VideoFX (dostępnym w Google Labs) ograniczone jest do 720p i klipów trwających do 8 sekund. W przyszłości planowane jest rozszerzenie tych możliwości.
- Realizm i fizyka: Model charakteryzuje się zaawansowanym zrozumieniem fizyki świata rzeczywistego, co pozwala na dokładne odwzorowanie ruchu, tekstur (np. różnice między wodą a olejem) oraz ludzkich ekspresji i gestów. Przykładowo, potrafi realistycznie pokazać krojenie pomidora czy ruch pszczół wokół pszczelarza.
- Elastyczność instrukcji: Veo 2 radzi sobie zarówno z prostymi, jak i złożonymi poleceniami. Użytkownicy mogą określać style wizualne, kąty kamery, typy obiektywów (np. 18 mm) czy efekty kinematograficzne, takie jak płytka głębia ostrości czy ruchome ujęcia.
- Mniejsza liczba błędów: W porównaniu do poprzednika i innych modeli, Veo 2 rzadziej „halucynuje”, czyli generuje mniej nienaturalnych artefaktów, takich jak zniekształcone dłonie czy nienaturalne ruchy.
- Zastosowania: Jest przeznaczony dla szerokiego grona odbiorców – od twórców treści, przez marketerów, po profesjonalnych filmowców. Może być używany do tworzenia teł wideo, krótkich klipów na YouTube Shorts czy materiałów szkoleniowych.
Veo 2
Dostępność:
Obecnie Veo 2 jest dostępny w ramach eksperymentalnego narzędzia VideoFX na platformie Google Labs, ale tylko dla użytkowników z USA powyżej 18. roku życia, po zapisaniu się na listę oczekujących. Google planuje rozszerzyć dostępność w 2025 roku, integrując model m.in. z YouTube Shorts i Vertex AI. Wersja na Vertex AI jest już dostępna dla wybranych klientów korporacyjnych od kilku tygodni przed ogłoszeniem Veo 2.
Przykłady możliwości:
- Prompt: „Kinematograficzne ujęcie lekarki w żółtym kombinezonie ochronnym w laboratorium, kamera powoli zbliża się do jej twarzy, podkreślając zmartwienie na jej czole” – Veo 2 generuje realistyczną scenę z subtelnymi detalami emocji i oświetlenia.
- Prompt: „Niskie ujęcie samochodu driftingowego w mieście, z dymem i smugami światła” – model tworzy dynamiczną, stylizowaną sekwencję z precyzyjnym ruchem i atmosferą.
Najlepszy generator wideo AI
Porównanie z konkurencją:
W testach na zestawie danych MovieGenBench (1003 podpowiedzi), Veo 2 oceniono jako lepszy od modeli takich jak Sora, Kling v1.5 czy Minimax pod względem ogólnej preferencji i zgodności z promptami. Google podkreśla, że Veo 2 wyróżnia się lepszym rozumieniem kinematografii i mniejszą liczbą artefaktów wizualnych.
Najlepszy generator wideo AI Veo 2 to krok naprzód w dziedzinie generatywnej sztucznej inteligencji, choć nadal ma ograniczenia, np. w generowaniu bardzo złożonych scen z dynamicznym ruchem. Model oznaczany jest niewidocznym znakiem wodnym SynthID, wskazującym na jego AI-pochodzenie, co ma zwiększać przejrzystość i bezpieczeństwo użytkowania.