Google, I/O 2025 etkinliğinde yapay zeka destekli yeni video üretim modeli Veo 3'ü tanıttı. OpenAI'ın Sora modeliyle rekabet eden Veo 3, yalnızca video üretmekle kalmayıp eş zamanlı olarak ses efektleri, arka plan sesleri ve karakter diyalogları da üretebiliyor. Google bu özellikle, video üretimini sessiz dönemden çıkardığını vurguluyor.
Google DeepMind CEO'su Demis Hassabis'in açıklamasına göre, kullanıcılar yalnızca karakterleri ve ortamı değil, sahnede geçen diyaloğu ve bu diyaloğun nasıl duyulmasını istediklerini de tarif ederek videolar oluşturabiliyor. Model, sahnedeki görsellerle sesleri gerçekçi şekilde senkronize edebiliyor; dudak hareketleri ve fizik kurallarına uyum konusunda da önceki versiyonlara göre oldukça gelişmiş.

Veo 3, 249,99 dolarlık aylık abonelik bedeliyle sunulan Google AI Ultra planı kapsamında, ABD'deki kullanıcılar için Gemini uygulamasında erişime açıldı. Aynı zamanda kurumsal kullanıcılar için Vertex AI platformuna da entegre edildi.
Google'ın video üretim alanındaki bu hamlesi, OpenAI, Runway, Pika, Luma gibi şirketlerin hızla model geliştirdiği rekabetçi pazarda farklılaşma çabası olarak öne çıkıyor. Özellikle otomatik ses üretimi ve senkronizasyon yetenekleri, Veo 3'ü diğerlerinden ayıran en önemli unsur.
Veo 3'ün geliştirilmesinde, DeepMind'ın geçtiğimiz yıl tanıttığı video-temelli ses üretimi araştırmalarının etkili olduğu belirtiliyor. Google, telif ve manipülasyon endişelerine karşı içeriklerde SynthID adlı görünmez dijital işaretleme teknolojisini de kullanıyor.
Google ayrıca, bir önceki modeli olan Veo 2 için de güncellemeler sundu. Kullanıcılar artık video içine nesne ekleyip çıkarabiliyor, sahneleri genişletebiliyor ve farklı kamera hareketlerini taklit edebiliyor. Bu özellikler kısa süre içinde Vertex AI API kullanıcılarına da sunulacak.
İlk Yorumu yazmak ister misiniz?
Yorum Yazmak için Giriş Yap