Yapay zeka video üretimine odaklanan Luma, Luma Agents'ı piyasaya sürdü. Luma Agents, metin, görüntü, video ve ses alanlarında uçtan uca yaratıcı çalışmaları yürütmek üzere tasarlandı. Unified Intelligence model ailesi tarafından desteklenen Luma Agents, reklam ajansları, pazarlama ekipleri, tasarım stüdyoları ve işletmeler için yeni bir çalışma yöntemi olarak tanıtılıyor.
Uni-1'ın detayları

Luma'nın ajanlarının Unified Intelligence yapay zeka modelleri ailesinin ilki olan Uni-1 modeli üzerine inşa edildiğini belirtelim. Uni-1'ın ses, video, görüntü, dil ve uzamsal akıl yürütme konusunda eğitildiğini de eklemekte fayda var. Tıpkı Google'ın Nano Banana Pro ve OpenAI'ın GPT Image 1.5 modelleri gibi, Uni-1 de otoregresif dönüştürücü üzerine inşa edildi. Bu bağlamda Uni-1, geleneksel difüzyon modellerinin yaptığı gibi gürültüden görüntüleri çıkarmak yerine, içeriği sırayla token token oluşturan bir yapay zeka modeli olarak karşılaşıyor. Kısacası, Metin ve görüntüler aynı işleme sürecini paylaşıyor.
Luma'nın belirttiğine göre model, oluşturma öncesinde ve sırasında komutları analiz ederek karmaşık talimatları parçalara ayırıp sahneleri planlayabiliyor. Bu yaklaşımın genellikle çok daha doğru komut izlemeyle sonuçlandığını belirtelim. Bu kapsamda Uni-1, birkaç fotoğrafı alıp tamamen yeni bir kompozisyon halinde birleştirebilir.
Luma'nın paylaştığı bilgilere göre Uni-1, mantık tabanlı görüntü işleme için RISEBench testinde en yüksek puanı aldı. Hatta model, Nano Banana 2 ve GPT Image 1.5'i az farkla geride bıraktı. Görüntü oluşturma yeteneğinin de modelin görsel anlayışını güçlendirdiğini belirtelim. Nesne tanımada Google'ın Gemini 3 Pro'suna neredeyse eşdeğer bir performans gösteren model, birden fazla dili destekliyor.
Luma Agents neler sunuyor?
Luma'nın belirttiğine göre ajanlar, yapay zeka modelleriyle koordinasyon halinde metin, görüntü, video ve ses planlama ve üretme yeteneğine sahip olduğunu belirtiyor. Ajanların yararlandığı modeller arasında Luma'nın Ray 3.14, Google'ın Veo 3 ve Nano Banana Pro, ByteDance'ın Seedream ve ElevenLabs'ın ses modelleri yer almakta.
Luma'nın CEO'su ve kurucu ortağı Amit Jain'in belirttiğine göre Luma Agents'ı farklı kılan şey, bir görüntü veya fikir üzerinde her yineleme için ileri geri komutlar vermenize gerek olmaması. Bunun yerine sistem, büyük varyasyon setleri oluşturuyor ve kullanıcıların konuşma yoluyla yönü belirlemelerine imkan tanıyor.
Jain'in aktardıklarına göre Luma Ajanları, varlıklar, iş ortakları ve yaratıcı yinelemeler arasında kalıcı bir şekilde bağlamı koruyabiliyor. Ajanlar çıktıları değerlendirip iyileştirebilirken, yinelemeli bir özeleştiri yoluyla kendi sonuçlarını geliştirebiliyor.
Luma, küresel reklam ajansları Publicis Groupe ve Serviceplan'ın yanı sıra Adidas, Mazda ve Suudi AI şirketi Humain gibi markalar da dahil olmak üzere mevcut müşterileriyle yeni ajan platformunu kullanmaya başladı bile. Kullanım örnekleri olarak 200 kelimelik bir özet ve bir ürün görüntüsü, sistemin bir reklam kampanyası için birbirinden farklı konumlar, modeller ve renk şemaları için çeşitli fikirler üretmesini sağlayabiliyor. Jain'in belirttiğine göre Luma Agents, bir markanın 15 milyon dolarlık, bir yıllık reklam kampanyasını 40 saat içinde 20 bin doların altında bir maliyetle farklı ülkeler için çok sayıda yerelleştirilmiş reklama dönüştürdü. Üstelik bu süreç hem markanın iç kalite kontrollerinden hem de doğruluk kontrollerinden geçti.
Luma Agents şu anda API aracılığıyla kullanıma açık. Luma önümüzdeki dönemde Luma Agents'ı kademeli olarak daha fazla kullanıcıya açmayı planlıyor.
İlk Yorumu yazmak ister misiniz?
Yorum Yazmak için Giriş Yap