Google DeepMind, güncel temel dünya modeli Genie 3'ü tanıttı. Genie 3, genel amaçlı yapay zeka ajanlarını eğitmek için kullanılabiliyor. Halen araştırma aşamasında olan Genie 3, henüz kamuya açık bir şekilde yayınlanmadı. Genie 3'ün ajanlar için yeni ortamlar oluşturabilen önceki modeli Genie 2 ve DeepMind'ın video oluşturma modeli Veo 3 üzerine inşa edildiğini belirtelim.
DeepMind araştırma direktörü Shlomi Fruchter, yaptığı açıklamada şu ifadelere yer verdi:
“Genie 3, ilk gerçek zamanlı etkileşimli genel amaçlı dünya modelidir”
“Bu model, daha önce var olan dar dünya modellerinin ötesine geçiyor. Belirli bir ortama özgü değil. Fotoğraf gerçekçiliğinde, hayali dünyalar ve bunların arasındaki her şeyi oluşturabilir.”
Genie 3'ün öne çıkan özellikleri
Genie 3, basit bir metin komutuyla, saniyede 24 kare hızında 720p çözünürlükte birkaç dakikalık etkileşimli 3D ortamlar oluşturabiliyor. Hatırlatmak gerekirse Genie 2, 10 ila 20 saniye arasında içerik üretimi gerçekleştirebiliyordu.
Model ayrıca komutla tetiklenebilir dünya olayları özelliğine de sahip, Özellik kapsamında komut kullanarak oluşturulan dünyayı değiştirebilmeniz mümkün. Bunlara ek olarak Genie 3'ün daha önce oluşturduklarını hatırlayabilmesi sayesinde simülasyonlar zaman içinde fiziksel olarak tutarlılığını koruyabiliyor. Model, ürettiği şeyleri hatırlayarak ve uzun zaman dilimlerinde akıl yürüterek dünyanın nasıl işlediğini kendi kendine öğreniyor. Burada dünyanın nasıl işlediğinden kasıt ise nesnelerin nasıl hareket ettiği, düştüğü ve birbirleriyle nasıl etkileşime girdiği.
Fruchter'ın belirttiğine göre; Genie 3, eğitim deneyimleri, oyunlar veya yaratıcı konseptlerin prototipinin oluşturulması için önemli yenilikler sunuyor. Genie 3'ün yetenekleri arasında dünyanın fiziksel özelliklerini modelleme, doğal dünyayı simüle etme, Modelleme animasyonu ve kurgu yapma, konumları ve tarihi mekanları keşfetme yer alıyor. Yine de modelin gerçek potansiyelinin genel amaçlı görevler için ajanların eğitilmesinde ortaya çıkacağı vurgulanıyor. Üstelik genel amaçlı görevler için ajanların eğitilmesi Yapay Genel Zekaya (AGI) ulaşmak için mühim.
DeepMind'ın açıklamasına göre; model, yapay zeka ajanlarını sınırlarına kadar zorlayarak, insanların gerçek dünyada öğrendiği gibi kendi deneyimlerinden öğrenmeye zorlama potansiyeline de sahip. Örnek olarak DeepMind, Genie 3'ü genel amaçlı Scalable Instructable Multiworld Agent (SIMA) yazılımının son sürümüyle test etti. Test kapsamında yazılımdan bir dizi hedef peşinde koşması istendi. Deepmind ekibi, bir depo ortamında, ajandan “parlak yeşil çöp sıkıştırıcısına yaklaş” veya “dolu kırmızı forklifte yürü” gibi görevleri yerine getirmesini istediler.
DeepMind'ın açık uçlu ekibinde araştırma bilimcisi olan Jack Parker-Holder test sonuçlarını şöyle aktarıyor:
Üç durumda da SIMA ajanı hedefe ulaşabildi. Model, sadece ajandan eylemleri alıyor. Böylece ajan hedefi algılıyor, etrafındaki simüle edilmiş dünyayı görüyor ve ardından dünyada eylemleri gerçekleştiriyor. Genie 3 tutarlı kalması nedeniyle ileriye doğru simülasyon yapmayı başarıyor.
Genie 3'ün sınırlamaları
Öte yandan Genie 3 bir takım sınırlamalara da sahip. Örneğin, kayak yapan birinin dağdan aşağı kaymasını gösteren demo, karın kayakçıya göre nasıl hareket edeceğini yansıtamadı. Ayrıca, bir ajanın gerçekleştirebileceği eylemlerin kapsamının sınırlı olduğunu da ekleyelim Bununla beraber paylaşılan bir ortamda birden fazla bağımsız ajan arasındaki karmaşık etkileşimleri doğru bir şekilde modellemek hala zor. Üstelik uygun bir ajan eğitimi için saatler harcanması gerekiyor. Genie 3 ise yalnızca birkaç dakikalık sürekli etkileşimi destekleyebiliyor.
Tüm bunlara rağmen modelin, ajanlara pek çok konuda öğrenme imkanı tanıdığını söylemek mümkün. Bu konular arasında girdilere tepki vermenin ötesine geçme, planlama, keşif, belirsizliği araştırma ve deneme yanılma yoluyla gelişme yer alıyor. İlerleyen dönemde yapay zeka araştırmacıları, Genie 3 modelinin yeni versiyonlarıyla, Yapay Genel Zekaya adım adım yaklaşabilir.
İlk Yorumu yazmak ister misiniz?
Yorum Yazmak için Giriş Yap