Apple'ın sessiz sedasız yayına aldığı büyük/geniş dil modeli: Ferret

Sorgular için görüntülerin bölgelerini kullanabilen Ferret, ekim ayında bir araştırma sürümü olarak yayına alındı. 
Apple'ın sessiz sedasız yayına aldığı büyük/geniş dil modeli: Ferret

Apple'da ve Cornell Üniversitesi'nde çalışan araştırmacılar, ekim ayında sessiz sedasız bir şekilde Ferret isimli açık kaynak çok modlu (multimodal) büyük/geniş dil modelini (LLM) yayına aldı. Sorgular için görüntülerin bölgelerini kullanabilen Ferret, bir araştırma sürümü olarak yayına alındı. 

30 Ekim'de Ferret'in için kodlarıyla beraber Ferret-Bench de yayınlandı. Buna ek olarak kontrol noktası (checkpoint) sürümleri 14 Aralık'ta tanıtıldı.

Cumartesi günü yapay zeka araştırmacılarının gündeminde kendine yer bulan Ferret, ticari olmayan bir lisans altında açık kaynak olarak yayınlandı. Bu da sürümün mevcut haliyle ticarileştirilemeyeceği anlamına geliyor. Öte yandan modelin ilerleyen dönemde Apple ürünlerinde veya hizmetlerinde kullanılma ihtimali de varlığını sürdürüyor. 

Ferret ne işe yarıyor?

Bir görüntü üzerinde çizilen bir bölgeyi inceleyebilen Ferret, bu kapsamda gerçekleşen bir sorguda kullanıcının işine yarayacak unsurları belirleyebiliyor. Bununla birlikte tespit edilen unsurun etrafına sınırlayıcı bir kutucuk çizebiliyor. Ayrıca daha sonra tanımlanan bu öğeyi bir sorgunun parçası olarak kullanabilirken, söz konusu sorguya tipik bir şekilde yanıt verebiliyor.

Örnek vermek gerekirse; bir görselde yer alan hayvan görüntüsünü öne çıkararak Ferret'a "Bu hayvanın nedir?" diye sorabilirsiniz. Bunun karşılığında Ferret, hayvanın türünü tespit ederken, kullanıcının bu türde yer alan tek bir hayvana atıfta bulunduğunu algılayabilir. Ardından kullanıcıya daha fazla yanıt sunmak için görüntüde tespit edilen diğer öğelerin bağlamını kullanabilir.

Yapay zeka alanında Apple'ın rekabet stratejisi 

Microsoft, Google ve Meta'ya kıyasla yapay zeka alanında daha sessiz kalan Apple, bu büyük/geniş dil model ile yapay zeka alanındaki çalışmalarını artıracağının sinyalini veriyor. 

Apple'ın yapay zeka alanındaki hareketsizliğinin nedenlerinden biri de sahip olduğu yapay zeka sunucuları yaşadığı yetersizlik. Reddit'in r/Apple "subreddit"inde paylaşılan bilgilere göre; Ferret, 80GB belleğe sahip 8 A100 GPU üzerinde eğitildi. Bu da Apple'ın altyapı problemlerini yavaş yavaş çözmeye başladığını göstermekte. Bu alana yeni varlık gösteren bir şirket olarak açık kaynak kodlar yayınlamayı tercih etmesi ise Apple'ın OpenAI ve Microsoft gibi devlerle rekabet etmek için Meta'nın adımlarını takip ettiğini gösteriyor. 

Apple'In yapay zeka alanında attığı tek adım açık kaynak büyük/geniş dil modeli değil. Temmuz ayında ChatGPT rakibi üretimsel yapay zeka chatbot'unu test etmesiyle gündeme gelen Apple'ın, Siri'nin üretimsel yapay zeka destekli versiyonunu gelecek yıl yayınlaması bekleniyor. Ayrıca Apple'ın yapay zeka için 2 yıl içinde 5 milyar dolar harcama yapabileceği de konuşulmakta. 

Teknoloji dünyasındaki gelişmeleri takip edin. Neleri size ulaştırmamızı istersiniz?
Abonelik kaydınız başarıyla oluşturuldu.