Apple'da ve Cornell Üniversitesi'nde çalışan araştırmacılar, ekim ayında sessiz sedasız bir şekilde Ferret isimli açık kaynak çok modlu (multimodal) büyük/geniş dil modelini (LLM) yayına aldı. Sorgular için görüntülerin bölgelerini kullanabilen Ferret, bir araştırma sürümü olarak yayına alındı.
30 Ekim'de Ferret'in için kodlarıyla beraber Ferret-Bench de yayınlandı. Buna ek olarak kontrol noktası (checkpoint) sürümleri 14 Aralık'ta tanıtıldı.
Cumartesi günü yapay zeka araştırmacılarının gündeminde kendine yer bulan Ferret, ticari olmayan bir lisans altında açık kaynak olarak yayınlandı. Bu da sürümün mevcut haliyle ticarileştirilemeyeceği anlamına geliyor. Öte yandan modelin ilerleyen dönemde Apple ürünlerinde veya hizmetlerinde kullanılma ihtimali de varlığını sürdürüyor.
Ferret ne işe yarıyor?
Bir görüntü üzerinde çizilen bir bölgeyi inceleyebilen Ferret, bu kapsamda gerçekleşen bir sorguda kullanıcının işine yarayacak unsurları belirleyebiliyor. Bununla birlikte tespit edilen unsurun etrafına sınırlayıcı bir kutucuk çizebiliyor. Ayrıca daha sonra tanımlanan bu öğeyi bir sorgunun parçası olarak kullanabilirken, söz konusu sorguya tipik bir şekilde yanıt verebiliyor.
Örnek vermek gerekirse; bir görselde yer alan hayvan görüntüsünü öne çıkararak Ferret'a "Bu hayvanın nedir?" diye sorabilirsiniz. Bunun karşılığında Ferret, hayvanın türünü tespit ederken, kullanıcının bu türde yer alan tek bir hayvana atıfta bulunduğunu algılayabilir. Ardından kullanıcıya daha fazla yanıt sunmak için görüntüde tespit edilen diğer öğelerin bağlamını kullanabilir.
I somehow missed this. @Apple joined the open source AI community in October. Ferret’s introduction is a testament to Apple’s commitment to impactful AI research, solidifying its place as a leader in the multimodal AI space. Way to go @Apple - ps: I'm looking forward to the day… https://t.co/Pi1kQrsVvx
— Bart de Witte (@OpenMedFuture) December 23, 2023
Yapay zeka alanında Apple'ın rekabet stratejisi
Microsoft, Google ve Meta'ya kıyasla yapay zeka alanında daha sessiz kalan Apple, bu büyük/geniş dil model ile yapay zeka alanındaki çalışmalarını artıracağının sinyalini veriyor.
Apple'ın yapay zeka alanındaki hareketsizliğinin nedenlerinden biri de sahip olduğu yapay zeka sunucuları yaşadığı yetersizlik. Reddit'in r/Apple "subreddit"inde paylaşılan bilgilere göre; Ferret, 80GB belleğe sahip 8 A100 GPU üzerinde eğitildi. Bu da Apple'ın altyapı problemlerini yavaş yavaş çözmeye başladığını göstermekte. Bu alana yeni varlık gösteren bir şirket olarak açık kaynak kodlar yayınlamayı tercih etmesi ise Apple'ın OpenAI ve Microsoft gibi devlerle rekabet etmek için Meta'nın adımlarını takip ettiğini gösteriyor.
Apple'In yapay zeka alanında attığı tek adım açık kaynak büyük/geniş dil modeli değil. Temmuz ayında ChatGPT rakibi üretimsel yapay zeka chatbot'unu test etmesiyle gündeme gelen Apple'ın, Siri'nin üretimsel yapay zeka destekli versiyonunu gelecek yıl yayınlaması bekleniyor. Ayrıca Apple'ın yapay zeka için 2 yıl içinde 5 milyar dolar harcama yapabileceği de konuşulmakta.
İlk Yorumu yazmak ister misiniz?
Yorum Yazmak için Giriş Yap