Google, haziran ayında açık modeli Gemma 2'yi 27 milyar (27B) ve 9 milyar (9B) parametre boyutlarında piyasaya sürmüştü. Şirket şimdi de Gemma 2 ailesine üç yeni üye ekledi; Gemma 2 2B, ShieldGemma ve Gemma Scope.
Gemma 2 2B, popüler 2 milyar (2B) parametre modelinin yeni bir versiyonu, yerleşik güvenlik geliştirmeleri ve güçlü bir performans ve verimlilik dengesi içeriyor. ShieldGemma ise yapay zeka modellerinin girdi ve çıktılarını filtrelemek ve kullanıcıyı güvende tutmak için Gemma 2 üzerine inşa edilmiş bir güvenlik içeriği sınıflandırıcı modelleri paketi. Gemma Scope da modellerin iç işleyişine farklı bir bakış açısı sunan yeni bir model yorumlanabilirlik aracı.
Gemma 2 2B
Gemma 2 2B, uç cihazlar ve dizüstü bilgisayarlardan Vertex AI ve Google Kubernetes Engine (GKE) ile sağlam bulut dağıtımlarına kadar geniş bir donanım yelpazesinde verimli bir şekilde çalıştırılıyor. Hızını daha da artırmak için NVIDIA TensorRT-LLM kitaplığı ile optimize edildi ve NVIDIA NIM olarak kullanılabiliyor. Bu optimizasyon, NVIDIA RTX, NVIDIA GeForce RTX GPU'lar veya uç yapay zeka için NVIDIA Jetson modülleri kullanan veri merkezleri, bulut, yerel iş istasyonları, PC'ler ve uç cihazlar dahil olmak üzere çeşitli dağıtımları hedefliyor. Ayrıca Gemma 2 2B, Keras, JAX, Hugging Face, NVIDIA NeMo, Ollama, Gemma.cpp ve yakında MediaPipe ile sorunsuz bir şekilde entegre olarak geliştirmeyi kolaylaştırıyor.
ShieldGemma
ShieldGemma ise özellikle dört temel zarar alanını hedefliyor: Nefret söylemi, taciz, cinsel içerikli içerik, tehlikeli içerik. Bu açık sınıflandırıcılar, sınırlı sayıda veri noktası ile belirli bir politikaya göre uyarlanmış sınıflandırıcılar oluşturmak için bir metodoloji içeren Responsible AI Toolkit'teki mevcut güvenlik sınıflandırıcıları paketi ve API aracılığıyla sunulan mevcut Google Cloud kullanıma hazır sınıflandırıcıları tamamlıyor.
Gemma Scope
Gemma Scope, araştırmacılara ve geliştiricilere Gemma 2 modellerinin karar verme süreçlerinde şeffaflık sunuyor. Güçlü bir mikroskop gibi hareket eden Gemma Scope, model içindeki belirli noktaları yakınlaştırmak ve iç işleyişini daha yorumlanabilir hale getirmek için seyrek otomatik kodlayıcılar (SAE'ler) kullanıyor. Bu SAE'ler, Gemma 2 tarafından işlenen yoğun ve karmaşık bilgileri analiz edilmesi ve anlaşılması daha kolay bir forma genişleterek açmaya yardımcı olan özel sinir ağları olarak tanımlanabilir. Araştırmacılar bu genişletilmiş görünümleri inceleyerek Gemma 2'nin kalıpları nasıl tanımladığı, bilgileri nasıl işlediği ve nihayetinde nasıl tahminlerde bulunduğuna dair içgörüler elde edebiliyorlar.
İlk Yorumu yazmak ister misiniz?
Yorum Yazmak için Giriş Yap