Stability AI, yeni yapay zeka modeli Stable Code 3B'yi tanıttı. Stable Code 3B, 3 milyar parametreli bir model olarak karşımıza çıkıyor. Yazılım geliştirme için kod tamamlama yeteneklerine odaklanan Stable Code 3B, özel GPU'ları olmayan dizüstü bilgisayarlarda yerel olarak çalışabiliyor. Bununla beraber model, Meta'nın CodeLLaMA 7B'si gibi daha büyük modellere karşı rekabet etmenizi sağlayan performansı ve yetenekleriyle dikkat çekiyor.
Stability AI'ın görece daha küçük, daha kompakt ve yetenekli modellere yönelmesi StableLM Zephyr 3B ile başladı. Şirketin, 2023'ün son aylarında metin üretimi için StableLM Zephyr 3B'yi çıkardığını hatırlatalım. Stable Code ise ilk olarak 2023'ün Ağustos ayında kod oluşturmaya yönelik büyük/geniş dil modelinin ilk sürümü olarak önizleme modunda görücüye çıktı.
Stable Code 3B, sadece yeni kod satırları önermekle kalmıyor, Ortayı Doldur (FIM) olarak bilinen gelişmiş bir kod tamamlama özelliği ile aynı zamanda mevcut koddaki daha büyük eksik bölümleri de doldurabiliyor.
Modelin eğitim süreci
Modelin eğitiminde ayrıca Rotary Position Embeddings (RoPE) olarak bilinen teknik kullanılarak model, genişletilmiş bir bağlam boyutu ile optimize edildi. Tekniğin isteğe bağlı olarak bağlam uzunluğunun 100 bin token'a kadar genişletilmesini sağladığını belirtelim. Bu anlamda RoPE tekniği, Meta'nın Llama 2 Long'u da dahil olmak üzere diğer büyük/geniş dil modellerinin de kullandığı bir teknik olarak öne çıkmakta.
Bu arada Stable Code 3B'nin Stability AI'ın Stable LM 3B doğal dil modeli üzerine inşa edildiğini eklemekte fayda var. Model, yazılım mühendisliği verilerine odaklanan ileri eğitim sayesinde genel dil görevlerinde güçlü yönlerini korurken kod tamamlama becerileri kazandı.
Paylaşılan bilgilere göre; modelin eğitim verileri arasında kod depoları, geliştirici forumları ve diğer teknik kaynaklar yer aldı. Model, ayrıca 18 farklı programlama dilinde eğitim aldı.
Modeller arası karşılaştırma
Stability AI'ın belirttiğine göre; Stable Code 3B, birden fazla dilde gerçekleşen kıyaslama testlerinde üstün performans gösteriyor.
Model Python, Java, JavaScript, Go, Ruby ve C++ gibi popüler dilleri kapsıyor. İlk kıyaslamalara göre; model, kendi boyutunun iki katından daha büyük modellerin tamamlama kalitesiyle eşleşiyor. Hatta Stable Code 3B'nin bu modelleri geride bıraktığı da oluyor.
Kod tamamlama söz konusu olduğunda aslında Stable Code 3B'nin pek çok rakibi mevcut. Özellikle 3 milyar parametre açısından, IBM, HuggingFace ve ServiceNow tarafından ortaklaşa geliştirilen StarCoder LLM öne çıkıyor. Açık kaynaklı bu çalışma, popüler seçenekler arasında yer alıyor.
Stability AI'ın aktardıklarına göre; Stable Code 3B, Python, C++, JavaScript, Java, PHP ve Rust programlama dillerinde StarCoder'dan daha iyi performans gösteriyor.
Stability AI abonelik hizmeti
Stability AI yeni abonelik hizmetini ilk olarak Aralık ayında duyurmuştu. Stable Code 3B de bu abonelik hizmetinin bir parçası olarak ticari kullanıma sunuluyor.
Abonelik hizmetinden yararlanan üyeler, Stable Code 3B'nin yanı sıra Stability AI'ın portföyündeki diğer yapay zeka araçlarına da erişebiliyor. Bu araçlar arasında SDXL Stable Diffusion görüntü oluşturma araçları, metin içeriği oluşturma için StableLM Zephyr 3B, ses oluşturma için Stable Audio, video oluşturma için Stable Video yer alıyor.
İlk Yorumu yazmak ister misiniz?
Yorum Yazmak için Giriş Yap