Alibaba, tıpkı OpenAI'ın o1 modeli gibi akıl yürütmeye odaklanan yeni yapay zeka modeli QwQ-32B-Preview'u tanıttı. ve Qwen ekibi tarafından geliştirilen 32,5 milyar parametreli model, yaklaşık 32 bin kelime uzunluğundaki istemleri değerlendirebiliyor.
Alibaba'nın paylaştığı testlere göre QwQ-32B-Preview, AIME ve MATH testlerinde OpenAI'ın o1 modellerini geride bırakıyor. Bu noktada AIME'nin bir modelin performansını değerlendirmek için diğer yapay zeka modellerini kullandığını belirtelim. MATH ise bir kelime problemleri koleksiyonu olarak karşımıza çıkıyor.
Paylaşılan bilgilere göre, QwQ-32B-Preview, “akıl yürütme” yetenekleri sayesinde mantık bulmacalarını çözebiliyor. Bununla beraber model, oldukça zorlu matematik sorularını da yanıtlayabiliyor. o1'e benzer şekilde, QwQ-32B-Preview, görevler boyunca mantık yürütüyor ve ileriyi planlıyor.
Öte yandan Alibaba'nın paylaştığına göre; model beklenmedik şekilde dil değiştirebileceği gibi döngülerde takılabilme olasılığına sahip. Ayrıca modelin sağduyulu muhakeme gerektiren görevlerde düşük performans gösterebileceği de belirtilmekte.
QwQ-32B-Preview'un bazı siyasi konulara yaklaşımı ise yakın zamanda yayınlanan DeepSeek akıl yürütme modeline benziyor. Bunun nedeni DeepSeek'in de Alibaba gibi Çin merkezli bir şirket olması. Zira Çin'in internet düzenleyicisi, modellerin yanıtlarının temel sosyalist değerleri yansıttığından emin olmak için onları kıyaslamaya tabi tutuyor. Böylece çin merkezli yapay zeka modelleri, düzenleyicilerin tepkisini çekebilecek konulara yanıt vermeyi reddediyor.
QwQ-32B-Preview, yapay zeka geliştirme platformu Hugging Face'de çalıştırılabiliyor ve platform üzerinden indirilebiliyor. Model, Apache 2.0 lisansı altında açık olarak kullanılabiliyor. Bu anlamda dileyenler modeli ticari uygulamalar için kullanılabilir.
İlk Yorumu yazmak ister misiniz?
Yorum Yazmak için Giriş Yap