OpenAI o1 rakibi düşük maliyetli açık akıl yürütme modeli: s1

Gemini 2.0 Flash Thinking Experimental'dan damıtılan s1, bulut işlem kredilerinde 50 doların altında bir maliyetle eğitildi.
OpenAI o1 rakibi düşük maliyetli açık akıl yürütme modeli: s1

Stanford ve Washington Üniversitesi'ndeki yapay zeka araştırmacıları, düşük maliyetli bir akıl yürütme modeli ile karşımıza çıkıyor. Araştırmacılar, s1 adlı bu modeli bulut işlem kredilerinde 50 doların altında bir maliyetle eğitebildi. 

s1, matematik ve kodlama ölçütlerinde OpenAI'ın o1'ı ve DeepSeek'in R1'ı gibi önde gelen muhakeme modellerine benzer bir performans sergiliyor. Hatırlarsanız OpenAI, DeepSeek’in damıtma yöntemi sayesinde düşük maliyetlerle gelişmiş yapay zeka modelleri ortaya koyduğunu iddia etmişti. Araştırmacılar s1’ın makalesinde damıtma yöntemi kullandıklarını belirtiyor.

Araştırmacıların belirttiğine göre s1, Google'ın akıl yürütme modellerinden biri olan Gemini 2.0 Flash Thinking Experimental'dan damıtıldı. Bununla beraber, s1'ın makalesinde yer alan bilgilere göre denetimli ince ayar (SFT) kullanılarak akıl yürütme modellerinin nispeten küçük bir veri kümesiyle damıtılabiliyor. 

Paylaşılan bilgilere göre s1, Alibaba'nın sahibi olduğu yapay zeka laboratuvarı Qwen'in ücretsiz olarak indirilebilen küçük, kullanıma hazır bir yapay zeka modeline dayanıyor. Araştırmacılar s1'i eğitmek için, Google'ın Gemini 2.0 Flash Thinking Experimental programından her bir cevabın arkasındaki düşünme sürecini ele aldı. Bunun yanı sıra bu sorulara verilen cevaplarla eşleştirilmiş bin sorudan oluşan bir veri seti oluşturdu.

16 Nvidia H100 GPU kullanılarak 30 dakikadan kısa süren s1 eğitiminin ardından s1 belirli yapay zeka kıyaslamalarında güçlü performans elde etti. Stanford araştırmacısı Niklas Muennighoff'un aktardıklarına göre;söz konusu işlemci 20 dolara kiralanabiliyor. s1 modeline, eğitim verileri ve koduna GitHub'dan erişmek mümkün.

Teknoloji dünyasındaki gelişmeleri takip edin. Neleri size ulaştırmamızı istersiniz?
Abonelik kaydınız başarıyla oluşturuldu.