OpenAI Perşembe günü GPT-4o mini isimli yeni hafif (lightweight) modelini piyasaya sürdü. GPT-4o mini şirketin ChatGPT'yi destekleyen amiral gemisi büyük dil modelinin daha küçük ve daha uygun fiyatlı bir versiyonu olarak karşımıza çıkıyor. Şu anda yalnızca metin ve görüntü ile çalışan GPT-4o mini, ilerleyen dönemde ses ve video gibi diğer içerik türlerini de işleyebilecek.
GPT-4o mini'nin öne çıkan özellikleri
Bu yeni model, OpenAI'ın şimdiye kadar sunduğu en küçük modeli GPT-3.5 Turbo'ya kıyasla geliştiricilere yüzde 60 daha ucuza mal olacak. Geliştiriciler 1 milyon girdi token'ı başına 5 dolar ve 1 milyon çıktı token'ı başına 15 dolar ödeyecek. Bununla beraber GPT-4o mini'nin saniyede yaklaşık 67 token ileterek GPT-3.5 Turbo kadar hızlı çalışması hedefleniyor.
Ancak bunun da ötesinde GPT-4o mini, bugünden itibaren ücretsiz ChatGPT kullanıcıları için GPT-3.5 Turbo'nun yerini alacak. Böylece araçtan ücretsiz olarak yararlananlar, temel ChatGPT deneyiminde dikkate değer bir değişim yaşayacak. GPT-3.5 Turbo'yu kullanmaya devam etmek isteyen geliştiriciler, OpenAI'ın API'si aracılığıyla bu modele erişebilecek.
GPT-4o mini performansı
OpenAI'ın belirttiğine göre; GPT-4o mini'nin Kitlesel Çoklu Görev Dil Anlayışı Ölçütünde (MMLU) yüzde 82'lik bir puan elde etti. Söz konusu ölçütün 57 akademik konuda 16 bin çoktan seçmeli soru içerdiğini belirtelim. GPT-4o, MMLU ölçütünde yüzde 88,7 puan almıştı. GPT-4o mini, GPT-4o'yu geçememiş olsa da; aynı ölçütten yüzde 70 puan alan GPT-3,5 Turbo'yu geride bırakıyor.
Büyük dil modellerinin tükettiği enerji ve bu modellere erişim zorluğu, çıkarılan daha küçük ve hafif modellerle giderilmeye çalışılıyor. Google'ın Google I/O'da duyurduğu Gemini 1.5 Flash ve Anthropic'in Haiku'su bunun en güzel örneklerinden. GPT-4o mini, MMLU ölçütünde yüzde 77.9 alan Gemini Flash ve yüzde 73.8 performans gösteren Claude Haiku'yu geride bırakıyor.
GPT-4o mini, çok modlu bir muhakeme değerlendirmesi olan MMMU'da yüzde 59,4 puan aldı. Modelin aynı ölçütte yüzde 56,1 puan alan Gemini Flash ve yüzde 50,2 puan alan Claude Haiku'dan daha iyi performans gösterdiğini görmekteyiz.
GPT-4o, matematiksel muhakeme ve kodlama görevlerini içeren MGSM ve kodlama performansını içeren HumanEval ölçütlerinde de Gemini Flash ve Claude Haiku'yu geride bırakmayı başarıyor.
Aslında pek çok uzman bu ölçütleri güvenilir bulmuyor, hatta Antrophic yeni ölçütlerin araştırılması için bir fon bile kurdu. Ancak şirketlerin kendi başarılarını ortaya koymasının başka bir yolu şu an için bulunmuyor.
GPT-4o mini iPhone'lara geliyor
OpenAI'ın Ürün Başkanı Olivier Godement'ın aktardıklarına göre; GPT-4o mini, Apple Intelligence aracılığıyla bu sonbaharda kullanıma sunulacak. Bununla birlikte model, cihaz üzerinde değil OpenAI bulut sunucularında çalışacak.
İlk Yorumu yazmak ister misiniz?
Yorum Yazmak için Giriş Yap