OpenAI dün San Francisco'da gerçekleştirdiği DevDay etkinliğinde yeni geliştirici araçlarını tanıttı. Etkinlikte GPT-4o'ya ve Chat Completions API'ye eklenen yenilikleri duyuran şirket, Realtime API, görüntü ince ayarı, model damıtma ve istem önbellekleme araçlarını açıkladı.
GPT-4o yenilikleri
Tanıtılan yeni özellikler kapsamında; GPT-4o'yu web sitesi yerleşim düzenleri oluşturmak için kullananlar, modele örnek tasarımlardan oluşan bir koleksiyon iletebilecek. Aynı şekilde, GPT-4o ile taranan belgelerden veri çıkarmak isteyenler ise modeli daha önce işlenmiş dosyalar üzerinde eğitebilecek. Bu eğitim ile kullanıcılar, doğruluk sorunlarını azaltabilecek. Buunla beraber, OpenAI, GPT-4o'nun performansını artırmak için ince ayar veritabanının yaklaşık 100 görüntüyü yeterli bulacağını belirtti.
Realtime API'nin detayları
Şirket, etkinlikte bulut hizmeti Realtime API'yi tanıttı. Bu hizmet ile yazılım ekipleri, uygulamalarına çok modlu işleme yetenekleri ekleyebilecek. Ayrıca geliştiriciler, Realtime API ile sesli komutları anlayabilen ve yanıtlarını yüksek sesle okuyabilen yapay zeka uygulamaları oluşturabilecek. Şimdiye kadar işlenmek üzere bir OpenAI modeline sesli komut göndermek birden fazla adımı içermekteydi. Bu adımlar kapsamında, geliştiricilerin sesi yazıya dökmesi, yazıya dökülen metni modele aktarması ve ardından modelin metin tabanlı çıktısını sentetik konuşmaya dönüştürmesi gerekmekteydi. Realtime API ise bu ara adımlar olmadan doğrudan GPT-4o'ya ses akışını mümkün kılıyor.
Şirketin paylaştığı bilgilere göre; hizmet, yalnızca geliştirmeyi basitleştirirken, model gecikmesini de azaltabilecek. Yani Realtime API destekli yapay zeka uygulamaları kullanıcı talimatlarına daha hızlı yanıt verebilecek. Realtime API'nin özellikleri arasında desteklediği uygulamaların harici sistemlerdeki görevleri otomatik olarak gerçekleştirmesini sağlamak da yer alıyor.
Paylaşılan bilgilere göre; ilerleyen dönemde Realtime API, görüntü ve video işlemeyi de kapsayacak. OpenAI geliştirme kitinde yapacağı değişikliklerle Realtime API'yi Python ve Node.js uygulama geliştirme framework'ü kullanılarak oluşturulan iş yüklerine entegre etmeyi kolaylaştıracak.
Chat Completions API'ye eklenen yeni özellik
Etkinlikte mevcut Chat Completions API'sine ses girdisini işlemek için Realtime API'ye benzer çok modlu bir yetenek de tanıtıldı. OpenAI'ın açıkladığına göre; söz konusu özellik, Realtime API tarafından sunulan düşük gecikme süresini gerektirmeyen ses işleme kullanım durumlarına yönelik.
Görüntü ince ayarı
Buna ek olarak OpenAI, görüntü ince ayarı adı verilen bir özelliği kullanıma sunduğunu duyurdu. Görüntü ince ayarı, bir sinir ağına, çıktısının kalitesini artırmak için ek eğitim verileri sağlama sürecini içeriyor. Geliştiriciler, yeni görüntü ince ayarı özelliğini kullanarak ChatGPT-4o'ya özel görüntü veri kümeleri sağlayabilecek. Böylece modelin, bilgisayar görüşü görevlerinde daha iyi performans göstermesi mümkün olacak. Özellikle görüntüleri işleyen uygulamalar geliştiren geliştiriciler, bu ince ayardan faydalanabilir.
Model damıtma ve istem önbellekleme
OpenAI etkinlikte müşterilerin çıkarım maliyetlerini düşürmek için tasarlanan Model Damıtma ve İstem Önbellekleme özelliklerini de tanıttı.
Öncelikle model damıtma (model distillation) bahsedelim. Model damıtma, bilgi damıtma olarak bilinen bir yapay zeka yöntemini kullanarak geliştiricilerin tasarruf etmesini sağlıyor. Bu yöntem sayesinde geliştiriciler, büyük bir modeli daha az donanım kullanan daha küçük bir modelle değiştirebiliyor.
Aynı komut istemi verildiğinde, büyük bir sinir ağının daha küçük bir sinir ağına kıyasla daha iyi bir yanıt üreteceğini söyleyebiliriz. Ancak bilgi damıtımı sayesinde geliştiriciler, daha büyük modelin daha kaliteli yanıtını alıp daha küçük modele aktarabilir. Geliştiriciler, model damıtma özelliğine bir uygulama programlama arayüzü aracılığıyla ulaşabiliyor. Özellik kapsamında şirketin öncü modellerinden birine istemler gönderen geliştiriciler, modelin yanıtlarını bir yapay zeka eğitim veri setine dönüştürebiliyor. Ortaya çıkan veri seti, daha küçük bir sinir ağının kalitesini artırmak için kullanılabiliyor.
İstem Önbellekleme (Prompt Caching) özelliği ise şirketin modellerinin belirli durumlarda kullanıcı girdisini yeniden kullanmasını sağlıyor. Böylece modeller, daha önce bir kez tamamladıkları hesaplamaları tekrarlamak durumunda kalmıyor. Bu güncellemer ile OpenAI, çıkarım maliyetlerinde yüzde 50'ye varan bir düşüş beklemekte. Şirket, daha iyi yanıt süreleriyle karşımıza çıkacağını da belirtiyor. İstem önbellekleme GPT-4o, GPT-4o mini, o1-preview ve o1-mini'nin güncel versiyonlarında kullanılabiliyor.
İlk Yorumu yazmak ister misiniz?
Yorum Yazmak için Giriş Yap