OpenAI'ın Google ile rekabeti, CEO Sam Altman'ın personele kurum içi bir “kırmızı kod” notu yayınlamasına kadar varmışken, OpenAI, bugün GPT-5.2'yi piyasaya sürdü. GPT-5.2'yi şimdiye kadarki en gelişmiş modeli olarak tanımlayan şirket, modelin geliştiriciler ile günlük profesyonel kullanım için tasarlandığını belirtti. OpenAI'ın GPT-5.2 modeli, ChatGPT ücretli kullanıcılarına ve geliştiricilere API aracılığıyla üç farklı sürümde sunulacak.
GPT-5.2 model serisi, Instant, Thinking ve Pro modellerini içeriyor. Instant, bilgi arama, yazma ve çeviri gibi rutin sorgular için hız optimizasyonlu bir model olarak karşımıza çıkarken, Thinking, kodlama, uzun belgelerin analizi, matematik ve planlama gibi karmaşık yapılandırılmış işlerde performans gösteriyor. Pro ise zor problemler için maksimum doğruluk ve güvenilirlik sunmayı amaçlayan en üst düzey model olarak konumlanıyor.
Şirketin belirttiğine göre GPT-5.2 model serisi, çalışma sayfaları oluşturma, sunumlar hazırlama, kod yazma, görüntüleri algılama, uzun bağlamları anlama, araçları kullanma ve karmaşık, çok adımlı projeleri yönetme konusunda daha iyi. Hatta OpenAI'ın ürün müdürü Fidji Simo model serisi için şu ifadeleri kullandı:
Hesap tabloları oluşturma, sunumlar hazırlama, kod yazma, görüntüleri algılama, uzun bağlamları anlama, araçları kullanma ve ardından karmaşık, çok adımlı projeleri birbirine bağlama konusunda daha iyidir.
OpenAI paylaştığı blog gönderisinde GPT-5.2'nin yapay zeka ajanlarının iş akışları için daha iyi olduğunu da belirtiyor. Yapay zeka devlerinin yapay zeka ajanları odağındaki yarışı burada da kendini gösteriyor. Şirket ayrıca, Thinking modelinin öncekinden daha az halüsinasyon gördüğünü belirtiyor. Ön sürüm test kullanıcıları arasında Notion, Box, Shopify, Harvey, Zoom ve Databricks yer aldı. Bu markaların modellere birkaç hafta önce erişim izni aldığı belirtiliyor.
GPT-5.2, LMArena'nın çoğu ölçüt (benchmarkta) liderlik tablosunun zirvesinde yer alan Google'ın Gemini 3 ile yarışmaya odaklanıyor. Bu noktada LMArena'nın kodlama ölçütünde Anthropic'in Claude Opus-4.5'in hala lider olduğunu belirtmekte fayda var.
OpenAI'nin kendi benchmark tablosunda, GPT-5.2 Thinking, neredeyse tüm muhakeme testlerinde Gemini 3 ve Anthropic'in Claude Opus 4.5'i geride bırakıyor. Buna gerçek dünya yazılım mühendisliği görevleri (SWE-Bench Pro), doktora düzeyinde bilimsel bilgi (GPQA Diamond) soyut muhakeme ve örüntü keşfi (ARC-AGI paketleri) de dahil.

Araştırma lideri Adain Clark'ın belirttiğine göre; daha yüksek matematik puanları sadece denklemleri çözmekle ilgili değil. Matematiksel muhakeme, bir modelin çok adımlı mantığı takip edip edemeyeceğini, sayıları zaman içinde tutarlı tutabileceğini ve zamanla birikebilecek ince hataları önleyebileceğini gösteren bir gösterge.
Yeni GPT-5.2 modelleri, OpenAI'ın ChatGPT Plus, Pro, Go, Business ve Enterprise olmak üzere ücretli planları ile başlayarak bugün ChatGPT içinde kademeli olarak kullanıma sunulacak.
İlk Yorumu yazmak ister misiniz?
Yorum Yazmak için Giriş Yap