Anthropic dün otonom kodlama yetenekleriyle öne çıkan yeni modeli Claude Sonnet 4.5'i tanıttı. Claude Sonnet 4.5'in prototiplerin ötesinde “üretime hazır” uygulamalar da geliştirebileceğini belirten Anthropic, modelde önceki yapay zeka modellerine kıyasla güvenilirlik açısından büyük bir sıçrama gerçekleştirildiğini dile getiriyor.
Modelin detayları
Anthropic'in belirttiğine göre Claude Sonnet 4.5, SWE-Bench Verified dahil olmak üzere çeşitli kodlama ölçütlerinde sektör lideri performans sunuyor. Yine de GPTQA Diamond ve Visual Reasoning ölçütlerinde sırasıyla Gemini 2.5 Pro ve GPT-5 modellerinin öne çıktığını görmekteyiz.
Öte yandan Anthropic yapay zeka araştırmacısı David Hershey ise Claude Sonnet 4.5'in performansını sadece benchmarklarla ölçmenin zor olduğunu dile getiriyor. Hershey'nin belirttiğine göre bazı kurumsal müşterilerle yapılan ilk denemelerde Claude Sonnet 4.5'in 30 saate kadar otonom olarak kod yazdığı görüldü. Paylaşılan bilgilere göre bu süre zarfında, yapay zeka modeli, sadece bir uygulama oluşturmakla kalmayıp, aynı zamanda veritabanı hizmetlerini kurdu. Bunun yanı sıra alan adları satın alan model, ürünün güvenli olduğundan emin olmak için SOC 2 denetimi yaptı. Tüm bu süreçte yaklaşık 11 bin satırlık kod üreten Claude Sonnet 4.5, görevi tamamladığında çalışmayı durdurdu.
Claude Sonnet 4.5, Anthropic tarafından gerçek dünya ajanları, kodlama ve bilgisayar kullanımı için dünyanın en iyi modeli olarak tanımlanıyor. Bu bağlamda Anthropic, yaklaşık bir yıl önce piyasaya sürdüğü Bilgisayar Kullanımı özelliğine atıfta bulunuyor ve modelin bilgisayar kullanımında pazara liderlik ettiğini ifade ediyor. Gerçek dünya bilgisayar görevlerinde yapay zeka modellerini test eden bir ölçüt olan OSWorld'de, Sonnet 4.5 şu anda yüzde 61,4 ile lider konumda. Yaklaşık dört ay önce, Sonnet 4'ün aynı ölçütte yüzde 42,2 ile lider olarak konumlandığını belirtelim. Şirketin Claude for Chrome uzantısı ise bahsi geçen yükseltilmiş yetenekleri kullanıma sunuyor.
Cursor CEO'su Michael Truell ve Windsurf CEO'su Jeff Wang de Claude Sonnet 4.5'in yeteneklerinden övgüyle bahsediyor. Michael Truell, Claude Sonnet 4.5'in özellikle uzun vadeli görevlerde en son teknoloji kodlama performansını temsil ettiğini ifade ederken, Jeff Wang, Claude Sonnet 4.5'in yeni nesil kodlama modellerini temsil ettiğini dile getiriyor.
Anthropic'in belirttiğine göre; Claude Sonnet 4.5, önceki modellere göre daha düşük dalkavukluk ve aldatma oranlarına sahip. Şirket, Claude'un hızlı enjeksiyon saldırılarına karşı duyarlılığını da iyileştirdiğini belirtiyor.
Claude Sonnet 4.5, Claude API ve Claude chatbot üzerinden kullanıma sunulacak. Geliştiriciler için fiyatlandırma Claude Sonnet 4 ile aynı tutuluyor. Yaklaşık 750 bin kelimeye denk gelen milyon girdi token'ı başına 3 dolar ve milyon çıktı token'ı başına 15 dolar.
Claude Agent SDK ve Imagine with Claude
Claude Sonnet 4.5'in lansmanının yanı sıra, Anthropic ayrıca Claude Agent SDK'yı da piyasaya sürüyor. Paylaşılan bilgilere göre; Claude Agent SDK, Claude Code'u destekleyen altyapıyla aynı. Geliştiriciler, kendi ajanlarını oluşturmak için Claude Agent SDK'dan faydalanabilir.
Ayrıca Anthropic, Max abonelerine geçici bir araştırma önizlemesi olan “Imagine with Claude”u sunuyor. Söz konusu önizleme, yapay zeka modelinin yazılımı anında oluşturduğunu gösteriyor. Şirketin belirttiğine göre Imagine with Claude kapsamında model, önceden belirlenmiş işlevsellik veya önceden yazılmış kod olmadan kullanıcı isteklerine gerçek zamanlı olarak yanıt verecek.
Yapay zeka yarışında Anthropic'in stratejisi
Geçtiğimiz yıl, yazılım mühendisliği görevlerindeki güçlü performans sergileyen Anthropic'in yapay zeka modelleri, geliştiriciler ve işletmelerin ilgi odağı haline geldi. Anthropic'in Cursor, Windsurf ve Replit gibi yapay zeka kodlama uygulamalarına API erişimi satarak önemli bir iş hacmi elde ettiğini hatırlatalım. Hatta Apple ve Meta'nın Claude modellerini şirket içinde kullandığı belirtilmekte. Ağustos ayında sizlerle paylaştığımız sektör verilerine göre Anthropic, yıllık tekrarlayan gelirini sadece yedi ayda 1 milyar dolardan 5 milyar dolara beş kat artırdı. Ancak, şirketin 3,1 milyar dolarlık API gelirinin neredeyse yarısı, kodlama asistanı Cursor ve Microsoft'un GitHub Copilot'ı olmak üzere sadece iki müşteriden geliyor.
OpenAI'ın GPT-5 modelinin, çeşitli kodlama ölçütlerinde Claude modellerini geride bırakması, Anthropic'i yeniden harekete geçirdi. Hatırlarsanız Anthropic, GPT-5 lansmanı öncesinde de Claude Opus 4.1'i tanıtarak GPT-5'ten rol çalmaya çalışmıştı. Anthropic'in yaklaşık 2 ay sonra Claude Sonnet 4.5 ile karşımıza çıkması ise kodlama konusundaki liderliği elden bırakmamaya kararlı olduğunu gösteriyor.
İlk Yorumu yazmak ister misiniz?
Yorum Yazmak için Giriş Yap