Bu haftanın yapay zeka gündemine şüphesiz Çin merkezli yapay zeka şirketi DeepSeek damgasını vurdu. Geçtiğimiz haftadan beri gündemden düşmeyen DeepSeek ve modeli R1'ın başarısının sırrını sizlere aktarmıştık. Geliştiriciler DeepSeek'in yenilikçi yaklaşımı sayesinde OpenAI o1'a meydan okuyan R1 modelini düşük maliyetlerle kendi cihazlarında çalıştırabiliyor. Yapay zeka topluluk platformu Hugging Face'te R1 497 binden fazla indirmeye ulaştı. Geliştiricilerin R1'a bu ilgiyi göstermesinin nedeni de milyon token başına maliyetin OpenAI'ın o1 serisi modelleriyle karşılaştırıldığında çok düşük olması. DeepSeek hakkında daha detaylı bir inceleme için konuk yazarımız Duygu Öktem Clark'ın DeepSeek devrimi ve sonrası için tahminler başlıklı yazısını okuyabilirsiniz.
DeepSeek sadece R1 modeliyle değil, uygulamasıyla da OpenAI'ın tacına gözünü dikmiş durumda. DeepSeek'in mobil uygulaması, geçtiğimiz hafta sonu ChatGPT'yi geride bırakarak dünya genelindeki uygulama mağazalarında 1 numaraya yükseldi. Mobil uygulama analiz firması Appfigures'un paylaştığı bilgilere göre DeepSeek, iOS'ta bu hafta ABD App Store'da ve diğer 51 ülkede 1 numaralı ücretsiz uygulama konumuna geldi. Appfigures'a göre uygulama Pazartesi günü App Store'da 111 ülkede, Google Play'de ise 18 ülkede ücretsiz uygulamalar arasında ilk 10'da yer almaktaydı. Öte yandan DeepSeek'in mobil uygulaması, İtalya'da App Store ve Google Play Store'dan kaldırıldı. Bu olay İtalya'nın veri koruma kurumu Garante'nin başlattığı soruşturma sonrası gerçekleşti. Ayrıca Garante, DeepSeek’in Avrupa Birliği’nin Genel Veri Koruma Yönetmeliği'ne (GDPR) uyumlu olup olmadığını incelemek için şirketten bilgi talep etti.
Nvidia hisselerinde DeepSeek etkisi
DeepSeek'in GPU verimliliği konusundaki yenilikçi yaklaşımı Nvidia hisselerinde de düşüşe yol açtı. Nvidia hisseleri DeepSeek'in yükselişinin ardından 589 milyar dolarlık bir düşüş yaşadı. Yüzde 17 oranındaki düşüş, 2020 yılının Mart ayından bu yana yaşanan en büyük düşüş olarak karşımıza çıkıyor. DeepSeek tarafından paylaşılan bilgilere göre R1 modeli, rakiplerinden farklı olarak üst düzey pahalı çiplere veya donanımlara ihtiyaç duymadan geliştirildi. Daha az çip ile başarılı yapay zeka modellerinin geliştirilebiliyor olması da otomatik olarak yapay zeka dünyasının en büyük çip tedarikçisi konumunda bulunan Nvidia'nın hisselerinde sert bir düşüş yarattı.
DeepSeek güvenlik endişeleri
Teknik makalesinde ortaya koyduğu yeniliklerle ses getiren DeepSeek, aynı zamanda geniş çaplı bir siber saldırının hedefi olduğunu açıkladı. Şirket, kullanıcı verilerinin güvenliğini sağlamak adına yeni kayıtları geçici olarak durdurduğunu duyurdu. Siber saldırının yanı sıra DeepSeek gizlilik politikasındaki ifadelerle de gündeme geldi. Gizlilik politikasında paylaşılanlara göre DeepSeek ürünleri, klavye tuşlarına dokunuş paternleri ve ritmlerine kadar verilerinizi kaydediyor ve bunları ağırlıklı olarak Çin'de saklıyor. Bu anlamda yerelde çalıştıracağınız DeepSeek modellerinin daha güvenli olduğunu söyleyebiliriz.
DeepSeek'in yeni modeli: Janus-Pro-7B
Siber saldırı ve gizlilik endişeleri DeepSeek'in başarısına kısa süreli bir gölge düşürse de; şirket yeni modellerini duyurmaya hız kesmeden devam etti. DeepSeek, görsel üretimine odaklanan yapay zeka modeli Janus-Pro-7B'yi tanıttı. Şirketin açıklamasına göre, model metinden görsele dönüşüm alanında OpenAI'ın DALL-E 3 ve Stability AI'ın Stable Diffusion modellerini geride bırakarak dikkat çekici bir başarı elde etti.
Janus-Pro-7B, önceki Janus modeline kıyasla önemli iyileştirmelerle donatıldı. Model, 72 milyon yüksek kaliteli sentetik görüntüden oluşan büyük bir veri setiyle eğitildi. Bu veri seti, gerçek dünya görselleriyle dengeli bir şekilde harmanlanarak, modelin daha gerçekçi, detaylı ve yaratıcı görseller üretmesini sağlıyor. DeepSeek, modelin özellikle ince detaylar ve karmaşık görsel sahneler yaratma konusunda lider konumda olduğunu belirtiyor.
Bu esnada OpenAI ve Microsoft ne yapıyor?
DeepSeek, bir süredir OpenAI başta olmak üzere ABD merkezli şirketlerin eleştirilmesine yol açıyor. OpenAI, Financial Times'a yaptığı açıklamada DeepSeek'in sohbet robotunu oluşturmak için “damıtma” olarak tercüme edebileceğimiz distillation yöntemini kullandığına dair kanıtları olduğunu açıkladı. Bu sürecin üstesinden üretmeye devam ederek gelmeyi planlayan OpenAI, devlet kurumlarına özel ChatGPT planını tanıttı. OpenAI, federal kurumların yapay zeka destekli araçlardan daha güvenli ve verimli bir şekilde yararlanmasını sağlamak amacıyla bu hizmeti geliştirdi. Yeni hizmet, OpenAI'ın ticari ChatGPT Enterprise modelinin bir uzantısı olarak sunuluyor. Ancak, hükümetin yüksek güvenlik gereksinimlerini karşılamak için ek önlemler içeriyor.
Bu esnada OpenAI'ın ortaklarından Microsoft ise DeepSeek'in muhakeme modeli R1'ı, Azure AI Foundry hizmetine eklediğini duyurdu. Microsoft'un Azure AI Foundry platformunda kurumlar için farklı yapay zeka hizmetlerini tek bir başlık altında bir araya getirdiğini hatırlatalım. Microsoft'un bir yandan DeepSeek'in OpenAI'ın uygulama programlama arayüzünü (API) kullanmasını araştırmaya başlaması diğer yandan R1'ı platformuna dahil etmesi dikkat çekti.
DeepSeek ile beraber açık kaynak yapay zekanın yıldızı parlarken, Jack Dorsey'nin şirketi Block, açık kaynaklı yapay zeka agent'ı Goose'u tanıttı. Goose, piyasadaki hemen hemen her büyük dil modeli (LLM) ile yapay zeka agent'ları (aracıları) oluşturma sürecini basitleştirmeyi hedefliyor. Böyle bakıldığında Goose'un tek bir agent'ın ötesinde bir agent framework'ü olarak da karşımıza çıktığını söyleyebiliriz. Jack Dorsey, Goose'un duyurusundan kısa bir süre açık kaynağa vurgu yapan bir gönderi paylaştı.
Tüm bunlar olurken, Meta, yapay zeka tabanlı önerilerini daha kişiselleştirilmiş hale getirmek amacıyla Facebook ve Instagram aktivitelerini kullanacağını duyurdu. Şirketin geliştirdiği Meta AI, artık kullanıcıların sosyal medya platformlarındaki davranışlarını analiz ederek daha isabetli ve bireyselleştirilmiş öneriler sunmayı hedefliyor.
DeepSeek rüzgarı tüm şirketleri etkisi altına almışken, Gemini artık Google E-Tablolar'da daha karmaşık veri analizi yapabilmeye başladı. Yapay zeka agent'ı, içgörüler sunmak için Python kodu yazacak. Buna ek olarak Google'ın Gemini 2.0 Pro Experimental modeliyle karşımıza çıkması bekleniyor.
Bu arada yapay zeka konusunda Çin'in önde gelen oyuncuları DeepSeek ile sınırlı değil. Alibaba da bu hafta DeepSeek'i geride bıraktığını söylediği yapay zeka modeli Qwen2.5-Max ile gündemde yerini aldı. Alibaba, Qwen2.5-Max adlı yapay zeka modelini tanıtarak, DeepSeek'in son dönemdeki yükselişine yanıt verdi. Şirket, bu modelin GPT-4o, DeepSeek-V3 ve Llama-3.1-405B gibi mevcut büyük dil modellerini çeşitli kriterlerde geride bıraktığını iddia ediyor.
Alibaba, Qwen2.5'in yenilenmiş versiyonunun önceki sürümlere kıyasla daha iyi mantık yürütme, kodlama ve metin üretme yeteneklerine sahip olduğunu belirtiyor. Özellikle uzun metinler üzerinde daha tutarlı sonuçlar verdiği ve kod yazma görevlerinde ciddi performans artışı sağladığı söyleniyor.
İlk Yorumu yazmak ister misiniz?
Yorum Yazmak için Giriş Yap