Alibaba'dan DeepSeek'i geride bıraktığını söylediği yapay zeka modeli: Qwen2.5-Max

Alibaba, Qwen2.5-Max adlı yapay zeka modelini tanıtarak, DeepSeek'in son dönemdeki yükselişine yanıt verdi.
Alibaba'dan DeepSeek'i geride bıraktığını söylediği yapay zeka modeli: Qwen2.5-Max

Çin'in yapay zeka alanındaki rekabeti, Alibaba ve DeepSeek gibi şirketlerin yeni modelleriyle giderek kızışıyor. Alibaba, Qwen2.5-Max adlı yapay zeka modelini tanıtarak, DeepSeek'in son dönemdeki yükselişine yanıt verdi. Şirket, bu modelin GPT-4o, DeepSeek-V3 ve Llama-3.1-405B gibi mevcut büyük dil modellerini çeşitli kriterlerde geride bıraktığını iddia ediyor.

Alibaba, Qwen2.5'in yenilenmiş versiyonunun önceki sürümlere kıyasla daha iyi mantık yürütme, kodlama ve metin üretme yeteneklerine sahip olduğunu belirtiyor. Özellikle uzun metinler üzerinde daha tutarlı sonuçlar verdiği ve kod yazma görevlerinde ciddi performans artışı sağladığı söyleniyor.

Qwen2.5-Max'in öne çıkanları

Qwen2.5-Max, 20 trilyonun üzerinde token ile önceden eğitilen ve daha sonra SFT ve RLHF yöntemleriyle geliştirilen büyük ölçekli bir Mixture-of-Experts (MoE) modeli. Model, MMLU-Pro, LiveCodeBench, LiveBench ve Arena-Hard gibi çeşitli benchmark testlerinde GPT-4o ve Claude-3.5-Sonnet gibi en son teknoloji modellerle karşılaştırıldı. Sonuçlar, Qwen2.5-Max'in Arena-Hard, LiveBench, LiveCodeBench ve GPQA-Diamond gibi değerlendirmelerde DeepSeek V3'ü geride bıraktığını ve diğer değerlendirmelerde de rekabetçi sonuçlar elde ettiğini gösterdi.

Qwen2.5-Max, Qwen Chat platformu üzerinden kullanıcıların erişimine sunuldu ve ayrıca Alibaba Cloud üzerinden API olarak da kullanılabilir halde. API'yi kullanmak için bir Alibaba Cloud hesabı oluşturup Model Studio hizmetini etkinleştirmek ve ardından bir API anahtarı oluşturmak gerekiyor. Qwen API'leri, OpenAI API'leriyle uyumlu olduğundan, mevcut OpenAI API uygulamalarında kolaylıkla entegre edilebiliyor. Bu sayede, Qwen2.5-Max'i çeşitli uygulamalarda kullanmak mümkün hale geliyor.

DeepSeek ile rekabet yarışı

DeepSeek, son üç hafta içinde yapay zeka alanında hızlı bir yükseliş gösterdi. Şirketin R1 adlı modeli, OpenAI'ın ChatGPT'siyle benzer performans sergilerken, daha düşük maliyetle ve daha az enerji tüketimiyle dikkat çekiyor. Bu başarı, ABD ve Çin arasındaki yapay zeka rekabetini daha da artırdı.

Alibaba’nın bu hamlesi, DeepSeek'in son dönemdeki yükselişine bir yanıt olarak görülüyor. Zira DeepSeek, birkaç hafta içinde yapay zeka alanında büyük ses getirmiş ve piyasaya sunduğu DeepSeek-V3 modeliyle büyük dikkat çekmişti. Alibaba'nın böyle bir modeli yayınlamış olması ise söz konusu yarışı ABD ve Çin arasında olmaktan uzaklaştırdı diyebiliriz. 

Yapay zeka alanında gelişmeler çok hızlı bir şekilde ilerliyor. Alibaba, DeepSeek ve OpenAI gibi şirketlerin yarışında ilerleyen dönemde neler olacağını hep birlikte göreceğiz. 

Teknoloji dünyasındaki gelişmeleri takip edin. Neleri size ulaştırmamızı istersiniz?
Abonelik kaydınız başarıyla oluşturuldu.