Amazon Web Services (AWS), bu yıl re:Invent sahnesine yapay zeka altyapısında büyük bir sıçramayla çıktı. Şirket hem üçüncü nesil Trainium3 çipini hem de Trainium3 UltraServer sistemini tanıttı; ayrıca bir sonraki adım olan Trainium4’ün geliştirildiğini doğruladı. AWS’in uzun süredir sürdürdüğü “kendi donanım bileşeniyle maliyeti düşürme ve performansı artırma” stratejisi, artık Nvidia ile daha yakın bir entegrasyon dönemine giriyor.
Trainium3, AWS’in bugüne kadar geliştirdiği en güçlü yapay zeka eğitim çiplerinden biri. UltraServer sisteminde 3 nanometre Trainium3 bileşenleri ve AWS’in kendi yüksek hızlı ağ mimarisi bir araya geliyor. Bu yapı, önceki nesle göre dört kat daha yüksek performans ve dört kat daha fazla bellek sunuyor. AWS ayrıca binlerce UltraServer’ı birbirine bağlayarak uygulamalara 1 milyon Trainium3’e kadar ölçek imkanı verebileceğini söylüyor. Enerji tüketimi tarafında da yüzde kırka varan tasarruf dikkat çekiyor; bu da hızla büyüyen veri merkezi kapasitesi içinde AWS’in maliyet odaklı yaklaşımıyla uyumlu.
Mevcut müşteri referansları da stratejinin çalıştığını gösteriyor. Anthropic, Karakuri, SplashMusic gibi şirketler Trainium3 sistemleriyle çıkarım maliyetlerinde anlamlı düşüşler yakalamış durumda. Bu aynı zamanda AWS’in Trainium ailesinin ilk günden beri benimsediği “yüksek performans - düşük maliyet” çizgisinin üçüncü nesilde daha da belirginleştiğini gösteriyor.
AWS’in sunduğu tablo Trainium3 ile sınırlı değil. Şirket Trainium4’ün geliştirme aşamasında olduğunu duyurdu ve en kritik detaylardan biri, Nvidia’nın NVLink Fusion yüksek hızlı bağlantı teknolojisini desteklemesi olacak. Bu, Trainium tabanlı sistemlerin Nvidia GPU’larla daha sıkı şekilde birlikte çalışmasına imkan tanıyacak; üstelik AWS’in kendi sunucu rafı tasarımlarını ve maliyet avantajını koruyarak. CUDA, Nvidia’nın paralel hesaplama mimarisi, ekosisteminin fiili standart haline geldiği bir dönemde Trainium4, Nvidia odaklı model geliştiren şirketler için AWS tarafındaki bariyerleri düşürmeyi hedefliyor.
AWS zaten Trainium1 ve Trainium2 ile maliyet-performans odaklı bir çizgi kurmuştu. Trainium1 bulut sunucuları yüzde elliye varan daha düşük eğitim maliyeti sağlarken, Trainium2 ise dört kata kadar daha yüksek performans ve daha iyi fiyat-performans oranıyla büyük dil modelleri ve çok modlu sistemler için tercih ediliyordu. Trainium3 ve yaklaşan Trainium4 ile bu çizgi daha agresif bir rekabete dönüşüyor.
Görsel: Nano Banana
İlk Yorumu yazmak ister misiniz?
Yorum Yazmak için Giriş Yap