Nvidia'nın GPT-4o'yu geride bırakan yapay zeka modeli Llama-3.1-Nemotron-70B-Instruct'tan sizlere daha önce bahsetmiştik. Nvidia dün yeni açık yapay zeka modeli ailesi Nemotron 3'ü piyasaya sürdü. Şirketin belirttiğine göre, Nvidia Nemotron 3 adlı bu model grubu, doğru yapay zeka ajanları oluşturmak için en verimli açık model ailesi.
Model ailesi, Nemotron 3 Nano, Nemotron 3 Super ve Nemotron 3 Ultra'dan oluşuyor. Nemotron 3 Nano hedeflenen görevler için küçük bir model olarak karşımıza çıkarken, Nemotron 3 Super çoklu yapay zeka ajanı uygulamalarına odaklanıyor. Nemotron 3 Ultra'nın ise daha karmaşık görevler için geliştirildiği belirtiliyor.
Nemotron 3 Nano
30 milyar parametreli Nemotron 3 Nano, hedefli, yüksek verimli görevler için bir seferde 3 milyar parametreyi etkinleştirebiliyor. Şu anda piyasada bulunan Nemotron 3 Nano, yazılım hata ayıklama, içerik özetleme, AI asistanı iş akışları ve düşük çıkarım maliyetleriyle bilgi alma gibi görevler için optimize edildi. Nemotron 3 Nano'nun hesaplama maliyeti açısından en verimli model olduğunu söyleyebiliriz.
Paylaşılan bilgilere göre; model, verimlilik ve ölçeklenebilirlikte kazanç sağlamak için benzersiz bir hibrit Uzmanlar Karışımı (MoE) mimarisi kullanıyor. Bu tasarım, Nemotron 2 Nano ile karşılaştırıldığında 4 kata kadar daha yüksek token verimi sağlarken, akıl yürütme tokeni üretimini yüzde 60'a kadar azaltıyor. Böylece çıkarım maliyetleri önemli ölçüde düşüyor. 1 milyon tokenlik bağlam penceresine sahip olan Nemotron 3 Nano, daha fazla bilgiyi hatırlayabiliyor. Bu sayede model, daha doğru ve uzun, çok adımlı görevlerde bilgileri daha iyi bir şekilde birbirine bağlayabiliyor.
Nemotron 3 Super ve Nemotron 3 Ultra
Nemotron 3 Super, çoklu ajan uygulamaları için yaklaşık 100 milyar parametreye ve token başına 10 milyar aktif parametreye sahip yüksek doğruluklu bir akıl yürütme modeli olarak konumlanıyor. Düşük gecikme süresiyle öne çıkan Nemotron 3 Super, özellikle karmaşık görevleri gerçekleştirmek için birçok iş birliği yapan birçok ajanın gerekli olduğu uygulamalarda tercih edilebiliyor.
Nemotron 3 Ultra ise karmaşık yapay zeka uygulamaları için yaklaşık 500 milyar parametreye ve token başına 50 milyar aktif parametreye sahip büyük bir akıl yürütme motoru. Nemotron 3 Ultra, derin araştırma ve stratejik planlama gerektiren yapay zeka iş akışları için gelişmiş bir akıl yürütme motoru görevi görüyor. Nemotron 3 Super ve Ultra'nın 2026'nın ilk yarısında piyasaya sürülmesi bekleniyor.
Açık Nemotron 3 modelleri, girişimlerin yapay zeka ajanları üzerinde daha hızlı bir şekilde geliştirme ve yineleme yapmalarını sağlıyor. Böylece prototipten kurumsal dağıtıma kadar inovasyonun hızlandırıldığını söyleyebiliriz.
Nvidia'nın kurucusu ve CEO'su Jensen Huang, model hakkında şu ifadeleri kullandı:
“Nemotron ile gelişmiş yapay zekayı, geliştiricilere büyük ölçekli ajan sistemleri oluşturmak için ihtiyaç duydukları şeffaflığı ve verimliliği sağlayan açık bir platforma dönüştürüyoruz.”
Nemotron 3 model ailesi ile geliştiriciler, belirli iş yükleri için doğru boyutta olan açık modeli seçebilir, düzinelerce ajandan yüzlerce ajana kadar ölçeklendirme yapabilir ve karmaşık iş akışları için daha hızlı, daha doğru ve uzun vadeli akıl yürütmeden yararlanabilir.
SchedMD satın alması ile Nvidia'nın açık kaynak odağı
Nvidia'nın açık kaynak yazılımlar ve kaynaklar alanında geniş kapsamlı bir hareket alanına sahip olduğunu görüyoruz. Şirket, yeni açık kaynak modeller yayınlamanın yanı sıra açık kaynaklaı sistemleri satın alma konusunda da iddialı.
Dün gerçekleşen SchedMD satın alması bunun en güzel örneği. Nvidia dün popüler açık kaynaklı iş yükü yönetim sistemi Slurm'un öne çıkan geliştiricisi SchedMD'yi satın aldığını açıkladı. Anlaşmanın finansal detayları ise şu an için gizliliğini koruyor. NVIDIA, Slurm'u açık kaynaklı, satıcıdan bağımsız bir yazılım olarak geliştirmeye ve dağıtmaya devam edecek. Böylece şirket, Slurm'u çeşitli donanım ve yazılım ortamlarında daha geniş HPC ve yapay zeka topluluğu tarafından yaygın olarak kullanılabilir ve desteklenebilir hale getirmeyi hedefliyor.
Slurm ilk olarak 2002 yılında piyasaya sürülürken, SchedMD, Slurm'un baş geliştiricileri Morris Jette ve Danny Auble tarafından 2010 yılında kuruldu. O n yıldan fazla bir süredir SchedMD ile çalışan Nvidia, blog gönderisinde bu teknolojinin üretken yapay zeka için kritik bir altyapı olduğunu belirtti.
Son zamanlarda Nvidia'nın yayınladıpı açık kaynak ve açık yapay zeka ürünlerine baktığımızda, Ş irketin, geçen hafta yayınladığı otonom sürüş araştırmalarına odaklanan yeni bir açık akıl yürütme görsel dil modeli olan Alpamayo-R1'ı görüyoruz. Şirket ayrıca, lisans altında açık kaynak olan Cosmos dünya modellerini kapsayan daha fazla iş akışı ve kılavuz eklediğini de açıkladı. Cosmos dünya modellerinin geliştiricilerin fiziksel yapay zeka geliştirmek için modelleri daha iyi kullanabilmelerine yardımcı olduğunu hatırlatalım.
İlk Yorumu yazmak ister misiniz?
Yorum Yazmak için Giriş Yap