“Hiçbir şeyin gerçekleşmediği on yıllar ve on yılların gerçekleştiği haftalar vardır.” Geçen hafta işte tam da böyle, on yılların gerçekleştiği bir haftaydı. DeepSeek, yapay zeka konusunda ezberleri bozdu, hem Silikon Vadisi’ni hem de piyasaları temelden sarstı. DeepSeek ile birlikte yapay zeka alanındaki küresel yarış, aslında şimdi başladı. Nvidia, tarihte bir şirketin bir günde yaşadığı en büyük değer kaybına ulaşarak, 590 milyar dolar kaybetti. Nvidia’nın bir gündeki bu kaybı Türkiye’nin toplam yıllık ihracatının iki katından fazla! Yalnızca bir teknoloji değil, aynı zamanda ülkelerin kullandığı bir politika aracı olması nedeniyle de kritik öneme sahip olan yapay zeka konusunda kartlar yeniden dağıtıldı. Peki, geçtiğimiz hafta tam olarak ne oldu?
DeepSeek nedir?
DeepSeek, Çin merkezli LLM (Large Language Models/Büyük Dil Modelleri) geliştiren bir yapay zeka şirketi. Şirketin kurucusu ve CEO’su Liang Wenfeng 1985 doğumlu bir elektronik mühendisi. Wenfeng, 2015 yılında yapay zeka algoritmaları kullanarak hisse alım satımı yapan ve bugün hala 9 milyar dolar değerinde bir portföy yöneten High-Flyer isminde bir yatırım fonu kuruyor. 2023 yılında ise High-Flyer’in bir alt şirketi olarak, DeepSeek hayata geçiyor. DeepSeek’in misyonu, etik yapay zeka teknolojilerini erişilebilir hale getirmek.
DeepSeek devrimi nedir?
Eğer DeepSeek’in paylaştığı bilgiler doğru ise OpenAI, Facebook, Google ve Antrophic gibi rakiplerinin en az 100 milyon dolar harcadığı modeli eğitme maliyetini 5.8 milyon dolara, kullanılan GPU sayısını 100 binden 2 bine düşürerek en az onlar kadar iyi bir model geliştirmeyi başardılar. Üstelik bunu rakiplerinden çok daha az sayıda araştırmacı ile yapıp, modeli tüm dünyaya ücretsiz olarak sundular.
DeepSeek bunu nasıl başardı?
DeepSeek, açık kaynak kodlu bir model. Hem kaynak kodlarına hem de teknik makalelerine ulaşmak mümkün. Hatırlarsanız Covid-19 pandemisiyle birlikte tedarik zincirlerindeki kopmalar nedeniyle küresel bir çip krizi yaşanmıştı. Bunun üzerine ABD, Çin’e çip ambargosu getirerek, Nvidia’nın yalnızca düşük kapasiteli çiplerini Çin’e satmasına izin verdi. ABD'de şirketlerin kullandığı H100 ile Çin’deki şirketlerin kullanımına izin verilen H800 arasındaki temel fark GPU’ların arasındaki bant genişliği. Peki Çin, bu önemli kısıtı nasıl aştı?
DeepSeek, geleneksel yapay zeka modellerinden farklı olarak "Mixture of Experts" (Uzmanlar Karışımı) sistemini benimsiyor:
- Geleneksel modeller tüm parametreleri her zaman aktif tutarken, DeepSeek yalnızca belirli bir anda ihtiyaç duyulan parametreleri kullanıyor. Bu sayede OpenAI'ın 1.8 trilyon aktif parametre kullanmasına karşın, DeepSeek yalnızca 37 bin parametreyi aktif tutarak aynı seviyede performans elde edebiliyor.
Ayrıca FP8 (Floating Point 8-bit) optimizasyonu sayesinde verileri daha küçük formatta (tüm veriyi yazmak yerine, kısaltmalar kullanmak gibi) depolayarak bellek ve hesaplama ihtiyacını yüzde 75 azaltıyor. Üstelik bunu, sonucun doğrulundan taviz vermeden ve enerji verimliliği sağlayarak yapıyor. Yaptıkları pek çok küçük yenilik var, ancak bu iki yöntem bahsettiğim verimlilik ve performans artışının sağlanmasında kritik önemde.
Veriler gerçekten Çin’e gidiyor mu?
Bazı uzmanlar bunun Çin hükümetinin bir projesi olduğunu, DeepSeek R1 anonsunun özellikle Trump’ın OpenAI, Oracle ve Softbank ile duyurduğu 500 milyar dolarlık Stargate projesinin hemen sonrasında ve TikTok tartışmalarının tam ortasında yapılmasını tesadüf görmüyor. Bazıları ise ne olursa olsun, Çin’in yapay zeka kabiliyetlerinin hafife alınmaması gerektiğini ve bunun OpenAI, Facebook, Google gibi dev Amerikan şirketlerine önemli bir uyarı olduğunu düşünüyor.
Ben bu yazıyı yazarken, Amerika’nın Yapay Zeka ve Kripto Lideri David Sacks, DeepSeek’in OpenAI verisi ile eğitildiğine dair ciddi kanıtlar olduğunu söyledi. Bu iddiaların doğrulanması durumunda, ABD ile Çin arasındaki teknoloji rekabeti daha da kızışacak ve veri paylaşımı konularında yeni tartışmalar gündeme gelecektir.
DeepSeek kullanıcılarının verileri Çin’e gidiyor mu? Eğer DeepSeek’i kendi web sitesinden ya da uygulamasından kullanırsanız evet, veriler Çin’e gidiyor. Ancak model açık kaynak kodlu olduğu için bilgisayarınıza/cep telefonu ya da tabletinize indirip offline olarak, verilerinizi paylaşmadan da kullanabilirsiniz. Yine Perplexity AI’ı kullanarak, modeli R1 olarak seçtiğinizde verileriniz DeepSeek’te değil, bir Amerikan şirketi olan Perplexity’de kalıyor.
X’te paylaşılan ve çok popüler olan bu tespit ise hem doğru hem düşündürücü: “Kar amacı gütmeyen bir şirket olarak yola çıkan OpenAI’ın ayda 200 dolar ücreti varken, tamamen kar amacı taşıyan bir yatırım fonunun tüm dünyaya yapay zekayı ücretsiz olarak sunması ise tam bir ironi.”
Bütün bu gelişmelerin sonuçları ne?
- Geleneksel kabul “Yapay zeka teknolojisi, özellikle de LLM’ler ancak milyar dolarları olan şirketlerin yapabileceği işlerdir.” şeklindeydi. OpenAI, Meta ve Google da rekabet avantajlarını bu kabule dayandırıyorlardı. DeepSeek R1 ile birlikte bu algı tamamen yıkıldı.
- Borsalar ve yatırımcılar yapay zeka şirketlerinin değerlemelerini bu kabulü merkeze alarak yapıyor, ayrıca “Daha iyi modeller için daha çok GPU gerekir. Kimin daha çok GPU’ya erişimi ve parası varsa o kazanır.” varsayımını benimsiyorlardı. Bu ikisi de yerle bir olduktan sonra bu alandaki şirketlerin değerlemeleri rekalibrasyona tabi tutuldu. Başta Nvidia olmak üzere diğer şirketlerin değer kaybının temel sebebi bu. Kişisel fikrim, borsanın gereğinden fazla tepki verdiği yönünde. Bu teknolojilerin fiyatlarının düşmesi, son kullanıcıların ve bu teknolojileri kullanarak ürün geliştiren girişimlerin talebini artıracaktır (Jevons Paradoksu).
- Günün sonunda OpenAI ve diğerleri DeepSeek’in yaptıklarını şu an harıl harıl inceliyor ve yaptıkları yenilikleri kendi modellerine uygulayıp verimlilik artışı sağlayacaklar. Meta’nın gelişmeler sonrası 4 tane “War Room” kurup, yapay zeka ekibinin gece gündüz çalıştığını biliyoruz. Bu yarış hız kesmeden, aksine hız artırarak devam edecek.
- Çok büyük ekipleriniz olsa da, milyar dolarlık kaynağa da sahip olsanız; aynı amaç etrafında mobilize olan, akıllı ve çalışkan bir ekip hala en büyük rekabet avantajını sağlayan faktörlerden biri. DeepSeek bize bunu tekrar kanıtladı.
- Yapay zeka yalnızca bir teknoloji değil, aynı zamanda ülkelerin kullandığı bir politika aracı.
- DeepSeek, bize aslında önemli olanın LLM’ler olmadığını gösterdi. Artık geldiğimiz noktada Uygulama Katmanı’nda yapılacak olanlarla, arayüz geliştirmeleri daha kritik. Bu da bizim gibi bu yarışa henüz girmekte olan ülkelerdeki girişimciler ve girişimler için önemli ve pozitif bir gelişme.
- Bütün bu toz bulutunda en avantajlı pozisyonda olan ise Apple. Apple, diğerleri gibi “Herkes yapıyor, ben de yapmalıyım.” diyerek milyar dolarlar harcayıp LLM işine girmedi. Acele etmedi, paniklemedi. Donanımdaki üstünlüğünü ve son kullanıcıya ulaşmadaki avantajını kullanarak, esas değer yaratımı LLM’lerden LLM’leri kullanan uygulamalara geçtiğinde oyuna çok güçlü şekilde dahil olacak.
- Gözden kaçan ancak esas önemli olan nokta “fiziksel yapay zeka” diyebileceğimiz, yapay zekanın donanım ile buluşması. Buna robotlar, dronelar, üretim hatları, otomasyon sistemleri dahil. Çin’in üretim konusunda hem deneyim hem de kapasite olarak çok ciddi avantajlara sahip olduğu malum. Bu noktada enerji üretimi ve robotik teknolojiler çok kritik hale geliyor. Bu madde başlı başına bir yazıyı hak ediyor çünkü bu alana savunma sanayi ve ülke güvenliği konuları da dahil oluyor.
Son söz: Bu devrim, Türkiye’deki girişimciler ve girişimler için önemli bir fırsat penceresi açıyor: Yapay zeka yarışında öne geçmek için artık milyar dolarlarınızın olmasına gerek yok. Geç kalmanın dezavantajını avantaja çevirme zamanı. Bize gereken tek şey, zeki ve çalışkan ekipler, verimli çözümler ve bu teknolojiyi günlük yaşama entegre edecek yenilikçi uygulamalar geliştirme kararlılığı.
İlk Yorumu yazmak ister misiniz?
Yorum Yazmak için Giriş Yap