Grok-2'yi destekleyen ve Midjourney'i geride bırakan FLUX.1 modellerinin arkasındaki isimler

Midjourney ve DALL-E'ye meydan okuyan ve son dönemde projelerde sıkça kullanılan FLUX.1 serisini geliştiren ekibe gelin yakından bakalım. 
Grok-2'yi destekleyen ve Midjourney'i geride bırakan FLUX.1 modellerinin arkasındaki isimler

xAI'ın yeni yapay zeka modeli serisi Grok-2 ve Grok-2 mini'yi yayınladığını sizlere aktarmıştık. Grok-2 serisi görüntüleri oluşturmak için Black Forest Labs tarafından geliştirilen yapay zeka model ailesi FLUX.1'i kullanmaktaydı. Midjourney ve DALL-E'ye meydan okuyan ve son dönemde projelerde sıkça kullanılan FLUX.1 modellerini geliştiren ekibe gelin yakından bakalım. 

Black Forest Labs ekibi 

Öncelikle Flux'ı geliştiren Black Forest Labs ekibinden bahsetmekte fayda var. Black Forest Labs ekibinde kurucu ortaklar Andreas Blattmann ve Axel Sauer'in yanı sıra Dominik Lorenz, Dustin Podell, Frederic Boesel, Harry Saini, Jonas Müller, Kyle Lacey, Patrick Esser, Robin Rombach, Sumith Kulal, Tim Dockhorn, Yam Levi ve Zion English yer alıyor. 

Almanya merkezli Black Forest Labs, ekibinin akademik, endüstriyel ve açık kaynaklı ortamlarda temel üretken yapay zeka modelleri geliştirme konusunda olağanüstü bir geçmişe sahip olduğunu belirtiyor. 

Black Forest Labs'in paylaştığı bilgilere göre ekibin yenilikleri arasında VQGAN ve Latent Diffusion, Stable DiffusionXL, Stable Video Diffusion, Rectified Flow Transformers olmak üzere görüntü ve video üretimi için Stable Diffusion modelleri ve ultra hızlı, gerçek zamanlı görüntü sentezi için Adversarial Diffusion Distillation bulunmakta. 

Black Forest Labs'in Flux modelleri 

Girişim, yaklaşık 1 ay önce FLUX.1 metinden görüntüye modeller paketini yayınladı. Pakette FLUX.1 (pro), FLUX.1 (dev) ve FLUX.1 (schnell) yer almakta. 

FLUX.1 (pro) modelini FLUX.1 paketinin en iyisi olarak tanımlayabiliriz. Model, en üst düzey istem takibi, görsel kalite, görüntü ayrıntısı ve çıktı çeşitliliği ile son teknoloji performanslı görüntü üretimi sunuyor Modeli kullanmak için girişimin API'si aracılığıyla erişim sağlayabiliyorsunuz. FLUX.1 (pro) Replicate ve fal.ai aracılığıyla da kullanılabiliyor. Girişimin FLUX.1 (pro) kapsamında özelleştirilmiş kurumsal çözümler sunduğunu da belirtelim.

FLUX.1 (dev) modeli ise ticari olmayan uygulamalar için kullanılabiliyor. Açık ağırlıklı ve doğrudan FLUX.1 (pro)'dan damıtılan FLUX.1 (dev), aynı boyuttaki standart bir modelden daha verimli. Bununla beraber model, benzer kalite ve hızlı bağlılık özellikleri de sunmakta. Ağırlıkları HuggingFace' te mevcut olan FLUX.1 (dev), doğrudan Replicate veya Fal.ai üzerinde denenebilir. 

FLUX.1 (schnell) ise serinin en hızlı modeli. Yerel geliştirme ve kişisel kullanım için uyarlanan FLUX.1 (schnell) Apache2.0 lisansı altında açık bir şekilde kullanılabilir. Modelin ağırlıklar Hugging Face'de yer alırken, çıkarım kodu GitHub 'da ve HuggingFace'in Diffusers'da bulunabiliyor. Ayrıca modelin ComfyUI için ilk gün entegrasyonuna sahip olduğunu belirtelim. 

FLUX.1 modellerinin farkı ne?

Black Forest Labs'in paylaştığı bilgilere göre; tüm kamuya açık FLUX.1 modelleri, çok modlu ve paralel difüzyon transformatör bloklarından oluşan hibrit bir mimariye dayanmakta. Söz konusu modellerin 12 milyar parametreye ölçeklendirildiğini ekleyelim. Ekip, difüzyonu özel bir durum olarak içeren üretken modelleri eğitmek için akış eşleştirme yöntemini kullanmakta. Böylece ekip önceki son teknoloji difüzyon modelleri geliştirmiş oluyor. Buna ek olarak ekip, döner konumsal yerleştirmeler (rotary positional embeddings) ve paralel dikkat katmanları (parallel attention layers) ekleyerek model performansını artırıyor. Bununla beraber ekibin donanım verimliliğini de iyileştirdiğini belirtelim.

FLUX.1 (pro) ve (dev), Görsel Kalite, İstemi Takip Etme, Boyut/Görünüş Değişkenliği, Tipografi ve Çıktı Çeşitliliği gibi özelliklerde Midjourney v6.0, DALL-E 3 (HD) ve SD3-Ultra gibi popüler modelleri geride bırakıyor. Girişim, FLUX.1 (schnell)'in ise sınıfındaki rakiplerinin yanı sıra Midjourney v6.0 ve DALL-E 3 (HD) gibi damıtılmamış güçlü modellerden bile daha iyi performans gösterdiğini belirtiyor. Black Forest Labs'in belirttiğine göre; modeller, ön eğitimden gelen tüm çıktı çeşitliliğini korumak için özel olarak ayarlandı.

İstikamet video modeli SOTA

Black Forest Labs FLUX.1 serisinden sonra karşımıza metinden videoya yapay zeka modeli SOTA ile çıkmayı planlıyor. Girişim sitesinde video modellerinin, yüksek çözünürlükte ve benzeri görülmemiş hızda hassas oluşturma ve düzenlemenin kilidini açacağını dile getiriyor. 

Black Forest Labs'in aldığı yatırım

Black Forest Labs'in paylaştığı bilgilere göre; şirket geçtiğimiz ay 31 milyon dolarlık tohum yatırım aldı. Yatırım turunda liderliği Andreessen Horowitz üstlendi. Yatırım turuna melek yatırımcılar Brendan Iribe, Michael Ovitz, Garry Tan, Timo Aila ve Vladlen Koltun ile yapay zeka araştırmaları ve şirket kurma alanındaki diğer tanınmış uzmanlar katılım gösterdi. Bununla beraber şirket, General Catalyst ve MätchVC 'den devam yatırımları aldığını ifade ediyor. 

Teknoloji dünyasındaki gelişmeleri takip edin. Neleri size ulaştırmamızı istersiniz?
Abonelik kaydınız başarıyla oluşturuldu.