Microsoft AI, metin, ses ve görüntü üretebilen MAI-Transcribe-1,MAI-Voice-1 ve MAI-Image-2 olmak üzere üç temel yapay zeka modelinin piyasaya sürüldüğünü duyurdu.
Microsoft'un paylaştığı bilgilere göre, Microsoft'un Azure Fast hizmetinden 2,5 kat daha hızlı olan MAI-Transcribe-1, 25 farklı dildeki konuşmayı metne dönüştürüyor. Arka plan gürültüsü, düşük kaliteli ses kayıtları ve üst üste binen konuşmalar gibi zorlu koşullar gözetilerek tasarlanan modelin; kafe, ofis ve konser gibi gerçek yaşam senaryolarında test edildiği belirtiliyor. Modelin altyazı üretimi, podcast transkripsiyonu, toplantı arşivleme, çağrı merkezi analizi gibi çevrimdışı uygulamaların yanı sıra gerçek zamanlı toplantı transkripsiyonu ve dikte gibi düşük gecikmeli çevrimiçi görevler için de uygun olduğu ifade ediliyor. Model, Copilot'un Sesli Modu ve Microsoft Teams ile aşamalı olarak entegre ediliyor.

Ses üretme modeli MAI-Voice-1 ise kullanıcıların bir saniyede 60 saniyelik ses üretmesine ve özel bir ses oluşturmasına imkan tanıyor.
Video üretim modeli MAI-Image-2, fotogerçekçilik konusunda önemli bir adım atıyor. Model, doğal ışık, doğru cilt tonları ve gerçekçi ortamlar sunarak kullanıcıların post-prodüksiyon sürecinde harcadığı zamanı azaltmayı hedefliyor. Şirketin belirttiğine göre; görsel içinde metin oluşturma konusunda da güçlü bir performans sergileyen model; poster, infografik, slayt ve diyagram gibi içeriklerde tutarlı sonuçlar üretiyor

MAI-Image-2'nin ilk olarak 19 Mart'ta yeni bir büyük dil modeli test yazılımı olan MAI Playground'da piyasaya sürüldüğünü belirtelim. Artık bu üç model Microsoft Foundry'de piyasaya sürülüyor. Ayrıca transkripsiyon ile ses modellerinin MAI Playground'da da yer aldığını ekleyelim.
Fiyatlandırma açısından baktığımızda MAI-Transcribe-1, saat başına 0,36 dolardan başlıyor. MAI-Voice-1, 1 milyon karakter başına 22 dolardan başlarken, MAI-Image-2, metin girdisi için 1 milyon token başına 5 dolardan, görüntü çıktısı için 1 milyon token başına 33 dolardan başlıyor.
Modeller, Microsoft AI CEO'su Mustafa Suleyman'ın liderliğindeki Microsoft'un MAI Superintelligence ekibi tarafından geliştirildi. bir AI araştırma ekibi olan MAI Superintelligence ekibi Kasım 2025'te kuruldu. Suleyman, bir röportajında Microsoft'un kendi modellerini piyasaya sürmesine rağmen OpenAI ile olan ortaklığına olan bağlılığını sürdürdüğünü dile getirmişti. Suleyman, verdiği başka bir demeçte ise bu ortaklığın yakın zamanda yeniden müzakere edilmesi sayesinde Microsoft'un bu süper zeka araştırmasını gerçekten sürdürebildiğini belirtti.
Geçtiğimiz ay donanım açısından verimli akıl yürütme modeli Phi-4-reasoning-vision-15B'yi duyuran Microsoft, 2025'in ekim ayında MAI-Image-1 ile gündeme gelmişti. Şirket, 2025'in Ağustos ayında ise MAI-Voice-1 ve MAI-1-preview modellerini tanıtmıştı.
İlk Yorumu yazmak ister misiniz?
Yorum Yazmak için Giriş Yap