Toplantılarda ve sunumlarda siz istediğiniz yöne bakarken göz temasını sabitleyen yapay zeka: NVIDIA Maxine

Artırılmış gerçeklik ve yapay zekayı bir araya getiren NVIDIA Maxine, görüntülü arama üzerinde gerçekleşen toplantılarda anlık çeviri, arka plandaki gürültünün sessize alınması ve göz kontağının sürdürülmesi gibi özellikler sunuyor.
Toplantılarda ve sunumlarda siz istediğiniz yöne bakarken göz temasını sabitleyen yapay zeka: NVIDIA Maxine

NVIDIA AI çatısı altında yer alan NVIDIA Maxine, görüntülü arama üzerinde gerçekleşen toplantılarda anlık çeviri, arka plandaki gürültünün sessize alınması ve göz kontağının sürdürülmesi gibi özellikler sunuyor.

Artırılmış gerçeklik ve yapay zekayı bir araya getiren NVIDIA Maxine sayesinde toplantı esnasında bir metin okusanız da tüm katılımcılarla göz kontağını sürdürmeniz mümkün. Hatta toplantılarda aynı anda gerçek zamanlı olarak birden fazla dilde konuşmanız da imkan dahilinde. Bu yetenekler dil bariyerini ortadan kaldırırken, toplantı esnasında başka görevlere de odaklanabilmeniz destek oluyor. Arka plandaki gürültünün ortadan kaldırılması ise farklı mekanlardan toplantılara katılmanıza imkan tanıyor. 

Özetleyecek olursak; Maxine'in modelleri, standart mikrofon ve kamera ekipmanıyla elde edilebilecek yüksek kaliteli efektler yaratıyor. NVIDIA Maxine, ses, video ve artırılmış gerçeklik efektlerini gerçek zamanlı olarak geliştiren yapay zeka özelliklerini dağıtmak için GPU destekli hızlandırılmış yapay zeka SDK'lardan ve bulutta yerel mikro hizmetlerden oluşan bir pakete sahip. Bu noktada paketin, GPU'larda gerçek zamanlı çıkarım için hızlandırılmış ve optimize edilmiş yapay zeka özellikleri içerdiğini belirtelim. Böylece ses, video ve artırılmış gerçeklik efektlerinde düşük gecikme sağlanabiliyor. 

NVIDIA Maxine, video deşifresi, kodlaması ve kodlamanın değiştirilmesi, sohbete dayalı yapay zeka, bilgisayarla görme, video yayın ve analiz hizmetleri sunuyor. Ayrıca Maxine şirket içindeki sunucularda ya da bulutta çalışabiliyor. Maxine'in ilk adımdan itibaren bulut üzerinde çalışabilen bir yapıya sahip olması da şirketlere esneklik sağlıyor. 

Ses SDK'sının kapsamı 

Geliştiriciler, Ses efektleri SDK'sını Windows ve Linux uygulamalarına entegre edebiliyor. Ses kalitesini artırma özelliğine sahip olan ses SDK'sı, ses kalitesini 8 kHz'den 16 kHz'e ve 16 kHz'den 48 kHz'e çıkarabiliyor. 

Bnunla beraber Ses SDK'sı kapsamında akustik yankı engelleme, gürültü giderme, oda yankısının gidirilmesi ve konuşmacı odağı özellikleri sunuluyor. 

Video efekt SDK'sının kapsamı 

Video efekt SDK'sı ise standart web kamerası girişiyle çalışabilmesinin yanı sıra, video konferans düzenlerine kolayca entegre edilebilen yapay zeka tabanlı görsel efektleri etkinleştiriyor. 

SDK, sanal arka plan, süper çözünürlük, yükseltici (upscaler), yapı azaltma (Artifact Reduction) ve video paraziti giderme gibi özellikler sunuyor. Maxine'in Video efekt SDK'sı sanal arka plan özelliği için bir kişiyi segmentlere ayırarak yapay zeka desteğiyle arka planı kaldırma, değiştirme ya da bulanıklaştırma işlemlerini uyguluyor. Upscaler ise 4 kata kadar yüksek kaliteli videolar sunuyor. 

Artırılmış Gerçeklik SDK'sının kapsamı

Artırılmış Gerçeklik SDK'sında yüz ifadesi tahmini özelliği sunan Maxine, yüzü takip ediyor ve takip ettiği kişinin ifadesini tahmin ediyor. Aynı şekilde kullanıcıların başka yere bakarken göz temasını sürdürmesini sağlayan Artırılmış Gerçeklik SDK'sı, bakışları tahmin etmenin yanında kamera ile hizalayarak bir göz temasını simülasyonu yaratıyor. 

Bunların yanı sıra yüz izleme, yüz işareti izleme ve vücut duruşu tahmini özellikleri de Artırılmış Gerçeklik SDK'sı kapsamında sunuluyor. SDK'nın yüz işareti izleme kapsamında 126 anahtar noktayı kullanarak yüz özelliklerini ve konturlarını tanıdığını belirtelim. Vücut duruşu tahmininde ise Maxine, insan vücüdunun 34 temel noktasını 2 boyutlu ve 3 boyutlu olarak tahmin ediyor. 

Teknoloji dünyasındaki gelişmeleri takip edin. Neleri size ulaştırmamızı istersiniz?
Abonelik kaydınız başarıyla oluşturuldu.