OpenAI, kitap özeti çıkaran yapay zeka modeli geliştirdi

OpenAI'ın yeni modeli, önce bir kitabın küçük bölümlerini özetleyerek, ardından bu özetleri daha üst düzey bir özet halinde özetleyerek çalışıyor.
OpenAI, kitap özeti çıkaran yapay zeka modeli geliştirdi

OpenAI, kitapları özetleyebilen bir yapay zeka modeli geliştirdi. GPT- 3'ün ince ayarlı bir versiyonu olan model, önce bir kitabın küçük bölümlerini özetleyerek ve ardından bu özetleri OpenAI'ın “öz yinelemeli görev ayrıştırma” olarak adlandırdığı bir paradigmayı takip ederek daha üst düzey özetler halinde özetleyerek çalışıyor. 

Hizalama sorununa ölçeklenebilir bir çözümün, model çıktılarının insanlar tarafından değerlendirilmesinin zor veya zaman alıcı olduğu görevlerde çalışması gerekiyor. OpenAI'ın kendi paylaştığı bilgilere baktığımızda şirketin, ölçeklenebilir hizalama tekniklerini test etmek tüm kitapları özetlemek üzere bir model eğittiğini görüyoruz.

Yukarıda da bahsettiğimiz gibi bu model, önce bir kitabın küçük bölümlerini özetleyerek, ardından bu özetleri daha üst düzey bir özet halinde özetleyerek çalışıyor. Hatta OpenAI'ın sitesine baktığımızda Lewis Carroll'ın Alice's Adventures in Wonderland (Alice Harikalar Diyarında) kitabının bir özetini görmek mümkün.

OpenAI, en iyi modelin GPT-3'ten ince ayarlandığını ve tüm kitapların mantıklı özetlerini oluşturduğunu belirtiyor. Hatta bu özetler, bazen insan tarafından yazılan özetlerin ortalama kalitesiyle eşleşiyor. Modelin ayrıca kitap uzunluğunda özetleme için BookSum veri setinde en gelişmiş sonuçları elde ettiği belirtiliyor. Kitap uzunluğundaki soru cevaplama için NarrativeQA veri setinde en son teknolojiyi elde etmek için modelin özetleri kullanılabiliyor.

OpenAI, modellerini giderek daha karmaşık görevleri yapmak için eğitirken, modellerin çıktılarının bilinçli değerlendirmelerini yapmanın insanlar için giderek daha zor hale geleceğini belirtiyor. Bu durumun model çıktılarında, mevcut modeller dağıtıldığında olumsuz sonuçlara yol açabilecek ince sorunları tespit etmeyi zorlaştırdığını belirten şirket, yetenekleri arttıkça modellerini değerlendirme yeteneğinin de artmasını istiyor. Şirket, bu konuda yaklaşımlarının insanları diğer modellerden gelen yardımları kullanarak makine öğrenimi modeli çıktılarını değerlendirme konusunda yetkilendirmek olduğunun altını çiziyor.