NVIDIA’dan Yeni Ses Üretken Yapay Zekâ Modeli: Fugatto
Yapay zekâ alanında donanımları ve modelleri ile önemli bir yere sahip olan NVIDIA, “ses için İsviçre çakısı” olarak tanımladığı yeni deneysel üretken yapay zekâ modeli Fugatto’yu (Foundational Generative Audio Transformer Opus 1) tanıttı. Fugatto ismi, müzikte kullanılan ve çok sesli, tekrar eden melodilerden oluşan besteleme modeli olan Fugato teriminden esinlenmiştir. Bu isim, yapay zekâ modelinin de çok sesli yapısını ve farklı aksanları ile dilleri algılayabilme yeteneğini yansıtmak için seçilmiştir.
Sesleri İnsanların Anladığı Gibi Anlayacak
Konu hakkında açıklamalarda bulunan NVIDIA Uygulamalı Ses Araştırmaları Yöneticisi Rafael Valle, “İnsanların sesleri anladığı ve ürettiği gibi anlayan bir model oluşturmak istedik.” şeklinde bir ifade kullandı. NVIDIA, Fugatto’nun gerçek dünyada kullanılabilecek çeşitli senaryolarına da duyurusunda yer verdi. Bu senaryolar arasında:
- Bir şarkı fikrinin prototipini oluşturmak,
- Farklı tarzlar, sesler ve enstrümanları denemek,
- Farklı ses tonlarıyla ve aksanlarla dil öğrenme fırsatı,
- Oyun geliştiricilerinin aynı sesin varyasyonlarını üretmesine yardımcı olmak,
- Yeni alanlarda ufak ayarlarla kullanılabilme yeteneği.
Fugatto’nun kamunun erişimine açılıp açılmayacağı ise henüz netlik kazanmış değil. Daha önce, Meta ve Google gibi teknoloji devleri de benzer yapay zekâ modelleri geliştirmişti.
Kaynak: Webtekno