Tekno Takip

Meta’dan sonra Google’da yapay zekaya ses ürettiriyor

Ulaş Utku Bozdoğan: Meta’dan sonra Google’da yapay zekaya ses ürettiriyor 1

Yapay zeka teknolojisi her geçen gün yeni bir düzeye ulaşıyor. Birçok kişi bu teknolojiyi ödevlerini tamamlamakta kullanırken, yapay zeka bu tıp kullanımların çok daha ötesine geçebiliyor. Google, yıllardır yapay zekanın bu potansiyelini tam manasıyla keşfetmek için çalışmalar yapıyor. AudioPaLM ismini verdikleri son geliştirmeleriyle, eşsiz bir doğrulukla dinleme, konuşma ve çeviri yeteneği sunabilecek bir model üzerinde çalışıyorlar.

Google araştırmacıları, AudioPaLM ismini verdikleri, dinleme, konuşma ve çeviri yeteneği olan yeni bir lisan modelini tanıttılar. Bu model, PaLM-2 ve AudioLM ismindeki iki var olan modelin yeteneklerini birleştirerek oluşturuldu. AudioPaLM, metin tabanlı bir lisan modeli olan PaLM-2’nin dilsel bilgi tahlil yeteneği ile paralinguistik bilgi muhafaza konusunda eksiksiz olan AudioLM modelinin yeteneklerini bir ortada sunarak hem metin üzerinde hem de konuşmada daha geniş kapsamlı bir anlayış ve üretim sağlıyor.

Meta’dan sonra Google’da yapay zekaya ses ürettiriyor

AudioPaLM, konuşmayı ve metni temsil etmek için hudutlu sayıda belirteç kullanan bir söz dağarcığı kullanıyor. Bu da, konuşma tanıma, metinden sese dönüştürme ve konuşmadan konuşmaya çeviri üzere süreçlerin tek bir mimari ve eğitim sürecine entegre edilmesini mümkün kılıyor.

AudioPaLM, mevcut sistemlere kıyasla daha uygun bir performans gösterdiği belirtildi. Bu model, daha evvel karşılaşmadığı lisan kombinasyonları için sıfır öğrenme ile metinden konuşmaya çeviri yapabiliyor. Kısa konuşma ipuçlarına dayanarak, sesleri farklı lisanlar arasında taşıyabiliyor ve farklı lisanlardaki farklı ses tonlarını yakalayıp tekrar üretebiliyor.

Exit mobile version