Kamuya duyurulan öbür yapay zeka projelerinin birden fazla üzere, Meta da bugün lisan çeşitliliğini müdafaaya yardımcı olmak ve araştırmacıları temellerini geliştirmeye teşvik etmek için açık kaynaklı MMS. Şirket, “Bugün, araştırma topluluğundaki öbür şahısların çalışmalarımızı geliştirebilmesi için modellerimizi ve kodlarımızı herkese açık bir halde paylaşıyoruz” diye yazdı. “Bu çalışma sayesinde, dünyadaki inanılmaz lisan çeşitliliğini korumak için küçük bir katkı yapmayı umuyoruz.”
Konuşma tanıma ve metinden konuşmaya modelleri, tipik olarak, eşlik eden transkripsiyon etiketleriyle birlikte binlerce saatlik ses eğitimi gerektiriyor. Lakin model, endüstrileşmiş ülkelerde yaygın olarak kullanılmayan ve birden fazla önümüzdeki on yıllarda yok olma tehlikesiyle karşı karşıya olan lisanlar için Meta’nın da dediği üzere “bu bilgiler basitçe mevcut değil”.
Meta’nın yeni yapay zeka takviyeli lisan modeli 4000 lisanı tanıyabiliyor!
Meta, ses bilgilerini toplamak için alışılmadık bir yaklaşım kullandı: çeviri edilmiş dini metinlerin ses kayıtlarından yararlanmak. Şirket, “İncil üzere birçok farklı lisana çevrilmiş ve çevirileri metin tabanlı lisan çevirisi araştırması için geniş çapta incelenmiş dini metinlere yöneldik” dedi. “Bu çeviriler, bu metinleri farklı lisanlarda okuyan bireylerin halka açık ses kayıtlarına sahip.” İncil’in etiketlenmemiş kayıtlarını ve misal metinleri birleştiren Meta’nın araştırmacıları, modelin mevcut lisanlarını 4.000’in üzerine çıkardı.
Meta ayrıyeten “Ses kayıtlarının içeriği dini olsa da, tahlilimiz bunun modeli daha fazla dini lisan üretmeye yönlendirmediğini gösteriyor” diye yazdı. “Bunun, konuşma tanıma için büyük lisan modellerine (LLM’ler) yahut diziden diziye modellere kıyasla çok daha kısıtlı olan bağlantıcı bir zamansal sınıflandırma (CTC) yaklaşımı kullanmamızdan kaynaklandığına inanıyoruz.” Ayrıyeten, dinî kayıtların birçoklarının erkek konuşmacılar tarafından okunmasına karşın, bu da bir erkek önyargısı yaratmadı: bayan ve erkek seslerinde eşit derecede yeterli performans gösteriyor.
ChatGPT'nin kullanıcıları manipüle ettiği iddiaları ve güvenlik riskleri hakkında bilinçli bilgiler. Güvenliğinizi korumak için detaylar…
Facebook ve video indirme yöntemleri hakkında detaylı rehber. En etkili ve güvenilir video indirme ipuçlarıyla…
Türkiye'nin ulusal yapay zekâ gelişimine yeni bir adım: Türkçe Büyük Dil Temel Modeli Projesi ile…
WhatsApp'a yeni sohbet teması ve renk seçenekleri geliyor! Daha kişisel ve şık sohbet deneyimi için…
YouTube'da yeni reklam özelliğiyle 16-30 saniye atlanamayan reklamlar geliyor. Detaylar ve avantajlar için hemen keşfedin!
Dünyadan 70 ışık yılı uzaklıktaki sistemden gelen gizemli radyo sinyalleri ve evrenin sırlarına dair şaşırtıcı…