Categories: Yapay Zeka

Google, YouTube için gerçek vakitli dublaj hizmetini test ediyor

PaLM 2‘deki yapay zeka özelliklerinin Bard da dahil olmak üzere Google ekosistemine meselesiz bir halde entegre edilmesi, Google I/O 2023 aktifliğinin ana temalarından biri oldu. Lakin Google kimi özelliklerin çabucak piyasaya sürülmemesi gerektiğine inanıyor. Bu ortada PaLM 2, Google’ın makine tahsili ve yapay zeka alanındaki araştırmalarına dayanan yeni jenerasyon büyük lisan modeli olarak biliniyor.

Google I/O konuşmasında, şirketin teknoloji ve toplumdan sorumlu kıdemli lider yardımcısı James Manyika, yanlış bilgilendirme ve kimi yapay zeka yetenekleri, yani yapay zeka yoluyla yapılabilecek dezenformasyon ilgili telaşlarını lisana getirdi. Manyika’nın bahsettiği şey, deepfake çalışmalarının görüntülerde seslendirme yapmak için kullandıkları lisan modelleri.

Google, bu teknolojinin berbata kullanılma potansiyeli olduğunu düşünerek, birtakım adımlar atmayı ihmal etmemiş. Şimdilik test kademesinde prototip olarak yayınladığı “Evrensel Çevirmen” özelliği ise şimdiden geliştiriciler tarafından ilgi odağı haline gelmiş durumda.

Google’ın Kozmik Çevirmen’i, konuşmaları gerçek vakitli olarak çevirebiliyor. Bir görüntü izlerken diğer bir lisanda ne söylendiğini anında görebiliyor ve okuyabiliyorsunuz. Bunun bir nevi deneysel bir yapay zeka görüntü dublaj hizmeti olduğunu söyleyebiliriz.

Meral Erden: Google, YouTube için gerçek vakitli dublaj hizmetini test ediyor 1Meral Erden: Google, YouTube için gerçek vakitli dublaj hizmetini test ediyor 1

Prototip, aktiflik sırasında Arizona Eyalet Üniversitesi ile ortaklaşa oluşturulan bir çalışmadan alınan görüntüler aracılığıyla sergilendi. Google, birinci sonuçların umut verici olduğunu söylüyor.

Model 4 etapta çalışıyor. Birinci basamakta model, bir görüntüdeki dudak hareketlerini tanıdığı sözlerle eşleştiriyor. 2’inci adım, anlık konuşma üretimi sağlayan bir algoritmayı tetikliyor. Modelin 3’üncü etabı, çeviriye yardımcı olmak için konuşan kişinin doğal konuşma suratındaki yükselme ve alçalmayı ölçen tonlamayı kullanıyor. Son olarak, tarz kopyalandıktan ve konuşmacının dudak hareketlerinden ton eşleştirildikten sonra, çeviriyi oluşturmak için hepsini bir ortaya getiriyor.

Evrensel Tercüman özelliği şimdi küçük bir test kümesi dışında kullanıma açık değil. Google bu özelliği test ettikten sonra, YouTube ve görüntü konferans hizmeti Google Meet üzere hizmetlerde kullanıma sunabilir.

Meral Erden

Recent Posts

Tesla Model Y Türkiye’de Stok Güncellemeleri ve Yeni Hamleler

Tesla Model Y’nin Türkiye’deki stok güncellemeleri ve yeni hamleler hakkında güncel bilgiler. En son gelişmeleri…

23 dakika ago

Samsung’un Yeni Arayüzü One UI 8 Üzerinde Çalışmalar Hız Kesmeden Devam Ediyor

Samsung'un yeni arayüzü One UI 8 üzerinde çalışmalar hız kesmeden devam ediyor. Yenilikleri ve gelişmeleri…

35 dakika ago

iPhone 17 Pro Max’in Dev Pil Kapasitesi İddiası

iPhone 17 Pro Max'in dev pil kapasitesi iddiasıyla ilgili detaylar, batarya ömrü ve performans avantajları…

2 saat ago

Tesla’nın Türkiye’de Resmi Tesla Shop’u Açıldı: Artık Türkiye’den Tesla Aksesuarlarını Kolayca Satın Alabilirsiniz

Tesla'nın Türkiye’deki resmi mağazasıyla Tesla aksesuarlarını kolayca satın alın. Kalite ve güvenle Tesla ürünleri artık…

4 saat ago

Elektrikli Otomobillerde Devrim Niteliğinde Süper Şarj Teknolojisi Geliştirildi

Elektrikli otomobillerde devrim niteliğinde süper şarj teknolojisi geliştirildi. Daha hızlı şarj ve uzun menzil imkanlarıyla…

5 saat ago

Apple, Yeni Nesil iPhone 17 Serisini Tanıtmaya Hazırlanıyor

Apple, en yeni iPhone 17 serisi ile teknoloji severlere gelişmiş özellikler ve şıklık sunmaya hazırlanıyor.…

6 saat ago