Categories: Yapay Zeka

OpenAI Yeni Sesli Konuşma Modellerini Tanıttı

OpenAI Yeni Ses Modellerini Duyurdu

OpenAI, sesli konuşma ve metinden sese çeviri alanında devrim niteliğinde yeni modellerini tanıttı. Bu yeni modeller artık API üzerinden erişilebilir durumda ve hem doğal konuşma üretimi hem de metinlerin sesli hale getirilmesi konularında önemli gelişmeler sunuyor. Kısacası, yapay zeka artık sadece konuşmakla kalmıyor, konuşma biçimini de çok daha etkili bir şekilde öğreniyor!

Yeni Modellerin Özellikleri

  • gpt-4o-mini-tts: Bu model, metinleri sese çevirerek daha akıcı ve gerçekçi konuşmalar oluşturabiliyor. Geliştiriciler, bu modelin konuşma tarzını özelleştirerek farklı seslendirme seçenekleri oluşturabiliyor. Örneğin, modelin bir bilim insanı gibi konuşması ya da sakin bir rehber sesiyle seslendirme yapması mümkün.
  • gpt-4o-transcribe ve gpt-4o-mini-transcribe: Bu modeller, OpenAI’nin önceki Whisper modelinin yerini alıyor. Yeni modeller, daha geniş kapsamlı ve yüksek kaliteli ses verileriyle eğitildiği için farklı aksanları ve konuşma tarzlarını daha iyi anlayabiliyor. Ayrıca, yoğun arka plan gürültüsünün bulunduğu ortamlarda bile konuşmaları daha doğru bir şekilde analiz edebiliyor.

Ancak, OpenAI, yeni transkripsiyon modellerini açık kaynak olarak sunmayacağını duyurdu. Daha önce Whisper modelini açık kaynak olarak paylaşan şirket, yeni modellerin çok daha büyük olduğunu ve yerel cihazlarda çalıştırılmasının güç olduğunu belirtti. Yine de, OpenAI ilerleyen dönemlerde cihazlara özel daha hafif versiyonların açık kaynak olarak yayımlanma ihtimalini değerlendiriyor.


Kaynak: Webtekno

İnanç Can Çekmez

Recent Posts

Meta, Limitless’i Satın Alarak Akıllı Giyilebilirlikte Yeni Bir Kategori Hedefliyor

Meta, Limitless’i satın alarak akıllı giyilebilirlikte yenilikçi bir kategori hedefliyor ve geleceğin teknolojisini keşfe davet…

2 saat ago

Geçmişin Absürt Telefon Tasarımları: Dairesel Tuşlardan Ruj Telefonuna Kadar

Geçmişin absürt telefon tasarımlarını keşfedin: dairesel tuşlardan ruj telefonuna uzanan bir yolculukla teknoloji geçmişini eğlenceli…

3 saat ago

FC 26 Profesyonel Taktikler: Sahada Kontrolü Elinde Tutmanın İncelikleri

FC 26 Profesyonel Taktikler: Sahada kontrolü elinde tutmanın inceliklerini keşfedin; pratiğe dönüştürülen strateji ve oyun…

3 saat ago

Görsel ve İşitsel Yapay Zekâ Üzerine Akışkan Bir İnceleme: Algı, Kaçınılmazlık ve Evrimsel Bir Bakış

Görsel ve işitsel yapay zekâ hakkında akışkan bir inceleme: algı, kaçınılmazlık ve evrimsel bakışla yön…

6 saat ago

Kapaklı Telefonların Altın Çağı: Unutulmaz Tasarımlar ve Efsane Modeller

Kapaklı telefonların nostaljisini yaşatırken, unutulmaz tasarımlar ve efsane modellerle altın çağını keşfedin.

9 saat ago

PS6 Beklentileri ve Özelliklerine Yeni Bir Bakış: Yayınlanmaya Hazırlanan Nesil Hakkında Güncel İzlenimler

PS6 beklentileri ve özellikleri üzerine güncel izlenimler: yayınlanmaya hazırlanan nesle dair güçlü bir önizleme ve…

9 saat ago