BBC tarafından gerçekleştirilen kapsamlı bir araştırma, yapay zekâ sohbet botlarının haber içeriklerini ne derece etkili bir şekilde özetleyebildiğini ortaya koydu. Çalışmada, OpenAI’ın ChatGPT’si, Microsoft’un Copilot’u, Google’ın Gemini’si ve Perplexity AI gibi popüler yapay zekâ platformlarına, BBC’nin haberleri verildi ve bu içeriklerin özetlenmesi istendi.
Bu inceleme, yapay zekâ sohbet botlarının haber özetleme yeteneklerini değerlendirmek amacıyla 100 farklı haber üzerinde yapıldı. Sonuçlar, bu botların haberleri güvenilir bir şekilde özetleme konusunda yetersiz kaldıklarını ve önemli hatalar yaptıklarını gösterdi. Özellikle, aşağıdaki hatalar tespit edildi:
Uzman gazetecilerin yaptığı detaylı incelemelerde, botların ürettiği yanıtların %51’inde ciddi yanlışlıklar gözlemlendi. Ayrıca, BBC kaynaklı haberleri temel alan yanıtların %19’unda yanlış tarihler, hatalı rakamlar ve eksik bilgiler tespit edildi. Öne çıkan hatalar arasında, Gemini’nin İngiltere’nin sağlık sistemi NHS’nin elektronik sigarayı sigarayı bırakmak için önerilmediğini iddia etmesi dikkat çekti.
ChatGPT ve Copilot’un ise eski İngiltere Başbakanı Rishi Sunak ve eski İskoçya Başbakanı Nicola Sturgeon’un hâlâ görevde olduklarını belirtmesi diğer dikkat çeken yanlışlıklardandı. Perplexity AI ise BBC haberlerini yanlış bir biçimde alıntılayarak hatalı bir içerik sundu.
BBC yetkilileri, yapay zekâ firmalarıyla iş birliği yaparak bu tür hataların önüne geçilmesi gerektiğini vurguladı. Kurum, yapay zekâ destekli haber özetleme sistemlerinin güvenilirliği konusunda endişelerini dile getirerek bu sistemlerin geri çekilmesini talep etti. Ayrıca, daha önce Apple’ın benzer bir durumu kabul ederek bu özelliği devre dışı bıraktığını hatırlattı.
Yapay zekâ sohbet botlarının haber içeriklerini nasıl ele aldığı konusundaki tartışmalar devam ederken, OpenAI ise kaynak gösterme konusunda iyileştirmeler yapma çabalarını sürdürdüğünü açıkladı.
Kaynak: Webtekno
Spotify'da beklenen fiyat artışının detayları, nedenleri ve olası etkileri hakkında bilinmesi gerekenler. Güncel tahminler ve…
Nothing'tan sıradışı tasarımlı ve bütçe dostu CMF Phone 2 Pro'nun detaylı tanıtımıyla inovasyonu keşfedin. Modern…
ChatGPT'ye gelen yeni özellikler ve güncellemeler hakkında detaylar, kullanım kolaylıkları ve gelişmelerle ilgili en güncel…
Togg T10F ile Leapmotor B01 tasarımını karşılaştırın. Benzerlikler ve farklar hakkında detaylı bilgi ve analizlerle…
Samsung Galaxy S22 ve S23 FE kullanıcıları için One UI 7.0 güncellemesi resmi olarak yayınlandı.…
Türkiye'nin 2028'de Çin ile Ay görevi ortaklığı ve keşif projeleri hakkında detaylar, hedefler ve uluslararası…