Yapılan Testlere Göre GPT-5, GPT-4o’dan Daha Fazla Halüsinasyon Görüyor (Şaşırmadık Desek Yalan Olmaz)

Ağustos 11, 2025

5

Geçtiğimiz hafta OpenAI’nin en yeni modelini kullanıma sunmasıyla,
GPT-5 hakkında heyecanlar yükseldi. CEO Sam Altman, bu sürümün şimdiye kadarki en güçlü, en hızlı ve en güvenilir versiyon olduğunu belirtirken, yapay zekâların uydurduğu bilgileri ifade eden “halüsinasyon” kavramının bu modelde çok daha az görüleceğini vurguladı.

Yapılan Testlere Göre GPT-5, GPT-4o'dan Daha Fazla Halüsinasyon Görüyor (Şaşırmadık Desek Yalan Olmaz)

Bir karşılaştırma için GazeteBenzeri bir platform olan Vectara bu iddiaları test etti. Sonuçlarda GPT-5’in halüsinasyon oranının GPT-4’e göre düşüş gösterdiği fakat farkın çok büyük olmadığı ortaya çıktı. Testlere göre GPT-4 için %1,8 olan halüsinasyon oranı GPT-5te %1,4’e geriledi. GPT-4o ise %0,09 farkla GPT-5‘in önünde kaldı. En iyi sonuç ise %0,795 ile OpenAI’nin o3-mini High Reasoning modelinde görüldü. En çok halüsinasyon gören model ise Grok-4 olarak kaydedildi.

Ancak GPT-5 hâlâ rakiplerinin üzerinde güvenilirlik sunuyor. Örneğin Google’ın Gemini-2.5-pro sürümü %2,6 halüsinasyon üretirken, Grok-4 ise %4,8 oranında hata çıkarıyor. Grok’un arkasındaki xAI şirketi ise ünlülerin uygunsuz deepfake videolarını kolayca üretebilen “Spicy” modu nedeniyle eleştiri oklarının hedefinde kalıyor. Ayrıca verilerin X üzerinde toplanması nedeniyle halüsinasyon oranını düşürmekte karşılaşılan zorluklar da gündemde.

Peki sizce en düşük halüsinasyon oranını hangi model yakalıyor? Düşüncelerinizi aşağıdaki yorumlar kısmından bizimle paylaşabilirsiniz.

Kaynak: Webtekno

Önceki İçerik

Apple Tamamen Camdan Oluşacak iPhone İçin Yeni Bir Patent Daha Aldı: İşte Böyle Görünecek!

Sonraki İçerik

Yıllardır İstenen Oldu: League of Legends’e WASD Desteği Geliyor

CEVAP VER İptal

Lütfen yorumunuzu giriniz!

Lütfen isminizi buraya giriniz

Yanlış bir e-posta adresi girdiniz!

Lütfen e-posta adresinizi buraya girin

Yapılan Testlere Göre GPT-5, GPT-4o’dan Daha Fazla Halüsinasyon Görüyor (Şaşırmadık Desek Yalan Olmaz)

Görsel ve İşitsel Yapay Zekâ Üzerine Akışkan Bir İnceleme: Algı, Kaçınılmazlık ve Evrimsel Bir Bakış

İtiraf Modülüyle Şeffaflığı Artıran Yapay Zeka Geliştirmesi: Yanıltıcı İçerik İçin Açık Dürüstlük Sistemi

io İsmi İçin Davada Yeni Gelişme: Jony Ive ve Sam Altman’ın Itirazı Reddedildi

CEVAP VER İptal

Trend Yazılar

Meta, Limitless’i Satın Alarak Akıllı Giyilebilirlikte Yeni Bir Kategori Hedefliyor

Geçmişin Absürt Telefon Tasarımları: Dairesel Tuşlardan Ruj Telefonuna Kadar

FC 26 Profesyonel Taktikler: Sahada Kontrolü Elinde Tutmanın İncelikleri

Görsel ve İşitsel Yapay Zekâ Üzerine Akışkan Bir İnceleme: Algı, Kaçınılmazlık ve Evrimsel Bir Bakış

Son Yorumlar

Editörün Seçimi

Meta, Limitless’i Satın Alarak Akıllı Giyilebilirlikte Yeni Bir Kategori Hedefliyor

Geçmişin Absürt Telefon Tasarımları: Dairesel Tuşlardan Ruj Telefonuna Kadar

FC 26 Profesyonel Taktikler: Sahada Kontrolü Elinde Tutmanın İncelikleri

Popüler Yazılar

Ulaş Utku Bozdoğan Kimdir ? Nerelidir ?

Ulaş Utku Bozdoğan, Yapay Zeka Alanında Yenilikçi Çalışmalarıyla 2023’de Öne Çıkıyor

Bilgisayar ve Telefon İçin 20 Muhteşem Kahraman Duvar Kağıdı

Kategoriler

TAKİPTE KAL!