Categories: Yapay Zeka

Yapılan Testlere Göre GPT-5, GPT-4o’dan Daha Fazla Halüsinasyon Görüyor (Şaşırmadık Desek Yalan Olmaz)

Geçtiğimiz hafta OpenAI’nin en yeni modelini kullanıma sunmasıyla,
GPT-5 hakkında heyecanlar yükseldi. CEO Sam Altman, bu sürümün şimdiye kadarki en güçlü, en hızlı ve en güvenilir versiyon olduğunu belirtirken, yapay zekâların uydurduğu bilgileri ifade eden “halüsinasyon” kavramının bu modelde çok daha az görüleceğini vurguladı.

Bir karşılaştırma için GazeteBenzeri bir platform olan Vectara bu iddiaları test etti. Sonuçlarda GPT-5’in halüsinasyon oranının GPT-4’e göre düşüş gösterdiği fakat farkın çok büyük olmadığı ortaya çıktı. Testlere göre GPT-4 için %1,8 olan halüsinasyon oranı GPT-5te %1,4’e geriledi. GPT-4o ise %0,09 farkla GPT-5‘in önünde kaldı. En iyi sonuç ise %0,795 ile OpenAI’nin o3-mini High Reasoning modelinde görüldü. En çok halüsinasyon gören model ise Grok-4 olarak kaydedildi.

Ancak GPT-5 hâlâ rakiplerinin üzerinde güvenilirlik sunuyor. Örneğin Google’ın Gemini-2.5-pro sürümü %2,6 halüsinasyon üretirken, Grok-4 ise %4,8 oranında hata çıkarıyor. Grok’un arkasındaki xAI şirketi ise ünlülerin uygunsuz deepfake videolarını kolayca üretebilen “Spicy” modu nedeniyle eleştiri oklarının hedefinde kalıyor. Ayrıca verilerin X üzerinde toplanması nedeniyle halüsinasyon oranını düşürmekte karşılaşılan zorluklar da gündemde.

Peki sizce en düşük halüsinasyon oranını hangi model yakalıyor? Düşüncelerinizi aşağıdaki yorumlar kısmından bizimle paylaşabilirsiniz.

Kaynak: Webtekno

Meral Erden

Next Yıllardır İstenen Oldu: League of Legends'e WASD Desteği Geliyor »

Previous « Apple Tamamen Camdan Oluşacak iPhone İçin Yeni Bir Patent Daha Aldı: İşte Böyle Görünecek!

iPhone 16 Pro vs iPhone 17: Hangi model sizin için daha uygun?

iPhone 16 Pro ile 17 arasındaki farkları inceleyin. Hangi model sizler için daha uygun? Performans,…

7 saat ago

Otomobil

BYD SEAL U: Okyanus Estetiğiyle Donatılmış D-SUV Avantajları ve Performans Özellikleri

BYD SEAL U: Okyanus estetiğiyle donatılmış D-SUV’in avantajları, performans ve sürüş keyfi için etkileyici bir…

8 saat ago

Mobil

Şok Marketten Yepyeni Apple Lansmanı: iPhone 17 Pro Max 256 GB Sınırlı Fiyatla Satışta

Şok Markette iPhone 17 Pro Max 256 GB sürpriz fiyatla satışta! Yeni lansmanla teknoloji tutkunlarına…

9 saat ago

Otomobil

Volkswagen T-Roc: Şehirden Yola Uygun Performans ve Teknoloji Dengesi

Volkswagen T-Roc ile şehir konforu ve macera için ideal denge: sürüş teknolojileri, güvenlik ve performansın…

10 saat ago

Oyun

Steam Hafta Boyu İndirimleriyle Gelen Öne Çıkan Oyunlar ve Fiyat Değişimleri

Steam hafta boyu indirimleriyle öne çıkan oyunlar ve fiyat değişimleri: en iyi fırsatlar, hızlı edin,…

10 saat ago

Oyun

Türkiye’de 2-9 Aralık’ta Steam’de En Çok Satılan Oyunlar: EA SPORTS FC 26 Zirvede

Türkiye'de 2-9 Aralık'ta Steam'de en çok satanlar listesinde EA SPORTS FC 26 zirvede. Oyun dünyasındaki…

10 saat ago

Yapılan Testlere Göre GPT-5, GPT-4o’dan Daha Fazla Halüsinasyon Görüyor (Şaşırmadık Desek Yalan Olmaz)

Related Post

Recent Posts

iPhone 16 Pro vs iPhone 17: Hangi model sizin için daha uygun?

BYD SEAL U: Okyanus Estetiğiyle Donatılmış D-SUV Avantajları ve Performans Özellikleri

Şok Marketten Yepyeni Apple Lansmanı: iPhone 17 Pro Max 256 GB Sınırlı Fiyatla Satışta

Volkswagen T-Roc: Şehirden Yola Uygun Performans ve Teknoloji Dengesi

Steam Hafta Boyu İndirimleriyle Gelen Öne Çıkan Oyunlar ve Fiyat Değişimleri

Türkiye’de 2-9 Aralık’ta Steam’de En Çok Satılan Oyunlar: EA SPORTS FC 26 Zirvede