Categories: Yapay Zeka

ChatGPT’nin Yeni Sürümlerinin Eskiye Göre Daha Kötü Cevaplar Verdiği Ortaya Çıktı

OpenAI’ın Kasım 2022’de piyasaya sürdüğü sohbet botu ChatGPT, yapabildikleriyle tüm dünyada viral olmayı başarmıştı. ChatGPT, günümüzde birçok mobil uygulamada kullanılmaya, özellikle müşteri temsilciliğinde aktör olarak yer almaya başladı.

ChatGPT’nin her güncellemeyle birlikte geliştiğini varsayıyor olsak da 18 Temmuz’da yayınlanan bir araştırma, ortaya ilginç sonuçlar koydu. Stanford ve Kaliforniya Üniversitelerinden bilim insanları, ChatGPT’nin her yeni dil modeliyle daha kötü cevaplar vermeye başladığını açıkladı.

Son sürüm GPT modellerinde başarısızlık oranı daha yüksek:

Meral Erden: ChatGPT'nin Yeni Sürümlerinin Eskiye Göre Daha Kötü Cevaplar Verdiği Ortaya Çıktı 1Meral Erden: ChatGPT'nin Yeni Sürümlerinin Eskiye Göre Daha Kötü Cevaplar Verdiği Ortaya Çıktı 1

Araştırma ekibinde yer alan Lingjiao Chen, Matei Zaharia ve James Zou, ChatGPT’yi oluşturan dil modeli GPT’nin iki farklı versiyonunu ve ikişer sürümünü teste soktu: GPT-3.5 Mart/Haziran ve GPT-4 Mart/Haziran.

Testte, dil modeline birkaç matematik problemi ile hassas sorular soruldu. Kod yazımı ve girdiye yönelik muhakeme yürütmesi istendi. Özellikle sürümler arasındaki fark, fazlasıyla şaşırtıcıydı.

GPT-4’ün Mart sürümü, kendisine sunulan bir sayının asal sayı olup olmadığını %97,6 doğruluk oranıyla bilmeyi başardı. Aynı versiyonun Haziran sürümünde ise bu oran sadece %2,4 ile sınırlı kaldı.

Asal sayılarda GPT-3.5’in başarısı ise GPT-4 Mart’tan da daha iyiydi. GPT-3.5 Mart sürümü, asal sayıları aynı süre içinde daha yüksek doğrulukta biliyordu. Geliştikçe yaşanan benzer düşüşler kod yazımında da kendisini gösterdi.

İş hassas sorulara geldiğinde ise garip bir tablo oluştu. Mart sürümlerinde bot, kullanıcıya bir soruyu neden cevaplayamayacağını detaylı bir şekilde anlatıyordu. Haziran sürümlerinde ise sadece kullanıcıdan özür diliyor ve soruyu cevaplayamayacağını söylüyor.

ChatGPT’nin kabiliyetlerindeki düşüşün ardındaki nedeni, araştırmayı yapan ekip de belirleyemedi.

Kaynak:  Webtekno

Meral Erden

Recent Posts

Samsung Galaxy Z Fold 7 Performans Testleri ve Özellikleri

Samsung Galaxy Z Fold 7'nin performans testleri ve özellikleri detaylı inceleme. En yeni özellikler ve…

1 saat ago

Apple iPhone 17 Serisi Ekran Özellikleri Hakkında Güncel Sızıntılar

Apple iPhone 17 Serisi ekran özellikleri hakkında güncel sızıntılar, yenilikler ve detaylar burada! En son…

2 saat ago

State of Play Etkinliği’nde Tanıtılan Tüm Oyunlar ve Detaylar

State of Play Etkinliği’nde tanıtılan tüm oyunlar ve detaylar hakkında bilgi edinin. En yeni oyunlar…

10 saat ago

Google Chrome Güvenlik Açığını Hızla Düzeltmeye Aldı: Güncelleme Şart!

Google Chrome'daki güvenlik açığını hızlıca kapatan güncelleme ile güvenliğinizi artırın. Güncelleme şart! Detaylar ve adımlar…

11 saat ago

Google Translate’e Yapay Zeka Destekli Güncellemeler ve Yenilikler

Google Translate'e yapay zeka destekli güncellemeler ve yenilikler ile daha doğru ve hızlı çeviri deneyimi…

13 saat ago

ChatGPT’nin İş Dünyasına Yönelik Yeni Güncellemeleri ve Özellikleri

ChatGPT'nin iş dünyasına yönelik yeni güncellemeleri ve özellikleri hakkında detaylı bilgiler. Verimliliği artıran yenilikleri keşfedin.

14 saat ago