Categories: Yapay Zeka

Yapay Zekâ Modellerine Yönelik Humanity’s Last Exam Performans Testi

Yapay Zekâ Modellerine Yönelik Yeni Performans Testi: Humanity’s Last Exam

Yapay Zekâ Modellerine Yönelik Yeni Performans Testi: Humanity's Last ExamYapay Zekâ Modellerine Yönelik Yeni Performans Testi: Humanity's Last Exam

Yapay zekâ alanında çığır açan bir gelişme olarak, Center for AI Safety (CAIS) ve Scale AI isimli kuruluşlar tarafından oluşturulan yeni bir performans testi tanıtıldı. “Humanity’s Last Exam” adı verilen bu test, yapay zekâ modellerini son derece zorlayacak sorular içermekte ve sektörde önemli bir referans kaynağı olma potansiyeline sahip.

Test, matematik, beşeri bilimler, doğa bilimleri gibi çeşitli alanlarda 3.000’e yakın zorlu soru sunarak, yapay zekânın sınırlarını zorlamayı hedefliyor. Geliştiriciler, testin etkinliğini artırmak için grafikler, diyagramlar ve görsellerle desteklenen sorular hazırlamışlar.

Yapılan araştırmalar, mevcut en iyi yapay zekâ modellerinin bile bu performans testinde yüzde 100 başarı gösteremediğini ortaya koydu. Örneğin, 2021 yılında yayımlanan matematik odaklı testlerde, erken aşamadaki yapay zekâ sistemleri 100 üzerinden yalnızca 10 puan alabilmişlerdi. Bu durum, yapay zekânın düşünme ve problem çözme yeteneklerinin henüz istenilen düzeye ulaşamadığını gösteriyor.

Humanity’s Last Exam’in geliştirilmesi sürecinde, 50’den fazla ülkeden 1.000’den fazla uzman katkıda bulundu. Bu destek, araştırmacılar ve akademisyenlerden oluşan bir ekip tarafından sağlandı. Böylelikle, bu performans testi, yapay zekâ alanında gelecekteki gelişmeler için önemli bir kıstas olma yolunda ilerliyor.

Testte yer alan bazı örnek sorulara göz atmak isterseniz, buradaki bağlantıyı ziyaret edebilirsiniz.

Kaynak: Webtekno

Şinasi Kaya

Recent Posts

Build A Rocket Boy’un Yeni Oyunu MindsEye Eleştirilerin Odağında

Build A Rocket Boy'un yeni oyunu MindsEye, eleştirmenlerin dikkatini çeken benzersiz oyun deneyimi ve etkileyici…

43 dakika ago

macOS 26 ile Mac ve iPhone Entegreliği Güçleniyor: Telefon Özellikleri Yeniden Tanımlanıyor

macOS 26 ile Mac ve iPhone entegrasyonu güçleniyor, telefon özellikleri yeniden tanımlanıyor. Yenilikleri kaçırmayın, daha…

2 saat ago

Tesla CEO’su Elon Musk’tan Robotaksi ve Otonom Araçlar Hakkında Heyecan Verici Açıklamalar

Tesla CEO’su Elon Musk, robotaksi ve otonom araçlar hakkında heyecan verici gelişmeleri paylaştı. Geleceğin ulaşımında…

2 saat ago

Yandex Maps Türkiye’de Yeniliklerle Gelişiyor

Yandex Maps Türkiye'de yeni özellikler ve geliştirmelerle kullanıcı deneyimini artırıyor. En güncel navigasyon ve harita…

2 saat ago

Nintendo Switch 2’yi Rekor Kıran Bir Çıkış Yaptı

Nintendo Switch 2, çıkışında rekor kırdı! Yeni özellikler ve oyun deneyimiyle oyuncuları büyüleyen konsolu yakından…

3 saat ago

BYD’nin Yeni Hibrit SUV Modeli Sealion 8 Tanıtıldı

BYD'nin yeni hibrit SUV modeli Sealion 8 tanıtıldı. Yüksek performans ve şık tasarımıyla dikkat çeken…

4 saat ago