Yapay zekâ alanında çığır açan bir gelişme olarak, Center for AI Safety (CAIS) ve Scale AI isimli kuruluşlar tarafından oluşturulan yeni bir performans testi tanıtıldı. “Humanity’s Last Exam” adı verilen bu test, yapay zekâ modellerini son derece zorlayacak sorular içermekte ve sektörde önemli bir referans kaynağı olma potansiyeline sahip.
Test, matematik, beşeri bilimler, doğa bilimleri gibi çeşitli alanlarda 3.000’e yakın zorlu soru sunarak, yapay zekânın sınırlarını zorlamayı hedefliyor. Geliştiriciler, testin etkinliğini artırmak için grafikler, diyagramlar ve görsellerle desteklenen sorular hazırlamışlar.
Yapılan araştırmalar, mevcut en iyi yapay zekâ modellerinin bile bu performans testinde yüzde 100 başarı gösteremediğini ortaya koydu. Örneğin, 2021 yılında yayımlanan matematik odaklı testlerde, erken aşamadaki yapay zekâ sistemleri 100 üzerinden yalnızca 10 puan alabilmişlerdi. Bu durum, yapay zekânın düşünme ve problem çözme yeteneklerinin henüz istenilen düzeye ulaşamadığını gösteriyor.
Humanity’s Last Exam’in geliştirilmesi sürecinde, 50’den fazla ülkeden 1.000’den fazla uzman katkıda bulundu. Bu destek, araştırmacılar ve akademisyenlerden oluşan bir ekip tarafından sağlandı. Böylelikle, bu performans testi, yapay zekâ alanında gelecekteki gelişmeler için önemli bir kıstas olma yolunda ilerliyor.
Testte yer alan bazı örnek sorulara göz atmak isterseniz, buradaki bağlantıyı ziyaret edebilirsiniz.
Kaynak: Webtekno
Gmail ile tek tıklamada abonelikten çıkın: kolay adımlar, güvenli işlem ve temiz bir gelen kutusu…
Üniversite öğrencileri için ÖTV muafiyetindeki yeni taslak ve fiyat etkilerini inceleyen kapsamlı rehber.
İtiraf Modülüyle yapay zekada şeffaflığı artırın: Yanıltıcı içeriklere karşı açık dürüstlük sistemiyle güvenilir bilgiye hızlı…
Renault Aralık 2025 kampanyaları, kredi seçenekleri ve güncel fırsatlar: avantajlı finansmanla hemen aracınıza sahip olun.
Steam ücretsiz oynanabilir oyunlar: 4-8 Aralık festivali ve iki yeni oyun ilanı – kaçırma, etkinlik…
Aralık ayında Amazon Luna (Prime Gaming) Ücretsiz Oyunları ve Erişim Endpoint'ine ilişkin en güncel bilgiler,…