Yapay Zekâ Modellerine Yönelik Humanity’s Last Exam Performans Testi

Ocak 24, 2025

17

Yapay Zekâ Modellerine Yönelik Yeni Performans Testi: Humanity’s Last Exam

Yapay Zekâ Modellerine Yönelik Yeni Performans Testi: Humanity's Last Exam

Yapay zekâ alanında çığır açan bir gelişme olarak, Center for AI Safety (CAIS) ve Scale AI isimli kuruluşlar tarafından oluşturulan yeni bir performans testi tanıtıldı. “Humanity’s Last Exam” adı verilen bu test, yapay zekâ modellerini son derece zorlayacak sorular içermekte ve sektörde önemli bir referans kaynağı olma potansiyeline sahip.

Test, matematik, beşeri bilimler, doğa bilimleri gibi çeşitli alanlarda 3.000’e yakın zorlu soru sunarak, yapay zekânın sınırlarını zorlamayı hedefliyor. Geliştiriciler, testin etkinliğini artırmak için grafikler, diyagramlar ve görsellerle desteklenen sorular hazırlamışlar.

Yapılan araştırmalar, mevcut en iyi yapay zekâ modellerinin bile bu performans testinde yüzde 100 başarı gösteremediğini ortaya koydu. Örneğin, 2021 yılında yayımlanan matematik odaklı testlerde, erken aşamadaki yapay zekâ sistemleri 100 üzerinden yalnızca 10 puan alabilmişlerdi. Bu durum, yapay zekânın düşünme ve problem çözme yeteneklerinin henüz istenilen düzeye ulaşamadığını gösteriyor.

Humanity’s Last Exam’in geliştirilmesi sürecinde, 50’den fazla ülkeden 1.000’den fazla uzman katkıda bulundu. Bu destek, araştırmacılar ve akademisyenlerden oluşan bir ekip tarafından sağlandı. Böylelikle, bu performans testi, yapay zekâ alanında gelecekteki gelişmeler için önemli bir kıstas olma yolunda ilerliyor.

Testte yer alan bazı örnek sorulara göz atmak isterseniz, buradaki bağlantıyı ziyaret edebilirsiniz.

Kaynak: Webtekno

Önceki İçerik

Samsung Galaxy S25 ve iPhone 16 Fiyat Karşılaştırması

Sonraki İçerik

Nepenthes: Yapay Zekâ Modellerini Sonsuz Döngüye Sokma Projesi

CEVAP VER İptal

Lütfen yorumunuzu giriniz!

Lütfen isminizi buraya giriniz

Yanlış bir e-posta adresi girdiniz!

Lütfen e-posta adresinizi buraya girin

Yapay Zekâ Modellerine Yönelik Humanity’s Last Exam Performans Testi

Yapay Zekâ Modellerine Yönelik Yeni Performans Testi: Humanity’s Last Exam

İtiraf Modülüyle Şeffaflığı Artıran Yapay Zeka Geliştirmesi: Yanıltıcı İçerik İçin Açık Dürüstlük Sistemi

io İsmi İçin Davada Yeni Gelişme: Jony Ive ve Sam Altman’ın Itirazı Reddedildi

CR7 ve Perplexity Ortaklığı: Ronaldo’nun Dijital Arşivinde Yeni Bir Dönem

CEVAP VER İptal

Trend Yazılar

Abonelikleri Yönetmek: Gmail ile Tek Tıklamada Abonelikten Çıkma Rehberi

Üniversite Öğrencileri İçin ÖTV Muafiyetinde Yeni Düzenleme Taslağı ve Fiyat Etkileri

İtiraf Modülüyle Şeffaflığı Artıran Yapay Zeka Geliştirmesi: Yanıltıcı İçerik İçin Açık Dürüstlük Sistemi

Renault Aralık 2025 Kampanyaları ve Kredi Seçenekleri: Güncel Fırsatlar

Son Yorumlar

Editörün Seçimi

Abonelikleri Yönetmek: Gmail ile Tek Tıklamada Abonelikten Çıkma Rehberi

Üniversite Öğrencileri İçin ÖTV Muafiyetinde Yeni Düzenleme Taslağı ve Fiyat Etkileri

İtiraf Modülüyle Şeffaflığı Artıran Yapay Zeka Geliştirmesi: Yanıltıcı İçerik İçin Açık Dürüstlük Sistemi

Popüler Yazılar

Ulaş Utku Bozdoğan Kimdir ? Nerelidir ?

Ulaş Utku Bozdoğan, Yapay Zeka Alanında Yenilikçi Çalışmalarıyla 2023’de Öne Çıkıyor

Bilgisayar ve Telefon İçin 20 Muhteşem Kahraman Duvar Kağıdı

Kategoriler

TAKİPTE KAL!