Categories: Yapay Zeka

Google Gemini 2.5 Pro: Yapay Zekâ Performans Testlerinde Zirvede

Yapay Zekâ Modellerinin Performans Testleri

Yapay Zekâ Modellerinin Performans TestleriYapay Zekâ Modellerinin Performans Testleri

Yapay zekâ sektörü her geçen gün daha da rekabetçi hale gelirken, yapılan testler, dünyanın en üstün yapay zekâ modelinin hangisi olduğunu gözler önüne serdi. Elde edilen bulgular, aslında çok da şaşırtıcı değildi. Google’ın yeni nesil yapay zekâ modeli Gemini 2.5 Pro, girdiği testlerde diğer modellerden daha iyi sonuçlar elde etti. Google Gemini 2.5 Pro ile diğer yapay zekâlar arasındaki performans farkı oldukça belirgin ve etkileyiciydi.

Model, bazı testlerde rakiplerinin gerisinde kalsa da, buradaki puan farkı çok anlamlı değildi. Gemini 2.5 Pro, farklı testlerde de gözle görülür bir başarı sergiliyor! Örneğin, matematik alanında gerçekleştirilen MathArena testinde, bu model rakiplerinden çok daha etkileyici bir performans sergileyerek, puanını yüzde 24,4 olarak kaydettirdi. Aynı testte, OpenAI, Anthropic ve DeepSeek gibi önde gelen firmaların yapay zekâ modelleri ise yüzde 5’in altında kaldı.

Bunun yanı sıra, yapay zekânın insanları ne zaman geçebileceğini ölçen Humanity’s Last Exam testinde de Gemini 2.5 Pro, rakiplerini geride bıraktı. Ancak bu, Gemini 2.5 Pro’nun her alanda en iyi yapay zekâ modeli olduğu anlamına gelmiyor. Örneğin, kodlama konusunda gerçekleştirilen LiveCodeBench testinde modelin aldığı puan yüzde 70,4 olarak kaydedildi. OpenAI’ın o3-mini modeli ise aynı testte yüzde 74,1 puan elde etti.

Ayrıca, yazılım geliştirme ile ilgili bir diğer test olan SWE-bench‘te Gemini 2.5 Pro, yüzde 63,8 puan alarak, yüzde 70,3 puanla öne çıkan Claude 3.7 Sonnet’in gerisinde kaldı.

Kaynak: Webtekno

İnanç Can Çekmez

Recent Posts

Microsoft, Windows 10’un Destek Süresini Uzatıyor: İşte Detaylar

Microsoft, Windows 10'un destek süresini uzatıyor! İşte detaylar ve yeni güncelleme bilgileriyle ilgili en güncel…

7 saat ago

Apple’ın iOS 26 Güncellemeleriyle Alarm Ekranı Yenilendi

Apple'ın iOS 26 güncellemeleriyle alarm ekranı yeni özellikler ve tasarımla yenilendi, kullanımı daha kolay ve…

7 saat ago

Yapay Zekâ Videolarında Köpekler Sahneye Çıkıyor: Hailuo 02 ile Yeni Trend

Yapay zekâ videolarında köpekler sahne alıyor! Hailuo 02 ile yeni trendleri keşfedin ve eğlence dolu…

8 saat ago

Hollanda’da PlayStation Dijital Oyun Fiyatlarına Karşı Toplu Dava Başlatıldı

Hollanda'da PlayStation dijital oyun fiyatlarına karşı toplu dava başladı. Detaylar ve gelişmeleri öğrenmek için tıklayın.

8 saat ago

Apple Arcade Nedir? Detaylı Rehber ve Bilmeniz Gerekenler

Apple Arcade nedir? Detaylı rehberle hizmetin özelliklerini, fiyatlandırmasını ve bilmeniz gereken tüm detayları keşfedin. Eğlenceyi…

8 saat ago

Google, Eski Android Sürümlerine Sahip Cihazlar İçin Chrome Desteğini Kesti

Google, eski Android sürümlerine sahip cihazlar için Chrome desteğini sona erdiriyor. Güncellemeleri kaçırmayın ve güvenliğinizi…

8 saat ago