Google Gemini 2.5 Pro: Yapay Zekâ Performans Testlerinde Zirvede

Nisan 4, 2025

11

Yapay Zekâ Modellerinin Performans Testleri

Yapay zekâ sektörü her geçen gün daha da rekabetçi hale gelirken, yapılan testler, dünyanın en üstün yapay zekâ modelinin hangisi olduğunu gözler önüne serdi. Elde edilen bulgular, aslında çok da şaşırtıcı değildi. Google’ın yeni nesil yapay zekâ modeli Gemini 2.5 Pro, girdiği testlerde diğer modellerden daha iyi sonuçlar elde etti. Google Gemini 2.5 Pro ile diğer yapay zekâlar arasındaki performans farkı oldukça belirgin ve etkileyiciydi.

Model, bazı testlerde rakiplerinin gerisinde kalsa da, buradaki puan farkı çok anlamlı değildi. Gemini 2.5 Pro, farklı testlerde de gözle görülür bir başarı sergiliyor! Örneğin, matematik alanında gerçekleştirilen MathArena testinde, bu model rakiplerinden çok daha etkileyici bir performans sergileyerek, puanını yüzde 24,4 olarak kaydettirdi. Aynı testte, OpenAI, Anthropic ve DeepSeek gibi önde gelen firmaların yapay zekâ modelleri ise yüzde 5’in altında kaldı.

Bunun yanı sıra, yapay zekânın insanları ne zaman geçebileceğini ölçen Humanity’s Last Exam testinde de Gemini 2.5 Pro, rakiplerini geride bıraktı. Ancak bu, Gemini 2.5 Pro’nun her alanda en iyi yapay zekâ modeli olduğu anlamına gelmiyor. Örneğin, kodlama konusunda gerçekleştirilen LiveCodeBench testinde modelin aldığı puan yüzde 70,4 olarak kaydedildi. OpenAI’ın o3-mini modeli ise aynı testte yüzde 74,1 puan elde etti.

Ayrıca, yazılım geliştirme ile ilgili bir diğer test olan SWE-bench‘te Gemini 2.5 Pro, yüzde 63,8 puan alarak, yüzde 70,3 puanla öne çıkan Claude 3.7 Sonnet’in gerisinde kaldı.

Kaynak: Webtekno

Önceki İçerik

DDR5 Bellek Modüllerinde Fiyat Artışı ve Nedenleri

Sonraki İçerik

Dünyanın En Küçük Kalp Pili Geliştirildi

CEVAP VER İptal

Lütfen yorumunuzu giriniz!

Lütfen isminizi buraya giriniz

Yanlış bir e-posta adresi girdiniz!

Lütfen e-posta adresinizi buraya girin

Google Gemini 2.5 Pro: Yapay Zekâ Performans Testlerinde Zirvede

Yapay Zekâ Modellerinin Performans Testleri

Yapay Zeka Destekli Film Seti Gezi Akımı: Adım Adım Uygulama Rehberi

YouTube Gaming ve Playables Builder: Kodsuz Oyun Tasarımında Yeni Deney

ChatGPT ile Apple Music Entegrasyonu: Yakında Kullanıma Sunulacak Özellikler ve İşleyiş

CEVAP VER İptal

Trend Yazılar

Netflix ve FIFA İş Birliğiyle 2026 Dünya Kupası’na Özel Oyun Geliyor: Delphi Interactive Geliştirme ve Çok Oyunculu Deneyim

Dizüstü Bilgisayarlarda Şarjdan Çıkınca Performans Düşüşünün Kök Nedenleri

5D Cam Bellek: Evrenin Yaşıyla Uygun Dayanıklı Genişletilmiş Depolama Deneyi

Akıllı Telefon Kameralarının Performansını Belirleyen Temel Unsurlar

Son Yorumlar

Editörün Seçimi

Netflix ve FIFA İş Birliğiyle 2026 Dünya Kupası’na Özel Oyun Geliyor: Delphi Interactive Geliştirme ve Çok Oyunculu Deneyim

Dizüstü Bilgisayarlarda Şarjdan Çıkınca Performans Düşüşünün Kök Nedenleri

5D Cam Bellek: Evrenin Yaşıyla Uygun Dayanıklı Genişletilmiş Depolama Deneyi

Popüler Yazılar

Ulaş Utku Bozdoğan Kimdir ? Nerelidir ?

Ulaş Utku Bozdoğan, Yapay Zeka Alanında Yenilikçi Çalışmalarıyla 2023’de Öne Çıkıyor

Bilgisayar ve Telefon İçin 20 Muhteşem Kahraman Duvar Kağıdı

Kategoriler

TAKİPTE KAL!