Perşembe, Nisan 10, 2025
Ana SayfaYapay ZekaGoogle Gemini 2.5 Pro: Yapay Zekâ Performans Testlerinde Zirvede

Google Gemini 2.5 Pro: Yapay Zekâ Performans Testlerinde Zirvede

Yapay Zekâ Modellerinin Performans Testleri

Yapay Zekâ Modellerinin Performans Testleri

Yapay zekâ sektörü her geçen gün daha da rekabetçi hale gelirken, yapılan testler, dünyanın en üstün yapay zekâ modelinin hangisi olduğunu gözler önüne serdi. Elde edilen bulgular, aslında çok da şaşırtıcı değildi. Google’ın yeni nesil yapay zekâ modeli Gemini 2.5 Pro, girdiği testlerde diğer modellerden daha iyi sonuçlar elde etti. Google Gemini 2.5 Pro ile diğer yapay zekâlar arasındaki performans farkı oldukça belirgin ve etkileyiciydi.

Model, bazı testlerde rakiplerinin gerisinde kalsa da, buradaki puan farkı çok anlamlı değildi. Gemini 2.5 Pro, farklı testlerde de gözle görülür bir başarı sergiliyor! Örneğin, matematik alanında gerçekleştirilen MathArena testinde, bu model rakiplerinden çok daha etkileyici bir performans sergileyerek, puanını yüzde 24,4 olarak kaydettirdi. Aynı testte, OpenAI, Anthropic ve DeepSeek gibi önde gelen firmaların yapay zekâ modelleri ise yüzde 5’in altında kaldı.

Bunun yanı sıra, yapay zekânın insanları ne zaman geçebileceğini ölçen Humanity’s Last Exam testinde de Gemini 2.5 Pro, rakiplerini geride bıraktı. Ancak bu, Gemini 2.5 Pro’nun her alanda en iyi yapay zekâ modeli olduğu anlamına gelmiyor. Örneğin, kodlama konusunda gerçekleştirilen LiveCodeBench testinde modelin aldığı puan yüzde 70,4 olarak kaydedildi. OpenAI’ın o3-mini modeli ise aynı testte yüzde 74,1 puan elde etti.

Ayrıca, yazılım geliştirme ile ilgili bir diğer test olan SWE-bench‘te Gemini 2.5 Pro, yüzde 63,8 puan alarak, yüzde 70,3 puanla öne çıkan Claude 3.7 Sonnet’in gerisinde kaldı.

Kaynak: Webtekno

RELATED ARTICLES

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz

Trend Yazılar