Yapay zekâ sektörü her geçen gün daha da rekabetçi hale gelirken, yapılan testler, dünyanın en üstün yapay zekâ modelinin hangisi olduğunu gözler önüne serdi. Elde edilen bulgular, aslında çok da şaşırtıcı değildi. Google’ın yeni nesil yapay zekâ modeli Gemini 2.5 Pro, girdiği testlerde diğer modellerden daha iyi sonuçlar elde etti. Google Gemini 2.5 Pro ile diğer yapay zekâlar arasındaki performans farkı oldukça belirgin ve etkileyiciydi.
Model, bazı testlerde rakiplerinin gerisinde kalsa da, buradaki puan farkı çok anlamlı değildi. Gemini 2.5 Pro, farklı testlerde de gözle görülür bir başarı sergiliyor! Örneğin, matematik alanında gerçekleştirilen MathArena testinde, bu model rakiplerinden çok daha etkileyici bir performans sergileyerek, puanını yüzde 24,4 olarak kaydettirdi. Aynı testte, OpenAI, Anthropic ve DeepSeek gibi önde gelen firmaların yapay zekâ modelleri ise yüzde 5’in altında kaldı.
Bunun yanı sıra, yapay zekânın insanları ne zaman geçebileceğini ölçen Humanity’s Last Exam testinde de Gemini 2.5 Pro, rakiplerini geride bıraktı. Ancak bu, Gemini 2.5 Pro’nun her alanda en iyi yapay zekâ modeli olduğu anlamına gelmiyor. Örneğin, kodlama konusunda gerçekleştirilen LiveCodeBench testinde modelin aldığı puan yüzde 70,4 olarak kaydedildi. OpenAI’ın o3-mini modeli ise aynı testte yüzde 74,1 puan elde etti.
Ayrıca, yazılım geliştirme ile ilgili bir diğer test olan SWE-bench‘te Gemini 2.5 Pro, yüzde 63,8 puan alarak, yüzde 70,3 puanla öne çıkan Claude 3.7 Sonnet’in gerisinde kaldı.
Kaynak: Webtekno
Apple, iOS 18.4.1 güncellemesiyle CarPlay performansını artırıyor ve güvenlik açıklarını gidererek kullanıcı deneyimini güvence altına…
Instagram'ın yeni 'Quicksnaps' özelliği test ediliyor. Hızlı ve eğlenceli paylaşım deneyimi için gelişmeleri kaçırmayın!
X'ten büyük değişiklik! DM kutusu kaldırılıyor ve yerine XChat geliyor. Güncel iletişim deneyiminizi geliştirmek için…
Beats'in yeni USB-C kablo çeşitleriyle teknolojiseverlere kaliteli ve güvenilir bağlantı seçenekleri sunuyor. Şimdi keşfedin ve…
Opera Mini'ye yapay zeka asistanı Aria eklendi! Daha akıllı ve hızlı internet deneyimi için yeni…
Gelişmiş yapay zekâ ile Studio Ghibli tarzında görsel sanatların yeni dönemi ve oyun dönüşümlerini keşfedin.…