Yeni gelişmelerin yankıları hâlâ sürerken, Google’ın Gemini 3 ailesi, dünya çapında gerçekleştirilen çeşitli performans testlerinde dikkatleri üzerine çekti. En önemli sonuçlar, rakipleri karşısında üst düzey bir performans sergilediğini gösteriyor. Bu içeriğimizde, Gemini 3’ün teste dayalı performansını ve elde ettiği başlıca bulguları özetliyoruz.
Yapılan kapsamlı değerlendirmeler sırasında, Google DeepMind ekibinin paylaştığı veriler ışığında Gemini 3’ün çoğu testte rakiplerini geride bıraktığı görüldü. Özellikle Humanity’s Last Exam adıyla bilinen küresel testler, Gemini 3 Pro modelinin çetin sorular karşısında ne kadar dayanıklı olduğunu ortaya koydu. Bu sınavda 2.500 soruluk bir dizi zorlu görev yer alıyor ve sonuçlar, GPT ile Sonnet gibi rakipleri geride bıraktı.
Bir diğer önemli sonuç ise Gemini 3 Deep Think ile ilgili. Bu testte, Gemini 3 Pro’nun ötesine geçilebildiğini gösteren bulgular mevcut. Ayrıca “yapay zekâ modelleri kârlı bir işletmeyi nasıl yönetir?” sorusunu içeren bir testte de üstünlük sağlandı ve Gemini 3 Pro, 5.500 dolarlık kazançla en yakın rakibi Sonnet’u geride bıraktı. Görüntülenen diğer ölçütler arasında, halüsinasyon ihtimalini ortaya koyan SimpleQA Verified testinde Gemini 3 Pro’nun en üst sıralarda olduğu dikkat çekiyor; bu alandaki rekabet, Gemini 2.5’in önceki iyileştirmelerini aşma eğilimini doğruluyor.
Çeşitli ölçekler üzerinden değerlendirilen yapay zekâ araçlarının genel zekâ durumunu ölçmeye yönelik Artificial Analysis Intelligence Index tablosunun sonuçları da Gemini 3 Pro’nun GPT 5.1’i 3 puan farkla geçtiğini gösteriyor. Ayrıca Gemini 2.5 Pro ile Gemini 3 Pro arasındaki performans farkı, sektördeki rekabetin yönünü daha da belirginleştirdi.
Gemini 3 ailesinin genel performansı üzerinde konuşulurken, google ekosisteminin teknolojik kapasitesi bir kez daha gözler önüne seriliyor. Test sonuçları hakkında düşüncelerinizi merakla bekliyoruz – Google yapay zekâ işini çözdü mü?
Kaynak: Webtekno
Gmail ile tek tıklamada abonelikten çıkın: kolay adımlar, güvenli işlem ve temiz bir gelen kutusu…
Üniversite öğrencileri için ÖTV muafiyetindeki yeni taslak ve fiyat etkilerini inceleyen kapsamlı rehber.
İtiraf Modülüyle yapay zekada şeffaflığı artırın: Yanıltıcı içeriklere karşı açık dürüstlük sistemiyle güvenilir bilgiye hızlı…
Renault Aralık 2025 kampanyaları, kredi seçenekleri ve güncel fırsatlar: avantajlı finansmanla hemen aracınıza sahip olun.
Steam ücretsiz oynanabilir oyunlar: 4-8 Aralık festivali ve iki yeni oyun ilanı – kaçırma, etkinlik…
Aralık ayında Amazon Luna (Prime Gaming) Ücretsiz Oyunları ve Erişim Endpoint'ine ilişkin en güncel bilgiler,…