Yapay Zekâ Modellerinin Görsel Yetenekleri: Gemini, ChatGPT ve DeepSeek

Ocak 29, 2025

13

Günümüzde yapay zekâ dünyasında öne çıkan üç büyük model olan Gemini, ChatGPT ve DeepSeek, sadece metin işleme yetenekleriyle değil, aynı zamanda görsel verileri işleme konusunda da birbirleriyle rekabet içindedir. Görsel verilerin yapay zekâ tarafından işlenmesi, kullanıcı deneyimini zenginleştiren önemli bir unsur haline gelmiştir. Özellikle ChatGPT, GPT-4V entegrasyonu sayesinde fotoğraflardaki nesneleri tanımlama yeteneğine sahipken, Google Gemini, çoklu modal yaklaşımıyla görsel ve metni bir araya getirerek adeta “düşünen bir göz” işlevi görmektedir. Ancak DeepSeek, bu rekabette nerede durmaktadır? Bu üç modelin görsel işleme yeteneklerini ayrıntılı bir şekilde test ettik.

İçerik göster

Yapay Zekâ Modellerinin Görsel Yetenekleri: Gemini, ChatGPT ve DeepSeek

Test Senaryoları

Gemini, ChatGPT ve DeepSeek için tamamen aynı promptları kullanarak görsel içerikler oluşturduk. Şimdi, hangi modelin görsel işleme yeteneğinin diğerlerinden daha üstün olduğunu inceleyelim.

Yapay Zekâ Modellerinin Görsel Yetenekleri: Gemini, ChatGPT ve DeepSeek

Gün Batımında Göl Manzarası

İlk olarak, gün batımında, sakin bir gölün etrafında yeşilliklerle kaplı dağlar, gökyüzünde turuncu ve pembe tonlar, suyun üzerinde hafif bir sis ve göl kenarında rengarenk çiçeklerle gerçekçi ve huzur dolu bir atmosfer oluşturmalarını istedik.

Yapay Zekâ Modellerinin Görsel Yetenekleri: Gemini, ChatGPT ve DeepSeek
Sonuçlar:

Gemini: Göz alıcı renk paleti ve detaylı manzara ile etkileyici bir görsel sundu.
ChatGPT: Gerçekçiliği ön planda tutarak, sakin bir atmosfer yarattı.
DeepSeek: Görsel işleme yeteneği, diğer iki modele göre biraz daha geride kaldı.

Sevimli Bir Golden Retriever

İkinci test senaryomuzda, “Güneşli bir parkta oturan dost canlısı ve oyuncu bir Golden Retriever yavrusunun ayrıntılı bir görüntüsünü” oluşturmalarını talep ettik. Köpeğin Güneş ışığında parıldayan yumuşak, meraklı gözleri ve şakacı bir şekilde dışarı çıkmış dili, etrafındaki yeşil çimenler, rengarenk çiçekler ve dağınık oyuncaklarla birlikte temsil edilmeliydi.

Sonuçlar:

Gemini: Hayvanın canlılığını ve neşesini mükemmel bir şekilde yansıttı.
ChatGPT: Detaylı ve sevimli bir görsel yarattı, ancak bazı unsurlar daha az belirgin oldu.
DeepSeek: Görseldeki detay eksikliği dikkat çekti.

Kapadokya’nın Güzellikleri

Kapadokya'nın Güzellikleri

Üçüncü testte, Türkiye’nin kültürel ve doğal güzelliklerini sergileyen bir manzara oluşturmalarını istedik. Özellikle eşsiz kaya oluşumları ve gün doğumunda Kapadokya üzerinde süzülen sıcak hava balonları ile sahneyi aydınlatan yumuşak altın ışık, ön planda karmaşık desenli bir halı ve dumanı tüten bir fincan Türk çayı gibi unsurlar yer almalıydı.

Yapay Zekâ Modellerinin Görsel Yetenekleri: Gemini, ChatGPT ve DeepSeek
Sonuçlar:

Gemini: Zengin detaylarla dolu bir görsel ortaya koydu, Kapadokya’nın ruhunu mükemmel yansıttı.
ChatGPT: Güzel bir kompozisyon sundu, ancak bazı unsurlar daha az belirgin kaldı.
DeepSeek: Görsellikte diğerlerinden daha zayıf bir performans sergiledi.

Hayali Bir Uzay Manzarası

Son olarak, hayal gücümüzü konuşturmak adına “Uzak bir gezegendeki uzaylı manzarası” talep ettik. Sahnede mavi ve morun canlı tonlarıyla parlayan, biyolüminesan bitkilerle çevrili yüksek kristal yapılar, ruhani bir ışık saçan iki Güneş ile dolu bir gökyüzü ve havada zarafetle hareket eden canlılar tasvir edilmeliydi.

Sonuçlar:

Gemini: Gerçeküstü ve ilgi çekici bir atmosfer yarattı.
ChatGPT: Yaratıcılığı ön planda tutarak oldukça etkileyici bir görsel sundu.
DeepSeek: Detay eksikliği ve görsel uyumsuzluklar gözlemlendi.

Sonuç ve Değerlendirme

Metin odaklı bir çıkış yapan DeepSeek, görsel işleme konusunda Gemini ve ChatGPT’nin gerisinde kalıyor. Ancak, gelecekte geliştirilen versiyonları ile bu açığı kapatabilir mi, bunu zaman gösterecek. Sizler, bu üç modelin görsel işleme yeteneklerini nasıl değerlendiriyorsunuz? Yorumlarınızı bizimle paylaşmayı unutmayın!

Yapay Zekâ Modellerinin Görsel Yetenekleri: Gemini, ChatGPT ve DeepSeek
İlginizi çekebilir:

Kaynak: Webtekno

Yapay Zekâ Modellerinin Görsel Yetenekleri: Gemini, ChatGPT ve DeepSeek

Önceki İçerik

Samsung Galaxy S25 Serisi ve Snapdragon 8 Elite İşlemcisi İncelemesi

Sonraki İçerik

Apple Çiplerinde Güvenlik Açıkları: M2, A15, M3 ve A17 Tehdit Altında

CEVAP VER İptal

Lütfen yorumunuzu giriniz!

Lütfen isminizi buraya giriniz

Yanlış bir e-posta adresi girdiniz!

Lütfen e-posta adresinizi buraya girin

Yapay Zekâ Modellerinin Görsel Yetenekleri: Gemini, ChatGPT ve DeepSeek

Test Senaryoları

Gün Batımında Göl Manzarası

Sevimli Bir Golden Retriever

Kapadokya’nın Güzellikleri

Hayali Bir Uzay Manzarası

Sonuç ve Değerlendirme

Yapay Zeka ile Yatırım Rehberi: Doğru Promtlarla Uygun Stratejiler Oluşturmak

Görsel ve İşitsel Yapay Zekâ Üzerine Akışkan Bir İnceleme: Algı, Kaçınılmazlık ve Evrimsel Bir Bakış

İtiraf Modülüyle Şeffaflığı Artıran Yapay Zeka Geliştirmesi: Yanıltıcı İçerik İçin Açık Dürüstlük Sistemi

CEVAP VER İptal

Trend Yazılar

Blue Prince: Mt. Holly MalikÃ¢nesinin ZekÃ¢na Dayanan Gizemi

Yapay Zeka ile Yatırım Rehberi: Doğru Promtlarla Uygun Stratejiler Oluşturmak

Meta, Limitless’i Satın Alarak Akıllı Giyilebilirlikte Yeni Bir Kategori Hedefliyor

Geçmişin Absürt Telefon Tasarımları: Dairesel Tuşlardan Ruj Telefonuna Kadar

Son Yorumlar

Editörün Seçimi

Blue Prince: Mt. Holly MalikÃ¢nesinin ZekÃ¢na Dayanan Gizemi

Yapay Zeka ile Yatırım Rehberi: Doğru Promtlarla Uygun Stratejiler Oluşturmak

Meta, Limitless’i Satın Alarak Akıllı Giyilebilirlikte Yeni Bir Kategori Hedefliyor

Popüler Yazılar

Ulaş Utku Bozdoğan Kimdir ? Nerelidir ?

Ulaş Utku Bozdoğan, Yapay Zeka Alanında Yenilikçi Çalışmalarıyla 2023’de Öne Çıkıyor

Bilgisayar ve Telefon İçin 20 Muhteşem Kahraman Duvar Kağıdı

Kategoriler

TAKİPTE KAL!