Yeni bir araştırma, günümüzün en güçlü yapay zekâ sistemlerinin bile analog saatleri okumakta zorluk yaşadığını ortaya koyuyor. Hatta bu sistemlerin bazıları, bu basit görevi tamamen yanlış bir şekilde yerine getiriyor. Peki, yapay zekâ neden bu kadar basit bir görevde bile geride kalıyor?
Yapay zekâ neden saati okuyamıyor? sorusunun yanıtını arayan bir çalışma, arXiv platformunda yayımlandı ve GPT-4, Claude 3 ve Gemini gibi dev dil modellerinin analog saatleri anlamakta neden zorluk çektiğini incelemekte.
Bu çalışmanın sonuçları, oldukça dikkat çekici:
- GPT-4, analog saat görüntülerini analiz ederken %50’ye yakın bir hata oranına sahip.
- Claude 3, bazı saatleri doğru bir şekilde okuyabilse de akrep ve yelkovanın pozisyonlarını sıkça karıştırıyor.
- Gemini ise bazen saati tamamen yanlış yorumlayarak (“10.10” yerine “2.50” gibi) yanıtlar verebiliyor.
Peki, bu kadar gelişmiş yapay zekâ modelleri neden bu temel işlemi gerçekleştiremiyor? Cevap, yapay zekânın öğrenme biçiminde gizli. Asıl sorun, yapay zekânın anlamaktan çok tahmin etmesidir.
Yapay zekâ modelleri, insan beyni gibi kavramları içselleştirerek öğrenmek yerine büyük veri setlerindeki kalıpları ezberleyerek tahminler yapıyor. Yani bir analog saati gördüğünde “Bu, akrep ve yelkovanın açısal ilişkisini gösteriyor.” diye düşünmüyor. Bunun yerine, eğitim verilerinde karşılaştığı benzer görsellerle ilişkilendirme yapmaya çalışıyor. İşte burada sorun ortaya çıkıyor. Eğitim verilerinde yeterince çeşitli analog saat örnekleri bulunmuyorsa, model bu bilgiyi yanlış öğrenebiliyor.
Saat okuma işlemi, görsel ve mantıksal bir bütünlük gerektiriyor. Ancak yapay zekâ, görseli parçalarına ayırıp bunları ilişkilendirmekte zorlanabiliyor. Ek olarak, Romen rakamları veya rakamsız saatler gibi farklı tasarımlar, onun için karmaşık hale geliyor.
Peki, bu durum yapay zekânın sınırlarının olduğunu mu gösteriyor? Tam olarak değil. Bu, yapay zekânın “genel akıl yürütme” (common sense reasoning) konusundaki eksiklerinin bir göstergesi. İnsanlar için oldukça basit olan bu görev, yapay zekâ için karmaşık bir bulmaca gibi görünse de, bu sorun gelecekte düzeltilemeyecek bir mesele değil.
Sonuçta, yapay zekâ ilk çıktığında bir elin parmaklarını bile düzgün çizemiyordu, ancak günümüzde bu tür görüntüleri gerçeğinden ayırt etmek oldukça zor. Araştırmacılar, modellerin “çoklu modalite” (multimodal) öğrenme yeteneklerini geliştirerek bu sorunu aşmayı hedefliyor. Yani, yapay zekânın yalnızca metin veya yalnızca görsel bilgileri değil, ikisini bir arada daha iyi işleyebilmesi durumunda, analog saat okuma gibi görevlerde de başarılı olma ihtimali artacak.
Sonuç: Yapay zekâ hâlâ öğrenme sürecinde!
Bu araştırma, yapay zekânın olağanüstü yeteneklere sahip olmasına rağmen, insanların doğal olarak gerçekleştirdiği bazı temel işlemlerde hâlâ zorluk çektiğini gösteriyor. Sizce yapay zekâ bir gün bu tür basit görevleri mükemmel bir şekilde yerine getirebilecek mi, yoksa bazı yetenekler yalnızca insana özgü kalacak mı? Düşüncelerinizi yorumlarda paylaşabilirsiniz!
Bonus: Eğer bir yapay zekâ modeline “Saat kaç?” diye sormak isterseniz, öncelikle ona bir dijital saat gösterin. Böylece muhtemelen daha doğru bir cevap alırsınız!
Kaynaklar: Arxiv, IFL Science
Yapay zekâ hakkında diğer içeriklerimiz:
Kaynak: Webtekno