Categories: Yapay Zeka

ChatGPT, Görmeye Başladı [Video]

Üretken yapay zekâlar arasında en ön plana çıkanlardan birisi olan ChatGPT, ne yazık ki bize açılan sürümünde henüz görselleri ve videoları analiz edemiyor. Peki, edebilseydi neler yapabilirdi?

İşte bu sorunun cevabı, yapay zekâ geliştiricisi Mckay Wrigley tarafından verildi. Wrigley, iPhone ve MacBook kullanarak, yazdığı yazılım sayesinde ChatGPT’ye ‘göz’ verdi. ChatGPT, etraftaki nesnelere göre öneriler de yaptı.

ChatGPT’nin gözlere sahip olduğu video:

Wrigley’nin etrafındaki tüm nesneler ve buzdolabındaki yiyecek ve içecekler, farklı bir yapay zekâ ile tanınıyor. Daha sonrasında bu veriler ChatGPT’ye sunuluyor. ChatGPT, bir soruyla önce hangi nesnelerin etrafta olduğunu öğreniyor, ardından bu nesnelere ilişkin bir diğer soruyu da cevaplıyor.

Wrigley, bu yöntem ile ChatGPT’ye buzdolabındaki nesneleri gösteriyor, öğretiyor. Sonrasında ise ChatGPT’den buzdolabındaki içeriklere uygun bir tarif vermesini istiyor. ChatGPT, internette kısa bir arama yaptıktan sonra uygun tarifi anlatıyor.

Videodaki sesli konuşma da elbette ChatGPT’nin yapabildiği bir şey değil. Wrigley, yazının anlık olarak sese dönüştürülmesi için OpenAI’ın Whisper yapay zekâsından faydalanıyor. Kendisinin kullandığı tüm yapay zekâlar ve kullanım amaçları ise şu şekilde:

  • GPT-4: ChatGPT’yi oluşturan dil modeli
  • YoloV8: Kameraya gözüken nesneleri tanımlayan yapay zekâ
  • Whisper: Metnin sese dönüştürülmesi
  • Google Custom Search Engine: ChatGPT’nin internette arama yapmasını sağlayan araç

Wrigley, bu yapay zekâları Python ile yazdığı kodlar ile bir arada çalıştırıyor ve ortaya böyle bir sonuç çıkıyor. Wrigley, Apple’ın piyasaya sürmeye hazırlandığı artırılmış gerçeklik gözlükleri için de araçlar geliştirmeye hazırlandığını söylüyor.

Bir diğer deyişle yukarıdaki video, artırılmış gerçeklik gözlüklerinin halihazırda bildiğimiz bir potansiyelinin somut bir şekilde sunumu.

Kaynak:  Webtekno

Meral Erden

Recent Posts

Google’da 6-7 Sarsıntısı: Dijital Kültürde Yeni Bir Meme ve Doğuş Hikayesi

Google’da 6-7 sarsıntısı: dijital kültürde yeni bir meme, doğuş hikayesi ve mizahın evrimine dair çarpıcı…

1 saat ago

Tek Ulusal Çerçeve İçin Yürütme Emirleri ve AI Düzenlemeleri Üzerine Güncel Gelişmeler

Tek Ulusal Çerçeve için yürütme emirleri ve AI düzenlemelerindeki güncel gelişmelerle güvenli ve uyumlu yapılar.

2 saat ago

Elektrikli Otomobillerin Batarya Maliyetinin Perde Arkası: Hammaddelerden Ar-Ge’ye

Elektrikli otomobillerin batarya maliyetinin perde arkası: hammaddelerden Ar-Ge'ye etkili analiz ve geleceğe dair öngörüler.

3 saat ago

Türkiye’de iPhone Fiyatları ve Garanti Politikaları: Apple Türkiye’nin Yeni Yaklaşımı

Türkiye’de iPhone fiyatları, garanti politikaları ve Apple Türkiye’nin yeni yaklaşımını tek bir yerde keşfedin.

3 saat ago

iOS 26.2 ile iPhone’da Gizli Kılavuz: Yeni Özellikler ve Güvenlik Geliştirmeleri

iOS 26.2 ile iPhone’da Gizli Kılavuz: Yeni Özellikler ve Güvenlik Geliştirmeleri hakkında kısa, akıcı ve…

13 saat ago

SILENT HILL f: 1960’ların Japonya’sında Karşılaşılan Gelişmiş Korku ve Psikolojik Derinlikler

1960’ların Japonya’sında gelişmiş korku ve psikolojik derinliklerle karşı karşıya gelen bir keşif: SILENT HILL’in derinliklerine…

18 saat ago