Categories: Yazılım

Ürpertici itiraf: ChatGPT’yi yapan firma bile nasıl çalıştığını bilmiyor

Geçtiğimiz günlerde OpenAI, yeni bir makale yayınladı. Bu makalede eski GPT-2 modelindeki nöronların davranışları için açıklamalar yazmak üzere GPT-4 dil modelini kullanan bir tekniğin ayrıntılarına yer veriliyor. Buradaki hedef ise hudut ağlarının ürettikleri çıktıları neden oluşturduklarını açıklamak.

Büyük lisan modelleri (LLM) teknoloji dünyasını fethederken, yapay zeka (AI) araştırmacıları hala kaputun altındaki fonksiyonellikleri ve yetenekleri hakkında çok fazla şey bilmiyorlar. OpenAI, yayınlanan makalesinin birinci cümlesinde “Dil modelleri daha yetenekli hale geldi ve daha yaygın olarak kullanılmaya başlandı, ancak nasıl çalıştıklarını anlamıyoruzdiyerek bunu açıkça itiraf ediyor.

Neden çalıştıklarını bilmiyoruz

Çerçevenin dışından bakanlar için bu söz, sadece LLM’lerden elde edilen gelire bağlı olmakla kalmayıp tıpkı vakitte onları insan ötesi muhakeme yeteneği düzeylerine çıkarmayı uman bir şirketten gelen çarpıcı bir itiraf üzere görünebilir.

Ancak bir hudut ağının ferdî nöronlarının çıktılarını üretmek için birlikte nasıl çalıştığını tam olarak “bilmeme” durumunun âlâ bilinen bir ismi bulunuyor: Kara kutu. Yani, mevcut durumda yapay zeka sistemlerinden bir şeyler istiyoruz ve onlar da bir bizlere bir karşılık veriyor, lakin bu iki süreç ortasındaki süreçte (kara kutu) ne olduğu bir gizem.

Kara kutunun içine bakmak maksadıyla OpenAI’daki araştırmacılar GPT-4 lisan modelini kullanarak GPT-2 üzere çok daha az karmaşık bir lisan modelindeki nöronların davranışları için doğal lisan açıklamaları oluşturdu ve kıymetlendirdi. Teoride, yorumlanabilir bir AI modeline sahip olmak, bu sistemlerin istendiği bir halde çalışmasına katkıda bulunabilir.

Çalışma halleri anlaşılabilirse eksiklikleri giderilebilir

Bilindiği üzere insan beyninde 100 milyar civarında nöron bulunuyor. Bir hudut ağında nöron, bilgiyi alan, işleyen ve bir çıktı üreten küçük bir karar verme ünitesi üzeredir, tıpkı aldığı sinyallere nazaran karar veren küçük bir beyin hücresi üzere. OpenAI’da bu yapay zeka nöronlarının çalışma halini anlamaya çalışıyor ancak görünüşe nazaran en azından şimdilik en gelişmiş yapay zeka modellerinden olan GPT-4 bile nöronları yorumlamakta zayıf kalıyor.

OpenAI araştırmacıları, yapay zeka modelleri daha gelişmiş hale geldikçe, üretilen açıklamaların kalitesinin artacağını ve bu karmaşık sistemlerin iç işleyişine dair daha âlâ bilgiler sunacağını umuyor. OpenAI, araştırma makalesini, her adımın örnek dökümlerini içeren, metnin vurgulanan kısımlarını ve bunların makul nöronlara nasıl karşılık geldiğini gösteren etkileşimli bir web sitesinde yayınladı. Firma çalışmalarına devam edeceğini belirtiyor.

Eğer “yorumlanabilirlik” alanında istenen muvaffakiyet sağlanırsa o vakit ChatGPT ve başkalarının neden bir şeyler uydurduğunu anlayabilir ve bu kritik sorun çözülebilir. Çünkü bu, tıpkı insanların hastalandıklarında tedavi edilmeleri üzere bir süreç. Bir meselemiz varsa hastaneye sarfiyat muayene olur ve teşhis konulur. Teşhis konulunca da buna nazaran ilaç verilir. Şimdilik yapay zeka modellerini kesin doğrulukla “muayene” edemiyoruz.

İnanç Can Çekmez

Share
Published by
İnanç Can Çekmez

Recent Posts

2025 Yılında En Güvenilir Otomobil Markaları: Consumer Reports’in Türkiye İçin Özeti

2025’de en güvenilir otomobil markalarını Türkiye için özetleyen, Consumer Reports verileriyle güven ve kalite odaklı…

1 saat ago

Few-off Koleksiyonları: Albert Spiess ve Lamborghini’nin Sınırları Zorlayan Sanat Eseri

Albert Spiess ve Lamborghini’nin sınırları zorlayan Few-off koleksiyonunun sanatında yenilikler, cesur renkler ve özgün tasarımın…

2 saat ago

MKBHD’nin 2025 Telefon Ödülleri: En İyiler ve Hayal Kırıklıkları

MKBHD’nin 2025 Telefon Ödülleri: En iyi cihazlar, beklenenler ve hayal kırıklıklarıyla dolu kapsamlı inceleme.

2 saat ago

Steam Spor Festivali: Ayrıntılı İndirim Listesi ve Öne Çıkan Fiyatlar

Steam Spor Festivali için kapsamlı indirim listesi ve öne çıkan fiyatlar. Kaçırılmayan fırsatlar ve hızlı…

4 saat ago

A101’de Bu Hafta Öne Çıkan ZTE nubia V70 Max Fiyatı ve Özellikleri

A101’te bu hafta öne çıkan ZTE nubia V70 Max özellikleri ve fiyatı; detaylar, avantajlar ve…

4 saat ago

Samsung Galaxy S25: One UI 8.5 Beta ile Depolama Alanı Paylaşımı ve Bilgi Akışı Yenilikleri

Samsung Galaxy S25: One UI 8.5 Beta ile Depolama Paylaşımı ve Bilgi Akışı yeniliklerini keşfedin.…

5 saat ago