OpenAI, Anthropic ve benzeri yapay zekâ şirketlerinin geliştirdiği modeller, artık yazılım geliştirme süreçlerinde giderek daha fazla kullanılmaya başlandı. Ancak bu alanda hevesi olanlar için belirtmek gerekir ki, görünüşe göre hâlâ geliştirilmesi gereken pek çok yön bulunuyor. Google CEO’su Sundar Pichai, şirket içindeki yeni kodların %25’inin yapay zekâ tarafından üretildiğini vurgulamıştı. Benzer şekilde, Meta CEO’su Mark Zuckerberg de yapay zekâ tabanlı kodlama ile ilgili planlamalarının bulunduğunu ifade etti.
Yapay Zekâlar Hâlâ Hataları Çözmekte Başarısız
Ancak Microsoft Research tarafından gerçekleştirilen yeni bir araştırma, bu yapay zekâ modellerinin yazılım hatalarını düzeltmede hâlâ yetersiz kaldığını gözler önüne serdi. SWE-bench Lite adlı testte, OpenAI ve Anthropic’in en gelişmiş modelleri, sunulan 300 hata düzeltme görevinden çoğunu başarılı bir şekilde çözemedi. Claude 3.7 Sonnet en yüksek başarı oranına sahip model olmasına rağmen, bu oran yalnızca %48,4’te kaldı. OpenAI’ın o1 modeli %30,2, o3-mini ise %22,1 gibi daha düşük başarı oranları sergiledi.
Araştırmacılara göre, bu düşük performansın temel nedenleri arasında, yapay zekâ modellerinin hata ayıklama araçlarını verimli bir şekilde kullanamaması ve eğitim verilerinde gerçek insan hata ayıklama süreçlerinden yeterince yararlanamaması yer alıyor. Bu durum, yapay zekânın yazılım geliştirme süreçlerinde henüz tam anlamıyla güvenilir bir yardımcı olamayabileceğini gösteriyor.
Yapay Zekâ ile İlgili Diğer İçeriklerimiz:
Peki, siz yapay zekâyı kodlama işlerinizde kullanmayı denediniz mi? Deneyimlerinizi ve düşüncelerinizi aşağıdaki yorumlar kısmında bizimle paylaşabilirsiniz.
Kaynak: Webtekno
TECNO'nun yeni POVA serisi akıllı telefonları POVA 7 5G ve POVA 7 Pro 5G tanıtıldı.…
YouTube Shorts videolarında yeni döndürme seçeneğiyle içeriklerinizi daha kolay ve hızlı biçimde keşfedin. Güncel özellikleri…
Tesla Model 3, 2025'in en güvenli otomobili seçilerek üstün güvenlik özellikleriyle öne çıkıyor. Detaylar için…
Türkiye’de fiber internet ve mobil ağların güncel durumu, gelişmeler ve gelecekteki vizyonu hakkında detaylı bilgi.…
Türkiye'nin ilk bilgisayarı ve teknolojinin başlangıcı hakkında bilgi edinin. Tarih boyunca teknolojinin gelişimini ve Türkiye'nin…
Telegram 11.13.0 güncellemesiyle yeni özellikler ve para kazanma fırsatları hakkında detaylar. En güncel bilgiler için…