OpenAI, Anthropic ve benzeri yapay zekâ şirketlerinin geliştirdiği modeller, artık yazılım geliştirme süreçlerinde giderek daha fazla kullanılmaya başlandı. Ancak bu alanda hevesi olanlar için belirtmek gerekir ki, görünüşe göre hâlâ geliştirilmesi gereken pek çok yön bulunuyor. Google CEO’su Sundar Pichai, şirket içindeki yeni kodların %25’inin yapay zekâ tarafından üretildiğini vurgulamıştı. Benzer şekilde, Meta CEO’su Mark Zuckerberg de yapay zekâ tabanlı kodlama ile ilgili planlamalarının bulunduğunu ifade etti.
Yapay Zekâlar Hâlâ Hataları Çözmekte Başarısız
Ancak Microsoft Research tarafından gerçekleştirilen yeni bir araştırma, bu yapay zekâ modellerinin yazılım hatalarını düzeltmede hâlâ yetersiz kaldığını gözler önüne serdi. SWE-bench Lite adlı testte, OpenAI ve Anthropic’in en gelişmiş modelleri, sunulan 300 hata düzeltme görevinden çoğunu başarılı bir şekilde çözemedi. Claude 3.7 Sonnet en yüksek başarı oranına sahip model olmasına rağmen, bu oran yalnızca %48,4’te kaldı. OpenAI’ın o1 modeli %30,2, o3-mini ise %22,1 gibi daha düşük başarı oranları sergiledi.
Araştırmacılara göre, bu düşük performansın temel nedenleri arasında, yapay zekâ modellerinin hata ayıklama araçlarını verimli bir şekilde kullanamaması ve eğitim verilerinde gerçek insan hata ayıklama süreçlerinden yeterince yararlanamaması yer alıyor. Bu durum, yapay zekânın yazılım geliştirme süreçlerinde henüz tam anlamıyla güvenilir bir yardımcı olamayabileceğini gösteriyor.
Yapay Zekâ ile İlgili Diğer İçeriklerimiz:
Peki, siz yapay zekâyı kodlama işlerinizde kullanmayı denediniz mi? Deneyimlerinizi ve düşüncelerinizi aşağıdaki yorumlar kısmında bizimle paylaşabilirsiniz.
Kaynak: Webtekno
Meta, Limitless’i satın alarak akıllı giyilebilirlikte yenilikçi bir kategori hedefliyor ve geleceğin teknolojisini keşfe davet…
Geçmişin absürt telefon tasarımlarını keşfedin: dairesel tuşlardan ruj telefonuna uzanan bir yolculukla teknoloji geçmişini eğlenceli…
FC 26 Profesyonel Taktikler: Sahada kontrolü elinde tutmanın inceliklerini keşfedin; pratiğe dönüştürülen strateji ve oyun…
Görsel ve işitsel yapay zekâ hakkında akışkan bir inceleme: algı, kaçınılmazlık ve evrimsel bakışla yön…
Kapaklı telefonların nostaljisini yaşatırken, unutulmaz tasarımlar ve efsane modellerle altın çağını keşfedin.
PS6 beklentileri ve özellikleri üzerine güncel izlenimler: yayınlanmaya hazırlanan nesle dair güçlü bir önizleme ve…