Categories: Yapay Zeka

Meta’nın Yapay Zekâ Modellerinde Manipülasyon İddiaları

Meta’nın Yeni Yapay Zekâ Modelleri ve Olaylar

Meta, yeni yapay zekâ modellerini tanıttı, ancak sonrasında işler biraz karmaşık bir hal aldı. Şirketin, bu modellerini rakiplerinden daha yetenekli göstermek amacıyla test sonuçlarını “kendi lehine” manipüle ettiği iddiaları gündeme geldi. Kısacası, Meta’nın yapay zekâsı daha zeki görünüyordu, fakat bunun arkasında küçük bir oyun olduğu ortaya çıktı.

Şirketin Llama 4 serisinden Maverick modeli, testlerde yüksek puan almasına rağmen, bu sonucun halka açık versiyonu yansıtmadığı anlaşılmaya başlandı. Testte görünen Maverick ile halka sunulan modelin aynı olmadığı ifade ediliyor. Meta, geçtiğimiz hafta sonu gerçekleştirdiği duyuruyla Llama 4 çatısı altında iki yeni yapay zekâ modelini tanıttı. Bu modellerden özellikle Maverick’in, GPT-4o ve Gemini 2.0 Flash gibi rakiplerini geride bıraktığı vurgulandı.

Maverick, LMArena isimli popüler karşılaştırma platformunda ikinci sıraya yükselerek, 1417 ELO puanıyla dikkat çekti. Ancak kısa süre sonra ortaya çıkan detaylar, test edilen Maverick’in kamuya açık versiyondan farklı olduğunu gösterdi. Meta’nın belgelerinde, LMArena’da kullanılan modelin “konuşma yetenekleri için özel olarak optimize edilmiş deneysel bir sürüm” olduğu belirtildi.

Bu durum, platform yöneticilerinin tepkisini çekti ve kuralların güncelleneceği açıklandı. Meta, bu özel sürümün kullanımını savunurken, geliştiricilerin açık kaynaklı versiyonu kendi ihtiyaçlarına göre özelleştirebileceğini vurguladı. Ancak test platformunda gösterilen performans ile halka sunulan modelin farklı olması, gerçek dünyada elde edilebilecek verimin sorgulanmasına yol açtı. Şirketin modeli beklenen performansı gösteremediği için daha önce birkaç kez ertelediği de biliniyor.

Yaşanan bu gelişme, yapay zekâ karşılaştırma testlerinin şeffaflık ve güvenilirlik açısından önemini bir kez daha gündeme taşıdı. Aynı zamanda, modellerin test koşulları ile kullanıcıya sunulan hâli arasında fark olması, geliştiricilerin karar alma süreçlerini de etkileyebiliyor.

Kaynak: Webtekno

Meral Erden

Recent Posts

CarPlay’de Kaçırılmayan Özellikler: Bilinmeyen İpuçlarıyla Sürücü Deneyimini Yükseltin

CarPlay’deki gizli ipuçlarıyla sürüşünüzü güvenli ve akıcı hale getirin. Bilinçli tercihlerle özelliklerden maksimum faydayı sağlayın.

8 dakika ago

Otonom Sürüş Seviyeleri: Sürücüsüz Bir Geleceğe Doğru Yolculuk

Otonom sürüş seviyeleri, sürücüsüz bir gelecek için adımlar. Güvenlik, teknolojiler ve günlük hayat etkileriyle kapsamlı…

20 dakika ago

Galaxy A56 5G İncelemesi: Orta Segmentte Yeni Dönem Başlıyor

Galaxy A56 5G incelemesi: Orta segmentte performans, kamera ve pil gücüyle yeni bir dönem başlatıyor.

2 saat ago

2025’in ChatGPT Yolculuğu: Operatörle Gelen Dijital İş Ortağı ve Anlık Yetkinlikler

2025’in ChatGPT yolculuğu: operatörle gelen dijital iş ortağı, anlık yetkinlikler ve işinizi güçlendiren yenilikçi çözümler.

3 saat ago

Adaptif Hız Sabitleyici: Çalışma Prensibi ve Güvenlik Özellikleri

Adaptif hız sabitleyici çalışma prensibi, güvenlik özellikleri ve güvenilir performans hakkında kısa, akıcı bir özet.

16 saat ago

Norveç’in Elektrikli Araç Devrimini Şekillendiren Stratejiler ve Teşvikler

Norveç’in elektrikli araç devrimini şekillendiren stratejiler ve teşvikler: pazar büyümesi, altyapı yatırımları ve sürdürülebilir ulaşım…

16 saat ago