Çin merkezli yapay zekâ şirketi DeepSeek, yeni nesil dil modeli DeepSeek-R2 için iddialı bir sürüm planını duyurdu. Duyuruya göre, 15-30 Ağustos tarihleri arasında yürürlüğe girecek olan lansman, şirketin kendi yapay zekâsıyla gerçekleştirilen bir sohbet esnasında ortaya çıktı ve DeepSeek, GPT-5’e karşı bir karşı atağa geçmeyi hedefliyor.

DeepSeek-R2, önceki sürüme göre çok daha gelişmiş bir yapı sunacak. Mixture of Experts adı verilen daha akıllı bir mimari ve iş yükünü daha verimli yöneten yeni bir ağ kullanacak olan modelin parametre sayısı 1,2 trilyona kadar ulaşacak, bu da DeepSeek-R1’in neredeyse iki katına denk geliyor. Yine de ChatGPT-4/5’in 1,8 trilyon parametre seviyesinin bir miktar gerisinde kalacak.
DeepSeek-R2, GPT-4’ün maliyetinin sadece %3’üyle eğitildi ifadesi, projenin mali tarafına dair dikkat çekici bir noktayı oluşturuyor. Ayrıca modelin tamamen Huawei’nin yerli Ascend 910B çipleriyle eğitildiği belirtiliyor. Huawei’nin çip kümesi, NVIDIA A100’lere yakın performans sunuyor ve bu adım, Çin’in ABD yapımı çiplere bağımlılığını azaltma çabalarının önemli bir kilometre taşı olarak değerlendiriliyor.
Bu gelişme, Çin genelinde yatırım ve piyasa hareketlerini de tetikledi. Yapay zekâ çip üreticisi Cambricon’un hisseleri yaklaşık %20 değer kazanırken, şirketin toplam değeri 355 milyar yuanı aştı. Piyasaların nabzını tutan bu haberlerin ardından, sizce DeepSeek-R2 başarıya ulaşabilir mi? Düşüncelerinizi yorumlar kısmında bizimle paylaşabilirsiniz.
Kaynak: Webtekno


