OpenAI’ın gelişmiş yapay zekâ modeli olan GPT-4 tabanlı GPT-4o modelini, sınavın toplamda 125 soru içeren TYT bölümüne uyguladık. TYT, Türkçe, Sosyal Bilimler, Temel Matematik ve Fen Bilimleri olmak üzere dört ana daldan oluşuyor ve toplamda şu dağılıma sahip: Türkçe 40 soru, Sosyal Bilimler 25 soru, Temel Matematik 40 soru ve Fen Bilimleri 20 soru. Bu zorlu sınavda, hız ve çok yönlülük açısından en uygun ve görsel okumadan metin analizine kadar çeşitli becerilere sahip olan GPT-4o’yu tercih ettik. Ayrıca, internet araması yapmaması ve mantık dışı modeller kullanılmaması yönünde talimat verdik.
ChatGPT’nin TYT 2025 performansı, beklentilerin oldukça altında kaldı. Toplamda 125 sorunun sadece 44’ünü doğru cevaplayabildi ve 81 soruda yanlış yaptı. Bu sonuç, yapay zekanın yüksek puanlar alıp üniversiteye yerleşme şansını oldukça düşük seviyelere çekti. Bu performans, geçtiğimiz hafta LGS sınavındaki sonuçlarla karşılaştırıldığında, GPT’nin sınavlara karşı genel başarısızlığını ortaya koyuyor.
| Ders | Doğru Cevap | Yanlış Cevap |
|---|---|---|
| Türkçe | 17 | 23 |
| Sosyal Bilimler | 10 | 15 |
| Temel Matematik | 11 | 29 |
| Fen Bilimleri | 6 | 14 |
İşte, ChatGPT’nin yaptığı bazı önemli hatalar ve bu hatalara dair açıklamalar:
Yapay zekanın sınavda gösterdiği performans, onun, soruları toplu ve hızlı çözmesiyle ilgili zorluklar yaşadığını gösteriyor. Soruları tek tek ve düşünerek çözmek, modelin hata oranını azaltıyor. Bu durum, gerçek öğrencilerde de baskı altında yapılan sınav performansıyla paralellik gösterebilir. Ayrıca, bu deneyden alınan ders, yapay zekanın sınavlara hazırlık sürecinde nasıl kullanılabileceği ve sınav performansını artırmak için hangi stratejilerin benimsenebileceği konusunda önemli ipuçları sunuyor.
Üç yıl sonra, aynı yapay zekaya “Kim Milyoner Olmak İster?” yarışmasında şans tanıdık ve ne kadar başarılı olabildiğini gözlemledik. Bu deneme, yapay zekanın bilgi seviyesini ve sınav performansını daha iyi anlamamıza yardımcı oldu. Kaynak: Webtekno
Tekkenin yaratıcı yüzü 30. yıla özel dönemde Bandai Namco'dan ayrılıyor: harikalarla dolu gelişmeler ve gelecek…
Ford ile Renault arasındaki stratejik iş birliği ve elektrikli modellerin Avrupa’da yükselen yolculuğu hakkında kapsamlı…
2025 Consumer Reports verileriyle en güvenilir ikinci el otomobil markalarını keşfedin; kaliteli seçenekler ve güvenilirlik…
2025 3.Çeyrek trendleri: En çok satan akıllı telefon modelleri ve pazar eğilimleri hakkında kapsamlı özet.
ChatGPT ile Instacart entegrasyonu sayesinde alışveriş artık sohbetin gücüyle kolaylaşıyor. Akıllı öneriler ve hızlı siparişler…
Gemini ve reklam tartışmasının ardındaki netlik: Google, reklam planını reddetti; süreç ve etkileri kısa ve…