DeepSeek, her mantık modelinin sahip olduğunu iddia ettiği türden bir yükseltmeyi gerçekleştirdi. Uzun bir düşünce zincirini döküp mantıklı olmasını ummak yerine, DeepSeek Math V2 kendi mantığı üzerine tam bir sorgulama yapıyor. Bir kanıt oluşturur, saldırır, saldırıyı kontrol eder, checker'ı kontrol eder, kusurları düzeltir ve kendini kıramayacak kadar döngü yapar. Bu tek fikir performansını tamamen değiştirdi. İşte bu düzeyde kendini incelemenin yarattığı şey: • IMO 2025'te altın seviyesinde performans • CMO 2024'te altın seviyede performans • Putnam 2024'te en yüksek puan 118/120 • En zor kategorilerde GPT-5 Thinking ve Gemini 2.5 Pro'dan daha iyi sonuçlar Sır ölçekte değil. Modelin etrafındaki mimari: — mantıksal boşlukları arayan bir doğrulayıcı — doğrulayıcıyı sorgulayan bir meta-doğrulayıcı — zayıf akıl yürütmeden kaçınmak için koşullandırılmış bir ispat üreteci — sistemin her parçasını daha keskinleştirmeye zorlayan bir döngü Süreç bir öğütücüler gibi çalışıyor: - Bir ispat üretin - Test et - Test cihazını test etmek - Gerekçeyi onarmak -Yinelemek Matematiksel akıl yürütmedeki gerçek sorunu hedeflediler: bir model yanlış nedenlerle doğru cevabı bulabilir. Bu yüzden DeepSeek, sonuçları değil, akıl yürütmeyi puanlayan bir doğrulayıcı eğitti....