🚨 Şok edici: Frontier LLM'leri standart kodlama benchmarklarında %85-95 puan alıyor. Ezberleyemedikleri dillerde eşdeğer problemler verdik. Düşüşler %0-11'e düştü. EsoLang-Bench'i sunuyorum. ICLR 2026'da 🧵 Mantıksal Akıl ve ICBINB atölyelerine kabul edildi