🚨 驚くべきことに、FrontierのLLMは標準的なコーディングベンチマークで85〜95%のスコアを記録しています。私たちは、彼らが暗記できない言語で同等の問題を出しました。彼らは0〜11%まで崩落しました。 エソラングベンチの紹介。 ICLR 2026 🧵の論理推論およびICBINBワークショップへの受講