СВЕЖИЕ НОВОСТИ: Анализ показывает, что задача Putnam в 4 раза проще / требует гораздо меньше рассуждений, чем IMO. Средняя длина доказательства Aristotle Lean4 для 10 решенных задач Putnam составила ~250 строк, по сравнению с ~1000 для IMO, что составляет сокращение на 75%. Мы исследуем возможность применения расширенных вычислений к двум другим (A5 и B4), чтобы более точно количественно оценить относительную сложность. Некоторые оговорки: с тех пор были улучшения модели / алгоритмов с момента золотой медали Aristotle на IMO, но также потребительская версия, доступная публике, гораздо слабее, чем та, что использовалась внутри для решения задач IMO. Как поклонники Putnam, даже мы должны признать — IMO все еще король. 👑