Насколько хорошо LLM могут рассуждать без цепочки размышлений (в рамках одного прямого прохода)? Я оцениваю временной горизонт без цепочки размышлений по математическим задачам и обнаруживаю, что у Opus 4.5 временной горизонт составляет 3,5 минуты (предостережение: человеческие временные оценки являются лишь приблизительными). Смотрите пост для получения дополнительной информации: