это самый важный график в мире, и он просто взрывается
METR
METR11 часов назад
Мы оцениваем, что Claude Opus 4.6 имеет 50%-ный временной горизонт около 14.5 часов (95% ДИ от 6 часов до 98 часов) для программных задач. Хотя это самая высокая точечная оценка, которую мы сообщали, это измерение крайне шумное, поскольку наш текущий набор задач почти насыщен.
линейная версия совершенно безумна. суперэкспоненциальная
для непосвященных это означает: (определенные) задачи, которые обычно требуют от человека 14 часов для выполнения, теперь могут быть выполнены ИИ (за гораздо более короткое время, вероятно, за минуты) с вероятностью 50% это 4,5 порядка величины с 2019 года, или увеличение в 26,000 раз с момента GPT-2
32