Никто не знает, что нас ждет Один человек с идеей может стать "CEO" компании из 10,000 агентов всего за 2 года. У вас будет "программное обеспечение как мысль", а не как услуга. Когда вы говорите, миллиард экземпляров "роя" строит бэкенд, фронтенд, безопасность и инфраструктуру масштабирования за считанные минуты. Последние 18 месяцев стали свидетелями самого быстрого прогресса, который мы когда-либо наблюдали в истории компьютерных наук. Я настоятельно призываю вас прочитать о SWE pro. Он был создан, чтобы быть устойчивым к загрязнению. Я еще не нашел хорошей причины, почему, когда мы наберем 90-100% по этому эталону, вся инженерия программного обеспечения не будет решена. Это один из самых сложных и трудноразработанных эталонов. Задания настолько длинные, что агент должен уметь учиться на своих неудачных тестах в рамках одной сессии - по сути, модели придется иметь какую-то форму непрерывного обучения, чтобы преодолеть этот эталон. Предварительная версия Gemini 2.5 набрала 13% Предварительная версия Gemini 3 набрала 43% Claude Opus 4.5 в настоящее время лидирует с 45% (по данным scale ai) — У ВАС ЕСТЬ ЛЮДИ В ANTHROPIC, КОТОРЫЕ ГОВОРЯТ, ЧТО СМОТРЯТ CLAUDE ВСЕ ДЕНЬ И ЗАПОЛНЯЮТ ПРОБЕЛЫ. Конечно, вы можете кричать, что они заинтересованы в этом, но разве ваша X временная шкала не была постоянным шоком за последние 2 недели о том, насколько хороши модели в кодировании? Особенно 4.5 Opus? Мне совершенно ясно, что инженерия программного обеспечения будет решена через 2 года. Даже если вы удвоите, нет, утроите эту оценку, это окажет ГЛУБОКОЕ влияние на ВВП и среднюю жизнь американца.