Хорошо, я думаю, что мой эксперимент с тем, чтобы оставить ИИ работать над задачами 24/7, заканчивается здесь. Это не работает. Код взрывается от сложности, результаты не такие уж и хорошие, ИИ не может преодолеть серьезные преграды (он по-прежнему совершенно не способен даже *осознать* SupGen), и это безумно дорого (потратил около 1k за последние 2 дня). Лучшие результаты на компиляторе JS, в основном потому, что он знаком (по сравнению с inets), но не стоит терять контроль над кодовой базой. Я думаю, что мечта о том, чтобы ИИ работали в фоновом режиме и добивались реального прогресса в важных вещах (т.е. действительно новых вещах) еще не осуществилась. Это все еще машина, жестко застрявшая на своих собственных обучающих данных, неспособная мыслить нестандартно. Она отлично подходит для создания вещей, которые уже были созданы. Но не для новых вещей. Кроме того, программирование обычно имеет недооцененное преимущество в том, что вы делаете две вещи одновременно: создаете кодовую базу *и* изучаете ее. ИИ делает только половину из этого. Вторая половина, очевидно, невозможна 🤔
или, возможно, я просто не могу терпеть ответы на глупые вопросы серьезно, GPT-5.3 *не может общаться*. он пишет много всего, а затем задает ВАМ вопросы о своем собственном коде. как будто вы его написали. предполагая, что вы знаете, о чем он говорит у него нет умственной модели того, что происходит
или, возможно, я просто не могу терпеть ответы на глупые вопросы серьезно, GPT-5.3 *не может общаться*. он пишет много всего, а затем задает ВАМ вопросы о своем собственном коде. как будто вы его написали. предполагая, что вы знаете, о чем он говорит у него нет теории разума. вообще.
Я скучаю по сонету 3.5, когда AI был просто возвышенным автозаполнением. Возможно, мне стоит дать опусу 4.6 больше шансов. Конечно, он делает больше логических ошибок, чем gpt 5.3, но всё остальное в нём гораздо более приятно. И если я всё равно излагаю всю логику... почему бы и нет?
Я скучаю по сонету 3.5, когда AI был просто разрекламированным автозаполнением. Возможно, мне стоит дать опусу 4.6 больше шансов. Конечно, он делает больше логических ошибок, чем gpt 5.3, но всё остальное в нём гораздо более приятно. И если я всё равно излагаю всю логику... почему бы и нет?
Сегодня утром: "Bend→JS бот полностью застопорился. Агент исчерпал легкие победы и теперь пытается все более отчаянные микро-оптимизации, которые все терпят неудачу. Бенчмарки не изменились с тех пор, как первоначальные победы произошли ~50 раундов назад." Другие боты также испытывают подобную судьбу ):
Сегодня утром: "Bend→JS бот полностью застопорился. Агент исчерпал легкие победы и теперь пытается все более отчаянные микро-оптимизации, которые все терпят неудачу, задавая вопросы о внутренностях V8. Бенчмарки вообще не изменились с ~50 раундов назад." вздыхает
86