A Anthropic teve 16 agentes de IA a construir um compilador C do zero. 100k linhas, compila o kernel do Linux, $20k, 2 semanas. Para colocar isso em perspectiva, o GCC levou milhares de engenheiros ao longo de 37 anos para ser construído. (Concedido, desde 1987 - no entanto) Um pesquisador e 16 agentes de IA acabaram de construir um compilador que passa 99% do próprio conjunto de testes de estresse do GCC, compila FFmpeg, Redis, PostgreSQL, QEMU e roda Doom. Eles dizem que "(na maior parte) se afastaram." Mas esse "na maior parte" está a fazer um trabalho pesado. Nenhum humano escreveu código, mas o pesquisador constantemente redesenhou testes, construiu pipelines de CI quando os agentes quebraram o trabalho uns dos outros e criou soluções alternativas quando todos os 16 agentes ficaram presos no mesmo bug. O papel humano não desapareceu. Mudou de escrever código para engenheirar o ambiente que permite que a IA escreva código. Não sei como você poderia argumentar que a IA está a bater numa parede.