Vejo muitas pessoas a dizerem "Eu nunca costumava escrever testes, mas agora apenas digo ao LLM para gerar um conjunto completo". Mas não está isso errado? Pensando a partir dos primeiros princípios, se os testes são a prova definitiva de que o seu código funciona, então você deve dedicar muito esforço manual ao design de um bom conjunto de testes, e depois deixar o LLM gerar o código real para satisfazer os testes. Por que a prática comum é o oposto? Parece que, em teoria, o TDD deveria prosperar na codificação orientada a agentes, mas não é o caso. Por quê?