Por que é que a IA para escrever front-end se tornou tão forte de repente? O artigo da MiMo da Xiaomi introduz como eles treinam modelos para escrever front-end, e a chave está nesta frase: "O nosso validador baseado em visão avalia o desempenho de trechos de vídeo gravados, avaliando a qualidade visual, a precisão funcional e a executabilidade, garantindo assim que o mecanismo de recompensa possa equilibrar tanto a aparência quanto o desempenho." O princípio é que o modelo escreve o código com base no prompt e depois usa o Playwright para gravar em vídeo, e então, entrega a um validador visual (que deve ser um modelo de compreensão de vídeo treinado especificamente) para pontuação, a fim de fornecer um sinal de recompensa.