📊 Como avaliar habilidades❓️ Muitas empresas estão a desenvolver habilidades para agentes de codificação. Mas como saber se a sua habilidade está realmente a funcionar? É tentador basear-se nas impressões, mas o desempenho varia muito entre as tarefas — e os agentes de codificação têm um enorme espaço de ação, o que torna essa variação ainda mais difícil de prever. Criámos um benchmark de avaliação para as nossas habilidades recém-lançadas LangSmith e LangChain. ➡️ Saiba mais sobre as nossas descobertas aqui: ➡️ Veja o benchmark por si mesmo: