Un système d'évaluations complet arrive bientôt sur GStack. Les évaluations LLM sont le seul moyen de créer des systèmes entièrement agents qui s'améliorent de manière répétée à mesure que vous améliorez le flux de travail, l'ingénierie contextuelle et les invites.