📣 Se acaba de lanzar 📣 el nuevo punto de referencia de IA de Vals Construimos el punto de referencia SAGE después de descubrir que los modelos tienen dificultades para calificar el trabajo de los estudiantes. Paradójicamente, los mejores modelos ahora pueden resolver problemas matemáticos desafiantes + ganar en mi opinión, pero luchan por superar el 50% al calificar. (1/5)