Actualización de la clasificación GDPval-AA: El GLM-4.7 es el nuevo líder de pesos abiertos con un ELO 1224, y el MiniMax M2.1 aporta mejoras significativas respecto al M2 GDPval-AA compara los resultados de los modelos en tareas realistas de trabajo de conocimiento como la preparación de presentaciones, análisis y más, utilizando un entorno terminal dedicado y acceso web. Los resultados del trabajo se comparan entre sí y se evalúan mediante una cadena automatizada para generar coincidencias y puntuaciones ELO. ➤ GLM-4.7 de @Zai_org alcanza un ELO de 1224, justo detrás de GPT-5.1 (alto) y un aumento de ~170 puntos respecto a GLM-4.6. Esto significa que esperamos que las salidas del GLM-4.7 superen al GLM-4.6 en el 73% de las veces en comparación directa. � @MiniMax__AI➤ también mostró mejoras respecto al GDPval-AA con su lanzamiento de M2.1, aumentando el ELO en +56 puntos respecto al modelo M2 anterior, pero manteniéndose entre el códice GLM-4.6 y GPT-5.1 (alto).
Clasificación GDPval-AA: Comparación de análisis artificial de proveedores de API serverless GLM-4.7: Comparación de análisis artificial de proveedores de API serverless MiniMax M2.1:
2.82K