El evento de lanzamiento de Grok4 solo puede describirse como mediocre, y el rendimiento específico es un poco insatisfactorio después de probarlo A continuación, un resumen de 👇 la presentación 1. Rendimiento: Grok 4 se desempeña bien en pruebas multidominio, con una tasa de precisión mucho más alta que modelos similares en preguntas difíciles como el "Ultimate Human Exam", una mejor versión multiagente y puntajes completos en programación, matemáticas y otras pruebas, y su capacidad académica ha alcanzado el nivel de posgrado, superando a la mayoría de los humanos. 2. Desarrollo de la formación: De Grok 2 a 4, la cantidad de formación aumenta en órdenes de magnitud, y la 4ª generación es 100 veces mayor que la 2ª generación. Las generaciones 3 y 4 se centran en el razonamiento y el aprendizaje por refuerzo, con la ayuda del aumento de datos y otras tecnologías y supercomputadoras para lograr el razonamiento de principios y la autocorrección. 3. Aplicación funcional: el retraso de la interacción de voz se reduce a la mitad y se agrega la voz natural; Una vez que se abre la API, se usa ampliamente en simulación de negocios, investigación científica, desarrollo de juegos y otros campos, como el aumento del valor neto del negocio de máquinas expendedoras, la aceleración de la investigación científica y el desarrollo rápido de juegos. 4. Planes futuros: Lanzar modelos de codificación en unas semanas para mejorar las capacidades multimodales; En las próximas 3-4 semanas, se lanzará la capacitación en generación de video, con el objetivo de construir modelos más rápidos e inteligentes y promover la actualización de la civilización humana.
8.51K