Tienda de dapps | Hub de Web3 para eventos y juegos

Temas en tendencia

¡Uau! DeepSeekMath-V2 ¡Arquitectura de generador y verificador otra vez! ... Hacia un razonamiento matemático autoverificable, investigamos cómo entrenar un verificador basado en LLM preciso y fiel para la demostración de teoremas. Luego entrenamos un generador de demostraciones usando el verificador como modelo de recompensa, e incentivamos al generador a identificar y resolver la mayor cantidad posible de problemas en sus propias demostraciones antes de finalizarlas. Para mantener la brecha de verificación generacional a medida que el generador se fortalece, proponemos escalar el cálculo de verificación para etiquetar automáticamente nuevas pruebas difíciles de verificar, creando datos de entrenamiento para mejorar aún más el verificador. Nuestro modelo resultante, DeepSeekMath-V2, demuestra una gran capacidad de demostración de teoremas, logrando puntuaciones de nivel oro en IMO 2025 y CMO 2024 y un casi perfecto 118/120 en Putnam 2024 con cálculo escalado en tiempo de prueba. Aunque queda mucho trabajo por hacer, estos resultados sugieren que el razonamiento matemático autoverificable es una dirección de investigación factible que podría ayudar a desarrollar sistemas de IA matemática más capaces.

Populares

Ranking

Favoritas