Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
¡Uau! DeepSeekMath-V2
¡Arquitectura de generador y verificador otra vez!
... Hacia un razonamiento matemático autoverificable, investigamos cómo entrenar un verificador basado en LLM preciso y fiel para la demostración de teoremas. Luego entrenamos un generador de demostraciones usando el verificador como modelo de recompensa, e incentivamos al generador a identificar y resolver la mayor cantidad posible de problemas en sus propias demostraciones antes de finalizarlas. Para mantener la brecha de verificación generacional a medida que el generador se fortalece, proponemos escalar el cálculo de verificación para etiquetar automáticamente nuevas pruebas difíciles de verificar, creando datos de entrenamiento para mejorar aún más el verificador. Nuestro modelo resultante, DeepSeekMath-V2, demuestra una gran capacidad de demostración de teoremas, logrando puntuaciones de nivel oro en IMO 2025 y CMO 2024 y un casi perfecto 118/120 en Putnam 2024 con cálculo escalado en tiempo de prueba. Aunque queda mucho trabajo por hacer, estos resultados sugieren que el razonamiento matemático autoverificable es una dirección de investigación factible que podría ayudar a desarrollar sistemas de IA matemática más capaces.

Populares
Ranking
Favoritas

