"y que cualquier cosa que se pueda aprender se puede aprender en un entorno de RL." ¿Entonces vamos a tener momentos de Claude Code para todo? ¿Hemos tenido nuevos modelos entrenados con los frutos de entornos de RL fuera del código ya? Siento que en '25 tuvimos un montón de empresas haciéndolos.
Jackson Kernion
Jackson KernionHace 16 horas
Estoy tratando de averiguar qué debería preocuparme a continuación. Me uní a Anthropic hace más de 4 años, motivado por el sueño de construir AGI. Estaba convencido, tras estudiar la filosofía de la mente, de que estamos acercándonos a una escala suficiente y que cualquier cosa que se pueda aprender se puede aprender en un entorno de RL.
¿Es Anthropic el más optimista en este momento? RL + Escala = AGI?
@jackclarkSF ¿Ya me retiro a una granja en Italia, teniendo a Claude cuidando de mi granja?
359