Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Nous Research
¡Atropos v0.3 ya está disponible!
Nuestro marco de trabajo de RL Environments ha experimentado muchas actualizaciones desde la versión 0.2, algunos aspectos destacados:
- Atropos ahora puede ser utilizado como marco de evaluación comparativa y evaluación por @rogershijin, con nuestro primer punto de referencia externo, Reward-Bench 2!
- Se agregó el Gimnasio de Razonamiento, un repositorio de gimnasio de entorno externo portado a Atropos con más de 100 tareas de razonamiento de @neurosp1ke y amigos.
- @max_paperclips integrado el bootcamp de razonamiento de @intern_lm, agregando 1000+ nuevas tareas de razonamiento para RL
- @dmayhem93 el ingeniero jefe de Atropos agregó docenas de correcciones de errores y otras mejoras de confiabilidad y compatibilidad, mejor soporte para múltiples entornos y CI/CD
- Muchos de los entornos del hackathon de Atropos se han fusionado en /environments/community - enumerarlos todos ocuparía la mayor parte del espacio de la pantalla, pero algunos aspectos destacados:
VR-CLI de @JakeABoggs, Philosophy RLAIF, Adaptive LLM Teachers, WebVoyager, diseño de proteínas de @hallerite, un entorno de enrutamiento de modelos de @gabinfay, múltiples en Lean Proving, Catbot Arena, Pokemon Showdown, Poker, Helpful Doctors, poesía sánscrita de @khoomeik y mucho más.
- Otros nuevos entornos notables con soporte oficial incluyen:
Formato de respuesta siguiendo el entorno
Pydantic a JSON entorno portado desde @MatternJustus trabajo
Instrucciones Siguiendo el trabajo de @natolambert y @allen_ai
Conteo de letras
- ¡47 nuevos colaboradores!
Echa un vistazo al registro de cambios completo aquí:

Teknium (e/λ)18 jul, 03:22
¡Acabo de fusionar un PR para un entorno para mejorar LLM como juez, así como evaluar los modelos en su capacidad para hacer juicios!
¿Sabías que todos los entornos de RL verificables son casi equivalentes a los puntos de referencia (¡y viceversa!)? Así que agregamos un comando de evaluación a la base de Atropos y ahora puede ejecutar pruebas comparativas a través de los entornos de Átropos.
Nos frustramos al trabajar con tantos marcos de referencia que estaban desactualizados o eran inutilizables, por lo que implementamos el modo de solo evaluación en Atropos, nuestro marco de entornos RL.
Así que nuestro primer port desde fuera de nuestros entornos existentes fue @natolambert's Reward-Bench!
Nota: por el momento, solo admite modelos de recompensa generativa (jueces regulares de LLM).
Echa un vistazo al PR aquí:

24.81K
Nous Research reposteó
¡Fue divertido trabajar con el equipo de @huggingface para hacer realidad esta función! ¡Gracias por todo tu trabajo y creatividad @pcuenq @reach_vb @julien_c @ariG23498!
¡También gracias a @NousResearch @Teknium1 @Euclaise_ por ser los primeros en adoptar modelos de cuadernos personalizados y trabajar en esto con nosotros!
31.35K
Hemos realizado algunas actualizaciones en nuestra API y NousChat en las últimas semanas:
El acceso a nuestra API de inferencia ya no está detrás de una lista de espera: los nuevos usuarios obtienen acceso inmediato
Hermes-3-Llama-3.1-405B ya está disponible a través de la API (además de Hermes-3-Llama-3.1-70B, DeepHermes-3-Llama-3-8B-Preview y DeepHermes-3-Mistral-24B-Preview)
Los límites de velocidad de API se han duplicado (ahora 100 rpm y 80k tpm)
Y nuestra nueva experiencia de chat se está implementando en
Su cuenta de chat está vinculada a su cuenta en, por lo que sus créditos de API se pueden usar para interactuar con el chat.

19.66K
Nous Research reposteó
Finalmente se completó y fusionó el entorno SWE_RL que fue descrito por el artículo SWE RL de Meta en Atropos: ¡un entorno realmente difícil que puede enseñar a un modelo a ser un agente de codificación mucho mejor!
Echa un vistazo a las relaciones públicas:
Echa un vistazo al documento SWE-RL de Meta:

11.69K
Populares
Ranking
Favoritas
Onchain en tendencia
Tendencia en X
Principales fondos recientes
Más destacadas