Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Nous Research
¡Atropos v0.3 ya está disponible!
Nuestro marco de Entornos RL ha recibido muchas mejoras desde v0.2 - algunos aspectos destacados:
- ¡Atropos ahora puede ser utilizado como un marco de evaluación y referencia por @rogershijin, con nuestro primer benchmark externo, Reward-Bench 2!
- Se añadió el Reasoning Gym, un repositorio de entornos externos portado a Atropos con más de 100 tareas de razonamiento por @neurosp1ke y amigos.
- @max_paperclips integró el bootcamp de razonamiento de @intern_lm, añadiendo más de 1000 nuevas tareas de razonamiento para RL.
- @dmayhem93, el ingeniero principal de Atropos, añadió docenas de correcciones de errores y otras mejoras de fiabilidad y compatibilidad, mejor soporte para múltiples entornos y CI/CD.
- Muchos de los entornos del hackathon de Atropos se han fusionado en /environments/community - enumerarlos todos ocuparía la mayor parte del espacio en pantalla, pero algunos aspectos destacados son:
VR-CLI por @JakeABoggs, Filosofía RLAIF, Profesores LLM Adaptativos, WebVoyager, diseño de proteínas por @hallerite, un entorno de enrutamiento de modelos por @gabinfay, múltiples en pruebas lean, la arena de catbots, enfrentamiento de pokemon, póker, doctores útiles, poesía sánscrita por @khoomeik y mucho más!
- Otros nuevos entornos oficialmente soportados incluyen:
Formato de respuesta siguiendo el entorno
Entorno Pydantic a JSON portado del trabajo de @MatternJustus
Seguimiento de instrucciones portado del trabajo de @natolambert y @allen_ai
Conteo de letras
- ¡47 nuevos contribuyentes!
Consulta el changelog completo aquí:

Teknium (e/λ)18 jul, 03:22
¡Acabamos de fusionar un PR para un entorno que mejora LLM como Juez y evalúa modelos en su capacidad para hacer juicios!
¿Sabías que todos los entornos RL verificables son casi equivalentes a los benchmarks (y viceversa!)? Así que añadimos un comando de evaluación a la base de Atropos y ahora puedes ejecutar benchmarks a través de los entornos de Atropos.
Nos frustramos al trabajar con tantos marcos de benchmark que estaban desactualizados o eran inutilizables, así que implementamos un modo solo de evaluación en Atropos, nuestro marco de entornos RL.
Así que nuestro primer puerto desde fuera de nuestros entornos existentes fue el Reward-Bench de @natolambert!
Nota: solo admite modelos de recompensa generativa (Jueces LLM regulares) en este momento.
Consulta el PR aquí:

24,8K
Nous Research republicó
¡Fue divertido trabajar con el equipo de @huggingface para hacer realidad esta función! ¡Gracias por todo tu trabajo y creatividad @pcuenq @reach_vb @julien_c @ariG23498!
¡También gracias a @NousResearch @Teknium1 @Euclaise_ por ser los primeros en adoptar modelos de cuadernos personalizados y trabajar en esto con nosotros!
31,35K
Hemos realizado algunas actualizaciones en nuestra API y NousChat en las últimas semanas:
El acceso a nuestra API de inferencia ya no está detrás de una lista de espera: los nuevos usuarios obtienen acceso inmediato
Hermes-3-Llama-3.1-405B ya está disponible a través de la API (además de Hermes-3-Llama-3.1-70B, DeepHermes-3-Llama-3-8B-Preview y DeepHermes-3-Mistral-24B-Preview)
Los límites de velocidad de API se han duplicado (ahora 100 rpm y 80k tpm)
Y nuestra nueva experiencia de chat se está implementando en
Su cuenta de chat está vinculada a su cuenta en, por lo que sus créditos de API se pueden usar para interactuar con el chat.

19,65K
Nous Research republicó
Finalmente se completó y fusionó el entorno SWE_RL que fue descrito por el artículo SWE RL de Meta en Atropos: ¡un entorno realmente difícil que puede enseñar a un modelo a ser un agente de codificación mucho mejor!
Echa un vistazo a las relaciones públicas:
Echa un vistazo al documento SWE-RL de Meta:

11,69K
Parte superior
Clasificación
Favoritos
En tendencia on-chain
En tendencia en X
Principales fondos recientes
Más destacado