Tópicos em alta
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Nous Research
O Atropos v0.3 já está disponível!
Nossa estrutura de ambientes RL passou por muitas atualizações desde a v0.2 - alguns destaques:
- O Atropos agora pode ser usado como uma estrutura de benchmarking e avaliações pela @rogershijin, com nosso primeiro benchmark externo, Reward-Bench 2!
- Adicionado o Reasoning Gym, um repositório de ginásio de ambiente externo portado para átropos com mais de 100 tarefas de raciocínio de @neurosp1ke e amigos
- @max_paperclips integrou o bootcamp de raciocínio do @intern_lm, adicionando 1000+ novas tarefas de raciocínio para RL
- @dmayhem93 o engenheiro-chefe da Atropos adicionou dezenas de correções de bugs e outras melhorias de confiabilidade e compatibilidade, melhor suporte para vários ambientes e CI/CD
- Muitos dos ambientes de hackathon de Átropos foram mesclados em /environments/community - listá-los todos ocuparia a maior parte do espaço da tela, mas alguns destaques:
VR-CLI por @JakeABoggs, Filosofia RLAIF, Professores de LLM Adaptativo, WebVoyager, design de proteínas por @hallerite, um ambiente de roteamento de modelo por @gabinfay, vários em lean proving, a arena catbot, confronto de pokémon, pôquer, médicos prestativos, poesia sânscrita de @khoomeik e muito mais!
- Outros novos ambientes com suporte oficial notáveis incluem:
Formato de resposta seguindo o ambiente
Ambiente Pydantic para JSON portado do trabalho @MatternJustus
Instruções a seguir portadas do trabalho de @natolambert e @allen_ai
Contagem de letras
- 47 novos colaboradores!
Confira o changelog completo aqui:

Teknium (e/λ)18 de jul., 03:22
Acabei de fundir um PR para um ambiente para melhorar o LLM como juiz, bem como avaliar os modelos em sua capacidade de fazer julgamentos!
Você sabia que todos os ambientes de RL verificáveis são quase equivalentes a benchmarks (e vice-versa!)? Por isso, adicionamos um comando evaluate à base do Átropos e agora você pode executar benchmarks em ambientes Átropos.
Ficamos frustrados em trabalhar com tantos frameworks de benchmark que estavam desatualizados ou inutilizáveis, então implementamos o modo somente avaliação no Atropos, nosso framework de ambientes RL.
Portanto, nossa primeira porta de fora de nossos ambientes existentes foi o Banco de Recompensas do @natolambert!
Nota: ele suporta apenas modelos de recompensa generativa (LLM Judges regulares) no momento.
Confira o PR aqui:

24,84K
Nous Research repostou
Foi divertido trabalhar com a equipe @huggingface para tornar esse recurso uma realidade! Obrigado por todo o seu trabalho e criatividade @pcuenq @reach_vb @julien_c @ariG23498!
Também obrigado a @NousResearch @Teknium1 @Euclaise_ por serem os primeiros a adotar notebooks de modelos personalizados e trabalharem nisso conosco!
31,36K
Fizemos algumas atualizações em nossa API e NousChat nas últimas semanas:
O acesso à nossa API de inferência não está mais atrás de uma lista de espera: novos usuários obtêm acesso imediato
Hermes-3-Llama-3.1-405B agora está disponível por meio da API (além de Hermes-3-Llama-3.1-70B, DeepHermes-3-Llama-3-8B-Preview e DeepHermes-3-Mistral-24B-Preview)
Os limites de taxa de API foram dobrados (agora 100 rpm e 80k tpm)
E nossa nova experiência de bate-papo está sendo lançada em
Sua conta de bate-papo está vinculada à sua conta em, portanto, seus créditos de API podem ser usados para interagir com o bate-papo.

19,69K
Melhores
Classificação
Favoritos
Em alta on-chain
Em alta no X
Principais fundos da atualidade
Mais notável