Trendande ämnen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Nous Research
Atropos v0.3 är nu ute!
Vårt ramverk för RL-miljöer har sett många uppgraderingar sedan v0.2 - några höjdpunkter:
- Atropos kan nu användas som ett ramverk för benchmarking och utvärdering av @rogershijin, med vår första externa benchmark, Reward-Bench 2!
- Lade till Reasoning Gym, ett repo för gym i extern miljö som överfördes till atropos med över 100 resonemangsuppgifter av @neurosp1ke och vänner
- @max_paperclips integrerade @intern_lm:s resonemang bootcamp och lade till 1000+ nya resonemangsuppgifter för RL
- @dmayhem93 lade Atropos chefsingenjör till dussintals buggfixar och andra förbättringar av tillförlitlighet och kompatibilitet, bättre stöd för flera miljöer och CI/CD
- Många av Atropos hackathon-miljöer har slagits ihop till /environments/community - att lista dem alla skulle ta upp det mesta av skärmutrymmet, men några höjdpunkter:
VR-CLI av @JakeABoggs, filosofi RLAIF, adaptiva LLM-lärare, WebVoyager, proteindesign av @hallerite, en modellroutingmiljö av @gabinfay, flera på lean proving, catbot arena, pokemon showdown, poker, hjälpsamma läkare, sanskritpoesi av @khoomeik och så mycket mer!
- Andra viktiga nya miljöer som stöds officiellt är:
Svarsformat följande miljö
Pydantic till JSON-miljö porterad från @MatternJustus arbete
Instruktion Följer portat från @natolambert och @allen_ai arbete
Räkning av bokstäver
- 47 helt nya bidragsgivare!
Kolla in hela ändringsloggen här:

Teknium (e/λ)18 juli 03:22
Har precis slagit ihop en PR för en miljö för att förbättra LLM som domare samt utvärdera modeller på deras förmåga att göra domar!
Visste du att alla verifierbara RL-miljöer är nästan likvärdiga med riktmärken (och vice versa!)? Så vi lade till ett evaluate-kommando till Atropos bas och nu kan du köra benchmarks genom Atropos-miljöer.
Vi blev frustrerade över att arbeta med så många benchmark-ramverk som var föråldrade eller oanvändbara, så vi implementerade endast utvärdering-läge i Atropos, vårt ramverk för RL-miljöer.
Så vår första port utanför våra befintliga miljöer var @natolambert's Reward-Bench!
Obs: den stöder endast generativa belöningsmodeller (vanliga LLM-domare) för tillfället.
Kolla in PR här:

24,84K
Nous Research delade inlägget
Det var roligt att arbeta med @huggingface-teamet för att göra den här funktionen till verklighet! Tack för allt ditt arbete och kreativitet @pcuenq @reach_vb @julien_c @ariG23498!
Tack också till @NousResearch @Teknium1 @Euclaise_ för att de var tidiga användare av bärbara datorer med anpassade modeller och arbetade med detta med oss!
31,36K
Vi har gjort några uppdateringar av vårt API och NousChat under de senaste veckorna:
Åtkomst till vårt Inference API ligger inte längre bakom en väntelista: nya användare får omedelbar åtkomst
Hermes-3-Llama-3.1-405B är nu tillgänglig via API:et (förutom Hermes-3-Llama-3.1-70B, DeepHermes-3-Llama-3-8B-Preview och DeepHermes-3-Mistral-24B-Preview)
API-hastighetsgränserna har fördubblats (nu 100 rpm och 80k tpm)
OCH vår nya chattupplevelse rullas ut på
Ditt chattkonto där är länkat till ditt konto så att dina API-krediter kan användas för att interagera med chatten.

19,69K
Topp
Rankning
Favoriter
Trendande på kedjan
Trendande på X
Senaste toppfinansieringarna
Mest anmärkningsvärda