Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Inspirat de auto-cercetarea, am făcut ca Hermes-Agent să se îmbunătățească la infinit (într-un fel).
I-am dat agentului Hermes un 5090 închiriat și Qwen3.5:4b și i-am spus să fie cel mai bun agent de cercetare pentru Hermes. Fluxul de lucru propus a fost:
- Rulează benchmark pe model
- adaugă un QLoRA sau finetune
- încărcarea modelului în memoria sistemului
-Repetă
și așa mai departe, a ajuns să creeze un model care a depășit Qwen3.5:27b (și aproape că și-a dublat propria performanță) în DeepPlanning (17.8 până la 31.2) și benchmark-uri conexe
Sunt sigur că, cu un timp mai lung (acest lucru s-a făcut în 7 ore), acest model ar putea depăși 31.2 și ar putea continua să itere.
Aceasta este o contribuție la hackathon-ul @NousResearch @Teknium, un produs uimitor pe care îl au aici.
Mai jos este un grafic al îmbunătățirii pe finetune (imagine realizată cu gpt-image-1.5)

Limită superioară
Clasament
Favorite
