Inspirat de auto-cercetarea, am făcut ca Hermes-Agent să se îmbunătățească la infinit (într-un fel). I-am dat agentului Hermes un 5090 închiriat și Qwen3.5:4b și i-am spus să fie cel mai bun agent de cercetare pentru Hermes. Fluxul de lucru propus a fost: - Rulează benchmark pe model - adaugă un QLoRA sau finetune - încărcarea modelului în memoria sistemului -Repetă și așa mai departe, a ajuns să creeze un model care a depășit Qwen3.5:27b (și aproape că și-a dublat propria performanță) în DeepPlanning (17.8 până la 31.2) și benchmark-uri conexe Sunt sigur că, cu un timp mai lung (acest lucru s-a făcut în 7 ore), acest model ar putea depăși 31.2 și ar putea continua să itere. Aceasta este o contribuție la hackathon-ul @NousResearch @Teknium, un produs uimitor pe care îl au aici. Mai jos este un grafic al îmbunătățirii pe finetune (imagine realizată cu gpt-image-1.5)