Inspirován auto-výzkumem jsem nechal Hermes-agenta sám sebe nekonečně vylepšit (tak nějak). Dal jsem agentovi Hermes pronajatý formulář 5090 a Qwen3.5:4b a řekl mu, aby byl nejlepší výzkumný agent pro Hermes. Navrhovaný pracovní postup byl: -Spusť benchmark na modelu -přidat QLoRA nebo finetune -načíst model do systémové paměti -opakuj a tak dále, nakonec vytvořil model, který překonal Qwen3.5:27b (a téměř zdvojnásobil svůj vlastní výkon) v DeepPlanning (17.8 až 31.2) a souvisejících benchmarkech Jsem si jistý, že s delším časem (tohle bylo hotové za 7 hodin) by tento model mohl překročit 31,2 a dál se zlepšovat. Toto je příspěvek do hackathonu @NousResearch @Teknium, úžasný produkt, který tu mají. Níže je grafika zlepšení per finetune (obrázek vytvořený pomocí gpt-image-1.5)