geïnspireerd door auto-onderzoek, heb ik hermes-agent gemaakt om zichzelf beter te maken, oneindig (soort van). Ik gaf hermes-agent een gehuurde 5090 en Qwen3.5:4b en vertelde het om de beste onderzoeksagent voor hermes te maken. De voorgestelde workflow was: - Voer benchmark uit op model - voeg een QLoRA toe of finetune - laad model in systeemgeheugen - herhaal enzovoort, het eindigde met het maken van een model dat Qwen3.5:27b overtrof (en bijna zijn eigen prestaties verdubbelde) in DeepPlanning (17.8 naar 31.2) en gerelateerde benchmarks. Ik weet zeker dat met meer tijd (dit werd gedaan in 7 uur) dit model 31.2 zou kunnen overschrijden en blijven itereren. dit is een inzending voor de @NousResearch @Teknium hackathon, geweldig product dat ze hier hebben. Hieronder is een grafiek van de verbetering per finetune (afbeelding gemaakt met gpt-image-1.5)