inspirowany auto-badaniami, sprawiłem, że hermes-agent stał się lepszy, w nieskończoność (tak trochę). Dałem hermes-agentowi wynajęte 5090 i Qwen3.5:4b i powiedziałem mu, aby stworzył najlepszy agent badawczy dla hermesa. Proponowany workflow to: - Uruchom benchmark na modelu - dodaj QLoRA lub finetune - załaduj model do pamięci systemowej - powtarzaj i tak dalej, w końcu stworzył model, który przewyższył Qwen3.5:27b (i prawie podwoił swoją własną wydajność) w DeepPlanning (17.8 do 31.2) i pokrewnych benchmarkach. Jestem pewien, że przy dłuższym czasie (to zostało zrobione w 7 godzin) ten model mógłby przekroczyć 31.2 i kontynuować iteracje. to jest zgłoszenie na hackathon @NousResearch @Teknium, mają niesamowity produkt tutaj. Poniżej znajduje się grafika poprawy na każdy finetune (obrazek stworzony z gpt-image-1.5)