inspirado pela auto-pesquisa, fiz com que o hermes-agent se tornasse melhor, infinitamente (mais ou menos). Dei ao hermes-agent um 5090 alugado e o Qwen3.5:4b e disse-lhe para criar o melhor agente de pesquisa para o hermes. O fluxo de trabalho proposto foi: -Fazer benchmark no modelo -adicionar um QLoRA ou afinar -carregar o modelo na memória do sistema -repetir e assim por diante, acabou por criar um modelo que superou o Qwen3.5:27b (e quase duplicou o seu próprio desempenho) em DeepPlanning (17.8 para 31.2) e benchmarks relacionados. Estou certo de que, dado mais tempo (isto foi feito em 7 horas), este modelo poderia exceder 31.2 e continuar a iterar. esta é uma submissão para o hackathon @NousResearch @Teknium, produto incrível que eles têm aqui. Abaixo está um gráfico da melhoria por afinação (imagem feita com gpt-image-1.5)