Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
inspirado pela auto-pesquisa, fiz com que o hermes-agent se tornasse melhor, infinitamente (mais ou menos).
Dei ao hermes-agent um 5090 alugado e o Qwen3.5:4b e disse-lhe para criar o melhor agente de pesquisa para o hermes. O fluxo de trabalho proposto foi:
-Fazer benchmark no modelo
-adicionar um QLoRA ou afinar
-carregar o modelo na memória do sistema
-repetir
e assim por diante, acabou por criar um modelo que superou o Qwen3.5:27b (e quase duplicou o seu próprio desempenho) em DeepPlanning (17.8 para 31.2) e benchmarks relacionados.
Estou certo de que, dado mais tempo (isto foi feito em 7 horas), este modelo poderia exceder 31.2 e continuar a iterar.
esta é uma submissão para o hackathon @NousResearch @Teknium, produto incrível que eles têm aqui.
Abaixo está um gráfico da melhoria por afinação (imagem feita com gpt-image-1.5)

Top
Classificação
Favoritos
