Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
вдохновленный автоисследованиями, я заставил hermes-agent улучшать себя бесконечно (в некотором роде).
Я дал hermes-agent арендованный 5090 и Qwen3.5:4b и сказал ему создать лучший исследовательский агент для hermes. Предложенный рабочий процесс был следующим:
-Запустить бенчмарк на модели
-добавить QLoRA или дообучить
-загрузить модель в системную память
-повторить
и так далее, в итоге он создал модель, которая превзошла Qwen3.5:27b (и почти удвоила свою собственную производительность) в DeepPlanning (с 17.8 до 31.2) и связанных бенчмарках.
Я уверен, что при большем времени (это было сделано за 7 часов) эта модель могла бы превысить 31.2 и продолжать итерации.
это подача на хакатон @NousResearch @Teknium, у них здесь потрясающий продукт.
Ниже график улучшения на каждое дообучение (изображение создано с помощью gpt-image-1.5)

Топ
Рейтинг
Избранное
