Магазин DApp | Web3-центр мероприятий и игр

Актуальные темы

вдохновленный автоисследованиями, я заставил hermes-agent улучшать себя бесконечно (в некотором роде). Я дал hermes-agent арендованный 5090 и Qwen3.5:4b и сказал ему создать лучший исследовательский агент для hermes. Предложенный рабочий процесс был следующим: -Запустить бенчмарк на модели -добавить QLoRA или дообучить -загрузить модель в системную память -повторить и так далее, в итоге он создал модель, которая превзошла Qwen3.5:27b (и почти удвоила свою собственную производительность) в DeepPlanning (с 17.8 до 31.2) и связанных бенчмарках. Я уверен, что при большем времени (это было сделано за 7 часов) эта модель могла бы превысить 31.2 и продолжать итерации. это подача на хакатон @NousResearch @Teknium, у них здесь потрясающий продукт. Ниже график улучшения на каждое дообучение (изображение создано с помощью gpt-image-1.5)

Топ

Рейтинг

Избранное