terinspirasi oleh penelitian otomatis, saya membuat agen hermes membuat dirinya lebih baik, tanpa batas (semacam). Saya memberi agen hermes 5090 dan Qwen3.5:4b yang disewa dan menyuruhnya membuat agen penelitian terbaik untuk hermes. Alur kerja yang diusulkan adalah: -Jalankan benchmark pada model -tambahkan QLoRA atau finetune -muat model ke dalam memori sistem -ulangi dan seterusnya, akhirnya membuat model yang mengungguli Qwen3.5:27b (dan hampir dua kali lipat kinerjanya sendiri) di DeepPlanning (17.8 hingga 31.2) dan tolok ukur terkait Saya yakin dengan waktu yang lebih lama diberikan (ini dilakukan dalam 7 jam) model ini bisa melebihi 31.2 dan terus berulang. Ini adalah pengajuan ke @NousResearch @Teknium hackathon, produk luar biasa yang mereka miliki di sini. Di bawah ini adalah grafik peningkatan per-finetune (gambar dibuat dengan gpt-image-1.5)