Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
terinspirasi oleh penelitian otomatis, saya membuat agen hermes membuat dirinya lebih baik, tanpa batas (semacam).
Saya memberi agen hermes 5090 dan Qwen3.5:4b yang disewa dan menyuruhnya membuat agen penelitian terbaik untuk hermes. Alur kerja yang diusulkan adalah:
-Jalankan benchmark pada model
-tambahkan QLoRA atau finetune
-muat model ke dalam memori sistem
-ulangi
dan seterusnya, akhirnya membuat model yang mengungguli Qwen3.5:27b (dan hampir dua kali lipat kinerjanya sendiri) di DeepPlanning (17.8 hingga 31.2) dan tolok ukur terkait
Saya yakin dengan waktu yang lebih lama diberikan (ini dilakukan dalam 7 jam) model ini bisa melebihi 31.2 dan terus berulang.
Ini adalah pengajuan ke @NousResearch @Teknium hackathon, produk luar biasa yang mereka miliki di sini.
Di bawah ini adalah grafik peningkatan per-finetune (gambar dibuat dengan gpt-image-1.5)

Teratas
Peringkat
Favorit
