Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
lấy cảm hứng từ việc tự nghiên cứu, tôi đã làm cho hermes-agent tự cải thiện, vô hạn (hơi hơi).
Tôi đã cho hermes-agent một chiếc 5090 thuê và Qwen3.5:4b và bảo nó tạo ra tác nhân nghiên cứu tốt nhất cho hermes. Quy trình làm việc được đề xuất là:
-Chạy benchmark trên mô hình
-thêm một QLoRA hoặc tinh chỉnh
-tải mô hình vào bộ nhớ hệ thống
-lặp lại
và cứ như vậy, nó đã tạo ra một mô hình vượt trội hơn Qwen3.5:27b (và gần như gấp đôi hiệu suất của chính nó) trong DeepPlanning (17.8 đến 31.2) và các benchmark liên quan.
Tôi chắc rằng với thời gian dài hơn (điều này được thực hiện trong 7 giờ) mô hình này có thể vượt quá 31.2 và tiếp tục lặp lại.
đây là một bài nộp cho hackathon @NousResearch @Teknium, sản phẩm tuyệt vời mà họ có ở đây.
Dưới đây là một đồ họa về sự cải thiện theo từng lần tinh chỉnh (hình ảnh được tạo bằng gpt-image-1.5)

Hàng đầu
Thứ hạng
Yêu thích
