Cửa hàng DApp | Trung tâm Web3 với các sự kiện và trò chơi

Chủ đề thịnh hành

lấy cảm hứng từ việc tự nghiên cứu, tôi đã làm cho hermes-agent tự cải thiện, vô hạn (hơi hơi). Tôi đã cho hermes-agent một chiếc 5090 thuê và Qwen3.5:4b và bảo nó tạo ra tác nhân nghiên cứu tốt nhất cho hermes. Quy trình làm việc được đề xuất là: -Chạy benchmark trên mô hình -thêm một QLoRA hoặc tinh chỉnh -tải mô hình vào bộ nhớ hệ thống -lặp lại và cứ như vậy, nó đã tạo ra một mô hình vượt trội hơn Qwen3.5:27b (và gần như gấp đôi hiệu suất của chính nó) trong DeepPlanning (17.8 đến 31.2) và các benchmark liên quan. Tôi chắc rằng với thời gian dài hơn (điều này được thực hiện trong 7 giờ) mô hình này có thể vượt quá 31.2 và tiếp tục lặp lại. đây là một bài nộp cho hackathon @NousResearch @Teknium, sản phẩm tuyệt vời mà họ có ở đây. Dưới đây là một đồ họa về sự cải thiện theo từng lần tinh chỉnh (hình ảnh được tạo bằng gpt-image-1.5)

Hàng đầu

Thứ hạng

Yêu thích