Cửa hàng DApp | Trung tâm Web3 với các sự kiện và trò chơi

Chủ đề thịnh hành

Hôm nay chúng tôi mở mã nguồn Nomos 1. Với chỉ 30B tham số, nó đạt 87/120 trong cuộc thi Putnam năm nay, một trong những cuộc thi toán học danh giá nhất thế giới. Điểm số này sẽ xếp hạng #2/3988 vào năm 2024 và đánh dấu bước đầu tiên của chúng tôi với @hillclimbai hướng tới việc tạo ra một nhà toán học AI SOTA.

Nomos 1 đạt 87/120 với 8 điểm tuyệt đối, trong khi Qwen3-30ba3b-Thinking-2507 chỉ đạt 24/120 khi chạy trong cùng một bộ harness dưới cùng một điều kiện, cho thấy rằng hiệu suất chủ yếu là do chất lượng dữ liệu và quá trình huấn luyện sau hơn là do bộ harness.

Các bài nộp đã được chấm điểm ẩn danh bởi một thí sinh con Putnam top 200, người đã nhận được các bài nộp ẩn danh. Các tệp chính xác được gửi đến các người chú thích của chúng tôi để chấm điểm có sẵn ở đây dưới dạng không ẩn danh: , cùng với các sách hướng dẫn được sử dụng để tạo ra chúng. Chúng tôi đã sử dụng cùng một giới hạn thời gian như các thí sinh - 3 giờ cho mỗi phần trong hai phần.

Hệ thống lý luận mã nguồn mở của chúng tôi bao gồm một giai đoạn giải quyết, nơi các công nhân cố gắng giải quyết một vấn đề ít được giải quyết nhất và tự đánh giá, tiếp theo là một giai đoạn hoàn thiện, giai đoạn này tổng hợp các bài nộp để chọn ra một bài nộp cuối cùng cho mỗi vấn đề. Chúng tôi đã sử dụng các tham số lấy mẫu mặc định của Qwen3 và không có lời nhắc hệ thống.

Chúng tôi mã nguồn mở mô hình của mình ở đây và lý do của chúng tôi ở đây. Mô hình này được đào tạo bởi @rogershijin trên cơ sở hạ tầng được xây dựng bởi @theemozilla và @dmayhem93 với sự tư vấn từ @nullvaluetensor và sự lãnh đạo từ @teknium và @theemozilla.

118,1K

Hàng đầu

Thứ hạng

Yêu thích