Trillion Labs, một công ty khởi nghiệp AI Hàn Quốc, đã ra mắt Tri-21B-think Preview, một mô hình lý luận với trọng số mở nhỏ có điểm số 20 trên Chỉ số Trí tuệ Phân tích Nhân tạo Những điểm chính trong việc đánh giá: ➤ Trí tuệ cao nhưng không dẫn đầu cho kích thước nhỏ của nó: Tri-21B-think Preview có điểm số cao cho kích thước 21 tỷ tham số tương đối nhỏ của nó. Mô hình chỉ có 21B làm cho nó tương đối dễ tiếp cận hơn để tự lưu trữ so với các mô hình mã nguồn mở hàng đầu như GLM-5 và Kimi K2.5 ➤ Tỷ lệ ảo tưởng thấp: Tri-21B-think Preview có điểm -49 trên Chỉ số AA-Omniscience, một tiêu chuẩn Phân tích Nhân tạo độc quyền đo lường độ tin cậy kiến thức và ảo tưởng trên các ngành. Điểm số tốt này chủ yếu được thúc đẩy bởi tỷ lệ ảo tưởng tương đối thấp (62%), đây là tỷ lệ thấp nhất trong số các mô hình Hàn Quốc mà chúng tôi đã đánh giá. ➤ Sức mạnh trong việc sử dụng công cụ Agentic: Tri-21B-think Preview có điểm 93% trên τ²-Bench Telecom, cho thấy hiệu suất mạnh mẽ trong các quy trình làm việc sử dụng công cụ agentic. Tri-21B-think Preview nằm trong số các mô hình trọng số mở tiên phong trong danh mục này, có điểm số tương tự như DeepSeek V3.2 và MiniMax M2.5 trong danh mục này ➤ Sử dụng Token cao: Tri-21B-think Preview cho thấy việc sử dụng token rất cao so với các mô hình khác trong cùng một cấp độ trí tuệ, sử dụng ~120M token lý luận trong bộ công cụ Trí tuệ Phân tích Nhân tạo. Điều này tương đương với K-EXAONE (100M token lý luận), một mô hình Hàn Quốc khác ➤ Không có Điểm cuối Công cộng: Tri-21B-think Preview là một mô hình trọng số mở theo giấy phép Apache 2.0. Hiện tại, cách duy nhất để truy cập mô hình là thông qua tự lưu trữ. Trillion Labs đã chia sẻ rằng một điểm cuối dành riêng của bên thứ nhất dự kiến sẽ được phục vụ trong tương lai gần. Xem bên dưới để phân tích thêm
Tri-21B-think Preview đạt 93% trên τ²-Bench Telecom, cho thấy hiệu suất mạnh mẽ trong các quy trình làm việc sử dụng công cụ agentic.
Tri-21B-think Preview cho thấy việc sử dụng token rất cao, sử dụng khoảng ~120 triệu token lý luận trong bộ công cụ Trí tuệ Phân tích Nhân tạo.
9,05K