// Các nguyên lý của tác nhân // Đây là một cách nhìn thật sự thú vị về việc xây dựng các hệ thống đa tác nhân hiệu quả. Các hệ thống đa tác nhân trở nên phức tạp hơn khi các nhiệm vụ trở nên khó khăn hơn. Nhiều vai trò, nhiều lời nhắc, nhiều mẫu tương tác tùy chỉnh hơn. Tuy nhiên, các mẫu tính toán cốt lõi vẫn lặp đi lặp lại trong mọi hệ thống: xem xét, bỏ phiếu, lập kế hoạch, thực hiện. Nhưng không ai coi những mẫu này là các khối xây dựng có thể tái sử dụng. Nghiên cứu mới này giới thiệu các Nguyên lý Tác nhân, một tập hợp các khối xây dựng tiềm ẩn để xây dựng các hệ thống đa tác nhân hiệu quả. Lấy cảm hứng từ cách mà các mạng nơ-ron được xây dựng từ các thành phần có thể tái sử dụng như các khối dư và các đầu chú ý, các nhà nghiên cứu phân tích các kiến trúc đa tác nhân thành ba nguyên lý lặp lại: Xem xét, Bỏ phiếu và Lựa chọn, và Lập kế hoạch và Thực hiện. Điều gì làm cho những nguyên lý này khác biệt? Các tác nhân bên trong mỗi nguyên lý giao tiếp qua KV-cache thay vì ngôn ngữ tự nhiên. Điều này tránh được sự suy giảm thông tin xảy ra khi các tác nhân truyền các tin nhắn văn bản dài qua lại trong các tương tác nhiều giai đoạn. Một tác nhân Tổ chức chọn và kết hợp các nguyên lý cho mỗi truy vấn, được hướng dẫn bởi một kho kiến thức nhẹ về các cấu hình thành công trước đó. Không cần thiết kế hệ thống thủ công. Kết quả trên tám tiêu chuẩn trải dài từ toán học, tạo mã, và QA với năm LLM mã nguồn mở: > Hệ thống MAS dựa trên nguyên lý cải thiện độ chính xác trung bình từ 12.0-16.5% so với các cơ sở đơn tác nhân > Trên GPQA-Diamond, sự cải thiện thật sự nổi bật, 53.2% so với khoảng 33.6-40.2% của các phương pháp trước như AgentVerse, DyLAN, và MAS-GPT Về mặt hiệu quả, việc sử dụng token và độ trễ suy diễn giảm khoảng 3-4 lần so với MAS dựa trên văn bản, trong khi chỉ chịu overhead từ 1.3-1.6 lần so với suy diễn đơn tác nhân. Thay vì thiết kế các kiến trúc đa tác nhân cụ thể cho nhiệm vụ từ đầu, các Nguyên lý Tác nhân cho thấy rằng một tập hợp nhỏ các mẫu tính toán có thể tái sử dụng với giao tiếp tiềm ẩn có thể đạt được hoặc vượt qua các hệ thống tùy chỉnh trong khi hiệu quả hơn rất nhiều. Bài báo: ...