Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Tôi đã tình cờ tìm ra một cách để cải thiện việc điều khiển của tác nhân. Cụ thể là, làm thế nào để cải thiện hiệu suất khi bạn nói "hãy chắc chắn rằng bạn làm điều này" và LLM không làm điều đó. Đây là cách:
Nói "hãy nhớ làm X" là không đáng tin cậy - nó yêu cầu LLM tự phát khởi động một hành vi quy trình. Nhưng việc trình bày cho tác nhân một tuyên bố cụ thể, có thể sai ("Bạn nên làm X - bạn vẫn đang làm điều đó chứ?") sẽ kích hoạt hành vi sửa chữa một cách đáng tin cậy khi tuyên bố đó sai.
Tác nhân không cần phải nhớ để kiểm tra. Sự không khớp giữa trạng thái được trình bày và trạng thái thực tế tạo ra một sự kiện sửa chữa mà LLM của tác nhân tự nhiên phản ứng với.
Điều này làm tôi nhớ đến câu châm ngôn cũ "cách tốt nhất để có được câu trả lời đúng trên internet là đăng một câu sai" và tôi đoán điều đó có lý vì LLM chủ yếu là "kiến thức" được chắt lọc từ internet.
Dù sao thì tôi đã xây dựng một hệ thống trí nhớ lâu dài cho các tác nhân của mình và việc triển khai nó theo cách này đã khắc phục được nhiều vấn đề.
Hàng đầu
Thứ hạng
Yêu thích
