Nếu bạn xây dựng các tác nhân AI, đừng bỏ lỡ phiên này. Thứ Ba tới, chúng ta sẽ đi vào các môi trường RL giúp chúng hoạt động. Tham gia cùng Will Brown (@willccbb) từ @PrimeIntellect và Robin Salimans của chúng tôi khi chúng tôi cho thấy cách chúng tôi thiết kế không gian nơi các tác nhân cải thiện một cách an toàn và hiệu quả. Dưới đây là những gì chúng tôi sẽ đề cập 👇 1. Môi trường RL là gì? Một cái nhìn về cách chúng tôi sử dụng các cài đặt được kiểm soát, có thiết bị để cho phép các tác nhân học hỏi an toàn từ phản hồi. 2. Xây dựng môi trường RL tại Zapier Cách chúng tôi áp dụng thư viện Verifiers và tối ưu hóa GEPA (Genetic-Pareto) để đánh giá và tinh chỉnh hành vi của tác nhân trên các nhiệm vụ tự động hóa thực tế. 3. Những bài học đã học cho đến nay Những hiểu biết ban đầu về những gì đã hoạt động, những gì không, và cách chúng tôi đang phát triển cách tiếp cận của mình đối với việc đào tạo và đánh giá tác nhân. Tham gia cùng chúng tôi trực tiếp, thứ Ba ngày 2 tháng 12 lúc 1 PM ET. Đặt chỗ ở đây: