Tôi đã có chuyến bay tự động hoàn toàn bằng RL hoạt động cách đây khoảng 2 tuần, và vào một thời điểm nào đó, nó đã bị mất. Tôi đã sửa khoảng 4 lỗi thực sự, thực sự tồi tệ trước khi nó hoạt động trở lại. Thực sự đáng sợ. Tôi thực sự đã định quay lại. Phần cứng + mạng nơ-ron thực sự rất khó.
Điều điên rồ là nó thực sự vẫn hoạt động, ý tôi là chính sách. Như, nếu tôi nheo mắt lại, tôi có thể thấy những hành vi suy đồi sẽ dẫn đến thất bại. Nơi nguyên nhân gốc rễ là một lỗi tồi tệ, tồi tệ (các cảm biến bên trái và bên phải bị hoán đổi trong các quan sát!)
Tôi từng tự hỏi: có lẽ tôi nên bắt đầu với xe điều khiển từ xa thay vì máy bay đa rotor - nhưng tôi vui vì đã chọn máy bay đa rotor. Xe điều khiển từ xa sẽ quá dễ dãi, và cơ sở hạ tầng của tôi sẽ không cần phải tốt như bây giờ.
Tôi cần ngồi xuống và suy nghĩ rất, rất cẩn thận về bài kiểm tra từ đầu đến cuối của mình. Kịch bản lý tưởng sẽ là một bài kiểm tra từ đầu đến cuối, nơi tôi có mô phỏng vật lý, và huấn luyện viên chạy, và nhiều multirotor vật lý thực tế được phóng và kiểm tra tự động trong một căn phòng tối.
Vấn đề mà tôi đang gặp phải chủ yếu là cơ sở hạ tầng phần cứng của tôi thay đổi quá nhanh. Mỗi tuần tôi có một khung multirotor mới, phần mềm điều khiển mới, firmware liên kết truyền thông hai chiều mới, cảm biến mới..
Cơn đau
thực ra, đó là kế hoạch cho QA. có lẽ nên xây dựng nó sớm hơn là muộn.
@BigwetRealism với RL, tôi đã rất ngạc nhiên; nó sẽ học các chiến lược để thu thập thông tin về thế giới trong trạng thái ẩn của nó trước khi khai thác nó. thực sự hoang dã
@BigwetRealism lý do mà mọi người không làm RL là vì họ kém. Họ không muốn dành 4 tháng để viết các mô phỏng trong cuda từ đầu.
@BigwetRealism thật lòng mà nói, tôi bị giới hạn về thời gian. Tôi có rất ít thời gian.
@BigwetRealism có rất nhiều điều khoa học mà tôi muốn thử. Tôi chỉ cần xây dựng cơ sở hạ tầng, bán một cái gì đó, và sau đó thuê người giúp tôi với nó
@BigwetRealism một điểm dữ liệu cho bạn vấn đề lớn nhất của tôi là mô hình hóa vật lý điều gì sẽ giúp tôi nhiều hơn là những cách học hành vi mới là những cách học môi trường mới
200