У меня была полностью автономная работающая система RL для полетов примерно 2 недели назад, и в какой-то момент она перестала работать. Я исправил около 4 действительно ужасных ошибок, прежде чем она снова заработала. Это было действительно страшно. Я искренне собирался откатить изменения. Аппаратное обеспечение + нейронные сети на самом деле очень сложно.
безумие заключалось в том, что это действительно все еще работало, я имею в виду политику. как будто, если я прищурился, я мог увидеть дегенеративные поведения, которые в конечном итоге приведут к провалу. где коренной причиной была ужасная, ужасная ошибка (сены слева и справа были перепутаны в наблюдениях!)
Я раньше думал: может быть, мне стоило начать с радиоуправляемых машин вместо радиоуправляемых мультикоптеров - но я рад, что выбрал мультикоптеры. Радиоуправляемые машины были бы слишком прощающе, и моя инфраструктура не была бы такой хорошей, как сегодня.
Мне нужно сесть и очень-очень внимательно подумать о моем тесте от начала до конца. Идеальный сценарий — это тест от начала до конца, где у меня есть физическая симуляция, и тренажер работает, и несколько настоящих физических мультикоптеров запускаются и тестируются автоматически в темной комнате
Проблема, с которой я сталкиваюсь, в основном заключается в том, что моя аппаратная инфраструктура меняется так быстро. Каждую неделю у меня новая рама многороторного дрона, новое управляющее программное обеспечение, новая прошивка для двусторонней связи, новые датчики..
Боль
на самом деле, это план для QA в любом случае. лучше построить это раньше, чем позже
@BigwetRealism с RL я был удивлён; он будет учиться стратегиям сбора информации о мире в своём скрытом состоянии, прежде чем начнёт его использовать. действительно дико
@BigwetRealism причина, по которой люди не занимаются RL, заключается в том, что они не умеют. Они не хотят тратить 4 месяца на написание симуляторов на cuda с нуля.
@BigwetRealism я на самом деле ограничен во времени. У меня так мало времени
@BigwetRealism так много научных вещей, которые я хочу попробовать. Мне просто нужно построить инфраструктуру, продать что-то, а затем нанять людей, чтобы помочь мне с этим.
@BigwetRealism вот вам точка данных моя самая большая проблема — моделирование физики что помогло бы мне больше, чем новые способы изучения поведения, так это новые способы изучения окружающей среды
196