2週間前に完全な自律型強化飛行が動いていましたが、ある時点でそれが失われてしまいました。私は「いいね」を修正しました。本当にひどいバグが4つもあって、ようやくまた動き始めた。本当に恐ろしい。本当に元に戻るつもりだった ハードウェア+ニューラルネットワークは実は本当に難しいです
驚いたのは、実際にそれがまだ機能していたことです。つまり、ポリシーのことです。例えば、目を細めれば失敗に至る堕落した行動が見えた。根本原因はひどいバグ(左右センサーが入れ替わって観測)でした。
かつては「RCマルチローターではなくRCカーから始めるべきだったのかもしれない」と考えていましたが、マルチローターを選んでよかったと思っています。RCカーは寛容すぎるし、今ほどインフラが整っている必要はなかったでしょう
私は座って、自分のエンドツーエンドのテストについて非常に慎重に考える必要があります。理想的なシナリオは、物理シミュレーションとトレーナーを同時に動かし、複数の実際の物理マルチローターを暗い部屋で自動的に打ち上げてテストするエンドツーエンドテストです
私が直面している問題は、主にハードウェアインフラが急速に変化していることです。毎週新しいマルチローターフレーム、新しい制御ソフト、新しい双方向通信リンクのファームウェア、新しいセンサーを手に入れています。
痛みがあります
実は、それがQAの計画です。早めに建てたほうがいい
@BigwetRealism現実生活では驚いています。世界の隠れた状態に関する情報を収集し、それを利用する前に戦略を学習します。本当にワイルドだ
@BigwetRealism、人々が現実学習をしない理由は、それがダメだからです。彼らは4ヶ月もCUDAでゼロからシムを書きたくないのです
@BigwetRealism正直、時間に縛られています。時間がほとんどありません
@BigwetRealism、試してみたい科学的なことがたくさんあります。インフラを作って、何かを売って、それから人を雇って手伝ってくれるだけだ
@BigwetRealismデータポイントです 私の最大の問題は物理のモデリングです 新しい行動の学習方法よりも環境を学ぶ新しい方法よりも私にとって役立つと思います
208