本プロジェクトの主な目的は、深層強化学習(DRL)を戦略的に統合してドローンナビゲーションを変革することである。従来の線形比例積分微分(PID)コントローラーの代わりに、近接方策最適化(PPO)に基づくDRLエージェントを使用してドローンを自律的に制御する。
プロジェクトの初期段階では、ドローンの手動操縦と自動操縦の両方を可能にすることと、Viconトラッキングシステムとの統合を目標とした。これにより、ドローンの柔軟性と精度を確保し、プロジェクトの後期段階に向けた基盤を築いた。
冬学期の目標は、自律飛行のための3D Aパスプランナーの構築と、実際のドローンでのDRLエージェントの展開である。Aアルゴリズムを3次元空間に拡張し、障害物を回避しながら最短経路を生成することができた。DRLエージェントの実機展開では、シミュレーションと現実のギャップにより、若干の振動とオーバーシュートが見られたが、さらなる学習と調整により改善が期待できる。
In eine andere Sprache
aus dem Quellinhalt
arxiv.org
Wichtige Erkenntnisse aus
by Junyang Zhan... um arxiv.org 04-02-2024
https://arxiv.org/pdf/2404.00204.pdfTiefere Fragen