2020年4月 - 2023年3月
深層強化学習を用いた避航操船分析に基づく避航モデルの高度化
日本学術振興会 科学研究費助成事業 若手研究 若手研究
2020年度研究項目「深層強化学習による避航モデルのベースラインの構築」では、深層強化学習を用いてベースラインとなる避航モデルの学習を行った。今津問題と呼ばれる1~3隻の相手船が配置されたシナリオセットを学習用の交通流シナリオとして設定し、加えて避航モデルの汎化性能を向上させるためにランダムな配置のシナリオも加えた。異なる安全航過距離を設定したOZT(Obstacle Zone by Target)を用いた避航モデルを深層強化学習の一手法であるPPO(Proximal Policy Optimization)により学習し、避航モデルを構築した。安全航過距離を広げた学習は、全結合のニューラルネットワークでは困難であったため、LSTM(Long Short Term Memory )と呼ばれる時系列データに特化したネットワーク構造を避航モデルのニューラルネットワークに取り入れることで学習の安定化を図った。また、OZTの計算においても、従来のOZTに対して前方航過距離による横切りの左右の区別や安全航過距離以下で既存のOZTを補完する内部OZTを提案し、学習への影響を調べた。またこのモデルでは、実際の船舶の航行手段に合わせて、目標針路指示(実際に船舶で利用される自動操舵装置への針路指示入力を想定)と直接操舵(避航モデルが操舵量を含めて学習する、つまり船舶の操縦性能も含めて学習する必要がある)の二種類の出力で学習を行った。学習結果は、今津問題に対して、0.5海里の安全航過距離までの離隔距離を確保した避航を行うことができるモデルの学習が行えることを確認した。
- ID情報
-
- 課題番号 : 20K14971
- 体系的課題番号 : JP20K14971