2020年9月 - 2022年3月
抽象度の異なる協調行動を獲得可能なマルチエージェント強化学習
日本学術振興会 科学研究費助成事業 研究活動スタート支援 研究活動スタート支援
本研究ではまず,深層強化学習をエージェント同士で入力情報の粒度が異なるマルチエージェント環境に展開し,深層学習によって情報粒度を抽象化していることを分析により明らかにした.また,従来提案した動的環境に追従可能なマルチエージェント強化学習法を深層強化学習に展開することで,入力情報の粒度が異なる複数のエージェントによる迷路問題において最適方策を獲得することを示した.また,動的環境においては,入力情報の粒度が異なる場合,エージェント間で同期的に動くことが難しいため,提案手法の隠れ層に時系列データを学習可能なLSTMを導入し,適切に同期的に協調行動をとる方策を獲得することを明らかにした.
- ID情報
-
- 課題番号 : 20K23326
- 体系的課題番号 : JP20K23326
この研究課題の成果一覧
絞り込み
MISC
1-
計測と制御 2023年2月10日 招待有り筆頭著者