共同研究・競争的資金等の研究課題

2020年9月 - 2022年3月

抽象度の異なる協調行動を獲得可能なマルチエージェント強化学習

日本学術振興会  科学研究費助成事業 研究活動スタート支援  研究活動スタート支援

課題番号
20K23326
体系的課題番号
JP20K23326
配分額
(総額)
2,860,000円
(直接経費)
2,200,000円
(間接経費)
660,000円

本研究ではまず,深層強化学習をエージェント同士で入力情報の粒度が異なるマルチエージェント環境に展開し,深層学習によって情報粒度を抽象化していることを分析により明らかにした.また,従来提案した動的環境に追従可能なマルチエージェント強化学習法を深層強化学習に展開することで,入力情報の粒度が異なる複数のエージェントによる迷路問題において最適方策を獲得することを示した.また,動的環境においては,入力情報の粒度が異なる場合,エージェント間で同期的に動くことが難しいため,提案手法の隠れ層に時系列データを学習可能なLSTMを導入し,適切に同期的に協調行動をとる方策を獲得することを明らかにした.

リンク情報
KAKEN
https://kaken.nii.ac.jp/grant/KAKENHI-PROJECT-20K23326
ID情報
  • 課題番号 : 20K23326
  • 体系的課題番号 : JP20K23326