2020年9月 - 2022年3月

抽象度の異なる協調行動を獲得可能なマルチエージェント強化学習

日本学術振興会科学研究費助成事業研究活動スタート支援研究活動スタート支援

上野史

課題番号

20K23326

体系的課題番号

JP20K23326

配分額

(総額): 2,860,000円
(直接経費): 2,200,000円
(間接経費): 660,000円

本研究ではまず，深層強化学習をエージェント同士で入力情報の粒度が異なるマルチエージェント環境に展開し，深層学習によって情報粒度を抽象化していることを分析により明らかにした．また，従来提案した動的環境に追従可能なマルチエージェント強化学習法を深層強化学習に展開することで，入力情報の粒度が異なる複数のエージェントによる迷路問題において最適方策を獲得することを示した．また，動的環境においては，入力情報の粒度が異なる場合，エージェント間で同期的に動くことが難しいため，提案手法の隠れ層に時系列データを学習可能なLSTMを導入し，適切に同期的に協調行動をとる方策を獲得することを明らかにした．

リンク情報

KAKEN: https://kaken.nii.ac.jp/grant/KAKENHI-PROJECT-20K23326

ID情報

課題番号 : 20K23326
体系的課題番号 : JP20K23326

この研究課題の成果一覧

絞り込み

受賞

2022年2月

2021年度学術奨励賞研究奨励賞, マルチエージェントシステムにおける協調行動の抽象化と深層強化学習器の関係性の考察, 計測自動制御学会

上野史

MISC

観測粒度の違いに適応可能なマルチエージェント強化学習

上野史

計測と制御 2023年2月10日招待有り筆頭著者

上野史

共同研究・競争的資金等の研究課題

抽象度の異なる協調行動を獲得可能なマルチエージェント強化学習

この研究課題の成果一覧

受賞

MISC

メニュー

共著者の一覧