基本情報

所属
岡山大学 学術研究院環境生命自然科学学域 助教
(兼任)工学部工学科情報・電気・数理データサイエンス系 助教
学位
博士(工学)(2020年3月 電気通信大学)

連絡先
uwanookayama-u.ac.jp
研究者番号
30880687
ORCID ID
 https://orcid.org/0000-0003-4139-2605
J-GLOBAL ID
201801006465985948
researchmap会員ID
B000297175

外部リンク

2017年4月~2020年3月 電気通信大学 博士後期課程 学生(日本学術振興会特別研究員DC1)

研究内容:静的・動的環境における通信なしマルチエージェント強化学習
本研究は,現実問題に起こる通信遅延や情報の不確かさに対処するために,複数のエージェント間の協調行動を通信なしで導く強化学習手法を提案するとともに,変化のない静的環境に加えて不測の事態などで変化する動的環境に対応できるように拡張した.迷路問題にて比較実験を行った結果,静的環境のみならず動的環境においても,提案手法は従来のQ学習よりも多くの報酬を早く獲得可能であることを明らかにした.

2020年4月~現在 岡山大学 助教

研究内容1:抽象度の異なる協調行動を学習可能なエージェントの提案
本研究では,ロボットのように周囲の環境から得た情報を基に行動を決める主体(エージェント)が,複数集まったときの適切な行動則を獲得するマルチエージェント強化学習を実用化する上での,センサの個体差や状況の違いによる,観測情報の粒度の違いに適応した協調行動学習法を提案する.具体的には,エージェントにおける情報の抽象度を制御し,獲得情報の粒度に従ってエージェント毎の抽象度を調整することで,適切な協調行動を学習する.

研究内容2:未知の協調・環境を想定したマルチエージェント強化学習の知識転移
本研究では,ロボットなどの活動主体(エージェント)が複数存在するときの協調制御ルールを,周囲環境から得た情報から各々が学習するマルチエージェント強化学習において,学習すべき協調や環境が未知であるときに適応した協調行動学習法を提案する.具体的には,他の環境などで今まで学習したエージェントの学習結果を各要素に分割し,階層的に抽象化することで生成した知識を組み合わせて学習することで未知の協調・環境に適応する.


受賞

  23

論文

  50

MISC

  70

講演・口頭発表等

  6

担当経験のある科目(授業)

  8

所属学協会

  12

共同研究・競争的資金等の研究課題

  7

学術貢献活動

  1