MISC

2022年

状態空間の t-SNE 次元削減による強化学習エージェントの戦術の可視化

人工知能学会全国大会論文集
  • 長友 結希
  • ,
  • 三宅 陽一郎

JSAI2022
開始ページ
4E1GS202
終了ページ
4E1GS202
記述言語
日本語
掲載種別
DOI
10.11517/pjsai.jsai2022.0_4e1gs202
出版者・発行元
一般社団法人 人工知能学会

本研究は強化学習 におけるエージェントのとる戦術の可視化による,強化学習の説明可能性の検証を目的とする. 昨今の強化学習の目覚ましい発展により,強化学習エージェントは高度な判断能力を備えたロボットのように振る舞うことができる.ただし強化学習エージェントは一 般的に学習過程の詳細な追跡が困難であり,どのような判断によりその行動を取るのかは不明瞭である.しかし,エージェントが置かれた空間上の状態とその時間軸上の遷移を観察することによって,一連の行動を取るに至るパターンを見出すことができる.だが,時空間上に存在する無数の状態変数がどのようにパターンを形成するのかを分析することは,次元の呪いにとらわれ容易ではない. 本研究では繰り返し観測される一連の行動群を戦術と見なし可視化し分析する.具体的には、エージェントの平面空間上での軌跡を取り,軌跡を t-SNEによる次元削減をすることで分析を行った.これによりエージェントの行動がいくつかのパターンに分類され,同一の戦術を繰り返し利用していることを可視化することに成功した.

リンク情報
DOI
https://doi.org/10.11517/pjsai.jsai2022.0_4e1gs202
CiNii Research
https://cir.nii.ac.jp/crid/1390855656024664192?lang=ja
ID情報
  • DOI : 10.11517/pjsai.jsai2022.0_4e1gs202
  • CiNii Research ID : 1390855656024664192

エクスポート
BibTeX RIS