2000年3月13日

関数近似器を用いた連続マルチエージェント系の強化学習

電子情報通信学会技術研究報告. NC, ニューロコンピューティング

玉越大輝
石井信

巻: 99
号: 684
開始ページ: 9
終了ページ: 14
記述言語: 日本語
掲載種別
出版者・発行元: 一般社団法人電子情報通信学会

マルチエージェント問題を解く手法として強化学習が用いられている。その手法の多くは状態及び行動空間を離散的であると仮定している。一方、ロボットの制御などの現実的な問題では状態及び行動空間共に連続であるため、従来の手法を適用することは困難である。本稿では従来手法を拡張し、連続空間における問題に適用可能な強化学習手法を提案する。困難の原因である評価関数の表現を、関数近似器を用いることで解決する。よって本拡張は強化学習と関数近似器を組み合わせることと言える。本研究では強化学習のアルゴリズムとしてQ学習を、関数近似器として正規化ガウス関数ネットワークを用いる。提案した手法を連続空間内のマルチエージェント追跡問題に適用する。実験の結果、本手法の有効性が示される。

リンク情報

CiNii Articles: http://ci.nii.ac.jp/naid/110003233617
CiNii Books: http://ci.nii.ac.jp/ncid/AN10091178
URL: http://id.ndl.go.jp/bib/5358745

ID情報

ISSN : 0913-5685
CiNii Articles ID : 110003233617
CiNii Books ID : AN10091178

エクスポート: BibTeX RIS

石井信

MISC

関数近似器を用いた連続マルチエージェント系の強化学習

メニュー

共著者の一覧

フォロー一覧