論文

査読有り
1996年2月

確率学習における遺伝的アルゴリズムの適用

電子情報通信学会論文誌. D-II
  • 棟朝 雅晴
  • ,
  • 高井 昌彰
  • ,
  • 佐藤 義治

79
2
開始ページ
230
終了ページ
238
記述言語
日本語
掲載種別
研究論文(学術雑誌)
出版者・発行元
一般社団法人電子情報通信学会

確率的な環境への適応学習を行う場合, 確率学習オートマトンに代表される強化学習が一般に用いられるが, 選択可能な行動の数が多くなった場合に最適解への収束が著しく遅くなるという欠点がある. 本論文では遺伝的アルゴリズムを応用することで, 強化学習における収束速度の問題点を解消する手法を提案する. 提案するアルゴリズムStGA(Stochastic Genetic Algorithm)においては, すべての可能な行動の中から少数の行動を集団としてサンプリングし, その集団に対して確率学習オートマトンを適用することで強化学習の収束速度を向上させる. 更に, 遺伝的操作を用いて集団内に含まれていない新たな行動を生成することを通して集団の内容を更新し, 最適な行動を効率良く探索する. StGAの収束性を証明するため, 確率学習オートマトンのε-optimalityをもとにした理論的解析を行う. 更にシミュレーション実験により, 可能な行動の数が多い場合におけるStGAの有効性を示す.

リンク情報
CiNii Articles
http://ci.nii.ac.jp/naid/110003227449
CiNii Books
http://ci.nii.ac.jp/ncid/AN1007132X
ID情報
  • ISSN : 0915-1923
  • CiNii Articles ID : 110003227449
  • CiNii Books ID : AN1007132X

エクスポート
BibTeX RIS