2014年3月 行動価値に集約状態の価値を利用した環境変化に柔軟なShaping強化学習 電子情報通信学会技術研究報告[ニューロコンピューティング] 岡晋之介, 村越一支 記述言語 日本語 会議種別 開催地 東京