山田 和明

J-GLOBALへ         更新日: 19/03/28 19:11
 
アバター
研究者氏名
山田 和明
 
ヤマダ カズアキ
URL
https://sites.google.com/site/pwiilabz/
所属
東洋大学
部署
理工学部
職名
准教授
学位
博士(工学)(神戸大学)
科研費研究者番号
80345149

研究分野

 
 

経歴

 
2015年4月
 - 
現在
東洋大学 理工学部機械工学科 准教授
 
2009年4月
 - 
2015年3月
東洋大学 理工学部機械工学科 講師
 
2008年4月
   
 
東洋大学工学部機能ロボティクス学科講師
 
2005年11月
   
 
東京大学大学院情報学環特任講師
 
2002年4月
   
 
東京大学先端科学技術研究センター特任助手
 

委員歴

 
2015年4月
 - 
現在
計測自動制御学会 システム・情報部門  庶務幹事
 
2012年4月
 - 
現在
ARG 「Webインテリジェンスとインタラクション」研究会  委員
 
2005年3月
 - 
2012年3月
電子情報通信学会ヒューマンコミュニケーショングループWI2研究会(IEICE SIG-WI2)  委員
 
2010年4月
 - 
2011年3月
日本機械学会関東支部第17期埼玉ブロック  商議員
 
2009年4月
 - 
2010年3月
日本機械学会関東支部第16期埼玉ブロック  商議員
 

受賞

 
2014年9月
第24回インテリジェント・システム・シンポジウム 最優秀論文賞 評判情報サイトにおけるプロダクト/サービスの価値推定-粒子フィルタの適用-
 
 
第13回 計測自動制御学会 システムインテグレーション部門講演会(SI2012)においてSI2012優秀講演賞を受賞
 
 
第12回 計測自動制御学会 システムインテグレーション部門講演会(SI2011)においてSI2011優秀講演賞を受賞
 
 
ファナックFAロボット財団の「平成16年度論文賞」 受賞
 

論文

 
Artificial Life and Robotics   23(4) 636-644   2018年10月   [査読有り]
山田 和明, 保田 俊行, 大倉和博
日本機械学会論文集   84(862) 1-15   2018年6月   [査読有り]
山田 和明
International Journal of Engineering Research & Technology (IJERT)   5(10) 39-47   2016年10月   [査読有り]
Expression of Continuous State and Action Spaces for Q-Learning Using Neural Networks and CMAC
山田 和明
Journal of Robotics and Mechatronics (JRM)   24(2) 330-339   2012年4月

書籍等出版物

 
新世紀の工学シリーズ〈4〉 創発とマルチエージェントシステム
山田 和明、東京大学人工物工学研究センター教授 上田 完次
培風館   2007年9月   
マルチエージェントシステムを実現するための手法として学習アルゴリズム(ニューラルネットワークおよび強化学習)について解説している.

講演・口頭発表等

 
Value estimation method of products / services using wisdom of crowd
Kazuaki Yamada
CIRP International Computation in Manufacturing Engineering (ICME 2016)   2016年7月20日   
学習予測制御システムの学習方法の検討 - 捕球問題への適用-
相澤 徹, 山田 和明
日本機械学会 ロボティクス・メカトロニクス講演会   2016年6月9日   
アンサンブル平均を用いた粒子フィルタ - アンサンブルの統合方法に関する検討 -
山田 和明
日本機械学会 情報・知能・精密機器部門講演会(IIP2016), G-1-4   2016年3月14日   
アンサンブル平均を用いた粒子フィルタ - 粒子集団数と推定精度の関係 -
山田和明
第28回自律分散システム・シンポジウム, pp.237-240   2016年1月22日   
評判情報サイトにおける集合知を用いた製品/サービスの価値推定 - 粒子フィルタを用いたユーザ評価からの価値推定手法の開発
高橋 梓, 山田 和明
第7回 ARG Webインテリジェンスとインタラクション(WI2), pp.43-48   2015年11月29日   
移動ロボットのためのベクトル表現を用いた環境情報の抽象化
新開 健, 山田 和明
計測自動制御学会 システム・情報部門学術講演会2015(SSI2015), pp.1139-1142   2015年11月20日   
ロバスト推定を用いた粒子フィルタの提案
山田 和明
計測自動制御 システム・情報部門学術講演会2015, pp.1131-1134   2015年11月20日   
Specialization in Swarm Robotics Using a Response Threshold Model
Kazuaki Yamada
The First International Symposium on Swarm Behavior and Bio-Inspired Robotics (Swarm 2015), pp.316-321   2015年10月29日   
評判情報サイトにおけるプロダクト/サービスの評価値の推定 - 粒子フィルタと平滑化法の適用 -
高橋 梓, 山田 和明, 中小路久美代, 山本恭裕
2015年度 人工知能学会全国大会, 3J4-3   2015年6月1日   
アンサンブル学習を用いた粒子フィルタの提案
山田 和明
2015 人工知能学会全国大会?, 2D5-4   2015年5月31日   
評判情報サイトにおけるインタラクション・パターン・ライブラリの構築
小玉 正太, 高橋 梓, 山田 和明, 中小路 久美代, 山本 恭裕
2015年度 人工知能学会全国大会, 1D5-OS-22b-6   2015年5月30日   
群ロボットのための反応閾値モデルを用いた自律的機能分化
山田 和明, 山崎 雄人
日本機械学会 ロボティクス・メカトロニクス講演会2015, CD-ROM 2A1-K07   2015年5月19日   
リカレント RBF ネットワークを用いた長期予測システム - パラメータ調整による学習性能の改善 -
相澤 徹, 山田 和明, 後藤 拓馬
日本機械学会 ロボティクス・メカトロニクス講演会2015, CD-ROM 2A1-M08   2015年5月19日   
A Particle Filter Approach for Reputation Information Systems - Performance Evaluations by A Multi-Agent Simulation -
Kazuaki Yamada
2014 IEEE/SICE International Symposium on System Integration, pp.122-127   2014年12月13日   IEEE/SICE
リカレントRBFネットワークを用いた長期予測システム - BPTTの適用による学習速度の改善 -
後藤 拓馬, 山田 和明, 松元 明弘
第24回インテリジェント・システム・シンポジウム(FAN2014), pp.17-22   2014年9月18日   日本機械学会 ロボティクス・メカトロニクス部門
評判情報サイトにおけるプロダクト/サービスの価値推定 —粒子フィルタの適用—
高橋 梓, 山田 和明, 松元 明弘
第24回インテリジェント・システム・シンポジウム(FAN2014), pp.11-16   2014年9月18日   日本機械学会 ロボティクス・メカトロニクス部門
集合知を利用したコンテンツ価値推定
高橋 梓, 山田 和明, 松元 明弘
日本機械学会 ロボティクス・メカトロニクス講演会2014, CD-ROM 2A2-X05   2014年5月27日   
リカレント RBFネットワークを用いた長期予測システムの提案
後藤 拓馬, 山田 和明, 松元 明弘
日本機械学会 ロボティクス・メカトロニクス講演会2014, CD-ROM 1A1-X06   2014年5月26日   
RRBFNを用いた制御対象の長期的な状態予測
後藤 拓馬, 山田 和明, 松元 明弘
日本機械学会 情報・知能・精密機器部門講演会(IIP2014), CD-ROM G-2-3   2014年3月18日   
RRBFNとファジィルールを用いた予測制御システム
山田 和明, 松元 明弘
第26回自律分散システム・シンポジウム, pp.103-108   2014年1月23日   
マルチエージェント強化学習における学習速度向上のためのルール伝播方法の検討
渡辺 智美, 豊島 一樹, 山田 和明, 松元 明弘
計測自動制御学会 システムインテグレーション部門 講演会 SI2013, pp.1748-1751   2013年12月18日   
本研究では,マルチエージェント強化学習において各エージェントが学習したルールを近傍のエージェント間で伝播させることで学習速度の向上を目指している.本稿では,報酬の高いルール群あるいは選択確率の高いルール群のみを伝播させるなど,計算機実験を通して様々なルール伝播方法の有効性を比較検証する.
マルチエージェント強化学習のためのエージェント間ルール伝播
渡辺 智美, 豊島 一樹, 山田 和明, 松元 弘明
計測自動制御学会 システム・情報部門 学術講演会 2013(SSI2013), pp.314-316   2013年11月18日   
相補ゲームのためのマルチエージェント強化学習 - 状態遷移図を用いた競合回避行動獲得プロセスの分析 -
渡辺 智美, 山田 和明, 松元 明弘
第31回日本ロボット学会学術講演会, RSJ2013AC2C2-05   2013年9月5日   
マルチエージェントシステムにおける競合回避行動の獲得 - 政策の複製によるアプローチ -
渡辺 智美, 山田 和明, 松元 明弘
ロボティクス・メカトロニクス講演会2013, CD-ROM 2P1-I05   2013年5月24日   
Multi-agent systems (MAS) can construct flexible and robust system in dynamic environment. However, conflicts occur among agents because they share time and space with others. To resolve these conflic
RNNとファジィルールを用いた予測制御システム - フライ捕球問題への適用 -
山田 和明
ロボティクス・メカトロニクス講演会2013, CD-ROM 1P1-M01   2013年5月23日   
This paper proposes a new predictive-control method by using recurrent neural networks (RNN) and fuzzy rules. We apply the proposed method to a fly ball catch problem. A robot can predict the trajector
異なる選好を持つエージェント群による競合回避行動の獲得
山田 和明, 渡辺 智美
計測自動制御学会 システム・情報部門 第48回システム工学部会研究会「システム工学の新展開」, pp.26-31   2013年3月6日   
ランドマークを用いた自律ロボットのための地図生成
山田 和明, 高松 雄, 松元 明弘
第13回 計測自動制御学会 システムインテグレーション部門講演会(SI2012), pp.415-418   2012年12月18日   
信頼度を用いた強化学習による競合回避行動の獲得 - エージェントの識別能力と学習性能の関係 -
渡辺 智美, 高野 慧, 山田 和明, 松元 明弘
第13回 計測自動制御学会 システムインテグレーション部門講演会(SI2012), pp.277-280   2012年12月18日   
RNN予測機構を用いたFuzzy制御
小林 美穂, 山田 和明, 松元 明弘
第13回 計測自動制御学会 システムインテグレーション部門講演会(SI2012), pp.200-204   2012年12月18日   
ニューラルネットワーク型強化学習 - マルチエージェント環境への拡張 -
村石 光隆, 山田 和明, 松元 明弘
第13回 計測自動制御学会 システムインテグレーション部門講演会(SI2012), pp.273-276   2012年12月18日   
Reinforcement Learning Approaches for Dispersion Games
Kazuaki Yamada
IEEE/SICE International Symposium on System Integration (SII2012), pp.440-445   2012年12月16日   
知識共有コミュニティの持続的発展のための制度設計 - 制度により生じるユーザ間インタラクションの分析 -
矢本 光一, 山田 和明
第1回 ARG Webインテリジェンスとインタラクション研究会資料, pp.93-94   2012年12月15日   
異種センサ統合のためのニューラルネットワーク型強化学習 - 多リンクロボットアームによるリーチング問題への適用 -
村石 光隆, 山田 和明, 松元 明弘
日本ロボット学会学術講演会2012, CD-ROM 3N2-1   2012年9月19日   
マルチエージェントシステムのための信頼度を用いた強化学習 - エージェントの知覚能力と競合回避行動の獲得確率の関係 -
高野 慧, 山田 和明, 松元 明弘
日本ロボット学会学術講演会2012, CD-ROM 3N2-4   2012年9月19日   
RNNを用いた予測制御機構の提案 -三次元空間におけるボールの捕球問題への適応-
小林 美穂, 山田 和明, 松元 明弘
日本ロボット学会学術講演会2012, CD-ROM 3N2-6   2012年9月19日   
マルチエージェントシステムのための信頼度を用いた強化学習 - 競合回避行動獲得プロセスの分析 -
高野 慧, 山田 和明
日本機械学会 ロボティクス・メカトロニクス講演会2012, CD-ROM 1A1-F09   2012年5月28日   
本研究では,Q学習の割引率を信頼度を用いて自律的に調整し,エージェントの選好を分化させ競合回避行動の獲得を目指す.本稿では,提案手法として狭路問題に適用し,その学習過程の分析を通して有効性を検証した.
リカレントニューラルネットワークを用いた予測制御機構の提案
小林 美穂, 山田 和明
日本機械学会 ロボティクス・メカトロニクス講演会2012, CD-ROM 1A1-F08   2012年5月28日   
本研究では物理モデルを用いず,リカレントニューラルネットワークを用いてボールの軌道を学習し,ファジィ制御によりボールを捕球する予測制御システムを提案した.
異種センサ統合のためのニューラルネットワーク型強化学習
村石 光隆, 山田 和明
日本機械学会 ロボティクス・メカトロニクス講演会2012, CD-ROM 1A1-F10   2012年5月28日   
本稿では,異種センサを含む多次元入力空間を扱える強化学習としてニューラルネットワークとタイリング手法の一つであるCMACを用いた手法を提案し,ロボットアームのリーティング問題に適用し,その有効性を検証した.
マルチエージェントシステムのための信頼度に基づいたQ学習
高野 慧, 山田 和明
第46回 計測自動制御学会 システム情報部門 システム工学部会研究会「次世代システム工学」, pp.29-34   2012年3月8日   
本研究では,マルチエージェントシステムにおいて発生する競合状態を回避するために, Q学習の割引率を信頼度を用いて自律的に調整し,エージェントの選好を分化させること で競合回避行動の獲得を目指す.本稿では,提案手法を狭路問題に適用し,その学習過程 の分析を通して有効性を検証した.
Q学習のためのニューラルネットワークとCMACを用いた行動価値関数近似
村石 光隆, 山田 和明
第46回 計測自動制御学会 システム情報部門 システム工学部会研究会「次世代システム工学」, pp.35-41   2012年3月8日   
本研究では,強化学習法の一つであるQ学習を連続な状態・行動空間に拡張するため,ニ ューラルネットワークとCMACを用いた行動価値関数の近似方法を提案する.本研究の有 効性を検証するために,自律ロボットによるナビゲーション問題に適用する.
信頼度を用いた強化学習によるマルチエージェントシステムの競合回避行動の獲得
山田 和明, 高野 慧, 渡辺 智美, 松元 明弘
第12回 計測自動制御学会 システムインテグレーション部門講演会   2011年12月23日   
本研究では,マルチエージェントシステムにおける競合回避行動を獲得するための新しい強化学習アプローチを提案する.提案手法は,従来のQ学習に,エージェントの行動の選好を分化させる方法を導入することで,マルチエージェントシステムに発生する競合状態を解消する.本研究では,提案手法を狭い通路を多数のエージェントがすれ違う狭路問題に適用し,その有効性を検証する.
Reinforcement Learning Approaches for Acquiring Conflict Avoidance Behaviors in Multi-Agent Systems
Kazuaki Yamada, Satoru Takano, Satomi Watanabe
2011 IEEE/SICE International Symposium on System Integration, pp.679-684   2011年12月20日   
This paper proposes new reinforcement learning approaches for acquiring conflict avoidance behavior in multi-agent systems.
知識共有コミュニティの持続的発展のための共創インタラクションモデル
山田 和明, 中小路 久美代東, 山本 恭裕, 矢本 光一
情報社会学会 第4回知識共有コミュニティワークショップ   2011年12月10日   
多次元入出力空間における強化学習 - 多リンクロボットアームによる障害物回避行動の獲得 -
村石 光隆, 山田 和明, 松元 明弘
計測自動制御学会 システム・情報部門学術講演会 2011(SSI2011). pp.358-363   2011年11月23日   
従来の強化学習は,状態における行動の期待値をルックアップテーブルにより記述していた.そのため,強化学習を多次元入出力空間に拡張する研究が行われている.本稿では,自律ロボットの入出力空間をニューラルネットワークとCMACを用いて記述することで,多次空間において学習可能な強化学習を提案する.提案手法を多リンクロボットアームの障害物回避行動の獲得問題に適用し,その有効性を検証する.
ニューラルネットワーク強化学習のためのネットワークパラメータ設定方法
山田 和明
第21回インテリジェント・システム・シンポジウム(FAN22011)   2011年9月2日   
本研究では,ニューラルネットワーク強化学習における結合荷重の初期値および中間ノード数の設定方法を提案する.そして,自律移動ロボットのナビゲーション問題を通して従来手法との性能比較を通して提案手法の有用性を検証する.
連続な状態行動空間における強化学習 - シグモイド型ネットワークとCMACを用いた行動価値関数の記述方法 -
山田 和明
日本機械学会 ロボティクス・メカトロニクス講演会2011   2011年5月27日   
本稿では,行動価値関数をシグモイド型ネットワークとCMACにより記述した連続な状態行動空間において学習可能な強化学習を提案した.そして自律ロボットによる経路探索問題を通して提案手法の有効性を検証した.
知識共有サイトの制度により生じるユーザ間インタラクションのモデル化と実装
山田 和明
第17回社会情報システム学シンポジウム   2011年1月21日   
Reinforcement Learning using Sigmoid Networks and Griddy-Gibbs Sampler for Mobile Robots
Kazuaki Yamada
Joint 5th International Conference on Soft Computing and Intelligent Systems and 10th International Symposium on advanced Intelligent Systems (SCIS & ISIS 2010), pp.716-721   2010年12月10日   
Setting Methods of Network Parameters for Reinforcement Learning Equipped with Artificial Neural Networks
Kazuaki Yamada
The 14th Asia Pacific Symposium on Intelligent and Evolutionary Systems, 2010(IES2010), pp.181-190   2010年11月20日   
知識共有サイトの持続的発展のためのインタラクションモデル
山田 和明, 中小路 久美代, 山本 恭裕
合同エージェントワークショップ&シンポジウム2010(JAWS2010)   2010年10月29日   

競争的資金等の研究課題

 
文部科学省: 科学研究費補助金(若手研究(B))
研究期間: 2013年 - 2015年    代表者: 山田 和明
文部科学省: 科学研究費補助金(若手研究(B))
研究期間: 2003年 - 2005年    代表者: 山田 和明
本研究では,Eラーニング環境を「学習者」と「編集者」の間でおこなわれる学習コンテンツを媒体としたコミュニケーションであるとみなし,双方にEラーニング環境の利用情報をフィードバックすることで,このコミュニケーションチャンネルを拡張し,両者を同時に支援するEラーニング環境の構築を目的としている.昨年度までの研究成果から,学習者の成績や興味などのユーザ特性は様々な要因により時間とともに変化し,また,その変化速度もユーザにより異なる.そのため,協調フィルタリングなどのクラスタリング手法によりテスト...