山本 一公

J-GLOBALへ         更新日: 18/12/02 19:45
 
アバター
研究者氏名
山本 一公
 
ヤマモト カズマサ
所属
中部大学
部署
工学部情報工学科
職名
准教授
学位
博士(工学)(豊橋技術科学大学)

プロフィール

音声言語情報処理の研究、特に頑健な音声認識に関して、音響特徴量や音響モデルに関する研究をしています。また、発展的な研究として雑談音声対話システムの開発を行っています。

研究分野

 
 

経歴

 
2017年4月
 - 
現在
中部大学 工学部 情報工学科 准教授
 
2013年4月
 - 
2014年3月
豊田工業高等専門学校 情報工学科 准教授
 
2013年3月
 - 
2017年3月
豊橋技術科学大学 大学院工学研究科 情報・知能工学系 准教授
 
2012年2月
 - 
2012年9月
カーネギーメロン大学 電気情報工学科 訪問研究員
 
2010年4月
 - 
2013年2月
豊橋技術科学大学 大学院工学研究科 情報・知能工学系 助教
 
2007年4月
 - 
2010年3月
豊橋技術科学大学 工学部 情報工学系 助教
 
2000年4月
 - 
2007年3月
信州大学 工学部 電気電子工学科 助手
 

受賞

 
2013年5月
電子情報通信学会 論文賞 Hidden Conditional Neural Fields for Continuous Phoneme Speech Recognition
受賞者: 藤井 康寿・山本 一公・中川 聖一
 

論文

 
関博史, 榎並大介, ZHU Faqiang, 山本一公, 中川聖一
電子情報通信学会論文誌 D(Web)   J100-D(1) 81‐92 (WEB ONLY)   2017年1月
Shoko Tsujimura,Kazumasa Yamamoto,Seiichi Nakagawa
Interspeech 2017, 18th Annual Conference of the International Speech Communication Association, Stockholm, Sweden, August 20-24, 2017   2764-2768   2017年   [査読有り]
Hiroshi Seki,Kazumasa Yamamoto,Seiichi Nakagawa
2017 IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2017, New Orleans, LA, USA, March 5-9, 2017   5480-5484   2017年   [査読有り]
Dairoku Kawai,Kazumasa Yamamoto,Seiichi Nakagawa
2017 IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2017, New Orleans, LA, USA, March 5-9, 2017   326-330   2017年   [査読有り]
Kazumasa Yamamoto,Chikara Ishikawa,Koya Sahashi,Seiichi Nakagawa
IEEE 6th Global Conference on Consumer Electronics, GCCE 2017, Nagoya, Japan, October 24-27, 2017   1-5   2017年   [査読有り]

Misc

 
仲野翔一, 山本一公, 中川聖一
日本音響学会研究発表会講演論文集(CD-ROM)   2013 ROMBUNNO.1-Q-26B   2013年3月
坂本渚, 山本一公, 中川聖一
日本音響学会研究発表会講演論文集(CD-ROM)   2013 ROMBUNNO.3-P-37A   2013年3月
藤堂 祐樹, 西村 良太, 山本 一公, 中川 聖一
研究報告ヒューマンコンピュータインタラクション(HCI)   2013(18) 1-7   2013年1月
現在のほとんどの音声対話システムは,ユーザとシステムの 1 対 1 の対話を扱っているが,我々はシステム側のエージェントを 2 人にした三者対話システムの開発を行ってきた.対話ドメインは従来の 「うどんとラーメンのどちらが好きか」 の他に 「北海道旅行と沖縄旅行のどちらに行きたいか」 を追加し,それぞれ同じドメインの二者対話システムと三者対話システムをユーザに使用し,評価実験を行った.被験者実験の結果,三者対話システムは,対話の弾み具合の向上や,対話の雑談らしさの印象を被験者に与えるという...
藤堂 祐樹, 西村 良太, 山本 一公, 中川 聖一
研究報告音声言語情報処理(SLP)   2013(18) 1-7   2013年1月
現在のほとんどの音声対話システムは,ユーザとシステムの 1 対 1 の対話を扱っているが,我々はシステム側のエージェントを 2 人にした三者対話システムの開発を行ってきた.対話ドメインは従来の 「うどんとラーメンのどちらが好きか」 の他に 「北海道旅行と沖縄旅行のどちらに行きたいか」 を追加し,それぞれ同じドメインの二者対話システムと三者対話システムをユーザに使用し,評価実験を行った.被験者実験の結果,三者対話システムは,対話の弾み具合の向上や,対話の雑談らしさの印象を被験者に与えるという...
坂本渚, 山本一公, 中川聖一
音声ドキュメント処理ワークショップ講演論文集(Web)   7th SDPWS2013-05 (WEB ONLY)   2013年
榎並大介, 山本一公, 中川聖一
電気関係学会東海支部連合大会講演論文集(CD-ROM)   2012 ROMBUNNO.C3-1   2012年9月
玉川聡, 山本一公, 中川聖一
電気関係学会東海支部連合大会講演論文集(CD-ROM)   2012 ROMBUNNO.D1-7   2012年9月
藤堂祐樹, 西村良太, 山本一公, 中川聖一
情報処理学会研究報告(CD-ROM)   2011(6) ROMBUNNO.MUS-94,NO.19   2012年4月
北岡教英, 矢野浩利, 杉本夏樹, 山本一公, 中川聖一
電子情報通信学会論文誌 D   J95-D(4) 982-994   2012年4月
榎並大介, 山本一公, 北岡教英, 中川聖一
全国大会講演論文集   2012(1) 617-619   2012年3月
大語彙連続音声認識(Large Vocabulary Continuous Speech Recognition; LVCSR) は読み上げ音声に関しては十分な性能を持つようになってきており,ディクテーションや字幕放送システムとして実用化されてきている.一方,対話や講演音声など自由発話の認識も期待されているものの,その性能はいまだに十分とはいえない.本稿では,人間の音響的知覚能力と,局所的なコンテキストを教示して音声を聞かせることで音響モデルとN-gram言語モデルによる音声認識をシミュレ...

書籍等出版物

 
中川 聖一, 小林 聡, 峯松 信明, 宇津呂 武仁, 秋葉 友良, 北岡 教英, 山本 幹雄, 甲斐 充彦, 山本 一公, 土屋 雅稔
コロナ社   2018年   ISBN:9784339028881
中川 聖一, 小林 聡, 峯松 信明, 宇津呂 武仁, 秋葉 友良, 北岡 教英, 山本 幹雄, 甲斐 充彦, 山本 一公, 土屋 雅稔
コロナ社   2013年   ISBN:9784339024692

講演・口頭発表等

 
関博史, 山本一公, 秋葉友良, 中川聖一, 中川聖一
日本音響学会研究発表会講演論文集(CD-ROM)   2017年9月11日   
芝原優真, 山本一公, 中川聖一
日本音響学会研究発表会講演論文集(CD-ROM)   2017年3月1日   
関博史, 山本一公, 秋葉友良, 中川聖一
日本音響学会研究発表会講演論文集(CD-ROM)   2017年3月1日   
辻村祥子, 山本一公, 中川聖一
日本音響学会研究発表会講演論文集(CD-ROM)   2017年3月1日   
竹部真晃, 山本一公, 中川聖一
日本音響学会研究発表会講演論文集(CD-ROM)   2017年3月1日   

競争的資金等の研究課題

 
文部科学省: 科学研究費補助金(基盤研究(C))
研究期間: 2012年 - 2012年    代表者: 山本 一公
文部科学省: 科学研究費補助金(挑戦的萌芽研究, 挑戦的萌芽研究, 挑戦的萌芽研究, 挑戦的萌芽研究)
研究期間: 2010年 - 2012年    代表者: 中川 聖一
監視カメラ等は犯罪防止の観点から社会に受け入れられるが、公共場所での音声や音の収録は社会的に受け入れられていない。これは音声には話者情報や言語情報などプライバシ情報を含んでいるからである。このため、収録音から音声だけを除去し背景音や環境音だけを残す技術、話者性を除去するための背景音中での声質変換技術、発話内容である言語情報から個人名等に対する音声区間の除去技術などが必要である。本年度は、音楽重量音声から音声だけを除去する二つの手法を開発した。一つはベクトル量子化法に基づく方法で、音楽重量音...
文部科学省: 科学研究費補助金(基盤研究(B))
研究期間: 2010年 - 2012年    代表者: 中川 聖一
音声情報の有効活用のためには、高精度な音声認識法、認識結果を読み易くするための音声整形法、音声要約法、大量の音声ドキュメントからの検索キーワードの高速検索法の技術開発が必要である。本年度は、現在の世界的標準となっている音声認識モデルであるHMMを包含する隠れニューラル確率場モデルによる音声認識技術を開発し、HMMと同等以上の性能を得る見込みを得た。音声認識の言語モデルに関しては、音声認識対象単語の直前の数十単語のコンテキストを用いてトピックを同定し、トピックに依存した言語モデルによる音声認...
文部科学省: 科学研究費補助金(若手研究(B))
研究期間: 2009年 - 2011年    代表者: 山本 一公
公共の場で収録される音・音声情報が有効に活用できる場面は多いと考えられるが、プライバシーの問題を感じる人が多いため、現在のところあまり利用されていない。本研究では、音・音声情報から、プライバシー情報(話者を推定し得る情報)を隠蔽することを目的として、音信号から音声・背景音を分離することでプライバシーを保護する「音声除去」、音声信号を別人の音声に変えることでプライバシーを保護する「声質変換」、音声認識することで言語的なプライバシー情報を保護する技術について検討を進めてきた。音信号から音声と背...
文部科学省: 科学研究費補助金(萌芽研究, 挑戦的萌芽研究)
研究期間: 2007年 - 2009年    代表者: 中川 聖一
遠隔発話の音声認識に関しては、H20年度とH21年度に開発した話者の位置と発声方向の同定方法を用いた認識手法を開発した。つまり、音源位置の同定に基づいて、マイクロフォンアレイのビームフォーマーによって音声を強調し、発声方向の向きの同定によって、発声語彙を推定・制限する方法により認識率を高めた。さらに、残響補正の基本的な手法であるケプストラム平均正規化法を、短時間の発声によりオンラインで適用できる技術を開発した。これは、混合ガウス分布(GMM)モデルにより音声をモデル化しておき、入力音声の各...
文部科学省: 科学研究費補助金(基盤研究(B))
研究期間: 2007年 - 2009年    代表者: 武田 一哉
実世界で雑音などにより劣化した音声の認識を目指し以下のことを行った。(1)劣化音声コーパスを整備し、CENSRECという名称で一般に利用可能とした、(2)劣化音声の認識率への影響度を測る指標を検討し、加法性・乗法性雑音に対して高精度に認識性能を予測できた、(3)劣化音声の劣化要因とその認識手法を体系化した、(4)劣化音声の認識手法を研究した。
文部科学省: 科学研究費補助金(若手研究(B))
研究期間: 2006年 - 2008年    代表者: 山本 一公
音声認識システムを使用時に誤認識が発生すると、人間であるユーザは訂正発話をゆっくりとした発話速度で行う傾向があるが、現在の音声認識システムはゆっくりした発話速度の音声の認識精度が悪いため悪循環となっている。本研究では、発話速度を自動推定し、その結果から最適な音声認識システムパラメータ(挿入ペナルティ、言語重み)を自動的に調整することでゆっくりした発話速度の音声の認識精度を大幅に改善した。
文部科学省: 科学研究費補助金(若手研究(B))
研究期間: 2004年 - 2005年    代表者: 山本 一公
本研究は、話し言葉音声における発話速度変動に頑健な音声認識を目指し、話速変化による認識率低下の抑制について、大きく分けて1.話速によるデータクラスタリングでの話速別モデルの構築。各話速別モデルを融合したモデル(HMM/BNモデル、マルチパスモデル)による各話速に対する評価。2.分析周期を変更したデータによる局所話速に対応したモデルの構築。分析周期を変更した複数モデルの認識結果統合による認識率改善手法。の2つの手法により検討を行なった。データクラスタリング話速別モデルによる検討では以下のよう...
文部科学省: 科学研究費補助金(基盤研究(C))
研究期間: 2003年 - 2004年    代表者: 松本 弘
(1)メルLPCスペクトルへの一般化対数とフォワードマスキングの適用メルLPCスペクトルについて,一般化対数の冪数γ,マスキング係数,ケプストラム平均・分散正規化の有無の影響をAURORA2データベースを用いて検討を行った.その結果,メルLPC分析では,マスキングを行わず,γ=0.1の一般化ケプストラムと一般化デルタケプストラムの特徴量にケプストラム平均及び分散正規化を行った場合に最も高い認識精度を与えることを示した.(2)メル周波数軸上のウィナーフィルタの開発聴感特性を考慮したメルLPC...
文部科学省: 科学研究費補助金(奨励研究(A), 若手研究(B))
研究期間: 2001年 - 2002年    代表者: 山本 一公
本研究では、音声の動的特徴に対するHMMの性能を改善するため、複数の連続するスペクトルを1つの特徴ベクトルとして扱うセグメント単位入力HMMを改良して用いることと、音声の動的特徴をより正確にモデル化するために音響モデルとして従来の音素より長い音節あるいは音節連鎖を用いることの2つの方法を導入した。セグメント単位入力HMMの改良では、可変長セグメントの可能性を探ったが、現在までに確固たる成果を得ることはできなかった。音素よりも長い音響モデル単位を用いる方法については、最初に音素環境依存音節モ...
文部科学省: 科学研究費補助金(基盤研究(C))
研究期間: 2000年 - 2001年    代表者: 松本 弘
1)ハンズフリー音声認識のための頑健な音響パラメータの検討ハンズフリー音声認識では,話者とマイクロホン間の相対位置の変動と残響のため認識性能が著しく劣化する.このような変動に対する頑健性を改善するため,本研究では,一般化対数スケール上のフォワードマスキングに基づく新しい特徴パラメータ,「一般化動的ケプストラム(DyMFGC)」,を検討した.始めに,提案するフォワードマスキングをメルフィルタバンクスペクトルに適用した.更に,このフォワードマスキングをメルLPCスペクトルに適用した.これはメル...