COUNTER10499

川波弘道

J-GLOBALへ         更新日: 18/09/01 03:03
 
アバター
研究者氏名
川波弘道
所属
津山工業高等専門学校
部署
総合理工学科
学位
博士(工学)

プロフィール

平12東京大学大学院工学系研究科博士課程了.博士(工学).同年電子技術総合研究所入所.平13より奈良先端科学技術大学院大学情報科学研究科助手,平19同助教.平28津山工業高等専門学校総合理工学科特命准教授.音声分析,音声対話の研究に従事.電子情報通信学会,情報処理学会,日本音響学会各会員.

研究分野

 
 

経歴

 
2007年4月
 - 
現在
奈良先端科学技術大学院大学 情報科学研究科 助教
 
2001年4月
 - 
2007年3月
奈良先端科学技術大学院大学 情報科学研究科 助手
 
2000年4月
 - 
2001年4月
通産省電子技術総合研究所(現 産業技術総合研究所) 知能情報部 研究員
 

Misc

 
川波弘道, 猿渡洋
立石科学技術振興財団助成研究成果集   (22) 64-67   2013年9月
吉田雄太, 久保慶伍, 川波弘道, 猿渡洋, 鹿野清宏
日本音響学会研究発表会講演論文集(CD-ROM)   2013 ROMBUNNO.3-P-45A   2013年3月
真嶋温佳, TORRES Rafael, 川波弘道, 原直, 松井知子, 猿渡洋, 鹿野清宏
日本音響学会研究発表会講演論文集(CD-ROM)   2013 ROMBUNNO.3-9-5   2013年3月
Rafael Torres, Hiromichi Kawanami, Tomoko Matsui, Hiroshi Saruwatari, Kiyohiro Shikano
情報処理学会論文誌   54(2)    2013年2月
In this work, we address the topic classification of spoken inquiries in Japanese that are received by a speech-oriented guidance system operating in a real environment. The classification of spoken inquiries is often hindered by automatic speech ...
真嶋温佳, 藤田洋子, TORRES Rafael, 川波弘道, 原直, 松井知子, 猿渡洋, 鹿野清宏
情報処理学会論文誌ジャーナル(CD-ROM)   54(2) 443-451   2013年2月
久保慶伍, 川波弘道, 猿渡洋, 鹿野清宏
情報処理学会論文誌ジャーナル(CD-ROM)   54(2) 452-462   2013年2月
西村竜一, 原直, 川波弘道, LEE Akinobu, 鹿野清宏
人工知能学会誌   28(1) 52-59   2013年1月
真嶋温佳, TORRES Rafael, 川波弘道, 原直, 松井知子, 猿渡洋, 鹿野清宏
日本音響学会研究発表会講演論文集(CD-ROM)   2012 ROMBUNNO.3-1-8   2012年9月
原直, 川波弘道, 猿渡洋, 鹿野清宏
情報処理学会研究報告(CD-ROM)   2012(2) ROMBUNNO.SLP-92,NO.1   2012年8月
真嶋温佳, 藤田洋子, RAFAEL Torres, 川波弘道, 原直, 松井知子, 猿渡洋, 鹿野清宏
情報処理学会研究報告(CD-ROM)   2012(2) ROMBUNNO.SLP-92,NO.7   2012年8月
真嶋 温佳, 藤田 洋子, トーレス ラファエル, 川波 弘道, 原 直, 松井 知子, 猿渡 洋, 鹿野 清宏
情報処理学会研究報告. SLP, 音声言語情報処理   2012(7) 1-6   2012年7月
実環境音声情報案内システムでは,雑音等の非音声やユーザ同士の背景会話など,システムへの入力として不適切な入力が存在する.これらの入力はシステムの誤作動・誤認識の原因となるので,無効入力として棄却して応答処理を行わないことが重要である.一般に,有効入力と無効入力との識別にはGMM (Gaussian Mixture Model) による方法など,音響的な情報に基づく方法が用いられることが多い.しかし,入力データに含まれる言語的な情報を使うことにより,システムのタスクも考慮した,より高精度な有...
原 直, 川波 弘道, 猿渡 洋, 鹿野 清宏
情報処理学会研究報告. SLP, 音声言語情報処理   2012(1) 1-6   2012年7月
本論文では携帯端末用の音声情報案内システム開発に向けたネットワークサービスソフトウェアの開発について検討する.このソフトウェアは2002年11月よりコミュニティセンターに設置されたたけまるくんシステムを基礎としている.本システムは,音声認識,対話管理,テキスト音声合成を統合したシステムである.WWWサイト開発者にも使いやすいような,Software-as-a-Service (SaaS) を目指すとともに,熟練した開発者や研究者にも使いやすいパッケージとしての展開を検討する.
西村一馬, 川波弘道, 猿渡洋, 鹿野清宏
情報処理学会研究報告(CD-ROM)   2012(1) ROMBUNNO.NL-206,NO.14   2012年6月
原 直, 川波 弘道, 猿渡 洋, 鹿野 清宏
電子情報通信学会総合大会講演論文集   2012(1)    2012年3月
西村 一馬, 川波 弘道, 猿渡 洋, 鹿野 清宏
情報処理学会研究報告. SLP, 音声言語情報処理   2011(12) 1-6   2011年7月
実環境下で運用されている音声情報案内システムの応答文生成手法として,質問応答データベースを参照して応答文を決定する,用例ベース応答生成の研究が行われている.しかし,これは入力質問文に一番近い質問文を選択し,その質問文に対応付けされている応答文を出力する手法であるため,データベースにないような想定外の質問が入力された場合には適切な応答を返すことができない.また,応答文はデータベース中の事前に決められた定型文を出力するため,入力質問文の表現に応じた柔軟な応答文を出力することができない.これらの...
久保 慶伍, 川波 弘道, 猿渡 洋, 鹿野 清宏
情報処理学会研究報告. SLP, 音声言語情報処理   2011(16) 1-6   2011年1月
未知語に対する自動読み付与の重要性は高く,音声認識,音声合成,検索クエリの予測変換などの技術において性能の改善が期待される.未知語に対する自動読み付与においては,文字などの小さい単位で表記と読みをアライメントした辞書データが必要となる.しかし,データを人手で構築するとコストが掛かるため,表記と読みの自動アライメントが研究されている.しかし,従来の研究で提案された手法では,大きい単位でのアライメントほど1以下の値の乗算回数が少なくなるため,大きい単位のアライメントが有利になり,小さい単位での...
Rafael Torres, Hiromichi Kawanami, Tomoko Matsui, Hiroshi Saruwatari, Kiyohiro Shikano
情報処理学会研究報告. SLP, 音声言語情報処理   2011(6) 1-6   2011年1月
Stacked generalization is a method that allows to combine outputs of multiple classifiers using a second-level classification, minimizing the generalization error of first-level classifiers and achieving greater predictive accuracy. In a previous ...
久保 慶伍, 川波 弘道, 猿渡 洋, 鹿野 清宏
情報処理学会研究報告. SLP, 音声言語情報処理   2010(15) 1-6   2010年7月
音声認識の実用化が進み,Voice Search や音声ドキュメント検索のような幅広いドメインを扱うタスクが増えてきた.幅広いドメインを扱うタスクでは,ドメインを限定したタスクと比べて,辞書に含まれない単語 「未知語」 が高い頻度で出現する.特に,日本語や中国語のような言語は,漢字により複合語や造語,省略語などの未知語が生まれやすいため未知語の対処が重要な課題となる.未知語の対処法として,サブワードと呼ばれる形態素よりも短い単位を形態素単位の認識辞書と言語モデルに組み込むことにより,未知語...
藤田 洋子, 竹内 翔大, 川波 弘道, 松井 知子, 猿渡 洋, 鹿野 清宏
情報処理学会研究報告. SLP, 音声言語情報処理   2010(3) 1-6   2010年2月
実環境で,音声認識を用いた音声情報案内システムを稼動させる場合には,雑音などの音声以外の入力やユーザ同士の背景会話などが混入されてくることがある.これらの入力はシステムの誤作動・誤認識を引き起こし,システムの応答性能を低下させる原因となる.そのため,システムへの入力として適当な入力 (有効入力) と不適当な入力 (無効入力) の識別を行い,無効入力を棄却することにより,無効入力に対する応答処理を行わないことが重要となる.一般的に有効入力と無効入力を識別には音響的特徴が用いられる.しかし,入...
猿渡 洋, 川波 弘道, 鹿野 清宏
日本ロボット学会誌   28(1) 31-34   2010年1月
久保 慶伍, 三宅 純平, 川波 弘道
電子情報通信学会技術研究報告   109(356) 189-194   2009年12月
久保 慶伍, 三宅 純平, 川波 弘道, 猿渡 洋, 鹿野 清宏
情報処理学会研究報告. SLP, 音声言語情報処理   2009(33) 1-6   2009年12月
近年,多様な発話に対応可能な音声対話システムの研究が行われている.その 1 つのアプローチにタスク外発話を検出し,Web 検索で処理する方法がある.しかし,一般に音声対話システムの言語モデルはタスク内の発話を認識できるようドメインを限定して構築されているため,多様性があるタスク外発話を精度良く認識できない.そこで,タスク外発話においてもある程度の認識性能を出せる汎用性の高い言語モデルが必要となる.本報告では,大規模テキストコーパスである Google N-gram (正式名称: Web 日...
竹内 翔大, 川波 弘道, 猿渡 洋, 鹿野 清宏
情報処理学会研究報告. SLP, 音声言語情報処理   2009(15) 1-6   2009年7月
実環境下で動作する音声情報案内システムに関して,質問応答データベース (QADB) を用いて応答を決定する,用例ベース応答生成手法が研究されている.この手法では,ユーザ発話を収集して質問応答データベース (QADB) を拡張することで,開発時に想定しないユーザ発話表現に対しても適切な応答が可能となる.しかしユーザ発話を収集して質問例を作成する作業は高コストである.本稿では用例ベース音声情報案内システムの QADB 拡張コストを削減するため,収集したユーザ発話からの未知質問例検出を検討した....
藤田 洋子, 竹内 翔大, 川波 弘道, 松井 知子, 猿渡 洋, 鹿野 清宏
情報処理学会研究報告. SLP, 音声言語情報処理   2009(14) 1-6   2009年7月
多様なユーザ発話に簡便かつ頑健に応答できる音声対話システムの実現手法として用例ベースの応答手法がある.質問応答データベース (Question and Answer Database:QADB) を用いる用例ベースの応答手法であれば,応答文を追加することによって応答内容が容易に拡張でき,質問例の拡張収集によって言語的なゆらぎに頑健なシステムとすることができる.ただし,このようなシステムは想定内の発話 (タスク内発話) に対して柔軟な応答が可能であるが,想定されていない発話 (タスク外発話)...
Rafael TORRES, Shota TAKEUCHI, Hiromichi KAWANAMI, Tomoko MATSUI, Hiroshi SARUWATARI, Kiyohiro SHIKANO
情報処理学会研究報告. SLP, 音声言語情報処理   2009(13) 1-6   2009年7月
The issue of providing appropriate responses for users' inquiries in a speechoriented guidance system can be addressed with an example-based response generation method, which compares a user's utterance with example questions stored in a question ...
鹿野 清宏, 武田 一哉, 河原 達也, 河原 英紀, 猿渡 洋, 徳田 恵一, 李 晃伸, 川波 弘道, 西村 竜一, 徳田 恵一, 戸田 智基, 西浦 敬信, 高橋 徹, 坂野 秀樹, 全 炳河
電子情報通信学会誌   92(6) 475-491   2009年6月
ITの急速な普及に伴い,だれもが容易に情報にアクセスできる手段として,人と機械との自然な音声対話の実現が望まれている.2003年度から5年間,文部科学省のリーディングプロジェクトとして「e-Society基盤ソフトウェアの総合開発」が実施され,その一環として音声認識・合成技術を本格的に普及利用させるための頑健かつ高精度な音声認識・合成基盤ソフトウェアを開発する本プロジェクト研究が実施された.本稿では,大語彙連続音声認識プログラム,話者環境適応プログラム,ハンズフリー音声認識・電話プログラム...
松本 恭徳, 川波 弘道, 猿渡 洋, 鹿野 清宏, 福嶋 茂信
全国大会講演論文集   71(2) "2-105"-"2-106"   2009年3月
三宅 純平, 竹内 翔大, 川波 弘道, 猿渡 洋, 鹿野 清宏
電子情報通信学会技術研究報告. SP, 音声   108(422) 1-6   2009年1月
本論文では,ユーザの手動登録に依存しない流行語・新語などに対する自動読み付与の手法を提案する.音声認識の大きな課題として,未知語処理が挙げられる.特に,流行語・新語は正しい読みが得られず,未知語として扱われることが多い.近年,流行語などの読み訂正処理として,「はてな」のようなキーワードと読みがペアで登録されている集合知サイトを利用した読み付与による音声認識辞書の修正が提案されている.しかしながら,集合知サイトに基づく読み付与は,匿名ユーザの手動による登録に強く依存しているため,迅速な読みの...
三宅 純平, 竹内 翔大, 川波 弘道, 猿渡 洋, 鹿野 清宏
情報処理学会研究報告. SLP, 音声言語情報処理   72 19-24   2008年7月
三宅純平, 竹内翔大, 川波弘道, 猿渡洋, 鹿野清宏
情報処理学会研究報告. SLP, 音声言語情報処理   2008(68) 19-24   2008年7月
本稿では,当研究室で開発を行っている音声対話システム「たけまるくん」におけるWeb検索タスクの認識率向上を目指し, Web検索時の発話データの分析および言語モデル構築のための様々な学習コーパスの比較検討を行なった.その結果,発話形式として単語発声の割合が高く,発話内容として流行語・新出語など流行情報とユーザが利用する土地の観光情報など地域情報への考慮が必要であるという知見を得た.流行情報は,「Wikipedia」や「検索キーワードランキング」などのオンラインデータベースサイトからキーワード...
鹿野清宏, CincarekTobias, 竹内翔大, 川波弘道, 李晃伸, 西村竜一, 猿渡洋
全国大会講演論文集   70(5) "5-335"-"5-336"   2008年3月
猿渡 洋, 高橋 祐, Cincarek Tobias, 酒井 啓行, 竹内 翔大, 大迫 慶一, 宮部 滋樹, 森 康充, 川波 弘道, 李 晃伸, 鹿野 清宏
全国大会講演論文集   70(5) "5-353"-"5-354"   2008年3月
川波 弘道, Cincarek Tobias, 竹内 翔大
音声ドキュメント処理ワークショップ講演論文集   2 27-32   2008年2月
酒井啓行, ツィンツァレクトビアス, 川波弘道, 猿渡洋, 鹿野清宏, 李晃伸
情報処理学会研究報告. SLP, 音声言語情報処理   2007(129) 13-18   2007年12月
人と音声対話ロボットとの自然な対話を可能にするためにハンズフリーインターフェースの導入が求められている.ハンズフリー音声認識システムでは様々な背景雑音の混入や,ユーザの直接音のパワーが減衰するなど様々な理由で入力音声のSignal-to-Noise Ratio (SNR)が低下してしまう.そしてSNRの低下に伴いユーザの発話区間を特定する音声区間検出が困難となる,また雑音環境における有効な音声区間検出手法は確立されていない.本稿では,雑音環境下においても頑健にユーザの発話区間を検出する音響...
竹内翔大, ツィンツァレクトビアス, 川波弘道, 猿渡洋, 鹿野清宏
情報処理学会研究報告. SLP, 音声言語情報処理   2007(129) 295-300   2007年12月
実環境で頑健に動作する音声対話システムには多彩な発話表現を柔軟に処理できる対話制御技術が必要となる.多彩な発話表現に対して頑健な応答生成手法として,用例ベースの応答生成が研究されている.この手法では質問応答データベース(QADB)を用いて入力音声の認識結果に最も近い質問例を選択し,入力に対して最も適切な応答を生成する.これまで,QADBは発話データの書き起こし文を用いて作成されていた.本稿では,音声認識結果を用いたQADB(認識結果QADB)による応答生成とその最適化を提案する.この手法に...
酒井啓行, ツィンツァレクトビアス, 川波弘道, 猿渡洋, 鹿野清宏, 李晃伸
電子情報通信学会技術研究報告. SP, 音声   107(406) 13-18   2007年12月
人と音声対話ロボットとの自然な対話を可能にするためにハンズフリーインターフェースの導入が求められている.ハンズフリー音声認識システムでは様々な背景雑音の混入や,ユーザの直接音のパワーが減衰するなど様々な理由で入力音声のSignal-to-Noise Ratio (SNR)が低下してしまう.そしてSNRの低下に伴いユーザの発話区間を特定する音声区間検出が困難となる,また雑音環境における有効な音声区間検出手法は確立されていない.本稿では,雑音環境下においても頑健にユーザの発話区間を検出する音響...
竹内翔大, ツィンツァレクトビアス, 川波弘道, 猿渡洋, 鹿野清宏
電子情報通信学会技術研究報告. SP, 音声   107(406) 295-300   2007年12月
実環境で頑健に動作する音声対話システムには多彩な発話表現を柔軟に処理できる対話制御技術が必要となる.多彩な発話表現に対して頑健な応答生成手法として,用例ベースの応答生成が研究されている.この手法では質問応答データベース(QADB)を用いて入力音声の認識結果に最も近い質問例を選択し,入力に対して最も適切な応答を生成する.これまで,QADBは発話データの書き起こし文を用いて作成されていた.本稿では,音声認識結果を用いたQADB(認識結果QADB)による応答生成とその最適化を提案する.この手法に...
酒井啓行, ツィンツァレクトビアス, 川波弘道, 猿渡洋, 鹿野清宏, 李晃伸
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション   107(405) 13-18   2007年12月
人と音声対話ロボットとの自然な対話を可能にするためにハンズフリーインターフェースの導入が求められている.ハンズフリー音声認識システムでは様々な背景雑音の混入や,ユーザの直接音のパワーが減衰するなど様々な理由で入力音声のSignal-to-Noise Ratio (SNR)が低下してしまう.そしてSNRの低下に伴いユーザの発話区間を特定する音声区間検出が困難となる,また雑音環境における有効な音声区間検出手法は確立されていない.本稿では,雑音環境下においても頑健にユーザの発話区間を検出する音響...
竹内翔大, ツィンツァレクトビアス, 川波弘道, 猿渡洋, 鹿野清宏
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション   107(405) 295-300   2007年12月
実環境で頑健に動作する音声対話システムには多彩な発話表現を柔軟に処理できる対話制御技術が必要となる.多彩な発話表現に対して頑健な応答生成手法として,用例ベースの応答生成が研究されている.この手法では質問応答データベース(QADB)を用いて入力音声の認識結果に最も近い質問例を選択し,入力に対して最も適切な応答を生成する.これまで,QADBは発話データの書き起こし文を用いて作成されていた.本稿では,音声認識結果を用いたQADB(認識結果QADB)による応答生成とその最適化を提案する.この手法に...
岡本英樹, 小島摩里子, 松井知子, 川波弘道, 猿渡洋, 鹿野清宏
電子情報通信学会技術研究報告. SP, 音声   107(165) 79-84   2007年7月
本稿では非可聴つぶやき(Non-Audible Murmur:NAM)を用いた話者照合法について,新たに収集したデータを用いて分析した結果を報告する.NAMとは,外部の騒音に対して頑健な体表接着型マイクロフォンを用いて収録したつぶやき音声を指す.これまでNAMの発声内容が他人に漏れ聞こえることがないという利点を活かし,NAMによるキーワードを利用したテキスト依存型話者照合法を提案してきた.今回は,新たに男性18名,女性9名のNAMを収録し,それらを詐称者セットとして用いて実験を行い,その性...
竹内翔大, ツィンツアレクトビアス, 木田学, 早川直樹, 川波弘道, 猿渡洋, 鹿野清宏
電子情報通信学会技術研究報告. SP, 音声   107(116) 31-36   2007年6月
実環境で用いる音声対話システムとして,音声認識結果に対し質問例と応答のペアのデータベース(QADB)を検索して応答を選択するシステムがある.このシステムでは多様な発話様式に対して簡便にかつ頑健に対応することができるが,利用するQADBによって応答性能が左右される.QADBの作成方法には二つの方針が考えられる.一つはQADB作成に用いる学習データの選択方法,もう一つは作成したQADBから不要なペアを自動除去する最適化手法である.本稿ではLeave-one-out交差検定法に基づく最適化手法の...
酒井啓行, ツィンツアレクトビアス, 川波弘道, 猿渡洋, 鹿野清宏, 李晃伸
電子情報通信学会技術研究報告. SP, 音声   107(116) 55-60   2007年6月
実環境ハンズフリー音声認識ではユーザの発話以外に様々な背景雑音が混入するためSNRが悪くなり,従来の振幅パワーに基づく音声区間検出は難しい.本稿では,ハンズフリー音声認識のための音響モデルと言語モデルに基づいた新しい音声区間検出およびその認識アルゴリズムを提案する.具体的には発話の前後の無音区間(非発話区間)の存在に注目し,認識を行う中で音韻と無音を比較することで区間を特定する.提案法では振幅パワーに関わらずリアルタイムに効果的な音声区間検出が可能である.提案法を音声認識エンジンJuliu...
ツインツァレクトビアス, 川波弘道, 木田学, 猿渡洋, 鹿野清宏, 西村西村, 李晃伸
情報処理学会研究報告. SLP, 音声言語情報処理   2006(136) 173-178   2006年12月
本稿では、「たけまるくん」の長期間運用に伴って構築してきた実環境音声データベースを用いて、音声案内システムの性能向上を時間軸でシミュレートする。収集期間と、データ数、出現している単語の数、評価データにおける言語モデルのパープレキシティーと未知語率、音声認識性能、応答正解率との関係を分析し、システム開発におけるそれぞれの構成要素の重要性に関して報告を行う。結果として、質問応答DBを始め、音響モデル、言語モデルの順番でシステム更新が効果的であることが判った。また、一年間の収集データに基づいて構...
ツィンツァレク トビアス, 川波 弘道, 木田 学, 猿渡 洋, 鹿野 清宏, 西村 竜一, 李 晃伸
電子情報通信学会技術研究報告. SP, 音声   106(443) 173-178   2006年12月
ツィンツァレクトビアス, 川波弘道, 木田学, 猿渡洋, 鹿野清宏, 西村竜一, 李晃伸
電子情報通信学会技術研究報告. SP, 音声   106(443) 173-178   2006年12月
本稿では、「たけまるくん」の長期間運用に伴って構築してきた実環境音声データベースを用いて、音声案内システムの性能向上を時間軸でシミュレートする。収集期間と、データ数、出現している単語の数、評価データにおける言語モデルのパープレキシティーと未知語率、音声認識性能、応答正解率との関係を分析し、システム開発におけるそれぞれの構成要素の重要性に関して報告を行う。結果として、質問応答DBを始め、音響モデル、言語モデルの順番でシステム更新が効果的であることが判った。また、一年間の収集データに基づいて構...
ツィンツァレクトビアス, 川波弘道, 木田学, 猿渡洋, 鹿野清宏, 西村竜一, 李晃伸
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション   106(441) 173-178   2006年12月
本稿では、「たけまるくん」の長期間運用に伴って構築してきた実環境音声データベースを用いて、音声案内システムの性能向上を時間軸でシミュレートする。収集期間と、データ数、出現している単語の数、評価データにおける言語モデルのパープレキシティーと未知語率、音声認識性能、応答正解率との関係を分析し、システム開発におけるそれぞれの構成要素の重要性に関して報告を行う。結果として、質問応答DBを始め、音響モデル、言語モデルの順番でシステム更新が効果的であることが判った。また、一年間の収集データに基づいて構...
鹿野清宏, CincarekTobias, 川波弘道, 西村竜一, 李晃伸
情報処理学会研究報告. SLP, 音声言語情報処理   2006(107) 33-38   2006年10月
筆者らは生駒市北コミュニティセンターに、音声情報案内システム「たけまるくん」を設置して、2002年11月から4年間運用している。最初の1年半あまり、精力的にシステムの改良を行い、現在では、子供を中心とする多くの市民に利用されている。このシステムは、大語彙連続音声認識プログラムJuliusを用いた4万語あまりの大語彙の連続発声認識を中心に構築された本格的な自由発話による音声情報案内システムである。また、入力された音声や雑音はすべて収録され、とくに最初の2年間は書き起こしが終了している。この2...
木田学, 川波弘道, 猿渡洋, 鹿野清宏
情報処理学会研究報告. SLP, 音声言語情報処理   2006(73) 81-86   2006年7月
本稿では,実環境下で収集した音声データからの音声情報案内システムの再設計手法を提案する.音声情報案内システムとは,音声をインタフェースとし,ユーザに知りたい情報を提供するシステムである.しかし,必ずしも全ての入力音声に対して正しい応答を返しているとは限らず,ユーザに誤った情報を提供している場合がある.本手法では,実環境下で収集したデータから質問応答正解データベースを構築し,応答生成システムの性能を評価する尺度である応答正解率を算出した.これにより,収集データを基にしたシステムの再設計が可能...
川波弘道, 木田学, 早川直樹, ツインツァレクトビアス, 北村任宏, 加藤智之, 鹿野清宏
電子情報通信学会技術研究報告. SP, 音声   106(123) 19-24   2006年6月
筆者らはこれまで,奈良県生駒市市民センターに音声案内システム「たけまるくん」を開発,運用してきた.この成果を活かし2006年3月末より,新たに開業された新駅「学研北生駒」駅に,独立した2個の音声案内システムを設置し継続して運用中である.「キタちゃん」は従来の音声案内システムと同様のCGエージェントが応答するがタッチパネル機能によりユーザからのウェブ上の情報へのインタラクションも可能とした.「キタちゃんロボット」はロボット型インタフェイスを持ちユーザが親しみやすいシステムを目指している.両シ...
追立真吾, 戸田智基, 李晃伸, 川波弘道, 猿渡洋, 鹿野清宏
情報処理学会研究報告. SLP, 音声言語情報処理   2006(12) 7-12   2006年2月
人型ロボットや券売機など公共の音声認識システムには話者交替が頻繁に生じるという特徴があるため,高速な話者適応技術が重要である.話者,空間,収録機器等を簡便に一括して正規化する手法としてケプストラム平均正規化(CMN)が広く用いられている.公共の音声認識システムでは,空間や収録機器の特性が急激な変化をすることは少ないので, CMNは主に話者正規化の効果を果たす.しかしながら, CMNは一般に発話単位でケプストラム平均値を算出するため,発話の人力開始と同時に認識処理を開始できない.そのため公共...
北村任宏, 戸田智基, 川波弘道, 李晃伸, 猿渡洋, 鹿野清宏
情報処理学会研究報告. SLP, 音声言語情報処理   2005(127) 103-108   2005年12月
音声認識, 音声対話システムを実環境で利用する場合, 設置する環境に適したタスクドメインを設定することが重要である.システムをより普及させるためには簡易に所望のタスクへと適用, もしくは拡張する技術が必須である.既存の音声対話システムに新たなタスクを追加する際, 発話に対するドメインの判別や対話戦略の構築が必要となる.その際に, 統計的言語モデルの作成時は新たに大量のコーパスを必要とし, 製作のために多大な時間を要する.本稿では, 統計的言語モデルに基づく既存の対話システムにおいて, ネッ...
北村任宏, 戸田智基, 川波弘道, 李晃伸, 猿渡洋, 鹿野清宏
電子情報通信学会技術研究報告. SP, 音声   105(496) 13-18   2005年12月
音声認識, 音声対話システムを実環境で利用する場合, 設置する環境に適したタスクドメインを設定することが重要である.システムをより普及させるためには簡易に所望のタスクへと適用, もしくは拡張する技術が必須である.既存の音声対話システムに新たなタスクを追加する際, 発話に対するドメインの判別や対話戦略の構築が必要となる.その際に, 統計的言語モデルの作成時は新たに大量のコーパスを必要とし, 製作のために多大な時間を要する.本稿では, 統計的言語モデルに基づく既存の対話システムにおいて, ネッ...
北村任宏, 戸田智基, 川波弘道, 李晃伸, 猿渡洋, 鹿野清宏
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション   105(494) 13-18   2005年12月
音声認識, 音声対話システムを実環境で利用する場合, 設置する環境に適したタスクドメインを設定することが重要である.システムをより普及させるためには簡易に所望のタスクへと適用, もしくは拡張する技術が必須である.既存の音声対話システムに新たなタスクを追加する際, 発話に対するドメインの判別や対話戦略の構築が必要となる.その際に, 統計的言語モデルの作成時は新たに大量のコーパスを必要とし, 製作のために多大な時間を要する.本稿では, 統計的言語モデルに基づく既存の対話システムにおいて, ネッ...
川波 弘道, 東 剛生, 中島 淑貴, 猿渡 洋, 鹿野 清宏
日本音響学会研究発表会講演論文集   2005(1) 289-290   2005年3月
大元 靖理, 川波 弘道, 猿渡 洋, 鹿野 清宏
日本音響学会研究発表会講演論文集   2005(1) 183-184   2005年3月
ADACHI Kazuki, TODA Tomoki, KAWANAMI Hiromichi, SARUWATARI Hiroshi, SHIKANO Kiyohiro
IEICE transactions on information and systems   E88-D(3) 519-524   2005年3月
This research aims to construct a high-quality Japanese TTS (Text-to-Speech) system that has high flexibility in treating prosody. Many TTS systems have implemented a prosody control system but such systems have been fundamentally designed to outp...
足立一樹, 戸田智基, 川波弘道, 猿渡洋, 鹿野清宏
電子情報通信学会技術研究報告. SP, 音声   103(750) 37-42   2004年3月
本報告では,TTS (Text-To-Speech)システムを用いて,多様な発話スタイルを表現する音声合成手法の検討を行う.多様な発話スタイルの音声を生成するためには,自由に周波数特性,韻律を制御する必要があるが,ここでは韻律(基本周波数F_0,音素持続時間)に着目し,標準的な音声(以下,normal),F_0の高い音声(high), F_oの低い音声(low),発話速度の速い音声(fast),発話速度の遅い音声(slow)を柔軟かつ高品質に生成することを目的とする.本稿では,波形接続型テ...
花園正也, 戸田智基, 川波弘道, 猿渡洋, 鹿野清宏
電子情報通信学会技術研究報告. SP, 音声   103(750) 43-48   2004年3月
ある話者の声を任意の話者の声に変換する手法として混合正規分布(Gaussian Mixture Model: GMM)に基づく声質変換法が挙げられる.この手法では話者間の相関を利用し入力された特微量に対して連続的な写像を行うことで,不連続感の少ない変換音声を得ることが可能である.しかし,その精度は音質や話者性の点から未だ十分なものではない,そこでGMMに基づく声質変換法において尤度基準の非線形時間伸縮(Dynamic Time Warping :DTW)を導入し,反復学習させる手法を提案す...
舛田剛志, 戸田智基, 川波弘道, 猿渡洋, 鹿野清宏
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理   87(2) 447-455   2004年2月
本論文では,多様な発話速度制御が可能で高品質な音声合成手法の検討を行う.波形素行接続方式では,PSOLA法や分析合成手法を用いて韻律の変更を行う場合,変更の程度に応じて品質劣化が生じる.そこで,発話速度ごとの音声データベースを用いることにより,音素持続時間の変更量を削減し品質劣化を低減する手法を提案する.本手法の特徴は, (1)目標とする発話速度の合成音声を発声ごとに呈示して音声を収録すること,(2)発話速度の異なる同一のテキストの音声データベースを作成すること,である.本手法では,速い・...
白石 達也, 戸田 智基, 川波 弘道, 猿渡 洋, 鹿野 清宏
日本音響学会研究発表会講演論文集   2003(1) 399-400   2003年3月
大野 康法, 真下 美紀子, 李 晃伸, 川波 弘道, 猿渡 洋, 鹿野 清宏
日本音響学会研究発表会講演論文集   2003(1) 363-364   2003年3月
岩見 洋平, 戸田 智基, 川波 弘道, 猿渡 洋, 鹿野 清宏
日本音響学会研究発表会講演論文集   2003(1) 267-268   2003年3月
岩見洋平, 戸田智基, 川波弘道, 猿渡洋, 鹿野清宏
電子情報通信学会技術研究報告. SP, 音声   102(619) 11-16   2003年1月
音声における感情表現は韻律におおきく影響されるといわれており,これまで,韻律を制御するためのさまざまな分析と,その分析から得られる規則を用いた合成手法が報告されている.しかし,それらの報告において,韻律は感情表現において重要な要素であるが,韻律だけでなく声質も重要な要素であると指摘されている.そこで本報告では,感情音声の声質を制御する手法として, GMM (Gaussian Mixture Model)に基づく声質変換を用いた感情音声合成手法を提案する.この手法では読み上げ調に発話された音...
Mashimo Mikiko, Toda Tomoki, Kawanami Hiromichi, SHIKANO KIYOHIRO, CAMPBELL NICK
情報処理学会論文誌   43(7) 2177-2185   2002年7月
This paper describes experiments that test an extension of techniques for converting the voice of one speaker to sound like that of another speaker, to include cross-language utterances, such as would be required for spoken language translation or...
白石達也, 戸田智基, 川波弘道, 猿渡洋, 鹿野清宏
情報処理学会研究報告. SLP, 音声言語情報処理   2002(65) 23-29   2002年7月
自然なコミュニケーションには音声情報とともに画像情報も重要な要素である。そこで本報告では,実画像を用いた発語顔画像合成手法を提案する.近年,音声合成枝術ではコーパスベース方式が主流となっている.本手法では,コーパスに音声同期画像を用いることで画像へと応用することで,合成音声と完全に同期した発話顔画像合成を可能とした.本システムは3つのモジュールで構成され,顔位置探索モジュール・顔位置正規化モジュール・画像フレーム選択モジュールから成る.顔位置探索モジュールで眉毛・目・鼻・口領域を抽出し,そ...
舛田 剛志, 戸田 智基, 川波 弘道, 猿渡 洋, 鹿野 清宏
日本音響学会研究発表会講演論文集   2002(1) 289-290   2002年3月
川波 弘道, 鹿野 清宏
日本音響学会研究発表会講演論文集   2002(1) 287-288   2002年3月
真下 美紀子, 戸田 智基, 川波 弘道, 鹿野 清宏, キャンベル ニック
日本音響学会研究発表会講演論文集   2002(1) 261-262   2002年3月
舛田剛志, 戸田智基, 川波弘道, 猿渡洋, 鹿野清宏
電子情報通信学会技術研究報告. SP, 音声   101(603) 61-68   2002年1月
本報告では, 多様な発話速度制御が可能で高品質な音声合成手法の検討を行う.波形素片接続方式では, PSOLA法や分析合成手法を用いて韻律の変更を行う場合, 変更の程度に応じて品質劣化が生じる.そこで, 発話速度ごとの音声データベースを用いることにより, 音素持続時間の変更量を削減し品質劣化を低減する手法を提案する.本手法の特徴は, (1)目標とする発話速度の合成音声を発声ごとに呈示して音声を収録すること, (2)発話速度の異なる同一のテキストの音声データベースを作成すること, である.本手...
舛田 剛志, 戸田 智基, 川波 弘道, 猿渡 洋, 鹿野 清宏
日本音響学会研究発表会講演論文集   2001(2) 245-246   2001年10月
真下 美紀子, 戸田 智基, 川波 弘道, 鹿野 清宏, Campbell Nick
日本音響学会研究発表会講演論文集   2001(2) 389-390   2001年10月
川波 弘道, 伊藤 克亘
日本音響学会研究発表会講演論文集   2001(1) 371-372   2001年3月
川波 弘道, 広瀬 啓吉
日本音響学会研究発表会講演論文集   2000(1) 237-238   2000年3月
北澤 茂良, 北村 達也, 川波 弘道, 広瀬 啓吉
日本音響学会研究発表会講演論文集   1999(2) 289-290   1999年9月
川波 弘道, 広瀬 啓吉
日本音響学会研究発表会講演論文集   1999(2) 275-276   1999年9月
川波 弘道, 広瀬 啓吉
電子情報通信学会技術研究報告. SP, 音声   99(74) 1-8   1999年5月
自然で聞きやすい対話音声を合成するための韻律規則を作成することを目的として、対話調音声と朗読調音声の韻律の比較を行っている。すでに、演劇経験者が模擬対話を行ったものを収録した資料について発話速度を分析し、朗読調音声を基準としたモーラ長の短縮率の文中での変化を調べて韻律規則を作成した。しかしながら、これは韻律文の内部的な構造を考慮していなかった。ここでは、F0パターンの観点から韻律的な下位構造を定義し、対話調音声の韻律文、韻律句、モーラの持続時間短縮率を階層的に分析した。その結果、文頭で朗読...
川波 弘道, 広瀬 啓吉
日本音響学会研究発表会講演論文集   1999(1) 253-254   1999年3月
川波 弘道, 広瀬 啓吉
日本音響学会研究発表会講演論文集   1998(2) 199-200   1998年9月
川波 弘道, 広瀬 啓吉
情報処理学会研究報告. SLP, 音声言語情報処理   98(68) 49-54   1998年7月
対話音声合成の韻律規則作成のために、対話調音声と朗読調音声の比較研究を進めている。すでに発話速度の合成規則も作成しているが, これは一韻律文に対して一律の持続時間制御を行うものであった。ここでは朗読音声との比較による対話音声のモーラ持続時間短縮率を中心に, 発話速度と基本周波数パターン(F_0パターン)により定義される韻律構造との対応を調べた。具体的には, F_0パターン重畳モデルに基づく韻律文, 韻律節, 韻律句, 韻律語の4つの韻律単位と発話速度との関係を分析した.韻律文では、対話音声...
川波弘道, 広瀬啓吉
情報処理学会研究報告   98(68(SLP-22)) 49-54   1998年7月
川波 弘道, 広瀬 啓吉
日本音響学会研究発表会講演論文集   1998(1) 223-224   1998年3月
川波 弘道, 広瀬 啓吉
電子情報通信学会技術研究報告. SP, 音声   97(396) 73-80   1997年11月
種々の態度・感情の音声の韻律的特徴を分析し, 朗読音声の韻律との比較を行った. その結果, 基本周波数パターンの文頭から文末への下降傾向が見られなくなること等が明らかとなった. 次に, 模擬対話を行って, 感情のレベルを段階的に変化させた音声を収録し, その分析を行った. 感情のレベルと韻律的特徴との間には, 一定の傾向が見られたものの, それは, 話者あるいは感情の種類によって大きく異なっていた. これは, 我々が, 感情を表出する複数の手段を有し, それを, どちらかというと場あたり的...
川波弘道, 広瀬啓吉
電子情報通信学会技術研究報告   97(396(SP97 57-67)) 73-80   1997年11月
川波 弘道, 広瀬 啓吉
日本音響学会研究発表会講演論文集   1997(2) 232-234   1997年9月
川波 弘道, 広瀬 啓吉
日本音響学会研究発表会講演論文集   1997(1) 207-208   1997年3月
川波 弘道, 広瀬 啓吉
情報処理学会研究報告. SLP, 音声言語情報処理   97(16) 15-20   1997年2月
対話音声の韻律的特徴を朗読音声のそれと比較すると、主要な情報を有する語に韻律的な強調がなされていたり、単調でない発話のリズムが与えられていたりといった性質が認められる。対話的な音声を規則合成するためには、上記のような韻律的特徴を生成することができる韻律規則が必要である。ここでは、3名の演劇経験のある男性話者の模擬対話音声と読み上げ音声について、基本周波数モデルのパラメータの一つであるアクセント指令について制御要因分析を行った結果について報告する。具体的には、対話音声、朗読音声におけるアクセ...
川波弘道, 広瀬啓吉
情報処理学会研究報告   97(16(SLP-15)) 15-20   1997年2月
広瀬啓吉, 高橋登, 妹尾徹, 阪田真弓, 川波弘道
音声・言語・概念の統合的処理による対話の理解と生成に関する研究 平成5-7年度   67-78   1997年
川波 弘道, 広瀬 啓吉
日本音響学会研究発表会講演論文集   1996(2) 201-202   1996年9月
広瀬啓吉, 川波弘道, 阪田真弓
人工知能学会全国大会論文集   10th 399-402   1996年6月
継続的な対話の実現を目指した,テレビ番組視聴時にユーザに共感を与え魅力的な雑談が可能なロボットの開発
川波 弘道
日本バーチャルリアリティ学会, サイバースペースと仮想都市研究委員会, 第19回シンポジウム「サイバラクティブチャレンジ」      2016年12月
対話ロボットのためロボットのための人との信頼感の獲得を目的とした同調的音声合成
川波 弘道
電子情報通信学会技術報告, マルチメディア・ 仮想環境基礎研究会 (MVE研究会), MVE2016-14, pp.81~84      2016年10月
テレビ共同視聴型雑談ロボットのためタイムシフト再生による対話感の向上
川波 弘道
電子情報通信学会技術報告, クラウドネットワークロボット研究会 (CNR), CNR2016-11, pp.21~25      2016年9月
川波 弘道
International Conference on Multimedia and Expo, Workshop on Multimedia Services and Technologies for E-health(MUST-EH), 6 pages      2016年7月   [査読有り]
ウェアラブルカメラと対話センシングによるブログ投稿支援システム
川波 弘道
電子情報通信学会技術報告, マルチメディア・仮想環境基礎研究会(MVE研究会)      2015年10月
高齢者のためのウェアラブルカメラと対話センシングによるブログ投稿支援システム
川波 弘道
第14回情報科学技術フォーラム(FIT) 講演論文集, pp.427~430      2015年9月
高齢者との対話継続を目的とした機械応答とソーシャルメディアを用いた対話ロボット
川波 弘道
情報処理学会研究報告, 第36回エンタテインメントコンピューティング研究会(EC研究会), 8 pages      2015年6月
機械応答とソーシャルメディアの併用による雑談ロボットの応答性と継続性の向上
川波 弘道
電子情報通信学会技術報告, クラウドネットワークロボット研究会(CNR)      2014年12月
継続的対話を目的とした機械対話と人間対話を併用したインタラクションロボット
川波 弘道
第32回日本ロボット学会学術講演会, 2 pages      2014年9月

書籍等出版物

 
シンギュラリティ 限界突破を目指した最先端研究
川波 弘道 (担当:共著)
近代科学社, 全324頁   2016年2月   
Natural Interaction with Robots, Knowbots and Smartphones –Putting Spoken Dialog Systems into Practice,
川波 弘道 (担当:共著)
Springer, 全397頁   2014年   

担当経験のある科目

 
 

論文

 
Haruka Majima,Rafael Torres,Yoko Fujita,Hiromichi Kawanami,Tomoko Matsui,Hiroshi Saruwatari,Kiyohiro Shikano
INTERSPEECH 2012, 13th Annual Conference of the International Speech Communication Association, Portland, Oregon, USA, September 9-13, 2012      2012年   [査読有り]
Keigo Kubo,Hiromichi Kawanami,Hiroshi Saruwatari,Kiyohiro Shikano
INTERSPEECH 2012, 13th Annual Conference of the International Speech Communication Association, Portland, Oregon, USA, September 9-13, 2012      2012年   [査読有り]
Rafael Torres,Shota Takeuchi,Hiromichi Kawanami,Tomoko Matsui,Hiroshi Saruwatari,Kiyohiro Shikano
INTERSPEECH 2010, 11th Annual Conference of the International Speech Communication Association, Makuhari, Chiba, Japan, September 26-30, 2010   1261-1264   2010年   [査読有り]
Hiroshi Saruwatari,Hiromichi Kawanami,Shota Takeuchi,Yu Takahashi,Tobias Cincarek,Kiyohiro Shikano
Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2009, 19-24 April 2009, Taipei, Taiwan   2009 Vol.7 3729-3732   2009年   [査読有り]
Hideki Okamoto,Tomoko Matsui,Hiromichi Kawanami,Hiroshi Saruwatari,Kiyohiro Shikano
INTERSPEECH 2008, 9th Annual Conference of the International Speech Communication Association, Brisbane, Australia, September 22-26, 2008   1369-1372   2008年   [査読有り]
Hiroshi Saruwatari,Yu Takahashi,Hiroyuki Sakai,Shota Takeuchi,Tobias Cincarek,Hiromichi Kawanami,Kiyohiro Shikano
INTERSPEECH 2008, 9th Annual Conference of the International Speech Communication Association, Brisbane, Australia, September 22-26, 2008   455-458   2008年   [査読有り]
Shota Takeuchi,Tobias Cincarek,Hiromichi Kawanami,Hiroshi Saruwatari,Kiyohiro Shikano
INTERSPEECH 2008, 9th Annual Conference of the International Speech Communication Association, Brisbane, Australia, September 22-26, 2008   451-454   2008年   [査読有り]
Tobias Cincarek,Hiromichi Kawanami,Ryuichi Nisimura,Akinobu Lee,Hiroshi Saruwatari,Kiyohiro Shikano
IEICE Transactions   E91-D(3) 576-587   2008年   [査読有り]
Hiroyuki Sakai,Tobias Cincarek,Hiromichi Kawanami,Hiroshi Saruwatari,Kiyohiro Shikano,Akinobu Lee
Proceedings of the 1st International Conference on Robot Communication and Coordination, ROBOCOMM 2007, Athens, Greece, October 15-17, 2007   16   2007年   [査読有り]
Hideki Okamoto,Mariko Kojima,Tomoko Matsui,Hiromichi Kawanami,Hiroshi Saruwatari,Kiyohiro Shikano
INTERSPEECH 2007, 8th Annual Conference of the International Speech Communication Association, Antwerp, Belgium, August 27-31, 2007   2017-2020   2007年   [査読有り]
Tobias Cincarek,Hiromichi Kawanami,Hiroshi Saruwatari,Kiyohiro Shikano
IEEE Workshop on Automatic Speech Recognition & Understanding, ASRU 2007, Kyoto, Japan, December 9-13, 2007   520-525   2007年   [査読有り]
Mariko Kojima,Tomoko Matsui,Hiromichi Kawanami,Hiroshi Saruwatari,Kiyohiro Shikano
INTERSPEECH 2006 - ICSLP, Ninth International Conference on Spoken Language Processing, Pittsburgh, PA, USA, September 17-21, 2006      2006年   [査読有り]
Kazuki Adachi,Tomoki Toda,Hiromichi Kawanami,Hiroshi Saruwatari,Kiyohiro Shikano
IEICE Transactions   E88-D(3) 519-524   2005年   [査読有り]
Kazuki Adachi,Tomoki Toda,Hiromichi Kawanami,Hiroshi Saruwatari,Kiyohiro Shikano
Proceedings of the Fourth International Conference on Language Resources and Evaluation, LREC 2004, May 26-28, 2004, Lisbon, Portugal      2004年   [査読有り]
Tatsuya Shiraishi,Tomoki Toda,Hiromichi Kawanami,Hiroshi Saruwatari,Kiyohiro Shikano
8th European Conference on Speech Communication and Technology, EUROSPEECH 2003 - INTERSPEECH 2003, Geneva, Switzerland, September 1-4, 2003      2003年   [査読有り]
Hiromichi Kawanami,Yohei Iwami,Tomoki Toda,Hiroshi Saruwatari,Kiyohiro Shikano
8th European Conference on Speech Communication and Technology, EUROSPEECH 2003 - INTERSPEECH 2003, Geneva, Switzerland, September 1-4, 2003      2003年   [査読有り]
Hiromichi Kawanami,Tsuyoshi Masuda,Tomoki Toda,Kiyohiro Shikano
Proceedings of the Third International Conference on Language Resources and Evaluation, LREC 2002, May 29-31, 2002, Las Palmas, Canary Islands, Spain      2002年   [査読有り]
Mikiko Mashimo,Tomoki Toda,Hiromichi Kawanami,Hideki Kashioka,Kiyohiro Shikano,Nick Campbell
7th International Conference on Spoken Language Processing, ICSLP2002 - INTERSPEECH 2002, Denver, Colorado, USA, September 16-20, 2002      2002年   [査読有り]
Hiromichi Kawanami,Tsuyoshi Masuda,Tomoki Toda,Kiyohiro Shikano
7th International Conference on Spoken Language Processing, ICSLP2002 - INTERSPEECH 2002, Denver, Colorado, USA, September 16-20, 2002      2002年   [査読有り]
Keikichi Hirose,Hiromichi Kawanami
Speech Communication   36(1-2) 97-111   2002年   [査読有り]
川波 弘道
IPSJ Journal, vol.54, no.2, pp.157~167 (doi: 10.2197/ipsjjip.21.157)      2013年4月   [査読有り]
音声情報案内システムにおけるBag-of-Wordsを用いた無効入力の棄却
川波 弘道
情報処理学会論文誌, vol.54, no.2, pp.443~451      2013年2月   [査読有り]
日本語の未知語に対する発音付与のための多対多アライメント
川波 弘道
情報処理学会論文誌, vol.54, no.2, pp.452~462      2013年2月   [査読有り]
対話調音声合成における韻律的特徴制御に関する研究  
川波 弘道
東京大学      2000年3月
対話音声の韻律的特徴の定量的分析と生成規則の構築  
川波 弘道
東京大学      1997年3月

競争的資金等の研究課題

 
文部科学省: 科学研究費補助金(基盤研究(C))
研究期間: 2012年 - 2014年    代表者: 川波 弘道
文部科学省: 科学研究費補助金(基盤研究(A), 基盤研究(A))
研究期間: 2011年 - 2014年    代表者: 猿渡 洋
本研究では、新しい統計モデリングおよび高次統計量追跡による能動的声質制御技術の確立、およびその自律カスタムメイド音声コミュニケーション拡張システムへの応用に関して研究を行うことを目的とする。具体的な実証システムとして、高次統計量追跡による高品質ブラインド音源分離に基づく両耳補聴システムや、統計量追跡による声質制御可能な発声補助システムを開発し、その有効性を実証する。本年度は、以下の4項目に関して研究を遂行した。(1)実環境における聴覚障害者の音響環境を模擬するため、両耳補聴器に関する基礎デ...
文部科学省: 科学研究費補助金(基盤研究(A))
研究期間: 2007年 - 2010年    代表者: 鹿野 清宏
音声としてのメディアを拡張する二つの新しい技術(1)声を出さなくても音声によるコミュニケーションが可能となる非可聴つぶやきという静かな音声メディアと、(2)騒音下における歪なしでの音源分離SIMO-ICAの研究を発展させ、企業への技術移転を行った。また、公共機関に音声情報案内システム「たけまるくん」を設置して、実環境での音声認識技術が利用可能であることを実証した。
文部科学省: 科学研究費補助金(萌芽研究)
研究期間: 2005年 - 2006年    代表者: 鹿野 清宏
H17年度に収録した28人からなり、異なる4時期で発声した非可聴つぶやき声(NAM)個人認証データベースをもとにNAMによる話者認証の研究を進めた。さらに、27人の詐称者のNAMを収録して、NAM個人認証データベースを完成するとともに評価を行った。NAMにより個人認証の研究で、研究を担当した小島麻里子(M2)が、暗号と情報セキュリティシンポジウムSCIS2006論文賞を受賞した。(1)Hl7年度に収録した28名のN削個人認証データベースに加えて、27名の詐称者のN削個人認証データベースの収...
文部科学省: 科学研究費補助金(基盤研究(B))
研究期間: 2003年 - 2006年    代表者: 鹿野 清宏
当初計画では、下記の項目の研究を行うことを述べている。1.雑音除去信号処理、高精度音韻モデルおよび環境・話者適応アルゴリズム、2.自由な発話を受け付けるタスク対応言語モデル、3.ユーザにマイクを意識させないハンズフリー音声認識、4.音声対話システムを使いやすくするためのヒューマンファクターの把握、これらの研究を、実験室内に音声認識システムを構築して研究するだけでなく、実環境に、音声認識システムを設置してアルゴリズムの有効性やヒューマンファクターの把握に努める。1.の話者・環境の同時適応を行...

学歴

 
 
 - 
2000年3月
東京大学 工学系研究科 電子情報工学専攻 博士課程修了
 
 
 - 
1994年3月
東京大学 工学部 電気工学科卒業