西崎 博光

J-GLOBALへ         更新日: 18/12/06 17:55
 
アバター
研究者氏名
西崎 博光
 
ニシザキ ヒロミツ
URL
http://www.alps-lab.org/
所属
山梨大学
部署
大学院総合研究部 工学域機械工学系(情報メカトロ二クス工学)
職名
准教授
学位
準学士(工学)(国立津山工業高等専門学校), 学士(工学)(豊橋技術科学大学), 修士(工学)(豊橋技術科学大学), 博士(工学)(豊橋技術科学大学)
科研費研究者番号
40362082
Twitter ID
hiro32_n

プロフィール

音声言語処理を中心に研究を行っています。特に,音声認識システムを利用した応用システムの開発に力を入れています。
例えば:
- 音声ドキュメント検索・音声キーワードスポッティング
- 音声言語処理を用いた技術伝承システムの開発
- Web知識源を利用した音声認識性能の改善
- 音声認識誤りが気にならない音声入力によるデータベース検索: 聞き耳インタフェース
- 小学校向け授業字幕システムの開発
- 講義・講演音声の音響的,言語的分析と印象評定との関連性,及びそれを利用した話し方の自動評価
- 音声中の内容語を用いた感情分類
- 多国語の同時音声認識
などの研究を行っています。

最近は,ディープラーニングを用いた画像処理や自然言語処理にも興味を持ち,画像類似検索・認識の研究も行っています。
初心者向けにディープラーニングに関しての書籍も執筆しています。

備考:
twitterでつぶやいています.興味のある方はこちらもどうぞ → http://twitter.com/hiro32_n/

研究分野

 
 

経歴

 
2016年4月
 - 
現在
山梨大学 大学院総合研究部 准教授
 
2015年8月
 - 
2016年3月
国立台湾大学 電機情報学院 客員研究員
 
2007年4月
 - 
2016年3月
山梨大学 大学院医学工学総合研究部 助教
 
2003年4月
 - 
2006年3月
山梨大学 大学院医学工学総合研究部 助手
 

論文

 
A Task Manual Creation Support System Using Automatic Speech Recognition
Chee-Siang Leow, Hiromitsu Nishizaki
Proceedings of the 2018 IEEE 7th Global Conference on Consumer Electronics (GCCE2018)   1-4   2018年10月   [査読有り]
小型コンピュータにおける深層学習アプリケーションの動作検証
西崎博光,レオ チーシャン,牧野浩二
電気学会論文誌C   138(9) 1-8   2018年10月   [査読有り]
Construction of a Corpus of Elderly Japanese Speech for Analysis and Recognition
Norihide Kitaoka, Yurie Iribe, Hiromitsu Nishizaki
Proceedings of the special speech sessions in The 11th International Conference on Language Resources and Evaluation (LREC2018)   14-20   2018年5月   [査読有り]
Usability and Learning Effect Evaluations of an Electrical Note-Taking Support System with Speech Processing Technologies
Hiromitsu Nishizaki, Yosuke Narita
Proceedings of the 25th International Conference on Computers in Education   31-39   2017年12月   [査読有り]
Hiromitsu Nishizaki
Proceedings of the 2017 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference   1222-1227   2017年12月   [査読有り]
Shogo Hara, Hiromitsu Nishizaki
Proceedings of the 2017 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference   1617-1620   2017年12月   [査読有り]
Hiromitsu Nishizaki, Kei Watase
Proceedings of the 2017 IEEE 6th Global Conference on Consumer Electronics (GCCE2017),   1-5   2017年10月   [査読有り]
Naoki Sawada, Ryo Masumura, Hiromitsu Nishizaki
Proceedings of the 18h Annual Conference of the International Speech Communication Association (INTERSPEECH 2017)   3311-3315   2017年8月   [査読有り]
Naoki Sawada,Ryo Masumura,Hiromitsu Nishizaki
Interspeech 2017, 18th Annual Conference of the International Speech Communication Association, Stockholm, Sweden, August 20-24, 2017   3311-3315   2017年   [査読有り]
Correct phoneme sequence estimation using recurrent neural network for spoken term detection
Naoki Sawada, Hiromitsu Nishizaki
Journal of Acoustical Society of Ameria   140(4) 3061-3061   2016年12月
Positioning Control of a Micro Manipulation Robot Based on Voice Command Recognition for the Microscopic Cell Operation
Hidetsugu Terada, Koji Makino, Hiromitsu Nishizaki, Eri Yanase, Takuya Suzuki, Tsutomu Tanzawa
Advances in Mechanism Design II, Volume 44 of the series Mechanisms and Machine Science   4 73-79   2016年8月   [査読有り]
Naoki Sawada, Hiromitsu Nishizaki
IEICE Transactions on Information & Systems   E99-D(10) 2518-2527   2016年10月   [査読有り]
Overview of the NTCIR-12 SpokenQuery&Doc-2 Task
Tomoyosi Akiba, Hiromitsu Nishizaki, Hiroaki Nanjo and Gareth J. F. Jones
Proceedings of the 12th NTCIR Conference   167-179   2016年6月   [招待有り]
Kentaro Domoto, Takehito Utsuro, Naoki Sawada, Hiromitsu Nishizaki
IEICE Transactions on Information & Systems   E99-D(10) 2528-2538   2016年10月   [査読有り]
Evaluation of DNN-based Phoneme Estimation Approach on the NTCIR-12 SpokenQuery&Doc-2 SQ-STD Subtask
Naoki Sawada, Hiromitsu Nishizaki
Proceedings of the 12th NTCIR Conference   211-216   2016年6月
Naoki Sawada, Hiromitsu Nishizaki
Proceedings of the 17th Annual Conference of the International Speech Communication Association (INTERSPEECH2016)   3688-3692   2016年9月   [査読有り]
Naoki Sawada,Hiromitsu Nishizaki
Proceedings of the 12th NTCIR Conference on Evaluation of Information Access Technologies, National Center of Sciences, Tokyo, Japan, June 7-10, 2016      2016年   [査読有り]
Tomoyosi Akiba,Hiromitsu Nishizaki,Hiroaki Nanjo,Gareth J. F. Jones
Proceedings of the 12th NTCIR Conference on Evaluation of Information Access Technologies, National Center of Sciences, Tokyo, Japan, June 7-10, 2016      2016年   [査読有り]
Kentaro Domoto,Takehito Utsuro,Naoki Sawada,Hiromitsu Nishizaki
INTERSPEECH 2015, 16th Annual Conference of the International Speech Communication Association, Dresden, Germany, September 6-10, 2015   834-838   2015年   [査読有り]
Hiromitsu Nishizaki,Naoki Sawada
Asia-Pacific Signal and Information Processing Association Annual Summit and Conference, APSIPA 2015, Hong Kong, December 16-19, 2015   263-269   2015年   [査読有り]
Hiromitsu Nishizaki,Naoki Sawada,Satoshi Natori,Kentaro Domoto,Takehito Utsuro
Proceedings of the 11th NTCIR Conference on Evaluation of Information Access Technologies, NTCIR-11, National Center of Sciences, Tokyo, Japan, December 9-12, 2014      2014年   [査読有り]
Tomoyosi Akiba,Hiromitsu Nishizaki,Hiroaki Nanjo,Gareth J. F. Jones
Proceedings of the 11th NTCIR Conference on Evaluation of Information Access Technologies, NTCIR-11, National Center of Sciences, Tokyo, Japan, December 9-12, 2014      2014年   [査読有り]
西崎 博光, 太田 晃平, 関口 芳廣
電子情報通信学会論文誌. D, 情報・システム   96(10) 2379-2389   2013年10月
講義・講演等の音声を聞きながら効率良くメモの作成を支援するための,音声インタフェースを備えた音声メモ作成支援アプリケーション「聞き耳メモリー」を開発した.音声を聞きながらのメモ手法は幾つか存在しており,我々はメモを取るとき好みの手法でメモを作成する.しかし,既存のメモ手法には幾つかの問題があり,効率的にメモを取れないことがある.開発した聞き耳メモリーは,既存のメモ手法の欠点を解消し,効率的なメモ作業を実現する.そのために聞き耳メモリーは音声インタフェースを備えている.メモ対象の音声を音声認...
伊藤 慶明, 西崎 博光, 中川 聖一, 秋葉 友良, 河原 達也, 胡新輝, 南條浩輝, 松井 知子, 山下 洋一, 相川 清明
情報処理学会論文誌   54(2) 471-483   2013年2月
TRECにおいてSpoken Document Retrieval(SDR:音声ドキュメント検索)のTrackが1996年~2000年に設定され,2006年には米国国立標準技術研究所(NIST)を中心に音声中の検索語検出(Spoken Term Detection:STD)タスクが設定され,以降海外ではさかんにSDR,STDに関する研究が行われるようになった.情報処理学会音声言語情報処理研究会(SIG-SLP)で国内の音声ドキュメント処理研究の推進・活性化を目的として2006年に音声ドキュ...
Yuto Furuya,Daiki Nakagomi,Satoshi Natori,Hiromitsu Nishizaki,Yoshihiro Sekiguchi
Proceedings of the 10th NTCIR Conference on Evaluation of Information Access Technologies, NTCIR-10, National Center of Sciences, Tokyo, Japan, June 18-21, 2013      2013年   [査読有り]
Tomoyosi Akiba,Hiromitsu Nishizaki,Kiyoaki Aikawa,Xinhui Hu,Yoshiaki Itoh 0001,Tatsuya Kawahara,Seiichi Nakagawa,Hiroaki Nanjo,Yoichi Yamashita
Proceedings of the 10th NTCIR Conference on Evaluation of Information Access Technologies, NTCIR-10, National Center of Sciences, Tokyo, Japan, June 18-21, 2013      2013年   [査読有り]
Chifuyu Yonekura,Yuto Furuya,Satoshi Natori,Hiromitsu Nishizaki,Yoshihiro Sekiguchi
Asia-Pacific Signal and Information Processing Association Annual Summit and Conference, APSIPA 2013, Kaohsiung, Taiwan, October 29 - November 1, 2013   1-4   2013年   [査読有り]
Naoki Sawada,Satoshi Natori,Hiromitsu Nishizaki
Asia-Pacific Signal and Information Processing Association Annual Summit and Conference, APSIPA 2014, Chiang Mai, Thailand, December 9-12, 2014   1-4   2014年   [査読有り]
Satoshi Natori,Yuto Furuya,Hiromitsu Nishizaki,Yoshihiro Sekiguchi
Asia-Pacific Signal and Information Processing Association Annual Summit and Conference, APSIPA 2013, Kaohsiung, Taiwan, October 29 - November 1, 2013   1-7   2013年   [査読有り]
Kentaro Domoto,Takehito Utsuro,Naoki Sawada,Hiromitsu Nishizaki
Asia-Pacific Signal and Information Processing Association Annual Summit and Conference, APSIPA 2014, Chiang Mai, Thailand, December 9-12, 2014   1-8   2014年   [査読有り]
Satoshi Natori,Yuto Furuya,Hiromitsu Nishizaki,Yoshihiro Sekiguchi
JIP   21(2) 176-185   2013年   [査読有り]
西崎 博光, 上平 拓弥, 関口 芳廣, 西崎 香苗, 倉金 理沙, 池上 仁志
電子情報通信学会論文誌. D, 情報・システム = The IEICE transactions on information and systems (Japanese edition)   93(10) 2129-2138   2010年10月   [査読有り]
病院リハビリテーション科において,使いやすいユーザインタフェースを備えた患者情報管理システム「聞き耳メアリー」を構築した.病院における患者情報の電子化にはばく大なコストが必要であり,かつ,端末操作が難しく導入時の混乱も報告されている.本論文では,使いやすいインタフェース実現を目的として,電話受話器元の音声や患者との直接対話音声を自動取得し,それを音声認識することで,対話と関係のある情報をタッチパネルディスプレイ上に提示するインタフェースを患者情報管理システムに実装した.これにより,端末操作...
西崎博光,関口芳廣
日本教育工学会論文誌   34(3) 171-179   2010年12月   [査読有り]
土屋 雅稔, 小暮 悟, 西崎 博光, 太田 健吾, 山本 一公, 中川 聖一
情報処理学会論文誌   50(2) 448-459   2009年2月   [査読有り]
近年,様々な教育機関において,多数のe-Learningコンテンツが作成·利用されている.これらのコンテンツを効果的に活用して学習するには,音声データの検索および要約機能を備えた高機能なコンテンツ閲覧システムが必要である.我々が作成した日本語講義音声コンテンツコーパス(Corpus of Japanese classroom Lecture speech Contents)は,講義音声を対象とする認識,検索および要約などの研究を行うための基礎的な資料として設計さ...
Construction and Analysis of Corpus of Japanese Classroom Construction and Analysis of Corpus of Japanese Classroom Lecture Speech ContentsLecture Speech Contents
Masatoshi Tsuchiya, Satoru Kogure, Hiromitsu Nishizaki, Kazumasa Yamamoto, and Seiichi Nakagawa
Proceedings of the 2009 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC 2009)   8-pages   2009年10月   [査読有り][招待有り]
Developing an SDR test collection from Japanese Lecture Audio Data
Tomoyosi Akiba, Kiyoaki Aikawa, Yoshiaki Itoh, Tatsuya Kawahara, Hiroaki Nanjo, Hiromitsu Nishizaki, Norihito Yasuda, Yoichi Yamashita, and Katunobu Ito
Proceedings of the 2009 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC 2009)   8-pages   2009年10月   [査読有り][招待有り]
渡辺 裕太, 関口 芳廣, 西崎 博光
情報処理学会論文誌   47(6) 1812-1821   2006年6月   [査読有り]
この論文では,数人と対話ができる音声対話機能を備えた音色識別学習支援システムについて述べている.この論文では,特に,音色の例として人間の声を扱っている.まず,最初に音色識別学習支援システムに必要な機能を被験者実験により調査した.その結果,(1) 音声対話機能が必要である,(2) 1 人よりも2 人で学習すると学習効果が高い,(3) 聴覚情報だけでなく,視覚情報も有効である,という3 つのことが分かった.そこで,前述の機能を備え,複数人で使用できる音色識別学習支援システムを作成した.被験者実...
話題依存言語モデル構築のためのLSAと単語発話情報を用いた語彙推定
藤原裕幸,西崎博光,関口芳廣
第8回情報科学技術フォーラム講演論文集,RE-004   2 35-43   2009年9月   [査読有り]
Nishizaki Hiromitsu, Sekiguchi Yoshihiro
COMPUTER PROCESSING OF ORIENTAL LANGUAGES, PROCEEDINGS   4285 213-+   2006年12月   [査読有り]
Webによるドキュメント拡張を利用した音声ドキュメント検索
杉本樹世貴,西崎博光,関口芳廣
第8回情報科学技術フォーラム講演論文集,RE-003   2 27-34   2009年9月   [査読有り]
宇津呂 武仁, 小玉 康広, 渡邉 友裕, 西崎 博光, 中川 聖一
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II   87(7) 1428-1440   2004年7月   [査読有り]
本論文では,様々な認識特性をもった複数の大語彙連続音声認識モデルが利用できるような状況において,信頼性の高い認識結果を柔軟に組み合わせる混合規則を機械学習の手法により学習し,この規則を用いて,複数の大語彙連続音声認識モデルの出力を混合する方式を提案する.新聞読上げ音声及びニュース音声を評価音声データとして,デコーダ,音響モデルの異なる26種類の大語彙日本語連続音声認識モデルの出力を混合する評価実験を行ったところ,機械学習を用いた混合手法により,認識率最大の単独モデル,及び,ROVER法のよ...
杉本 樹世貴, 西崎 博光, 関口 芳廣
情報科学技術フォーラム講演論文集   8(2) 27-34   2009年8月
西崎 博光, 中川 聖一
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II   86(10) 1369-1381   2003年10月   [査読有り]
本論文では,未知語を合んだ音声文書をロバストに検索できる,ニュース音声を対象とした音声文書検索システムについて述べる.音声文書を検索する一つの方法としては,音声認識により自動的に音声を単語列に書き起こし,これとキーワードとを直接マッチングする方法が一般的である.しかしこの場合,キーワードが未知語であれば,そのキーワードは他の既知語へ誤って認識されてしまうため,そのキーワードを合む音声文書とマッチングできない.この問題を避けるため,単語ベースのインデックスと音節ベースのインデックスの両方を用...
宇津呂 武仁, 西崎 博光, 小玉 康広, 中川 聖一
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II   86(7) 974-987   2003年7月   [査読有り]
本論文では,音声認識結果の正解部分と誤り部分を分離することを目的として,複数の音声認識システムによる認識結果のうち複数のシステムの間で共通となっている部分を用いる方法を提案し,その有効性を示す.具体的には,大語彙(い)日本語連続音声認識において,デコーダ,音響モデル,言語モデル,音響/言語スコアの重み,挿入ペナルティなど,様々な設定が少しずつ異なっている二つの大語彙連続音声認識モデルによる認識結果について,その共通部分が正解となっている割合を測定することにより,二つの大語彙連続音声認識モデ...
AkibaTomoyosi, AikawaKiyoaki, ItohYoshiaki, KawaharaTatsuya, NanjoHiroaki, NishizakiHiromitsu, YasudaNorihito, YamashitaYoichi, ItouKatunobu
Journal of Information Processing   17 82-94   2009年2月   [査読有り]
The lecture is one of the most valuable genres of audiovisual data. Though spoken document processing is a promising technology for utilizing the lecture in various ways, it is difficult to evaluate because the evaluation require a subjective judg...
西崎 博光, 中川 聖一
情報処理学会論文誌   42(12) 3173-3184   2001年12月   [査読有り]
近年,多くのニュース番組が放映されており,過去のニュース番組から興味のある記事を見つけたいという欲求が高まっている.数多くのニュース番組の中から,必要なニュースを見つける場合,各ニュースに対してインデックスが付けられている場合はそれを使って検索することができる.しかし,インデックスが付与されていないニュース音声データからの検索に対する需要もあり,この場合は放送されたすべてのニュースをあらかじめ文字化し,データベースとして蓄積しておく必要がある.この作業を人手で行うのは不可能に近く,大語彙音...
土屋 雅稔, 小暮 悟, 西崎 博光
情報処理学会論文誌 論文誌ジャーナル   50(2) 448-459   2009年2月
中川 聖一, 赤松 裕隆, 西崎 博光
自然言語処理 = Journal of natural language processing   6(2) 97-115   1999年1月   [査読有り]
Speech Recognition Performance of CJLC: Corpus of Japanese Lecture Contents
Satoru Kogure, Hiromitsu Nishizaki, Masatoshi Tsuchiya, Kazumasa Yamamoto, Shingo Togashi and Seiichi Nakagawa
Prodeedings of the 9th annual conference of the International Speech Communication Association (INTERSPEECH2008)   1554-1557   2008年9月   [査読有り]

講演・口頭発表等

 
音声中の検索語検出を用いた発話内容に着目した音声感情分類
齋藤友菜,澤田直輝,西崎博光
日本音響学会2018年春季研究発表会   2018年3月14日   日本音響学会
複数言語を同時に扱える音声認識のための音響モデリングの検討
原翔吾,西崎博光
日本音響学会2018年春季研究発表会   2018年3月13日   日本音響学会
複数認識システムの重要度を用いた正解音素推定器に基づく音声中の検索語検出の検討
澤田直輝,西崎博光
日本音響学会2017年秋季研究発表会   2017年9月26日   日本音響学会
教師発話から学習した音響特徴を用いた授業音声の発話強調
高橋徹,南條浩輝,西崎博光
日本音響学会2017年秋季研究発表会   2017年9月26日   日本音響学会
コンタクトセンタ通話分類のための注意機構共有型ネットワーク
澤田直輝,増村亮,西崎博光
日本音響学会2017年秋季研究発表会   2017年9月25日   日本音響学会
音声コーデックと変分オートエンコーダを利用した音響モデル学習データの拡張
西崎博光,南條浩輝,高橋徹
日本音響学会2017年秋季研究発表会   2017年9月25日   日本音響学会
小型コンピュータにおけるディープラーニングアプリケーションの動作検証
西崎博光,牧野浩二
第22回知能メカトロニクスワークショップ,2A4-4   2017年8月27日   
録音環境に頑健な授業音声認識のための音声コーデックとその活用の検討
南條浩輝,西崎博光,高橋徹
情報処理学会 第115回音楽情報科学研究会   2017年6月10日   情報処理学会音楽情報科学研究会
マルチストリーム音声ドキュメント分類のためのParallel Hierarchical Attention Networkの検討
澤田直輝,増村亮,西崎博光
情報処理学会第116回音声言語情報処理研究会   2017年5月15日   情報処理学会音声言語情報処理研究会
関連キーワードを使用したリアルタイムキーワードスポッティングの制度向上
中村卓磨,西崎博光
日本音響学会2017年春季研究発表会   2017年3月16日   日本音響学会

Misc

 
ロボットが音楽指導
山梨日日新聞      2017年11月
ディープ・ラーニングのイロハ&夢を語る
牧野浩二,西崎博光
Interface8月号オフ会      2017年7月   [依頼有り]
人工知能技術の最前線!
西崎博光
第12回アカデミックサロン      2016年6月   [依頼有り]
人工知能はここまで来た!
西崎博光
平成28年度通常総会 講演会      2016年6月   [依頼有り]

書籍等出版物

 
牧野 浩二 (担当:編者)
オーム社   2018年8月   ISBN:4274222535
牧野 浩二, 西崎 博光 (担当:共著)
CQ出版   2018年7月   ISBN:4789847063
3大人工知能ライブラリ
牧野浩二,西崎博光 (担当:共著)
CQ出版社   2018年3月   
算数&ラズパイから始めるディープ・ラーニング
牧野浩二,西崎博光 (担当:共著)
CQ出版社   2018年2月   
人工知能アルゴリズム探検隊 第11回番外編 インテル人工知能向け小型コンピュータの実力チェック
牧野浩二,西崎博光 (担当:共著)
CQ出版社   2017年7月   

競争的資金等の研究課題

 
ドローン空撮画像に対する機械学習基盤の開発
研究期間: 2017年6月 - 2018年3月    代表者: 西崎博光
音声処理・言語処理技術を用いた作業記録・手順書作成方式に基づく技術伝承システム
研究期間: 2017年4月 - 2021年3月    代表者: 西崎博光
技術伝承のための作業記録の作成・閲覧支援システムの開発
山梨大学: 地域振興研究プロジェクト
研究期間: 2016年6月 - 2017年3月    代表者: 西崎博光
学習・教育支援のための多様な環境で収録された授業音声の利活用に関する研究
研究期間: 2015年4月 - 2018年3月    代表者: 南條浩輝
音声処理技術と言語処理技術を活用した電子ノート作成支援システムの研究
研究期間: 2014年4月 - 2017年3月    代表者: 西崎博光

受賞

 
2017年11月
ソフトバンク株式会社 Haneda Robotics Lab賞 どれピパ
受賞者: 山梨AIロボット開発協議会 and YSK e-com
 

担当経験のある科目

 
 

その他

 
未踏IT人材発掘・育成事業2009年度上期(未踏ユース)において,研究室の学生さんが「スーパークリエータ」に認定されました.
日本音響学会2010年秋季研究発表会において,共同研究を行っている学生さんが優秀学生発表賞を受賞しました.
第8回情報科学技術フォーラム(FIT2009)で,共同研究を行っている学生さんがヤングリサーチャー賞を受賞しました.
研究室で開発したカードゲームロボット「キクラゲ」が山梨日日新聞(2009年3月16日付朝刊)で紹介されました。