小坂 哲夫

J-GLOBALへ         更新日: 19/03/07 02:42
 
アバター
研究者氏名
小坂 哲夫
 
コサカ テツオ
URL
http://speech-lab.yz.yamagata-u.ac.jp/
所属
山形大学
部署
大学院理工学研究科
職名
教授
学位
博士(情報科学)(東北大学)
科研費研究者番号
50359569

研究キーワード

 
 

研究分野

 
 

経歴

 
1986年4月
 - 
2002年8月
キヤノン株式会社 主幹研究員
 
1991年9月
 - 
1995年3月
ATR自動翻訳電話研究所 研究員
 
1994年5月
 - 
1994年8月
MITコンピュータサイエンス研究所 研究員
 
2002年9月
 - 
2007年3月
山形大学 工学部 情報科学科 助教授
 
2007年4月
 - 
2012年3月
山形大学 大学院理工学研究科 准教授
 

学歴

 
 
 - 
1984年3月
東北大学 工学部 電気工学科
 
 
 - 
1986年3月
東北大学 工学研究科 情報工学専攻
 

委員歴

 
2007年6月
 - 
2013年5月
日本音響学会  編集委員会委員
 
1995年1月
 - 
現在
電子情報通信学会  論文査読委員
 
1997年1月
 - 
現在
日本音響学会  論文査読委員
 
1999年3月
 - 
2002年8月
W3C Voice Browser Working Group  Member
 
2009年4月
 - 
2011年3月
情報処理学会  音声言語情報処理研究運営委員会 委員
 

受賞

 
1994年
ATR ATR論文賞
受賞者: 小坂哲夫,鷹見淳一,嵯峨山茂樹
 
1996年5月
電子情報通信学会 平成7年度電子情報通信学会論文賞
受賞者: 小坂哲夫,松永昭一,嵯峨山茂樹
 
2017年6月
電子情報通信学会 電子情報通信学会 情報・システムソサイエティ査読功労賞
 
2017年10月
The Institute of Electrical and Electronics Engineers, Inc IEEE GCCE2017 Outstanding Demo Award Multimodal Spoken Dialog System Using State Estimation by Body Motion
受賞者: Takeru Koseki, Tetsuo Kosaka
 

論文

 
統計的手法およびトップダウン情報を用いた男女声対象の自動ラベリング
小森 康弘, 小坂 哲夫, 大洞 恭則, 新中 新二
電気学会論文誌C   108-C(10) 795-802   1988年1月   [査読有り]
An Algorithm for Automatic HMM Structure Generation in Speech Recognition
Tetsuo Kosaka, Shigeki Sagayama
Proc. of Fourth Australian International Conference on Speech Science and Technology   104-109   1992年12月   [査読有り]
ATREUS: Continuous Speech Recognition Systems at ATR Interpreting Telephony Research Laboratiories
S. Sagayama, M. Sugiyama, K. Ohkura, J. Takami, A. Nagai, H. Singer, H. Hattori, K. Fukuzawa, Y. Kato, K. Yamaguti, T. Kosaka, A. Kurematsu
Proc. of Fourth Australian International Conference on Speech Science and Technology   324-329   1992年12月   [査読有り]
Rapid Speaker Adaptation Using Speaker-Mixtue Allophone Models Applied to Speaker-Independent Speech Recognition
Tetsuo Kosaka, Jun-Ichi Takami, Shigeki Sagayama
Proc. of ICASSP93   570-573   1993年4月   [査読有り]
A Dynamic Approach to Speaker Adaptation of Hidden Markov Networks for Speech Recognition
Tetsuo Kosaka, Edward Willems, Jun-Ichi Takami, Shigeki Sagayama
Proc. of Eurospeech93   363-366   1993年9月   [査読有り]

Misc

 
I. Suga, R. Yasuhara, M. Inoue and T. Kosaka
5th Joint Meeting of the Acoustical Society of America and Acoustical Society of Japan      2016年12月
Y. Aizawa, M. Kato and T. Kosaka
5th Joint Meeting of the Acoustical Society of America and Acoustical Society of Japan      2016年12月

書籍等出版物

 
Robust Speech Recognition and Understanding
M. Grimm and K. Kroschel (Ed) (担当:共著, 範囲:第10章)
I-Tech Education and Publishing   2007年6月   ISBN:9783902613080
Speech Recognition
France Mihelic and Janez Zibert (Ed) (担当:共著, 範囲:第18章)
I-Tech Education and Publishing   2008年11月   ISBN:9789537619299
電子情報通信学会知識ベース
原島博編 (担当:共著, 範囲:2群画像・音・言語,7編音声認識と合成, 「2-4 話者・環境適応」の執筆担当)
電子情報通信学会   2011年1月   
E-Activity and Intelligent Web Construction: Effects of Social Design, Chapter16
Tetsuo Kosaka, Takashi Kusama, Masaharu Kato, Masaki Kohda (担当:共著)
IGI Global   2011年5月   
Acoustics, Speech and Human-Machine Communication (Shuichi ITAHASHI et al. ed.) Chapter 2.3, No. 20.
Tetsuo Kosaka et al. (担当:分担執筆)
AOSOSHA Publishing company   2013年12月   ISBN:978-4-9906212-2-3

講演・口頭発表等

 
講演音声認識のための音響・言語モデルの検討
堤怜介、加藤正治、小坂哲夫、好田正紀
情報処理学会研究会   2002年12月   
かな・漢字文字列を単位とした言語モデルの検討
金野弘明、加藤正治、小坂哲夫、好田正紀、伊藤彰則
情報処理学会研究会   2002年12月   
マルチコンディション学習による雑音重畳音声認識
大塚 稔、加藤正治、小坂哲夫、好田正紀
情報処理学会東北支部研究会   2003年3月   
講演音声認識における音響モデルの話者適応
席信哉、堤怜介、加藤正治、小坂哲夫、好田正紀
情報処理学会東北支部研究会   2003年3月   
離散混合出力分布型HMMのMAP推定による雑音適応の検討
小坂哲夫、加藤正治、好田正紀
日本音響学会講演会   2003年3月   

競争的資金等の研究課題

 
雑音に頑健な音声認識手法の開発とモバイル環境への応用
日本学術振興会: 科学研究費助成事業
研究期間: 2004年4月 - 2007年3月
音声認識の主要な応用のひとつとして,モバイル環境での利用が考えられる.モバイル環境では屋外などで使用される場合が多く,これを実現するためには雑音の問題を解決する必要がる.本研究ではこの雑音の問題に対して,主に,音響モデルによる解決を目指す.この解決のために,従来あまり使用されていない離散分布HMMを用いる.離散分布HMMは,モデルの出力分布の表現において,正規分布の仮定が必要なく,任意の分布形状が表現できるという利点があるが,これまでの検討ではパラメータ推定の問題により,あまり使われること...
高精度な話し言葉認識技術の開発
日本学術振興会: 科学研究費助成事業
研究期間: 2010年4月 - 2013年3月
講演や会議音声など,話し言葉音声の認識の高精度化を目指す.この目的に対し,1)音響・言語モデルの高精度化,2)話者インデキシング,3)システム統合の3点の課題について重点的に取り組む.
大規模コーパスを利用した音声・音響信号の自動分類と音声認識への応用
日本学術振興会: 科学研究費助成事業
研究期間: 2013年4月 - 2016年3月
音声コーパスの拡大および計算機の性能向上による演算スピートの増加により,高精度な音声認識が可能となりつつある.しかし音声や音響信号には多様性があり,常に良好に認識できるわけではない.話者による性能劣化,雑音や残響などの影響など,多くの問題点が残されている.本研究ではクラスタリング技術を用い,音声・音響信号の多様性による音声認識の性能劣化の問題に取り組む.信号の特徴を利用して自動分類により性質の類似した信号をクラス別にまとめ,クラスごとモデルを構築し認識に利用する.
ディープラーニングに基づく音声認識の音響モデル適応の研究
日本学術振興会: 科学研究費助成事業
研究期間: 2016年4月 - 2019年3月    代表者: 小坂哲夫

特許

 
特許第2862306号 : 音声認識装置
共著
特許第3066920 : 音声認識方法および装置
共著
特許第3397568 : 音声認識方法及び装置
共著
特許第3542578 : 音声認識装置及びその方法,プログラム
共著
特許第3581648 : 音声認識システム、情報処理装置及びそれらの制御方法、プログラム
共著
USP6236964 : Speech recognition apparatus and method for matching inputted speech and a word generated from stored referenced phoneme data
共著
USP5621849 : Voice recognizing method and apparatus
共著
USP5208863 : Encoding method for syllables
共著
USP5220629 : Speech synthesis apparatus and method
共著
USP5369728 : Method and apparatus for detecting words in input speech data
共著
USP5715363 : Method and apparatus for processing speech
共著
USP5751898 : Speech recognition method and apparatus for use therein
共著
USP5893058 : Speech recognition method and apparatus for recognizing phonemes using a plurality of speech analyzing and recognizing methods for each kind of phoneme
共著
USP5924067 : Speech recognition method and apparatus, a computer-readable storage medium, and a computer-readable program for obtaining the mean of the time of speech and non-speech portions of input speech in the cepstrum dimension
共著
USP6108628 : Speech recognition method and apparatus using coarse and fine output probabilities utilizing an unspecified speaker model
共著
USP6236962 : Speech processing apparatus and method and computer readable medium encoded with a program for recognizing input speech by performing searches based on a normalized current feature parameter
共著
USP6266636 : Single distribution and mixed distribution model conversion in speech recognition method
共著
USP6393396 : Method and apparatus for distinguishing speech from noise
共著
USP6587820 : Information Processing Apparatus and Method, a Computer Readable Medium Storing a Control Program for Making a Computer Implemented Information Process, and a Control Program for Selecting a Specific Grammar Corresponding to an Active Input Field of for Controlling Selection of a Grammar or Comprising a Code of a Selection Step of Selecting a Specific Grammar
共著
USP6813606 : Client-server speech processing system, apparatus, method, and storage medium
共著
USP6877921 : Image-formingapparatus and image-forming method
共著
特許第3762191 : 情報入力方法、情報入力装置及び記憶媒体
小坂哲夫,山本寛樹
特許第3733322 : マルチモーダル文書受信装置及びマルチモーダル文書送信装置、マルチモーダル文書送受信システム及びそれらの制御方法、プログラム
酒井桂一,小坂哲夫
特許第3774698 : 情報処理装置、情報処理方法及び記憶媒体
小坂哲夫,上田隆也,伊藤史朗,山本寛樹,池田裕治
USP7058580 : Client-server speech processing system, apparatus, method, and storage medium
Ueyama Teruhiko, Komori Yasuhiro, Kosaka Tetsuo, Yamada Masayuki, Kushida Akihiro
特開2004-020613 : サーバ、受信端末
酒井桂一、小坂哲夫
特開2004-070523 : 情報処理装置およびその方法
奥谷泰夫、小坂哲夫
特開2004-072275 : 情報提供システム及びその制御方法
小坂哲夫、山田雅章、山本寛樹
特開2004-102918 : 操作代行装置およびその方法、並びに、情報処理装置およびその制御
廣田 誠。小坂哲夫、小森康弘
特開2004-173210 : 画像形成装置及び画像形成方法
廣田 誠、小坂哲夫、八木沢津義
特開2004-180197 : 情報処理装置、情報処理方法および記録媒体
小坂哲夫、小森康弘、八木沢津義
特開2005-055920 : 情報処理装置及びその方法、プログラム
酒井桂一、小坂哲夫、
特開2005-339513 : 情報処理装置及びその制御方法、プログラム
廣田 誠、小坂哲夫
特開2006-139789 : 情報入力方法、情報入力装置及び記憶媒体
小坂哲夫、山本寛樹
3728251 : 情報処理装置及びその制御方法,プログラム
廣田誠,小坂哲夫
3799280 : 対話システムおよびその制御方法
小坂哲夫,中川賢一郎,山本寛樹
3880383 : 音声認識装置及びその方法、プログラム
小坂哲夫,上田隆也
3884951 : 情報処理装置及びその方法、プログラム
酒井桂一,小坂哲夫
3902959 : 情報処理装置及びその制御方法、プログラム
廣田誠,小坂哲夫
7165034 : Information processing apparatus and method, and program
Sakai Keiichi, Kosaka Tetsuo
4012228 : 情報入力方法、情報入力装置及び記憶媒体
小坂哲夫,山本寛樹
4047323 : 情報処理装置及びその方法、プログラム
酒井桂一,小坂哲夫
7318033 : Method, apparatus and program for recognizing, extracting, and speech synthesizing strings from documents
Okutani Yasuo, Kosaka Tetsuo
4565585 : データ処理装置、データ処理方法、記録媒体
櫛田 晃弘,小坂 哲夫,伊藤 史朗
USP7099824 : Speech recognition system, speech recognition server, speech recognition client, their control method, and computer readable memory
Kushida Akihiro, Kosaka Tetsuo
USP7024361 : Information processing apparatus and method, a computer readable medium storing a control program for making a computer implemented information process, and a control program for selecting a specific grammar corresponding to an active input field or for controlling selection of a grammar or comprising a code of a selection step of selecting a specific grammar
Kosaka Tetsuo, Ueda Takaya, Ito Fumiaki, Yamamoto Hiroki, Ikeda Yuji
特開平01-040898 : 音声認識装置
小坂哲夫
特開平01-189700 : 音声合成装置
小坂哲夫
特開平01-262597 : 音声認識装置
小坂哲夫, 大洞恭則, 小森康弘, 新中新二
特開平03-149600 : 音声合成方法及び装置
小坂哲夫, 桜井穆, 田村純一
特開平04-129433 : ポケツトベル
松尾広, 桜井穆, 田村純一, 小坂哲夫
特開平04-129453 : 着信報知装置
松尾広, 桜井穆, 田村純一, 小坂哲夫
特開平04-331982 : 表示制御方法及びその装置
松尾広, 田村純一, 小坂哲夫
特開平05-040600 : 音声出力装置
小坂哲夫, 松尾広, 田村純一
特開平05-094198 : 音声認識方法及び装置
小坂哲夫
特開平05-197397 : 音声認識方法及びその装置
小坂哲夫
特開平10-097277 : 音声認識方法及び装置並びに記憶媒体
小森康弘, 小坂哲夫
特開平11-153998 : 音声応答装置及びその方法、コンピュータ可読メモリ
中川賢一郎, 小坂哲夫
特開平11-161293 : 音声応答装置及びその方法、コンピュータ可読メモリ
小坂哲夫
特開平11-202893 : 音声認識装置及び方法及びその記憶媒体
小坂哲夫
特開2000-047686 : 音声認識装置および方法
小坂哲夫
特開2000-047696 : 情報処理方法及び装置、その記憶媒体
中川賢一郎, 小坂哲夫, 小森 康弘
特開2000-092368 : カメラ制御装置及びコンピュータ読み取り可能な記憶媒体
坂内祐一, 大矢崇, 小坂哲夫
特開2000-101901 : 撮像装置、撮像方法、撮像装置制御システム及び記憶媒体
小坂哲夫, 高木常好
特開2000-284792 : 音声認識装置及び方法
小坂哲夫
特開2001-014331 : 情報処理方法、装置及び記憶媒体
中川賢一郎、小坂哲夫、八木沢津義
特開2001-100786 : 音声認識方法、装置及び記憶媒体
中川賢一郎、小坂哲夫、八木沢津義、川崎勝彦、山本寛樹、山田雅章
特開2001-296991 : データ処理装置、データ処理方法、記録媒体
櫛田晃弘、小坂哲夫、伊藤史朗
特開2001-306293 : 情報入力方法、情報入力装置及び記憶媒体
小坂哲夫、山本寛樹
特開2001-337695 : 音声処理システム、装置、方法及び記憶媒体
植山輝彦、小坂哲夫、山田雅章、小森康弘、櫛田晃弘
特開2002-116796 : 音声処理装置、音声処理方法及び記憶媒体
上田隆也、池田祐治、小坂哲夫、柴山茂樹
特開2002-123288 : 携帯電話、ユーザインターフェース装置、コンテンツ表示方法、記憶媒体
酒井桂一、小坂哲夫
特開2002-162988 : 音声認識システム及びその制御方法、コンピュータ可読メモリ
櫛田晃弘、小坂哲夫
特開2002-268681 : 音声認識システム及び方法及び該システムに用いる情報処理装置とその方法
小坂哲夫、山本寛樹
特開2002-304407 : プログラム及び情報処理装置
櫛田晃弘、小坂哲夫
特開2003-157095 : 音声認識装置及びその方法、プログラム
小坂哲夫、酒井桂一、山本寛樹
特開2003-157167 : マルチモーダル文書受信装置及びマルチモーダル文書送信装置、マルチモーダル文書送受信システム及びそれらの制御方法、プログラム
酒井桂一、小坂哲夫
特開2003-167598 : 音声認識装置及びその方法、プログラム
小坂哲夫、上田隆也
特開2003-186488 : マルチモーダル入出力装置及びその方法、プログラム
酒井桂一、小坂哲夫
特開2003-196306 : 画像検索装置及びその方法、プログラム
中谷 裕、小坂哲夫
特開2003-216293 : 情報処理装置及びその制御方法、プログラム
廣田 誠、小坂哲夫
特開2003-216424 : 情報処理装置及びその制御方法、プログラム
廣田 誠、小坂哲夫
特開2003-241796 : 音声認識システムおよびその制御方法
小坂哲夫
特開2003-255992 : 対話システムおよびその制御方法
小坂哲夫、中川賢一郎、山本寛樹
特許第6038918号 : 音声変換装置、及びプログラム
鈴木隆司, 小坂哲夫

社会貢献活動

 
サイエンスパートナープログラム講師
【】  2009年5月 - 2009年10月