市川 治

J-GLOBALへ         更新日: 18/04/06 17:36
 
アバター
研究者氏名
市川 治
所属
滋賀大学
部署
データサイエンス学部
職名
教授
学位
博士(工学)(奈良先端科学技術大学院大学)

プロフィール

Osamu ICHIKAWA is a professor of Faculty of Data Science at Shiga University. He received B.E. and M.E. degrees in Aeronautical Engineering from Tokyo University, Japan, in 1986 and 1988, respectively, and a Ph.D. degree in Information Science from Nara Institute of Science and Technology, Japan, in 2008.
He joined IBM Japan, Yamato Laboratory in 1988. He worked on software development including operating systems, voice software, multimedia, system management and satellite broadcasting data delivery. From April 1999 to March 2001, he was a funded researcher at the Institute of Space and Astronautical Science in Sagamihara, Japan, for research on computational fluid dynamics. In 2001, he joined the IBM Tokyo Research Laboratory, Japan, working on signal processing for automatic speech recognition. In 2018, he moved to Faculty of Data Science of Shiga University.
His research interests include auditory speech processing, robust speech recognition, microphone arrays, acoustic echo cancellation, and neural network modeling.
Dr. Ichikawa is a senior member of IEEE and the Institute of Electronics, Information and Communication Engineers (IEICE). He is also a member of the Acoustical Society of Japan.

研究分野

 
 

経歴

 
2018年2月
 - 
現在
滋賀大学 データサイエンス学部 教授
 
2001年4月
 - 
2018年1月
日本アイ・ビー・エム株式会社 東京基礎研究所
 
2015年4月
 - 
2016年3月
法政大学 理工学部 兼任講師
 
1999年4月
 - 
2001年3月
文部科学省 宇宙科学研究所 受託研究員
 
1988年4月
 - 
2001年3月
日本アイ・ビー・エム株式会社 開発部門(大和研究所)
 

学歴

 
2007年4月
 - 
2008年9月
奈良先端科学技術大学院大学 情報科学研究科 情報処理学専攻 博士後期課程
 
1986年4月
 - 
1988年3月
東京大学大学院 工学系研究科 航空学専攻 修士課程
 
1984年4月
 - 
1986年3月
東京大学 工学部 航空学科
 
1982年4月
 - 
1984年3月
東京大学 教養学部 理科一類
 

委員歴

 
2007年5月
 - 
2013年4月
電子情報通信学会  音声研究専門委員会(SP) 委員
 

受賞

 
2011年11月
神奈川県大和市 大和市産業人表彰
 

論文

 
Detecting breathing sounds in realistic Japanese telephone conversations and its application to automatic speech recognition
T. Fukuda, O. Ichikawa, M. Nishimura
Speech Communication   98 95-103   2018年   [査読有り]
Harmonic Feature Fusion for Robust Neural Network-based Acoustic Modeling
O. Ichikawa, T. Fukuda, M. Suzuki, G. Kurata, B. Ramabhadran
IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)   5195-5199   2017年   [査読有り]
Effective Joint Training of Denoising Feature Space Transforms and Neural Network Based Acoustic Models
T. Fukuda, O. Ichikawa, G. Kurata, R. Tachibana, S. Thomas, B. Ramabhadran
IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)   5190-5194   2017年   [査読有り]
Factorial Modeling for Effective Suppression of Directional Noise
O. Ichikawa, T. Fukuda, G. Kurata, S.J. Rennie
Annual Conference of the International Speech Communication Association (INTERSPEECH)   389-393   2017年   [査読有り]
正則化処理を用いた特徴空間識別学習の高精度化と音響環境適応
福田 隆,市川 治,立花 隆輝
情報処理学会論文誌   58(1) 288-296   2017年   [査読有り]
Convolutional Neural Network Pre-trained with Projection Matrices on Linear Discriminant Analysis
T. Fukuda, O. Ichikawa, R. Tachibana
IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)   5345-5349   2016年   [査読有り]
Speech corpus recycling for acoustic cross-domain environments for automatic speech recognition
O. Ichikawa, S. J. Rennie, T. Fukuda, D. Willett
Acoustical Science and Technology   Vol. 37(No. 2) 55-65   2016年   [査読有り]
Effective speech suppression using a two-channel microphone array for privacy protection in face-to-face sales monitoring
O. Ichikawa, T. Fukuda, R. Tachibana
Acoustical Science and Technology   Vol. 36(No. 6) 507-515   2015年   [査読有り]
Regularized Feature-space Discriminative Adaptation for Robust ASR
T. Fukuda, O. Ichikawa, M. Nishimura, S.J. Rennie, V. Goel
Annual Conference of the International Speech Communication Association (INTERSPEECH)   2185-2188   2014年   [査読有り]
Simultaneous adaptation of echo cancellation and spectral subtraction for in-car speech recognition
O. Ichikawa, M. Nishimura
IEICE transactions on fundamentals of electronics, communications and computer sciences   88(7) 1732-1738   2005年   [査読有り]
Channel-mapping for speech corpus recycling
O. Ichikawa, S.J. Rennie, T. Fukuda, M. Nishimura
IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)   7160-7164   2013年   [査読有り]
Model-based noise reduction leveraging frequency-wise confidence metric for in-car speech recognition
O. Ichikawa, S.J. Rennie, T. Fukuda, M. Nishimura
IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)   4921-4924   2012年   [査読有り]
Breath-detection-based Telephony Speech Phrasing
T. Fukuda, O. Ichikawa, M. Nishimura
Annual Conference of the International Speech Communication Association (INTERSPEECH)   2625-2628   2011年   [査読有り]
Combining Feature Space Discriminative Training with Long-Term Spectro-Temporal Features for Noise-Robust Speech Recognition
T. Fukuda, O. Ichikawa, M. Nishimura
Annual Conference of the International Speech Communication Association (INTERSPEECH)   229-232   2011年   [査読有り]
DOA estimation with local-peak-weighted CSP
O. Ichikawa, T. Fukuda, M. Nishimura
EURASIP Journal on Advances in Signal Processing   3    2010年   [査読有り]
Long-term spectro-temporal and static harmonic features for voice activity detection
T. Fukuda, O. Ichikawa, M. Nishimura
IEEE Journal of Selected Topics in Signal Processing   4(5) 834-844   2010年   [査読有り]
Dynamic Features in the Linear-Logarithmic Hybrid Domain for Automatic Speech Recognition in a Reverberant Environment
O. Ichikawa, T. Fukuda, M. Nishimura
IEEE Journal of Selected Topics in Signal Processing   4(5) 816-823   2010年   [査読有り]
ユーザの発話傾向分析に基づく車載機器操作のための音声入力手法の検討
倉田 岳人, 市川 治, 西村 雅史
電子情報通信学会論文誌 D   J93-D(10) 2107-2117   2010年   [査読有り]
Dynamic Features in the Linear Domain for Robust Automatic Speech Recognition in a Reverberant Environment
O. Ichikawa, T. Fukuda, R. Tachibana, M. Nishimura
Annual Conference of the International Speech Communication Association (INTERSPEECH)   44-47   2009年   [査読有り]
Improved voice activity detection using static harmonic features
T. Fukuda, O. Ichikawa, M. Nishimura
IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)   4482-4485   2009年   [査読有り]
Phone-duration-dependent long-term dynamic features for a stochastic model-based voice activity detection
T. Fukuda, O. Ichikawa, M. Nishimura
Annual Conference of the International Speech Communication Association (INTERSPEECH)   1293-1296   2008年   [査読有り]
Local peak enhancement combined with noise reduction algorithms for robust automatic speech recognition in automobiles
O. Ichikawa, T. Fukuda, M. Nishimura
IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)   4869-4872   2008年   [査読有り]
Short-and long-term dynamic features for robust speech recognition
T. Fukuda, O. Ichikawa, M. Nishimura
Annual Conference of the International Speech Communication Association (INTERSPEECH)   2262-2265   2008年   [査読有り]
Local Peak Enhancement for In-Car Speech Recognition in Noisy Environment
O. Ichikawa, T. Fukuda, M. Nishimura
IEICE transactions on information and systems   91(3) 635-639   2008年   [査読有り]
Robust speech recognition with Multi-channel Codebook Dependent Cepstral Normalization (MCDCN)
Sabine Deligne, Satya Dharanipragada, Osamu Ichikawa
International Congress on Acoustics (ICA)   2599-2602   2004年   [査読有り]
Sound source localization using a profile fitting method with sound reflectors
O. Ichikawa, T. Takiguchi, M. Nishimura
IEICE TRANSACTIONS on Information and Systems   87(5) 1138-1145   2004年   [査読有り]
Sound source localization using a pinna-based profile fitting method
O. Ichikawa, T. Takiguchi, M. Nishimura
International Workshop on Acoustic Echo and Noise Control (IWAENC2003)   263-266   2003年   [査読有り]
Speech enhancement by profile fitting method
O. Ichikawa, T. Takiguchi, M. Nishimura
IEICE TRANSACTIONS on Information and Systems   86(3) 514-521   2003年   [査読有り]
直交格子を使用した3次元の任意形状物体まわりの流体シミュレーション
市川 治, 藤井 孝藏
日本機械学会論文集 B   68(669) 1329-1336   2002年   [査読有り]

講演・口頭発表等

 
ロバスト音声認識のための調波構造情報を取り込んだニューラルネットワーク音響モデル
市川 治,福田 隆,鈴木 雅之,倉田 岳人
日本音響学会2017年春季研究発表会講演論文集,1-5-3   2017年   
狭帯域と広帯域の両方をサポートするCNNベースのミックスバンド音響モデル
市川 治,福田 隆,鈴木 雅之,倉田 岳人,Bhuvana Ramabhadran
日本音響学会2017年秋季研究発表会講演論文集,1-R-10   2017年   
ファクトリアルモデルによるビームフォーマのエイリアシング対策
市川 治,福田 隆,立花 隆輝
日本音響学会2016年春季研究発表会講演論文集,1-P-2   2016年   
対面販売モニタリングのための小規模マイクロフォンアレイによる効果的なスピーチサプレッション
市川 治,福田 隆,立花 隆輝
日本音響学会講2015年春季研究発表会講演論文集, 2-10-4   2015年   
正則化処理を有する識別的特徴変換行列の音響環境適応
福田 隆,市川 治,立花 隆輝
日本音響学会2015年春季研究発表会講演論文集,1-1-6   2015年   
エイリアシング重み付きポストフィルタとバイナリマスクによる指向性雑音抑圧
市川 治,福田 隆,立花 隆輝
日本音響学会講2015年秋季研究発表会講演論文集, 1-P-30   2015年   
大規模音声データを異なる音響環境向けの音響モデル学習データに変換するオーディオマッピング技術
市川 治,福田 隆,立花 隆輝
日本音響学会講2014年秋季研究発表会講演論文集,1-8-4   2014年   
特徴空間における長時間スペクトル変動成分の識別学習
福田 隆, 市川 治, 西村 雅史
情報処理学会研究報告(音声言語情報処理), Vol.2012-SLP-90 (21), pp.1-6   2012年   
息継ぎ音を利用した電話音声の発話分割
福田 隆, 市川 治, 西村 雅史
電子情報通信学会技術研究報告(音声), SP2011-153, pp.243-248   2012年   
メルバンドごとの信頼性指標を組み込んだ因子モデルに基づくモデルベース雑音補正
市川 治,福田 隆,西村 雅史
日本音響学会講2012年春季研究発表会講演論文集,1-7-14, pp.33-36   2012年   
頑健な音声認識のための線形−対数ハイブリッド領域における長時間動的特徴量
福田 隆, 市川 治, 西村 雅史
日本音響学会2010年春季研究発表会講演論文集, 1-6-2, pp.5-8   2010年   
残響にロバストな音声認識のための動的特徴量と調波構造重み付けメルフィルタバンク
市川 治, 福田 隆, 西村 雅史
日本音響学会講2010年春季研究発表会講演論文集, 1-6-1, pp.1-4   2010年   
音声認識のための長時間変動量と線形判別分析の比較検討
福田 隆, 市川 治, 西村 雅史
日本音響学会2010年秋季研究発表会講演論文集, 1-9-2, pp.3-6   2010年   
音声認識における母音区間の位相の安定性の利用
市川 治, 福田 隆, 西村 雅史
日本音響学会2010年秋期研究発表会講演論文集, 1-Q-7, pp. 127-130   2010年   
短・長スペクトル変動を考慮した雑音に頑健な音声認識
福田 隆, 市川 治, 西村 雅史
日本音響学会2009年春季研究発表会講演論文集, 1-5-3,pp.7-10   2009年   
長時間スペクトル変動情報と調波構造特徴量を併用した発話区間検出法の評価と考察
福田 隆, 市川 治, 西村 雅史
日本音響学会2009年秋季研究発表会講演論文集, 1-1-13, pp.39-42   2009年   
残響にロバストな音声認識のための動的特徴量
市川 治, 福田 隆, 西村 雅史
日本音響学会講2009年秋季研究発表会講演論文集, 1-1-9, pp.27-30   2009年   
長時間スペクトル変動と調波構造に基づく発話区間検出法の音声認識による評価
福田 隆, 市川 治, 西村 雅史
情報処理学会研究報告, 2009-SLP-78 (1), pp.1-6   2009年   
ユーザの発話傾向分析に基づく車載機器操作のための音声入力手法の検討
倉田 岳人, 市川 治, 西村 雅史
情報処理学会研究報告, 2009-SLP-78 (2), pp.1-6   2009年   
長時間スペクトル変動を考慮した低S/N環境下における発話区間検出法
福田 隆, 市川 治, 西村 雅史
日本音響学会2008年春季研究発表会講演論文集,1-10-6, pp. 19-20   2008年   
耐雑音性の高い発話区間検出のための調波構造に基づく音声特徴量
福田 隆, 市川 治, 西村 雅史
日本音響学会2008年秋季研究発表会講演論文集, 1-1-11, pp.25-26   2008年   
Local Peak Weighted CSP による方向推定の改善
市川 治, 福田 隆, 西村 雅史
日本音響学会講2008年秋季研究発表会講演論文集, 3-P-26, pp.821-822   2008年   
長時間スペクトル変動情報と調波構造特徴量を併用した発話区間検出法
福田 隆, 市川 治, 西村 雅史
情報処理学会研究報告(音声言語情報処理), 2008-SLP-73 (1), pp.1-6   2008年   
長時間スペクトル変動を考慮した音声特徴量の検討
福田 隆, 市川 治, 西村 雅史
日本音響学会2007年春季研究発表会講演論文集, 1-P-1, pp.125-126   2007年   
調波構造のローカルピーク強調によるF0抽出不要な音声強調法
市川 治, 福田 隆, 西村 雅史
日本音響学会講2007年秋季研究発表会講演論文集, 1-P-24, pp.185-186   2007年   
発話末尾残響区間推定に基づく低コストなフィルタ係数決定法
福田 隆, 市川 治,西村 雅史
日本音響学会2006年秋季研究発表会講演論文集, 2-P-1, pp.95-96   2006年   
自動車内音声認識のためのスペクトルサブトラクションとエコーキャンセラの同時適応法
市川 治, 西村 雅史
日本音響学会講2005年春季研究発表会講演論文集, Vol.I, 2-Q-10, pp.117-118   2005年   
ランクベーススペクトル サブトラクション法によるミュージカルノイズ低減
市川 治, 滝口 哲也, 西村 雅史
日本音響学会講2004年春季研究発表会講演論文集, Vol.I, 2-8-17, pp.93-94   2004年   
プロファイル・フィッティング法による音源位置推定
市川 治, 滝口 哲也, 西村 雅史
日本音響学会講2003年春季研究発表会講演論文集, Vol.I, 2-8-18, pp.687-688   2003年   
耳介付きプロファイル・フィッティング音源位置推定法の残響環境での評価
市川 治, 滝口 哲也, 西村 雅史
日本音響学会講2003年秋季研究発表会講演論文集, Vol.I, 1-5-14, pp.505-506   2003年   
ビーム形状に注目した音声強調処理
市川 治, 滝口 哲也, 西村 雅史
日本音響学会講2002年春季研究発表会講演論文集, Vol.I, 2-2-7, pp.69-70   2002年   
プロファイル フィッティング法による雑音抑圧処理,” 市川 治
市川 治, 滝口 哲也, 西村 雅史
電子情報通信学会技術研究報告, SP2002-21, pp.19-23   2002年   
PC 上で実時間動作可能な2チャンネル ビームフォーマの実装
市川 治, 西村 雅史
日本音響学会講2002年秋季研究発表会講演論文集, Vol.I, 3-Q-6, pp.165-166   2002年   
境界位置を取り込む直交格子差分法による3次元移動境界問題の計算
市川 治
第15回数値流体力学シンポジウム講演論文集   2001年   
境界位置を取り込む直交格子差分法による3次元移動境界問題の計算
市川 治, 藤井 孝藏
第14回数値流体力学シンポジウム講演論文集   2000年   
直交格子を利用して任意物体形状まわりの流れを解く場合の境界処理
市川 治, 藤井 孝藏
第13回数値流体力学シンポジウム講演論文集   1999年   

特許

 
特許US Patent 9734821 : TESTING WORDS IN A PRONUNCIATION LEXICON
特許US Patent 9640197 : EXTRACTION OF TARGET SPEECHES
特許US Patent 8468016 : SPEECH FEATURE EXTRACTOR APPARATUS, SPEECH FEATURE EXTRACTION METHOD, AND SPEECH FEATURE EXTRACTION PROGRAM
特許Japan Patent 5235438 : 自動車用マイクロフォンアレイ装置及びその製造方法
特許Japan Patent 5089295 : 音声処理システム、方法及びプログラム
特許US Patent 8165317 : METHOD AND SYSTEM FOR POSITION DETECTION OF A SOUND SOURCE
特許Japan Patent 4906908 : 目的音声抽出方法、目的音声抽出装置、及び目的音声抽出プログラム
特許US Patent 7797154 : SIGNAL NOISE REDUCTION
特許US Patent 7698133 : NOISE REDUCTION DEVICE
特許US Patent 7478041 : SPEECH RECOGNITION APPARATUS, SPEECH RECOGNITION APPARATUS AND PROGRAM THEREOF
特許Japan Patent 4107613 : 残響除去における低コストのフィルタ係数決定法
特許Japan Patent 3999689 : 音源位置取得システム、音源位置取得方法、該音源位置取得システムに使用するための音反射要素および該音反射要素の形成方法
特許US Patent 7079291 : BUSINESS MODEL OF WEB PAGE FACSIMILE SERVICE FOR AN INTERNET APPLIANCE DISCONNECTED TO A PRINTER
特許US Patent 5948082 : COMPUTER SYSTEM HAVING AA DATA BUFFERING SYSTEM WHICH INCLUDES A MAINRING BUFFER COMPRISED OF A PLURALITY OF SUB-RING BUFFERS CONNECTED....
特許US Patent 8566084 : Speech processing based on time series of maximum values of cross-power spectrum phase between two consecutive speech frames
特許Japan Patent 5156260 : 雑音を除去して目的音を抽出する方法、前処理部、音声認識システムおよびプログラム
特許Japan Patent 4082611 : 音声収録システム、音声処理方法. およびプログラム
特許Japan Patent 5339501 : 音声収集方法、システム及びプログラム
特許US Patent 8244800 : VIRTUAL SPACE SYSTEM, METHOD AND PROGRAM
特許US Patent 7729921 : APPARATUS, METHOD, AND PROGRAM FOR SUPPORTING SPEECH INTERFACE DESIGN
特許US Patent 8762137 : TARGET VOICE EXTRACTION METHOD, APPARATUS AND PROGRAM PRODUCT
特許US Patent 8930185 : SPEECH FEATURE EXTRACTOR APPARATUS, SPEECH FEATURE EXTRACTION METHOD, AND SPEECH FEATURE EXTRACTION PROGRAM
特許US Patent 9070375 : VOICE ACTIVITY DETECTION SYSTEM, METHOD, AND PROGRAM PRODUCT
特許US Patent 9087513 : NOISE REDUCTION METHOD,PROGRAM PRODUCT, AND APPARATUS

社会貢献活動

 
彦根東高校生向け「45分でわかる音声認識の仕組み」
【講師】  滋賀大学高大連携模擬授業  2018年3月19日 - 2018年3月19日
神奈川県立大和高等学校 学校評議員
【運営参加・支援】  2012年5月 - 2014年4月
神奈川県立大和高等学校 PTA会長
【運営参加・支援】  2012年5月 - 2013年4月

その他

 
2012年2月   第2種電気工事士
1998年2月   マイクロソフト認定エンジニア(MCP)
1995年7月   第一種情報処理技術者
1988年3月   高等学校教諭1級普通免許状 数学