河原 達也

J-GLOBALへ         更新日: 17/11/21 21:59
 
アバター
研究者氏名
河原 達也
 
カワハラ タツヤ
URL
http://sap.ist.i.kyoto-u.ac.jp/members/kawahara/
所属
京都大学
部署
情報学研究科
職名
教授
学位
工学修士(京都大学), 工学博士(京都大学)

プロフィール

京都大学 情報学研究科 教授.
音声情報処理,特に音声認識及び対話システムに関する研究に従事.
主著に,「音声認識システム」「音声対話システム」(いずれもオーム社).
情報処理学会,日本音響学会,電子情報通信学会,人工知能学会,言語処理学会,IEEE,ISCA,APSIPA 各会員.

研究分野

 
 

経歴

 
2003年4月
 - 
現在
京都大学 情報学研究科 教授
 
2006年4月
 - 
現在
情報通信研究機構 短時間研究員・招へい専門員
 
2003年4月
 - 
2016年3月
京都大学 学術情報メディアセンター 教授
 
1998年9月
 - 
2006年3月
ATR 客員研究員
 
1999年10月
 - 
2004年3月
国立国語研究所 非常勤研究員
 
1998年4月
 - 
2003年3月
京都大学 情報学研究科 助教授
 
1995年6月
 - 
1998年4月
京都大学 工学部 助教授
 
1995年9月
 - 
1996年8月
米国ベル研究所 客員研究員
 
1990年11月
 - 
1995年5月
京都大学 工学部 助手
 

学歴

 
1987年3月
 - 
1989年4月
京都大学 工学研究科 情報工学専攻
 
1983年4月
 - 
1987年3月
京都大学 工学部 情報工学科
 

委員歴

 
2014年1月
 - 
2015年12月
APSIPA  VP-Publications (BoG member)
 
2014年6月
 - 
2015年6月
情報処理学会  理事
 
2008年4月
 - 
2012年3月
情報処理学会  音声言語情報処理研究会(SIG-SLP) 主査
 
2004年3月
 - 
2008年3月
言語処理学会  理事
 
2003年10月
 - 
2006年12月
IEEE SPS  Speech TC member
 

受賞

 
2012年
情報処理学会 論文賞
 
2012年
科学技術分野の文部科学大臣表彰科学技術賞
 
2011年
情報処理学会 喜安記念業績賞
 
2000年
情報処理学会 坂井記念特別賞
 
1997年
日本音響学会 粟屋学術奨励賞
 

論文

 
Articulatory Modeling for Pronunciation Error Detection without Non-native Training Data based on DNN Transfer Learning
R.Duan, T.Kawahara, M.Dantsuji, J.Zhang
IEICE Trans.   E100-D(9) 2174-2182   2017年   [査読有り]
Assistive Typing Application for Older Adults Based on Input Stumble Detection
T.Hagiya, T.Horiuchi, T.Yazaki, T.Kato, T.Kawahara
J. Information Processing   25    2017年   [査読有り]
Partial and Synchronized Captioning: A new tool to assist learners in developing second language listening skill
M.Mirzaei, K.Meshgi, Y.Akita, T.Kawahara
ReCALL Journal   29(2) 2174-2182   2017年   [査読有り]
音声応用システム
河原 達也
電子情報通信学会100年史   367-370   2017年   [招待有り]
議会会議録における整文過程の分析
河原 達也
日本の速記   (938) 17-20   2017年   [招待有り]
Cross-Domain Speech Recognition using Nonparallel Corpora with Cycle-consistent Adversarial Networks
M.Mimura, S.Sakai, T.Kawahara
Proc. IEEE Workshop Automatic Speech Recognition & Understanding (ASRU)      2017年   [査読有り]
Incremental Training and Constructing the Very Deep Convolutional Residual Network Acoustic Models
S.Li, X.Lu, P.Shen, R.Takashima, T.Kawahara, H.Kawai
Proc. IEEE Workshop Automatic Speech Recognition & Understanding (ASRU)      2017年   [査読有り]
Automatic Meeting Transcription System for the Japanese Parliament (Diet)
T.Kawahara
Proc. APSIPA ASC      2017年   [査読有り][招待有り]
Emotion Recognition by Combining Prosody and Sentiment Analysis for Expressing Reactive Emotion by Humanoid Robot
Y.Li, C.T.Ishi, N.Ward, K.Inoue, S.Nakamura, K.Takanashi, T.Kawahara
Proc. APSIPA ASC      2017年   [査読有り]
Joint Learning of Dialog Act Segmentation and Recognition in Spoken Dialog Using Neural Networks
T.Zhao, T.Kawahara
Proc. IJCNLP      2017年   [査読有り]
Modeling Difficulties of Second Language Learners using Speech Technology
T.Kawahara
Proc. Seoul International Conference on Speech Sciences (SICSS)      2017年   [査読有り][招待有り]
Detection of Social Signals for Recognizing Engagement in Human-Robot Interaction
D.Lala, K.Inoue, P.Milhorat, T.Kawahara
Proc. AAAI Fall Sympo. Natural Communication for Human-Robot Collaboration      2017年   [査読有り]
Semi-Blind Speech Enhancement Based On Recurrent Neural Network For Source Separation And Dereverberation
M.Wake, Y.B,o, M.Mimura, K.Itoyama, K.Yoshii, T.Kawahara
Proc. IEEE Machine Learning for Signal Processing Workshop (MLSP)      2017年   [査読有り]
Detecting listening difficulty for second language learners using Automatic Speech Recognition errors
M.Mirzaei, K.Meshgi, T.Kawahara
Proc. Workshop Speech \& Language Technology for Education (SLaTE)   164-168   2017年   [査読有り]
Transfer Learning based Non-native Acoustic Modeling for Pronunciation Error Detection
R.Duan, T.Kawahara, M.Dantsuji, H.Nanjo
Proc. Workshop Speech \& Language Technology for Education (SLaTE)   50-54   2017年   [査読有り]
Listening Difficulty Detection to Foster Second Language Listening with the Partial and Synchronized Caption System
M.Mirzaei, K.Meshgi, T.Kawahara
Proc. EUROCALL   50-54   2017年   [査読有り]
Combined Multi-channel NMF-based Robust Beamforming for Noisy Speech Recognition
M.Mimura, Y.B,o, K.Shimada, S.Sakai, K.Yoshii, T.Kawahara
Proc. INTERSPEECH   2451-2455   2017年   [査読有り]
Analysis of the Relationship between Prosodic Features of Fillers and Its Forms or Occurrence Positions
S.Nakamura, R.Nakanishi, K.Takanashi, T.Kawahara
Proc. INTERSPEECH   1726-1230   2017年   [査読有り]
Social Signal Detection in Spontaneous Dialogue Using Bidirectional LSTM-CTC
H.Inaguma, K.Inoue, M.Mimura, T.Kawahara
Proc. INTERSPEECH   1691-1695   2017年   [査読有り]
Attentive Listening System with Backchanneling, Response Generation and Flexible Turn-taking
D.Lala, P.Milhorat, K.Inoue, M.Ishida, K.Takanashi, T.Kawahara
Proc. SIGdial Meeting Discourse & Dialogue   127-136   2017年   [査読有り]
A Conversational Dialogue Manager for the Humanoid Robot ERICA
P.Milhorat, D.Lala, K.Inoue, Z.Tianyu, M.Ishida, K.Takanashi, S.Nakamura, T.Kawahara
Proc. Int'l Workshop Spoken Dialogue Systems (IWSDS)      2017年   [査読有り]
Effective Articulatory Modeling for Pronunciation Error Detection of L2 Learner without Non-native Training Data
R.Duan, T.Kawahara, M.Dantsuji, J.Zhang
Proc. IEEE-ICASSP   5815-5819   2017年   [査読有り]
Semi-supervised Ensemble DNN Acoustic Model Training
S.Li, X.Lu, S.Sakai, M.Mimura, T.Kawahara
Proc. IEEE-ICASSP   5270-5274   2017年   [査読有り]
Bayesian Multichannel Nonnegative Matrix Factorization for Audio Source Separation and Localization
K.Itakura, Y.B,o, E.Nakamura, K.Itoyama, K.Yoshii, T.Kawahara
Proc. IEEE-ICASSP   551-555   2017年   [査読有り]
Utterance behavior of users while playing basketball with a virtual teammate
D.Lala, Y.Li, T.Kawahara
Proc. ICAART   28-38   2017年   [査読有り]
Semi-supervised Acoustic Model Training by Discriminative Data Selection from Multiple ASR Systems' Hypotheses
S.Li, Y.Akita, T.Kawahara
IEEE/ACM Trans. Audio Speech & Language Process.   24(9) 2174-2182   2016年   [査読有り]
傾聴対話システムのための言語情報と韻律情報に基づく 多様な形態の相槌の生成
山口 貴史, 井上 昂治, 吉野 幸一郎, 高梨 克也, Nigel G. Ward, 河原 達也
人工知能学会論文誌   31(4) 2174-2182   2016年   [査読有り]
Multi-modal Sensing and Analysis of Poster Conversations with Smart Posterboard
T.Kawahara, T.Iwatate, K.Inoue, S.Hayashi, H.Yoshimoto, K.Takanashi
APSIPA Trans. Signal & Information Process.   5(e2) 1-12   2016年   [査読有り]
多人数会話における音響・視線情報を統合した話者区間検出
井上 昂治, 若林 佑幸, 吉本 廣雅, 河原 達也
電子情報通信学会論文誌   J99-D(3) 348-357   2016年   [査読有り]
視聴覚情報の統合に基づく音源数推定と話者ダイアライゼーション
若林 佑幸, 井上 昂治, 中山 雅人, 西浦 敬信, 山下 洋一, 吉本 廣雅, 河原 達也
電子情報通信学会論文誌   J99-D(3) 326-336   2016年   [査読有り]
音声認識・画像認識における機械学習の最近の動向
河原 達也, 原田 達也
システム/制御/情報   60(3) 113-119   2016年   [招待有り]
Multi-lingual and Multi-task DNN Learning for Articulatory Error Detection
R.Duan, T.Kawahara, M.Dantsuji, J.Zhang
Proc. APSIPA ASC      2016年   [査読有り]
ASR errors as predictor of L2 listening difficulties and PSC enhancement
M.Mirzaei, K.Meshgi, T.Kawahara
Proc. Coling Workshop on Computational Linguistics for Linguistic Complexity (CL4LC)   192-201   2016年   [査読有り]
Annotation and analysis of listener's engagement based on multi-modal behaviors
K.Inoue, D.Lala, S.Nakamura, K.Takanashi, T.Kawahara
Proc. ICMI Workshop on Multimodal Analyses enabling Artificial Agents in Human-Machine Interaction (MA3HMI)      2016年   [査読有り]
Prediction of Ice-breaking Between Participants Using Prosodic Features in the First Meeting Dialogue
H.Inaguma, K.Inoue, S.Nakamura, K.Takanashi, T.Kawahara
Proc. ICMI Workshop on Advancements in Social Signal Processing for Multimodal Interaction (ASSP4MI)      2016年   [査読有り]
Multimodal interaction with the autonomous android ERICA
D.Lala, P.Milhorat, K.Inoue, T.Zhao, T.Kawahara
Proc. ICMI   Demo. Paper 417-418   2016年   [査読有り]
Pronunaciation Error Detection using DNN Articulatory Model based on Multi-lingual and Multi-task Learning
R.Duan, T.Kawahara, M.Dantsuji, J.Zhang
Proc. Int'l Sympo. Chinese Spoken Language Processing (ISCSLP)      2016年   [査読有り]
Confidence Estimation for Speech Recognition Systems using Conditional Random Fields Trained with Partially Annotated Data
S.Li, X.Lu, S.Mori, Y.Akita, T.Kawahara
Proc. Int'l Sympo. Chinese Spoken Language Processing (ISCSLP)      2016年   [査読有り]
Managing Dialog and Joint Actions for Virtual Basketball Teammates
D.Lala, T.Kawahara
Proc. IVA   Poster    2016年   [査読有り]
Talking with ERICA, an autonomous android
K.Inoue, P.Milhorat, D.Lala, T.Zhao, T.Kawahara
Proc. SIGdial Meeting Discourse & Dialogue   Demo. Paper 212-215   2016年   [査読有り]
Joint Optimization of Denoising Autoencoder and DNN Acoustic Model Based on Multi-target Learning for Noisy Speech Recognition
M.Mimura, S.Sakai, T.Kawahara
Proc. INTERSPEECH   3803-3807   2016年   [査読有り]
Prediction and Generation of Backchannel Form for Attentive Listening Systems
T.Kawahara, T.Yamaguchi, K.Inoue, K.Takanashi, N.Ward
Proc. INTERSPEECH   2890-2894   2016年   [査読有り]
ERICA: The ERATO Intelligent Conversational Android
D.F.Glas, T.Minato, C.T.Ishi, T.Kawahara, H.Ishiguro
Proc. RO-MAN   22-29   2016年   [査読有り]
Leveraging Automatic Speech Recognition Errors to Detect Challenging Speech Segments in TED Talks
M.Mirzaei, K.Meshgi, T.Kawahara
Proc. EUROCALL   313-318   2016年   [査読有り]
Interactional and Pragmatics-related Prosodic Patterns in Mandarin Dialog
N.Ward, Y.Li, T.Zhao, T.Kawahara
Proc. Int'l Conf. Speech Prosody      2016年   [査読有り]
Data Selection from Multiple ASR Systems' Hypotheses for Unsupervised Acoustic Model Training
S.Li, Y.Akita, T.Kawahara
Proc. IEEE-ICASSP   5875-5879   2016年   [査読有り]
Analysis and Prediction of Morphological Patterns of Backchannels for Attentive Listening Agents
T.Yamaguchi, K.Inoue, K.Yoshino, K.Takanashi, N.Ward, T.Kawahara
Proc. Int'l Workshop Spoken Dialogue Systems (IWSDS)      2016年   [査読有り]
講演音声認識のための類似話者選択に基づくDNN-HMMの教師なし適応
三村 正人, 河原 達也
電子情報通信学会論文誌   J98-D(11) 1411-1418   2015年   [査読有り]
Conversational System for Information Navigation based on POMDP with User Focus Tracking
K.Yoshino, T.Kawahara
Computer Speech and Language   34 275-291   2015年   [査読有り]
Automatic Lecture Transcription based on Discriminative Data Selection for Lightly Supervised Acoustic Model Training
S.Li, Y.Akita, T.Kawahara
IEICE Trans.   E98-D(8) 1545-1552   2015年   [査読有り]

Misc

 
潜在キャラクタモデルによるリアルタイム対話エンゲージメント推定
井上 昂治, Divesh Lala, Pierrick Milhorat, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B508-18    2017年
自律型アンドロイドERICAにおける多様な聞き手応答を用いた傾聴対話
井上 昂治, Divesh Lala, Pierrick Milhorat, 石田 真也, 趙 天雨, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B508-11    2017年
自律型アンドロイドの対話の振る舞い制御モデルによる キャラクタ表現法の検討
山本 賢太, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B508-05    2017年
雑音環境下音声認識のための多チャネル非負値行列因子分解に基づく 教師なしビームフォーマ
島田 一希, 坂東 宜昭, 三村 正人, 糸山 克寿, 吉井 和佳, 河原 達也
電子情報通信学会技術研究報告   SP2017-23    2017年
再帰型ニューラルネットワークを用いたセミブラインド音声分離・強調
和気 雅弥, 坂東 宜昭, 三村 正人, 糸山 克寿, 吉井 和佳, 河原 達也
電子情報通信学会技術研究報告   SP2017-22    2017年
深層生成モデルを事前分布に用いた教師なし音声強調
坂東 宜昭, 三村 正人, 糸山 克寿, 吉井 和佳, 河原 達也
電子情報通信学会技術研究報告   SP2017-20    2017年
End-to-EndモデルによるSocial Signals検出および音声認識との統合
稲熊 寛文, 井上 昂治, 三村 正人, 河原 達也
情報処理学会研究報告   SLP-117-7    2017年
Emotion Recognition by Combining Prosody with Text Information and Assessment Selection for Human-Robot Interaction
Yuanchao Li, Inoue Koji, Shizuka Nakamura, Katsuya Takanashi, Toshinori Ishi Carlos, Tatsuya Kawahara
人工知能学会研究会資料   SLUD-B506-09    2017年
円滑な発話権制御のための談話行為の連鎖に基づく フィラーの生起と形態の予測
中西 亮輔, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B506-04    2017年
フィラーの韻律的特徴と形態および生起位置との関係の分析
中村 静, 中西 亮輔, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B506-03    2017年
自律型アンドロイドによる対話における同調的笑いの生成
勝見 久央, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
情報処理学会研究報告   SLP-116-4    2017年
LSTM-CTCによる音声対話におけるSocial Signalsの検出
稲熊 寛文, 井上 昂治, 三村 正人, 河原 達也
情報処理学会研究報告   SLP-115-9    2017年
潜在キャラクタモデルによる聞き手のふるまいに基づく 対話エンゲージメントの推定
井上 昂治, Lala Divesh, 吉井 和佳, 高梨 克也, 河原 達也
日本音響学会研究発表会講演論文集   2-Q-12    2017年
Language Independent Non-native Articulatory Modeling for Pronunciation Error Detection
Richeng Duan, Tatsuya Kawahara, Masatake Dantsuji, Hiroaki Nanjo
日本音響学会研究発表会講演論文集   2002/11/8    2017年
End-to-Endモデルによる音声対話中のSocial Signalsの検出
稲熊 寛文, 井上 昂治, 三村 正人, 河原 達也
日本音響学会研究発表会講演論文集   2001/10/16    2017年
ニューラルネットによる音声対話における非言語的振る舞いの検出
稲熊 寛文, 井上 昂治, 河原 達也
情報処理学会全国大会講演論文集   7M-04    2017年
傾聴対話システムにおける自分語りを含む多様な聞き手応答の生成
石田 真也, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
情報処理学会全国大会講演論文集   7M-02    2017年
自律型アンドロイドのキャラクタ表現のための対話の振る舞い制御
山本 賢太, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
情報処理学会全国大会講演論文集   7M-01    2017年
遠隔音声認識のためのブラインド音源分離に基づくビームフォーマ
島田 一希, 坂東 宜昭, 板倉 光佑, 三村 正人, 糸山 克寿, 吉井 和佳, 河原 達也
情報処理学会全国大会講演論文集   6M-02    2017年
ロボット対話における深層学習を用いたセミブラインド音声強調
和気 雅弥, 坂東 宜昭, 三村 正人, 糸山 克寿, 吉井 和佳, 河原 達也
情報処理学会全国大会講演論文集   6M-01    2017年
聞き手の多様なふるまいに基づく対話エンゲージメントの推定
井上 昂治, Lala Divesh, 高梨 克也, 河原 達也
日本音響学会研究発表会講演論文集   2003/5/1    2017年
Effective Articulatory Modeling for Pronunciation Error Detection
Richeng Duan, Tatsuya Kawahara, Masatake Dantsuji
日本音響学会研究発表会講演論文集   2-P-30    2017年
DAEを用いたリアルタイム遠隔音声認識
井上 昂治, 三村 正人, 石井 カルロス寿憲, 坂井 信輔, 河原 達也
日本音響学会研究発表会講演論文集   1-Q-6    2017年
自動音声認識を用いた放送大学のオンライン授業に対する字幕付与
河原 達也, 秋田 祐哉, 広瀬 洋子
情報処理学会研究報告   AAC-2-5    2016年
マルチチャネル音源分離のための低ランク音源モデルと スパース重畳過程に基づくネスト型ベイズ混合・因子モデル
板倉 光佑, 坂東 宜昭, 中村 栄太, 糸山 克寿, 吉井 和佳, 河原 達也
電子情報通信学会技術研究報告   IBISML2016-95    2016年
発話行為の連鎖を考慮したフィラーの生起と形態の分析
中西 亮輔, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B505-30    2016年
初対面対話における韻律的特徴に基づくアイスブレーキングの分析と予測
稲熊 寛文, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B505-29    2016年
階層ベイズモデルを用いた聞き手の多様なふるまいに基づく 対話エンゲージメントの推定
井上 昂治, Divesh Lala, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B505-28    2016年
自律型アンドロイドERICAによる社会的役割に則したインタラクション
井上 昂治, Pierrick Milhorat, Divesh Lala, 趙 天雨, 河原 達也
人工知能学会研究会資料   SLUD-B505-7    2016年
Pronunciation Error Detection using DNN Articulatory Model based on Transfer Learning
Richeng Duan, Tatsuya Kawahara, Masatake Dantsuji
電子情報通信学会技術研究報告   SP2016-39    2016年
変分ベイズ多チャネルロバストNMFに基づく マイクロホンの移動・被覆を許容する音声強調
坂東 宜昭, 糸山 克寿, 昆陽 雅司, 田所 諭, 中臺 一博, 吉井 和佳, 河原 達也, 奥乃 博
電子情報通信学会技術研究報告   SP2016-36    2016年
マルチチャネル音源分離のためのネスト型基底・音源混合モデルに基づく 時間周波数クラスタリング
板倉 光佑, 坂東 宜昭, 中村 栄太, 糸山 克寿, 吉井 和佳, 河原 達也
電子情報通信学会技術研究報告   SP2016-31    2016年
傾聴対話システムのための発話を促す聞き手応答の生成
石田 真也, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B504-1    2016年
講演のリアルタイム字幕付与のための音声認識結果の簡約
大田 健翔, 秋田 祐哉, 河原 達也
情報処理学会研究報告   SLP-112-12    2016年
自律型アンドロイドによる円滑な発話権制御のための フィラーの生起位置と形態の分析
中西 亮輔, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B503-11    2016年
相槌「うん」と「うーん」の表記の問題と韻律的な特徴
中村 静, 高梨 克也, 山口 貴史, Nigel Ward, 河原 達也
人工知能学会研究会資料   SLUD-B503-10    2016年
Pronunciation Error Detection using DNN Articulatory Model based on Multi-lingual and Multi-task Learning
Richeng Duan, Tatsuya Kawahara, Masatake Dantsuji
日本音響学会研究発表会講演論文集   3-Q-23    2016年
Diversity-driven Semi-supervised Ensemble DNN Acoustic Model Training
Sheng Li, Xugang Lu, Shinsuke Sakai, Tatsuya Kawahara
電子情報通信学会技術研究報告   SP2016-40    2016年
初対面対話における場の和みのマルチモーダルな分析と検出
稲熊 寛文, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
情報処理学会全国大会講演論文集   6Q-02    2016年
傾聴対話システムのための多様な聞き手応答の生成
石田 真也, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
情報処理学会全国大会講演論文集   6Q-01    2016年
自律型アンドロイドERICAのための遠隔音声認識
井上 昂治, 三村 正人, 石井 カルロス寿憲, 河原 達也
日本音響学会研究発表会講演論文集   2001/1/1    2016年
[特別講演] 音声認識技術の展開
河原 達也
電子情報通信学会技術研究報告   PRMU2015-111    2015年   [依頼有り]
Discriminative Data Selection from Multiple ASR Systems' Hypotheses for Unsupervised Acoustic Model Training
Sheng Li, Yuya Akita, Tatsuya Kawahara
情報処理学会研究報告   SLP-109-8    2015年
音声認識を用いた講義・講演の字幕作成・編集システム
秋田 祐哉, 三村 正人, 河原 達也
情報処理学会研究報告   SLP-108-2    2015年
自律型アンドロイドEricaのための音声対話システム
井上 昂治, 河原 達也
人工知能学会研究会資料   SLUD-B502-5    2015年
多様な相槌をうつ傾聴対話システムのための相槌形態の予測
山口 貴史, 井上 昂治, 吉野 幸一郎, 高梨 克也, Nigel Ward, 河原 達也
人工知能学会研究会資料   SLUD-B502-1    2015年
スマートポスターボードにおける視線情報を用いた話者区間及び相槌の検出
井上 昂治, 若林 佑幸, 吉本 廣雅, 高梨 克也, 河原 達也
情報処理学会研究報告   MUS-107-68    2015年
傾聴対話における相槌形態と先行発話の統語構造の関係の分析
山口 貴史, 井上 昂治, 吉野 幸一郎, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B403-4    2015年
ポスター会話における音響・視線情報を統合した話者区間及び相槌の検出
井上 昂治, 若林 佑幸, 吉本 廣雅, 高梨 克也, 河原 達也
情報処理学会研究報告   SLP-105-9    2015年
ポスター会話における音響・視線情報の確率的統合による 話者区間及び相槌の検出
井上 昂治, 若林 佑幸, 吉本 廣雅, 高梨 克也, 河原 達也
日本音響学会研究発表会講演論文集   2002/2/4    2015年
Effective Combination of Multiple ASR Hypotheses with CRF-based Classifiers
Sheng Li, Yuya Akita, Tatsuya Kawahara
日本音響学会研究発表会講演論文集   1-Q-14    2015年
音素クラス特徴量を用いたLSTMによる残響下音声認識
三村 正人, 坂井 信輔, 河原 達也
日本音響学会研究発表会講演論文集   1-Q-7    2015年
スマートポスターボードにおける視線情報を用いた 話者区間検出及び相槌の同定
井上 昂治, 若林 佑幸, 吉本 廣雅, 高梨 克也, 河原 達也
情報処理学会全国大会講演論文集   6P-09    2015年
多様な形態の相槌をうつ音声対話システムのための傾聴対話の分析
山口 貴史, 吉野 幸一郎, 高梨 克也, 河原 達也
情報処理学会全国大会講演論文集   6P-08    2015年
講演音声認識結果の誤り箇所の復唱入力を用いたノートテイクシステム
大田 健翔, 秋田 祐哉, 河原 達也
情報処理学会全国大会講演論文集   5P-06    2015年
ユーザの焦点を用いたPOMDPによる音声情報案内システム
吉野 幸一郎, 河原 達也
情報処理学会全国大会講演論文集   3D-01    2015年
部分的アノテーションコーパスから学習可能な固有表現認識器
笹田 鉄郎, 森 信介, 河原 達也, 山肩 洋子
言語処理学会年次大会発表論文集   B5-4 748-751   2015年
拡散性雑音環境下における多人数会話のマルチモーダル話者区間検出
若林 佑幸, 中山 雅人, 西浦 敬信, 山下 洋一, 井上 昂治, 吉本 廣雅, 河原 達也
日本音響学会研究発表会講演論文集   1-Q-24    2015年
Incorporating divergences from hypotheses of multiple ASR systems to improve unsupervised acoustic model training
Sheng Li, Yuya Akita, Tatsuya Kawahara
日本音響学会研究発表会講演論文集   1-P-23    2015年
音素クラス情報を用いたディープオートエンコーダによる残響下音声認識
三村 正人, 坂井 信輔, 河原 達也
日本音響学会研究発表会講演論文集   1-P-22    2015年
ユーザの焦点を用いたPOMDPによる音声情報案内システム
吉野 幸一郎, 河原 達也
人工知能学会研究会資料   SLUD-B402-14    2014年
音声認識技術の活用による国会審議映像検索システムの実現
鈴木 泰山, 内山 雄司, 青木 保一, 相良 毅, 秋田 祐哉, 河原 達也, 竹田 香織, 増山 幹高
情報処理学会研究報告   SLP-103-5    2014年
Classifier-based Data Selection for Lightly-Supervised Training of Acoustic Model for Lecture Transcription
Sheng Li, Yuya Akita, Tatsuya Kawahara
情報処理学会研究報告   SLP-102-4    2014年
講演スライドの文字認識結果を用いた音声認識の改善
童 弋正, 秋田 祐哉, 河原 達也
情報処理学会研究報告   SLP-102-3    2014年
多人数会話における視線情報を用いた話者区間検出
井上 昂治, 若林 佑幸, 吉本 廣雅, 河原 達也
情報処理学会研究報告   SLP-102-1    2014年
Partial and Synchronized Caption Generation to Enhance the Listening Comprehension Skills of Second Language Learners
Maryam Sadat Mirzaei, Tatsuya Kawahara
情報処理学会研究報告   SLP-101-15    2014年
スマートポスターボード: ポスター会話のマルチモーダルなセンシングと解析
河原達也
人工知能学会研究会資料   Challenge-B303-1    2014年   [依頼有り]
傾聴対話における相槌の韻律的特徴の同調傾向の分析
上里 美樹, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B303-02    2014年
音声言語情報処理研究会の20年―歴代主査による研究レビュー―
新田 恒雄, 小林 哲則, 中村 哲, 武田 一哉, 河原 達也, 伊藤 彰則
情報処理学会研究報告   SLP-100-5    2014年
音声認識の方法論に関する考察―世代交代に向けて―
河原 達也
情報処理学会研究報告   SLP-100-3    2014年   [依頼有り]
多人数会話における音響情報と視線情報の確率的統合による話者区間検出
井上 昂治, 若林 佑幸, 吉本 廣雅, 河原 達也
日本音響学会研究発表会講演論文集   2002/8/4    2014年
ディープオートエンコーダとDNN-HMMを用いた残響下音声認識
三村 正人, 坂井 信輔, 河原 達也
情報処理学会研究報告   SLP-102-6    2014年
Unsupervised Training of Deep Neural Network Acoustic Models for Lecture Transcription
Sheng Li, Yuya Akita, Tatsuya Kawahara
日本音響学会研究発表会講演論文集   1-R-4    2014年
ユーザの焦点に適応的な雑談型音声情報案内システム
吉野 幸一郎, 河原 達也
人工知能学会研究会資料   SLUD-B303-11 761-764   2014年
講演音声認識におけるDNN-HMMの教師なし話者適応
三村 正人, 河原 達也
日本音響学会研究発表会講演論文集   2-Q4-22    2014年
音声認識結果の有用性の自動判定に基づく 講義のリアルタイム字幕付与システム
桑原 暢弘, 秋田 祐哉, 河原 達也
音声ドキュメント処理ワークショップ   2002/4/5    2014年
スマートポスターボードにおける実環境を想定した複数話者分離
中井 駿介, 宮崎 亮一, 猿渡 洋, 中村 哲, 井上 昂治, 若林 佑幸, 河原 達也
日本音響学会研究発表会講演論文集   2-Q4-8    2014年
スマートポスターボードにおける音響情報と画像情報の統合による 話者区間検出
若林 佑幸, 井上 昂治, 河原 達也, 中井 駿介, 宮崎 亮一, 猿渡 洋
日本音響学会研究発表会講演論文集   2-Q4-7    2014年
Data Selection Assisted by Caption to Improve Acoustic Modeling for Lecture Transcription
Sheng Li, Yuya Akita, Tatsuya Kawahara
日本音響学会研究発表会講演論文集   2002/4/4    2014年
ポスター会話における聴衆のマルチモーダルな振る舞いに基づく 興味・理解度の推定
河原 達也, 林 宗一郎, 高梨 克也
情報処理学会研究報告   SLP-97-12    2013年
CSJを用いた日本語講演音声認識へのDNN-HMMの適用と話者適応の検討
三村 正人, 河原 達也
情報処理学会研究報告   SLP-97-9    2013年
述語項構造を介したWebテキストからの文選択に基づく言語モデルの評価
吉野 幸一郎, 森 信介, 河原 達也
情報処理学会研究報告   SLP-97-4    2013年
音声認識の方法論に関する考察―歴史的変遷と今後の展望―
河原 達也
情報処理学会研究報告   MUS-99-1    2013年   [依頼有り]
[特別講演] スマートポスターボード: ポスター発表における場のマルチモーダルなセンシングと認識
河原 達也
電子情報通信学会技術研究報告   PRMU2012-167    2013年   [依頼有り]
[招待講演] 音声対話システムの進化と淘汰
河原 達也
人工知能学会研究会資料   SLUD-B203-02    2013年   [依頼有り]
音声認識を用いたオンライン自動字幕作成・編集システム
秋田 祐哉, 河原 達也
日本音響学会研究発表会講演論文集   2002/8/4    2013年
Automatic transcription of Chinese spoken lectures
Sheng Li, Masato Mimura, Tatsuya Kawahara
日本音響学会研究発表会講演論文集   2-P-31    2013年
CSJを用いた日本語講演音声認識用DNN-HMMの構築
三村 正人, 河原 達也
日本音響学会研究発表会講演論文集   1-P-42b    2013年
オープンコースウェアの講演を対象とした音声認識に基づく字幕付与
秋田 祐哉, 河原 達也
日本音響学会研究発表会講演論文集   2002/9/9    2013年
Combining Active Learning and Partial Annotation for Japanese Dependency Parsing
Daniel Flannery, 宮尾祐介, 森 信介, 河原 達也
言語処理学会年次大会発表論文集   D1-1 42-45   2013年
点予測による述語項構造解析
吉野 幸一郎, 森 信介, 河原 達也
情報処理学会研究報告   NL-209-6    2012年
議会の会議録作成のための音声認識−衆議院のシステムの概要−
河原 達也
情報処理学会研究報告   SLP-93-5    2012年
素性頻度ファイルと部分的アノテーションコーパスからの単語分割器の学習
笹田 鉄郎, 森 信介, Graham Neubig, 河原 達也
情報処理学会研究報告   NL-207-8    2012年
Comparison of Discriminative Models for Lexicon Optimization for ASR of Agglutinative Language
Mijit Ablimit, Tatsuya Kawahara, Askar Hamdulla
情報処理学会研究報告   SLP-92-13    2012年
Wavelet Packet Decomposition Approach to Reverberant Speech Recognition
R,y Gomez, Tatsuya Kawahara
情報処理学会研究報告   SLP-92-11    2012年
[招待講演] スマートポスターボード: ポスター会話のマルチモーダルなセンシングと認識
河原 達也
電子情報通信学会技術研究報告   SP2012-51    2012年   [依頼有り]
述語項構造を介した文の変換と選択に基づく音声対話用言語モデルの構築
吉野 幸一郎, 森 信介, 河原 達也
情報処理学会研究報告   SLP-91-3    2012年
ポスター会話におけるパラ言語・非言語情報を用いた 話者交替及び次話者の予測
岩立 卓真, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B103-10    2012年
Automatic transcription of TED Talks
Welly Naptali, Tatsuya Kawahara
音声ドキュメント処理ワークショップ      2012年
講演の音声認識と整形に基づく自動字幕付与
秋田 祐哉, 渡邉 真人, 河原 達也
日本音響学会研究発表会講演論文集   2001/1/18    2012年

書籍等出版物

 
音声認識システム 改訂2版
河原達也
オーム社   2016年   
知のバリアフリー
河原 達也 (担当:分担執筆, 範囲:第4章 聴覚障害学生支援の最先端 --音声認識による字幕付与技術.)
京都大学学術出版会   2014年   
Springer Handbook on Speech Processing and Speech Communication
Sadaoki Furui and Tatsuya Kawahara (担当:分担執筆, 範囲:Chpter 32: Transcription and distillation of spontaneous speech)
Springer   2008年   
音声対話システム
河原達也, 荒木雅弘
オーム社   2006年   
Spoken Language Systems
Seiichi Nakagawa, Michio Okada, and Tatsuya Kawahara, editors
Ohmsha/IOS Press   2005年   

講演・口頭発表等

 
音声認識・対話システムの最前線 [招待有り]
河原 達也
自動車技術会 エレクトロニクス部門委員会   2017年11月14日   
Computer-Assisted Language Learning (CALL) using speech technology [招待有り]
河原 達也
Seoul International Conference on Speech Sciences (SICSS2017)   2017年11月11日   
Modeling difficulties of second language learners using speech technology [招待有り]
河原 達也
Seoul International Conference on Speech Sciences (SICSS2017)   2017年11月10日   
会議録における整文過程の分析 -衆議院と欧州議会の比較及び過去十年の変化- [招待有り]
河原 達也
国会研究会   2017年9月20日   
What makes a quality transcript in Parliamentary reporting [招待有り]
河原 達也
Intersteno Conference   2017年7月25日   
音声認識技術の現状と裁判・取調べへの適用における課題 [招待有り]
河原 達也
日本弁護士連合会   2017年6月6日   
音声認識・対話 [招待有り]
河原 達也
応用脳科学アカデミー   2017年1月23日   
Speech Understanding for Intelligent Conversational Agent [招待有り]
河原 達也
Microsoft Research Asia Faculty Summit   2016年11月4日   
話がわかるコンピュータ -音声認識と会話ロボットの最前線- [招待有り]
河原 達也
京都大学「東京で学ぶ 京大の知」シリーズ23   2016年11月1日   
Captioning Lectures with Automatic Speech Recognition (ASR) [招待有り]
河原 達也
Intersteno Conference   2015年7月21日   
Recent Paradigm Shift in Speech Recognition [招待有り]
河原 達也
京都大学-稲盛財団合同京都賞シンポジウム   2014年7月13日   
スマートポスターボード: ポスター会話のマルチモーダルなセンシングと解析 [招待有り]
河原 達也
人工知能学会 AIチャレンジ研究会   2014年3月18日   
音声認識の方法論に関する考察―世代交代に向けて―. [招待有り]
河原 達也
情報処理学会 音声言語情報処理研究会(SLP)   2014年1月31日   
Smart Posterboard: Multi-modal Sensing and Analysis of Poster Conversations [招待有り]
河原 達也
Proc. APSIPA ASC   2013年10月30日   
Subtitling Lecture Videos with Automatic Speech Recognition [招待有り]
河原 達也
Intersteno Conference   2013年7月16日   
音声認識の方法論に関する考察―歴史的変遷と今後の展望―. [招待有り]
河原 達也
情報処理学会 音学シンポジウム   2013年5月11日   
音声対話システムの歴史と最近の技術動向 [招待有り]
河原達也
日本音響学会技術動向レビュー,東京工科大学,2013 年3 月12 日   2013年3月12日   
スマートポスターボード: ポスター発表における場のマルチモーダルなセンシングと認識. [招待有り]
河原達也
電子情報通信学会 パターン認識・メディア理解研究会(PRMU)   2013年2月22日   
音声対話システムの進化と淘汰 [招待有り]
河原 達也
人工知能学会 言語・音声理解と対話処理研究会(SLUD)   2013年2月1日   
Transcription System using Automatic Speech Recognition for the Japanese Parliament (Diet) [招待有り]
河原 達也
AAAI/IAAI   2012年7月26日   

担当経験のある科目

 
 

競争的資金等の研究課題

 
JST: 戦略的創造研究推進事業 CREST 「人間調和型情報環境」領域
研究期間: 2009年 - 2014年    代表者: 河原 達也
文部科学省: 科学研究費補助金(基盤研究(A))
研究期間: 2004年 - 2006年    代表者: 河原 達也
学会講演や大学の講義、放送番組や議会の討論などの音声アーカイブを対象として、自動音声認識及び書き起こしの自動整形に関する研究を行った。このような自然な話し言葉音声では、発音の変動が大きく、口語的な表現が多用されるため、これらの精緻なモデル化と統計的な学習が必要である。また、語彙や話題も多様であるため、個々の講演・講義・討論に対して適応を行う必要がある。そのため、以下のようなテーマに取り組んだ。・『日本語話し言葉コーパス』を用いた汎用的な発音変動モデルの統計的学習・統計的機械翻訳の枠組みに基...
文部科学省: 科学研究費補助金(特定領域研究)
研究期間: 2001年 - 2005年    代表者: 河原 達也
人間と共生する機械を実現するためには、システムがユーザのモデルを知覚し、それに応じて適応的に行動することが重要であると考えられる。本研究ではまず、音声対話によるインタフェースにおいて、協調的な応答を生成するためのユーザモデルについて検討を進めてきた。具体的には、システムに対する習熟度、タスクドメインに関する知識レベル、性急度の3つのユーザモデルを導入し、それに応じて対話制御を行う戦略を提案した。京都市バス運行情報案内システム(現在試験運用中:075-326-3116)において実装・評価を行...
人間どうしの音声コミュニケーションの認識・理解
JST: 戦略的創造研究推進事業 さきがけ 「協調と制御」領域
研究期間: 2001年 - 2004年    代表者: 河原 達也
文部科学省: 科学研究費補助金(基盤研究(B))
研究期間: 2000年 - 2002年    代表者: 河原 達也
講演や討論などの話し言葉の音声認識における問題を分析した上で、音響モデル・発音モデル・言語モデル・デコーダなどを検討・実装・評価した。学習・評価用のデータとして、開放的融合研究「話し言葉工学」プロジェクトで構築されている日本語話し言葉コーパスを用いた。話し言葉は書き言葉の読上げ音声と大きく性質が異なるため、それに合致したモデル化と認識手法の検討が必要となる。音響モデルについては発話スタイルとデータ量の影響を調べた。言語モデルについては,話し言葉コーパスのデータ量不足を補うために他のコーパス...
文部科学省: 科学研究費補助金(基盤研究(B))
研究期間: 1999年 - 2001年    代表者: 河原 達也
主に、英語を学習する日本人話者を対象として、発音訓練支援を行うCALLシステムの研究・開発をおこなった。具体的には以下の通りである。(1)誤りパターンの対判別を利用した日本人用英語発音教示システム 日本人学習者の典型的な英語発音誤りパターンのモデル化を行い、音声認識技術を用いて効果的に発音を教示するシステムを設計した。与えられた学習テキストに対して、誤りパターンに基づいて発音誤り候補を生成し、HMMによる認識器により、学習者の発音を同定、区分化する。HMMのみでは識別精度の信頼性が十分でな...