河原 達也

J-GLOBALへ         更新日: 19/09/03 01:15
 
アバター
研究者氏名
河原 達也
 
カワハラ タツヤ
URL
http://sap.ist.i.kyoto-u.ac.jp/members/kawahara/
所属
京都大学
部署
情報学研究科
職名
教授
学位
工学修士(京都大学), 工学博士(京都大学)
ORCID ID
0000-0002-2686-2296

プロフィール

京都大学 情報学研究科 教授.
音声情報処理,特に音声認識及び対話システムに関する研究に従事.
主著に,「音声認識システム」「音声対話システム」(いずれもオーム社).
IEEE Fellow.
情報処理学会,日本音響学会,電子情報通信学会,人工知能学会,言語処理学会,ISCA,APSIPA 各会員.
日本学術会議連携会員.

研究分野

 
 

経歴

 
2003年4月
 - 
現在
京都大学 情報学研究科 教授
 
2006年4月
 - 
現在
情報通信研究機構 短時間研究員・招へい専門員
 
2003年4月
 - 
2016年3月
京都大学 学術情報メディアセンター 教授
 
1998年9月
 - 
2006年3月
ATR 客員研究員
 
1999年10月
 - 
2004年3月
国立国語研究所 非常勤研究員
 
1998年4月
 - 
2003年3月
京都大学 情報学研究科 助教授
 
1995年6月
 - 
1998年4月
京都大学 工学部 助教授
 
1995年9月
 - 
1996年8月
米国ベル研究所 客員研究員
 
1990年11月
 - 
1995年5月
京都大学 工学部 助手
 

学歴

 
1987年3月
 - 
1989年4月
京都大学 工学研究科 情報工学専攻
 
1983年4月
 - 
1987年3月
京都大学 工学部 情報工学科
 

委員歴

 
2018年1月
 - 
現在
APSIPA  BoG member
 
2018年1月
 - 
現在
APSIPA Transactions on Signal and Information  Editor in Chief
 
2017年10月
 - 
現在
日本学術会議  連携会員
 
2017年9月
 - 
現在
ISCA  Board member
 
2017年1月
 - 
2018年12月
IEEE SPS Kansai Chapter  Chair
 

受賞

 
2012年
情報処理学会 論文賞
 
2012年
科学技術分野の文部科学大臣表彰科学技術賞
 
2011年
情報処理学会 喜安記念業績賞
 
2000年
情報処理学会 坂井記念特別賞
 
1997年
日本音響学会 粟屋学術奨励賞
 

論文

 
End-to-End Modeling for Selection of Utterance Constructional Units via System Internal States
K.Tanaka, K.Inoue, S.Nakamura, K.Takanashi, T.Kawahara
Proc. Int'l Workshop Spoken Dialogue Systems (IWSDS)      2019年   [査読有り]
Engagement-based Adaptive Behaviors for Laboratory Guide in Human-Robot Dialogue
K.Inoue, D.Lala, K.Yamamoto, K.Takanashi, T.Kawahara
Proc. Int'l Workshop Spoken Dialogue Systems (IWSDS)      2019年   [査読有り]
A Job Interview Dialogue System with Autonomous Android ERICA
K.Inoue, K.Hara, D.Lala, S.Nakamura, K.Takanashi, T.Kawahara
Proc. Int'l Workshop Spoken Dialogue Systems (IWSDS)      2019年   [査読有り]
Transfer Learning of Language-Independent End-to-End ASR with Language Model Fusion
H.Inaguma, J.Cho, M.K.Baskar, T.Kawahara, S.Watanabe
Proc. IEEE-ICASSP   6096-6100   2019年   [査読有り]
Multi-speaker Sequence-to-Sequence Speech Synthesis for Data Augmentation in Acoustic-to-Word Speech Recognition
S.Ueno, M.Mimura, S.Sakai, T.Kawahara
Proc. IEEE-ICASSP   6161-6165   2019年   [査読有り]
Prosodic Characteristics of Japanese Newscaster Speech for Different Speaking Situations
S.Nakamura, C.T.Ishi, T.Kawahara
Proc. Int'l Congress Phonetic Sciences (ICPhS)      2019年   [査読有り]
ERICA and WikiTalk
D.Lala, G.Wilcock, K.Jokinen, T.Kawahara
Proc. IJCAI   Demo. Paper    2019年   [査読有り]
Improving Transformer-based Speech Recognition Systems with Compressed Structure and Speech Attributes Augmentation
S.Li, R.Dabre, X.Lu, P.Shen, T.Kawahara, H.Kawai
Proc. INTERSPEECH      2019年   [査読有り]
Investigating Radical-based End-to-End Speech Recognition Systems for Chinese Dialects and Japanese
S.Li, X.Lu, C.Ding, P.Shen, T.Kawahara, H.Kawai
Proc. INTERSPEECH      2019年   [査読有り]
End-to-End Articulatory Attribute Modeling for Low-resource Multilingual Speech Recognition
S.Li, C.Ding, X.Lu, P.Shen, T.Kawahara, H.Kawai
Proc. INTERSPEECH      2019年   [査読有り]
Improved End-to-End Speech Emotion Recognition Using Self Attention Mechanism and Multitask Learning
Y.Li, T.Zhao, T.Kawahara
Proc. INTERSPEECH      2019年   [査読有り]
Analysis of effect and timing of fillers in natural turn-taking
D.Lala, S.Nakamura, T.Kawahara
Proc. INTERSPEECH      2019年   [査読有り]
Turn-taking Prediction Based on Detection of Transition Relevance Place
K.Hara, K.Inoue, K.Takanashi, T.Kawahara
Proc. INTERSPEECH      2019年   [査読有り]
Unsupervised Speech Enhancement Based on Multichannel NMF-Informed Beamforming for Noise-Robust Automatic Speech Recognition
K.Shimada, Y.Bando, M.Mimura, K.Itoyama, K.Yoshii, T.Kawahara
IEEE/ACM Trans. Audio Speech & Language Process.   27 108-127   2019年   [査読有り]
Joint Dialog Act Segmentation and Recognition in Human Conversations Using Attention to Dialog Context
T.Zhao, T.Kawahara
Computer Speech and Language   50 108-127   2019年   [査読有り]
聴覚障害者のための講演・講義の音声認識による字幕付与
河原 達也, 秋田 祐哉
日本音響学会誌   74(3) 156-162   2018年   [招待有り]
会議録作成を支援するICT
河原 達也, 荒木 章子
電子情報通信学会誌   101(5) 486-491   2018年   [招待有り]
音声認識技術の変遷と最先端−深層学習によるEnd-to-Endモデル−
河原 達也
日本音響学会誌   74(7) 381-386   2018年   [招待有り]
音声認識技術の変遷と展望
河原 達也
自動認識   31(10) 55-58   2018年10月   [招待有り]
Voice Input Tutoring System for Older Adults using Input Stumble Detection
T.Hagiya, K.Hoashi, T.Kawahara
Proc. ACM Int'l Conf. Intelligent User Interfaces (IUI)   415-419   2018年   [査読有り]
Audio-Visual Conversation Analysis by Smart Posterboard and Humanoid Robot
T.Kawahara, K.Inoue, D.Lala, K.Takanashi
Proc. IEEE-ICASSP   6573-6577   2018年   [査読有り]
An End-to-End Approach to Joint Social Signal Detection and Automatic Speech Recognition
H.Inaguma, M.Mimura, K.Inoue, K.Yoshii, T.Kawahara
Proc. IEEE-ICASSP   6214-6218   2018年   [査読有り]
Efficient Learning of Articulatory Models based on Multi-label Training and Label Correction for Pronunciation Learning
R.Duan, T.Kawahara, M.Dantsuji, H.Nanjo
Proc. IEEE-ICASSP   6239-6243   2018年   [査読有り]
Unsupervised Beamforming based on Multichannel Nonnegative Matrix Factorization for Noisy Speech Recognition
K.Shimada, Y.Bando, M.Mimura, K.Itoyama, K.Yoshii, T.Kawahara
Proc. IEEE-ICASSP   5734-5738   2018年   [査読有り]
Statistical Speech Enhancement based on Probabilistic Integration of Variational Autoencoder and Non-negative Matrix Factorization
Y.Bando, M.Mimura, K.Itoyama, K.Yoshii, T.Kawahara
Proc. IEEE-ICASSP   716-720   2018年   [査読有り]
Acoustic-to-Word Attention-based Model Complemented with Character-level CTC-based Model
S.Ueno, H.Inaguma, M.Mimura, T.Kawahara
Proc. IEEE-ICASSP   5804-5808   2018年   [査読有り]
Spoken Dialogue System for a Human-like Conversational Robot ERICA
T.Kawahara
Proc. Int'l Workshop Spoken Dialogue Systems (IWSDS)   201-208   2018年   [招待有り]
Generating Fillers based on Dialog Act Pairs for Smooth Turn-Taking by Humanoid Robot
R.Nakanishi, K.Inoue, S.Nakamura, K.Takanashi, T.Kawahara
Proc. Int'l Workshop Spoken Dialogue Systems (IWSDS)      2018年   [査読有り]
Latent Character Model for Engagement Recognition Based on Multimodal Behaviors
K.Inoue, D.Lala, K.Takanashi, T.Kawahara
Proc. Int'l Workshop Spoken Dialogue Systems (IWSDS)      2018年   [査読有り]
A Unified Neural Architecture for Joint Dialog Act Segmentation and Recognition in Spoken Dialog System
T.Zhao, T.Kawahara
Proc. SIGdial Meeting Discourse & Dialogue   201-208   2018年   [査読有り]
Engagement Recognition in Spoken Dialogue via Neural Network by Aggregating Different Annotators' Models
K.Inoue, D.Lala, K.Takanashi, T.Kawahara
Proc. INTERSPEECH   616-626   2018年   [査読有り]
Prediction of Turn-taking Using Multitask Learning with Prediction of Backchannels and Fillers
K.Hara, K.Inoue, K.Takanashi, T.Kawahara
Proc. INTERSPEECH   991-995   2018年   [査読有り]
Forward-Backward Attention Decoder
M.Mimura, S.Sakai, T.Kawahara
Proc. INTERSPEECH   2232-2236   2018年   [査読有り]
Encoder Transfer for Attention-based Acoustic-to-word Speech Recognition
S.Ueno, T.Moriya, M.Mimura, S.Sakai, Y.Yamaguchi, Y.Aono, T.Kawahara
Proc. INTERSPEECH   2424-2428   2018年   [査読有り]
Improving CTC-based Acoustic Model with Very Deep Residual Time-delay Neural Networks
S.Li, X.Lu, R.Takashima, P.Shen, T.Kawahara, H.Kawai
Proc. INTERSPEECH   3708-3712   2018年   [査読有り]
Independent Low-Rank Tensor Analysis for Audio Source Separation
K.Yoshii, K.Kitamura, Y.Bando, E.Nakamura, T.Kawahara
Proc. EUSIPCO   1671-1675   2018年   [査読有り]
Evaluation of real-time deep learning turn-taking models for multiple dialogue scenarios
D.Lala, K.Inoue, T.Kawahara
Proc. ICMI   78-86   2018年   [査読有り]
Human-like Conversational Robot
T.Kawahara
Proc. APSIPA ASC   1233-1239   2018年   [招待有り]
Bayesian Multichannel Speech Enhancement with a Deep Speech Prior
K.Sekiguchi, Y.Bando, K.Yoshii, T.Kawahara
Proc. APSIPA ASC   1233-1239   2018年   [査読有り]
Dialogue Behavior Control Model for Expressing a Character of Humanoid Robots
K.Yamamoto, K.Inoue, S.Nakamura, K.Takanashi, T.Kawahara
Proc. APSIPA ASC   1732-1737   2018年   [査読有り]
Improving Very Deep Time-Delay Neural Network with Vertical-Attention for Effectively Training CTC-based ASR Systems
S.Li, X.Lu, R.Takashima, P.Shen, T.Kawahara, H.Kawai
Proc. IEEE Spoken Language Technology Workshop (SLT)   77-83   2018年   [査読有り]
Improving OOV Detection and Resolution with External Language Models in Acoustic-to-Word ASR
H.Inaguma, M.Mimura, S.Sakai, T.Kawahara
Proc. IEEE Spoken Language Technology Workshop (SLT)   212-218   2018年   [査読有り]
Leveraging Sequence-to-Sequence Speech Synthesis for Enhancing Acoustic-to-Word Speech Recognition
M.Mimura, S.Ueno, H.Inaguma, S.Sakai, T.Kawahara
Proc. IEEE Spoken Language Technology Workshop (SLT)   477-484   2018年   [査読有り]
潜在キャラクタモデルによる聞き手のふるまいに基づく 対話エンゲージメントの推定
井上 昂治, Divesh Lala, 吉井 和佳, 高梨 克也, 河原 達也
人工知能学会論文誌   33(1) 17-36   2018年   [査読有り]
Speech Enhancement Based on Bayesian Low-Rank and Sparse Decomposition of Multichannel Magnitude Spectrograms
Y.Bando, K.Itoyama, M.Konyo, S.Tadokoro, K.Nakadai, K.Yoshii, T.Kawahara, H.G.Okuno
IEEE/ACM Trans. Audio Speech & Language Process.   26 17-36   2018年   [査読有り]
Bayesian Multichannel Audio Source Separation Based on Integrated Source and Spatial Models
K.Itakura, Y.Bando, E.Nakamura, K.Itoyama, K.Yoshii, T.Kawahara
IEEE/ACM Trans. Audio Speech & Language Process.   26 17-36   2018年   [査読有り]
Typing Tutor: Individualized Tutoring in Text Entry for Older Adults Based on Statistical Input Stumble Detection
T.Hagiya, T.Horiuchi, T.Yazaki, T.Kawahara
J. Information Processing   26    2018年   [査読有り]
Exploiting Automatic Speech Recognition Errors to Enhance Partial and Synchronized Caption for Facilitating Second Language Listening
M.Mirzaei, K.Meshgi, T.Kawahara
Computer Speech and Language   49 17-36   2018年   [査読有り]
人間型ロボットのキャラクタ表現のための対話の振る舞い制御モデル
山本 賢太, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
人工知能学会論文誌   33(5) C-I37_19   2018年   [査読有り]
Engagement recognition by a latent character model based on multimodal listener behaviors in spoken dialogue
K.Inoue, D.Lala, K.Takanashi, T.Kawahara
APSIPA Trans. Signal & Information Process.   7(e9) 1-16   2018年   [査読有り]
議会会議録における整文過程の分析
河原 達也
日本の速記   (938) 17-20   2017年   [招待有り]
音声応用システム
河原 達也
電子情報通信学会100年史   367-370   2017年   [招待有り]
Utterance behavior of users while playing basketball with a virtual teammate
D.Lala, Y.Li, T.Kawahara
Proc. ICAART   28-38   2017年   [査読有り]
Bayesian Multichannel Nonnegative Matrix Factorization for Audio Source Separation and Localization
K.Itakura, Y.Bando, E.Nakamura, K.Itoyama, K.Yoshii, T.Kawahara
Proc. IEEE-ICASSP   551-555   2017年   [査読有り]
Semi-supervised Ensemble DNN Acoustic Model Training
S.Li, X.Lu, S.Sakai, M.Mimura, T.Kawahara
Proc. IEEE-ICASSP   5270-5274   2017年   [査読有り]
Effective Articulatory Modeling for Pronunciation Error Detection of L2 Learner without Non-native Training Data
R.Duan, T.Kawahara, M.Dantsuji, J.Zhang
Proc. IEEE-ICASSP   5815-5819   2017年   [査読有り]
A Conversational Dialogue Manager for the Humanoid Robot ERICA
P.Milhorat, D.Lala, K.Inoue, Z.Tianyu, M.Ishida, K.Takanashi, S.Nakamura, T.Kawahara
Proc. Int'l Workshop Spoken Dialogue Systems (IWSDS)      2017年   [査読有り]
Attentive Listening System with Backchanneling, Response Generation and Flexible Turn-taking
D.Lala, P.Milhorat, K.Inoue, M.Ishida, K.Takanashi, T.Kawahara
Proc. SIGdial Meeting Discourse & Dialogue   127-136   2017年   [査読有り]
Social Signal Detection in Spontaneous Dialogue Using Bidirectional LSTM-CTC
H.Inaguma, K.Inoue, M.Mimura, T.Kawahara
Proc. INTERSPEECH   1691-1695   2017年   [査読有り]
Analysis of the Relationship between Prosodic Features of Fillers and Its Forms or Occurrence Positions
S.Nakamura, R.Nakanishi, K.Takanashi, T.Kawahara
Proc. INTERSPEECH   1726-1230   2017年   [査読有り]
Combined Multi-channel NMF-based Robust Beamforming for Noisy Speech Recognition
M.Mimura, Y.Bando, K.Shimada, S.Sakai, K.Yoshii, T.Kawahara
Proc. INTERSPEECH   2451-2455   2017年   [査読有り]
Listening Difficulty Detection to Foster Second Language Listening with the Partial and Synchronized Caption System
M.Mirzaei, K.Meshgi, T.Kawahara
Proc. EUROCALL   211-216   2017年   [査読有り]
Transfer Learning based Non-native Acoustic Modeling for Pronunciation Error Detection
R.Duan, T.Kawahara, M.Dantsuji, H.Nanjo
Proc. Workshop Speech \& Language Technology for Education (SLaTE)   50-54   2017年   [査読有り]
Detecting listening difficulty for second language learners using Automatic Speech Recognition errors
M.Mirzaei, K.Meshgi, T.Kawahara
Proc. Workshop Speech \& Language Technology for Education (SLaTE)   164-168   2017年   [査読有り]
Semi-Blind Speech Enhancement Based On Recurrent Neural Network For Source Separation And Dereverberation
M.Wake, Y.Bando, M.Mimura, K.Itoyama, K.Yoshii, T.Kawahara
Proc. IEEE Machine Learning for Signal Processing Workshop (MLSP)      2017年   [査読有り]
Detection of Social Signals for Recognizing Engagement in Human-Robot Interaction
D.Lala, K.Inoue, P.Milhorat, T.Kawahara
Proc. AAAI Fall Sympo. Natural Communication for Human-Robot Collaboration      2017年   [査読有り]
Modeling Difficulties of Second Language Learners using Speech Technology
T.Kawahara
Proc. Seoul International Conference on Speech Sciences (SICSS)   704-712   2017年   [招待有り]
Joint Learning of Dialog Act Segmentation and Recognition in Spoken Dialog Using Neural Networks
T.Zhao, T.Kawahara
Proc. IJCNLP   704-712   2017年   [査読有り]
Automatic Meeting Transcription System for the Japanese Parliament (Diet)
T.Kawahara
Proc. APSIPA ASC   134-140   2017年   [査読有り][招待有り]
Emotion Recognition by Combining Prosody and Sentiment Analysis for Expressing Reactive Emotion by Humanoid Robot
Y.Li, C.T.Ishi, N.Ward, K.Inoue, S.Nakamura, K.Takanashi, T.Kawahara
Proc. APSIPA ASC      2017年   [査読有り]
Cross-Domain Speech Recognition using Nonparallel Corpora with Cycle-consistent Adversarial Networks
M.Mimura, S.Sakai, T.Kawahara
Proc. IEEE Workshop Automatic Speech Recognition & Understanding (ASRU)   134-140   2017年   [査読有り]
Incremental Training and Constructing the Very Deep Convolutional Residual Network Acoustic Models
S.Li, X.Lu, P.Shen, R.Takashima, T.Kawahara, H.Kawai
Proc. IEEE Workshop Automatic Speech Recognition & Understanding (ASRU)   222-227   2017年   [査読有り]
Partial and Synchronized Captioning: A new tool to assist learners in developing second language listening skill
M.Mirzaei, K.Meshgi, Y.Akita, T.Kawahara
ReCALL Journal   29(2) 2174-2182   2017年   [査読有り]
Assistive Typing Application for Older Adults Based on Input Stumble Detection
T.Hagiya, T.Horiuchi, T.Yazaki, T.Kato, T.Kawahara
J. Information Processing   25    2017年   [査読有り]
Articulatory Modeling for Pronunciation Error Detection without Non-native Training Data based on DNN Transfer Learning
R.Duan, T.Kawahara, M.Dantsuji, J.Zhang
IEICE Trans.   E100-D(9) 2174-2182   2017年   [査読有り]
音声認識・画像認識における機械学習の最近の動向
河原 達也, 原田 達也
システム/制御/情報   60(3) 113-119   2016年   [招待有り]
Analysis and Prediction of Morphological Patterns of Backchannels for Attentive Listening Agents
T.Yamaguchi, K.Inoue, K.Yoshino, K.Takanashi, N.Ward, T.Kawahara
Proc. Int'l Workshop Spoken Dialogue Systems (IWSDS)      2016年   [査読有り]
Data Selection from Multiple ASR Systems' Hypotheses for Unsupervised Acoustic Model Training
S.Li, Y.Akita, T.Kawahara
Proc. IEEE-ICASSP   5875-5879   2016年   [査読有り]
Interactional and Pragmatics-related Prosodic Patterns in Mandarin Dialog
N.Ward, Y.Li, T.Zhao, T.Kawahara
Proc. Int'l Conf. Speech Prosody      2016年   [査読有り]
Leveraging Automatic Speech Recognition Errors to Detect Challenging Speech Segments in TED Talks
M.Mirzaei, K.Meshgi, T.Kawahara
Proc. EUROCALL   313-318   2016年   [査読有り]
ERICA: The ERATO Intelligent Conversational Android
D.F.Glas, T.Minato, C.T.Ishi, T.Kawahara, H.Ishiguro
Proc. RO-MAN   22-29   2016年   [査読有り]
Prediction and Generation of Backchannel Form for Attentive Listening Systems
T.Kawahara, T.Yamaguchi, K.Inoue, K.Takanashi, N.Ward
Proc. INTERSPEECH   2890-2894   2016年   [査読有り]
Joint Optimization of Denoising Autoencoder and DNN Acoustic Model Based on Multi-target Learning for Noisy Speech Recognition
M.Mimura, S.Sakai, T.Kawahara
Proc. INTERSPEECH   3803-3807   2016年   [査読有り]
Talking with ERICA, an autonomous android
K.Inoue, P.Milhorat, D.Lala, T.Zhao, T.Kawahara
Proc. SIGdial Meeting Discourse & Dialogue   Demo. Paper 212-215   2016年   [査読有り]
Managing Dialog and Joint Actions for Virtual Basketball Teammates
D.Lala, T.Kawahara
Proc. IVA   Poster    2016年   [査読有り]
Confidence Estimation for Speech Recognition Systems using Conditional Random Fields Trained with Partially Annotated Data
S.Li, X.Lu, S.Mori, Y.Akita, T.Kawahara
Proc. Int'l Sympo. Chinese Spoken Language Processing (ISCSLP)      2016年   [査読有り]
Pronunaciation Error Detection using DNN Articulatory Model based on Multi-lingual and Multi-task Learning
R.Duan, T.Kawahara, M.Dantsuji, J.Zhang
Proc. Int'l Sympo. Chinese Spoken Language Processing (ISCSLP)      2016年   [査読有り]
Multimodal interaction with the autonomous android ERICA
D.Lala, P.Milhorat, K.Inoue, T.Zhao, T.Kawahara
Proc. ICMI   Demo. Paper 417-418   2016年   [査読有り]
Prediction of Ice-breaking Between Participants Using Prosodic Features in the First Meeting Dialogue
H.Inaguma, K.Inoue, S.Nakamura, K.Takanashi, T.Kawahara
Proc. ICMI Workshop on Advancements in Social Signal Processing for Multimodal Interaction (ASSP4MI)      2016年   [査読有り]
Annotation and analysis of listener's engagement based on multi-modal behaviors
K.Inoue, D.Lala, S.Nakamura, K.Takanashi, T.Kawahara
Proc. ICMI Workshop on Multimodal Analyses enabling Artificial Agents in Human-Machine Interaction (MA3HMI)      2016年   [査読有り]
ASR errors as predictor of L2 listening difficulties and PSC enhancement
M.Mirzaei, K.Meshgi, T.Kawahara
Proc. Coling Workshop on Computational Linguistics for Linguistic Complexity (CL4LC)   192-201   2016年   [査読有り]
Multi-lingual and Multi-task DNN Learning for Articulatory Error Detection
R.Duan, T.Kawahara, M.Dantsuji, J.Zhang
Proc. APSIPA ASC      2016年   [査読有り]
視聴覚情報の統合に基づく音源数推定と話者ダイアライゼーション
若林 佑幸, 井上 昂治, 中山 雅人, 西浦 敬信, 山下 洋一, 吉本 廣雅, 河原 達也
電子情報通信学会論文誌   J99-D(3) 326-336   2016年   [査読有り]
多人数会話における音響・視線情報を統合した話者区間検出
井上 昂治, 若林 佑幸, 吉本 廣雅, 河原 達也
電子情報通信学会論文誌   J99-D(3) 348-357   2016年   [査読有り]
Multi-modal Sensing and Analysis of Poster Conversations with Smart Posterboard
T.Kawahara, T.Iwatate, K.Inoue, S.Hayashi, H.Yoshimoto, K.Takanashi
APSIPA Trans. Signal & Information Process.   5(e2) 1-12   2016年   [査読有り]
傾聴対話システムのための言語情報と韻律情報に基づく 多様な形態の相槌の生成
山口 貴史, 井上 昂治, 吉野 幸一郎, 高梨 克也, Nigel G. Ward, 河原 達也
人工知能学会論文誌   31(4) 2174-2182   2016年   [査読有り]
Semi-supervised Acoustic Model Training by Discriminative Data Selection from Multiple ASR Systems' Hypotheses
S.Li, Y.Akita, T.Kawahara
IEEE/ACM Trans. Audio Speech & Language Process.   24(9) 2174-2182   2016年   [査読有り]
座談会:国会審議をめぐる学際的研究の可能性
増山 幹高, 河原 達也, 松田 謙次郎, 木村 泰知, 高丸 圭一
レヴァイアサン   (56) 8-53   2015年   [招待有り]
ICT・音声認識の活用による講演・講義の字幕付与
河原 達也
情報処理   56(6) 543-546   2015年   [招待有り]
音声認識技術
河原 達也
電子情報通信学会誌   98(8) 710-717   2015年   [招待有り]

Misc

 
多数話者コーパスを用いたEnd-to-End音声合成による 単語単位End-to-End音声認識のデータ拡張
上乃 聖, 三村 正人, 坂井 信輔, 河原 達也
日本音響学会研究発表会講演論文集   2002/9/2    2019年
End-to-Endモデルに基づくアイヌ語の音声認識
松浦 孝平, 三村 正人, 上乃 聖, 坂井 信輔, 河原 達也
日本音響学会研究発表会講演論文集   2002/9/3    2019年
移行適格場の予測に基づくターンテイキング予測
原 康平, 井上 昂治, 高梨 克也, 河原 達也
情報処理学会全国大会講演論文集   2T-04    2019年
質問タイプの分類に基づく用例なし質問に対する応答生成
磯西 爽太, 田中 滉己, 井上 昂治, 高梨 克也, 河原 達也
情報処理学会全国大会講演論文集   2T-05    2019年
対話相手への好感に基づく発話構成要素の選択と お見合い対話システムへの実装
田中 滉己, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
情報処理学会全国大会講演論文集   2T-06    2019年
対話のふるまい制御によるキャラクタ表現モデルと対話コーパスによる検証
山本 賢太, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
情報処理学会全国大会講演論文集   2T-07    2019年
対話のふるまいに基づくキャラクタ表現の対話コーパスにおける分析
山本 賢太, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B803-08    2019年
移行適格場の情報を考慮したターンテイキング予測
原 康平, 井上 昂治, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B803-10    2019年
音声認識を用いた字幕作成システムの改良
秋田 祐哉, 上乃 聖, 三村 正人, 河原 達也
情報処理学会研究報告   AAC-9-34    2019年
自律型アンドロイドERICAにおけるエンゲージメント推定に基づく 音声対話システム
井上 昂治, Lala Divesh, 高梨 克也, 河原 達也
日本音響学会研究発表会講演論文集   2002/8/9    2018年
Improving articulatory attribute modeling based on multi-label training and label correction
Richeng Duan, Tatsuya Kawahara, Masatake Dantsuji, Hiroaki Nanjo
日本音響学会研究発表会講演論文集   2002/9/8    2018年
文字単位のモデルを併用した単語単位のEnd-to-End音声認識
上乃 聖, 稲熊 寛文, 三村 正人, 河原 達也
日本音響学会研究発表会講演論文集   2003/8/5    2018年
共感・発話促進のための多様な聞き手応答を生成する傾聴対話システム
石田 真也, 井上 昂治, 高梨 克也, 河原 達也
情報処理学会全国大会講演論文集   6Q-04    2018年
初対面対話における好感の生成と発話構成要素の予測のモデル
田中 滉己, 井上 昂治, 高梨 克也, 河原 達也
情報処理学会全国大会講演論文集   6Q-05    2018年
自律型アンドロイドのキャラクタ表現のための 対話の振る舞い制御モデルの構築と評価
山本 賢太, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
情報処理学会全国大会講演論文集   6Q-06    2018年
相槌・フィラー予測とのマルチタスク学習による円滑なターンテイキング
原 康平, 井上 昂治, 高梨 克也, 河原 達也
情報処理学会全国大会講演論文集   6Q-07    2018年
単語単位エンコーダデコーダ音声認識モデルの転移学習を用いた適応
上乃 聖, 森谷 崇史, 三村 正人, 坂井 信輔, 篠原 雄介, 山口 義和, 青野 裕司, 河原 達也
日本音響学会研究発表会講演論文集   2001/2/5    2018年
End-to-End音声合成を用いた単語単位End-to-End音声認識の学習データ拡張
上乃 聖, 三村 正人, 河原 達也
日本音響学会研究発表会講演論文集   2001/2/6    2018年
「日本語話し言葉コーパス」を用いた多数話者End-to-End音声合成
上乃 聖, 三村 正人, 河原 達也
日本音響学会研究発表会講演論文集   2001/4/2    2018年
ニュース様式の違いによる日本語アナウンサ音声の韻律的特徴
中村 静, 石井 カルロス 寿憲, 河原 達也
日本音響学会研究発表会講演論文集   2001/4/12    2018年
CTCによる文字単位のモデルを併用したAttentionによる単語単位の End-to-End音声認識
上乃 聖, 稲熊 寛文, 三村 正人, 河原 達也
情報処理学会研究報告   SLP-120-16    2018年
DAEを用いたリアルタイム遠隔音声認識
井上 昂治, 三村 正人, 石井 カルロス寿憲, 坂井 信輔, 河原 達也
日本音響学会研究発表会講演論文集   1-Q-6    2017年
Effective Articulatory Modeling for Pronunciation Error Detection
Richeng Duan, Tatsuya Kawahara, Masatake Dantsuji
日本音響学会研究発表会講演論文集   2-P-30    2017年
聞き手の多様なふるまいに基づく対話エンゲージメントの推定
井上 昂治, Lala Divesh, 高梨 克也, 河原 達也
日本音響学会研究発表会講演論文集   2003/5/1    2017年
ロボット対話における深層学習を用いたセミブラインド音声強調
和気 雅弥, 坂東 宜昭, 三村 正人, 糸山 克寿, 吉井 和佳, 河原 達也
情報処理学会全国大会講演論文集   6M-01    2017年
遠隔音声認識のためのブラインド音源分離に基づくビームフォーマ
島田 一希, 坂東 宜昭, 板倉 光佑, 三村 正人, 糸山 克寿, 吉井 和佳, 河原 達也
情報処理学会全国大会講演論文集   6M-02    2017年
自律型アンドロイドのキャラクタ表現のための対話の振る舞い制御
山本 賢太, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
情報処理学会全国大会講演論文集   7M-01    2017年
傾聴対話システムにおける自分語りを含む多様な聞き手応答の生成
石田 真也, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
情報処理学会全国大会講演論文集   7M-02    2017年
自律型アンドロイドによる対話における同調的笑いの生成
勝見 久央, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
情報処理学会研究報告   SLP-116-4    2017年
共感表出と発話促進のための聞き手応答を生成する傾聴対話システム
石田 真也, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B509-2    2018年
マルチチャネル非負値行列因子分解に基づく ビームフォーミングを用いた雑音環境下音声認識
島田 一希, 坂東 宜昭, 三村 正人, 糸山 克寿, 吉井 和佳, 河原 達也
電子情報通信学会技術研究報告   SP2017-90    2018年
ブラインド音源分離のための高速相関テンソル分解
北村 昂一, 坂東 宜昭, 糸山 克寿, 吉井 和佳, 河原 達也
電子情報通信学会技術研究報告   SP2017-127    2018年
モノラル音響信号に対する音源分離のための独立低ランクテンソル分析
吉井 和佳, 北村 昂一, 坂東 宜昭, 中村 栄太, 河原 達也
情報処理学会研究報告   MUS-120-18    2018年
転移学習による注意機構付き単語単位音声認識の適応
上乃 聖, 森谷 崇史, 三村 正人, 坂井 信輔, 篠原 雄介, 山口 義和, 青野 裕司, 河原 達也
電子情報通信学会技術研究報告   SP2018-23    2018年
独立低ランクテンソル分析:非負値性・低ランク性・独立性に基づく ブラインド音源分離の統一理論
吉井 和佳, 佐藤 寛之, 坂東 宜昭, 中村 栄太, 河原 達也
電子情報通信学会技術研究報告   IBISML2018-49    2018年
相槌・フィラー予測とのマルチタスク学習によるターンテイキング予測
原 康平, 井上 昂治, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B802-1    2018年
初対面対話における好感のモデリングと発話構成要素の選択
田中 滉己, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B802-3    2018年
[招待講演] アンドロイドERICAによる人間レベルの音声対話
河原 達也
人工知能学会研究会資料   SLUD-B802    2018年   [依頼有り]
自律型アンドロイドERICAによる傾聴対話
山本 賢太, 井上 昂治, Divesh Lala, 中村 静, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B802-13    2018年
自律型アンドロイドERICAのための遠隔音声認識
井上 昂治, 三村 正人, 石井 カルロス寿憲, 河原 達也
日本音響学会研究発表会講演論文集   2001/1/1    2016年
傾聴対話システムのための多様な聞き手応答の生成
石田 真也, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
情報処理学会全国大会講演論文集   6Q-01    2016年
初対面対話における場の和みのマルチモーダルな分析と検出
稲熊 寛文, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
情報処理学会全国大会講演論文集   6Q-02    2016年
Diversity-driven Semi-supervised Ensemble DNN Acoustic Model Training
Sheng Li, Xugang Lu, Shinsuke Sakai, Tatsuya Kawahara
電子情報通信学会技術研究報告   SP2016-40    2016年
自律型アンドロイドERICAによる就職面接対話
井上 昂治, Divesh Lala, 原 康平, 相原 邦光, 中村 静, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B802-14    2018年
End-to-End音声合成を用いた単語単位End-to-End音声認識のデータ拡張
上乃 聖, 三村 正人, 坂井 信輔, 河原 達也
情報処理学会研究報告   SLP-125-2    2018年
[招待講演] 音声認識の方法論の変遷と展望〜Acoustic-to-Wordモデルを中心に〜
河原 達也
電子情報通信学会技術研究報告   SP2018-48    2018年   [依頼有り]
ニューラルネットによる音声対話における非言語的振る舞いの検出
稲熊 寛文, 井上 昂治, 河原 達也
情報処理学会全国大会講演論文集   7M-04    2017年
End-to-Endモデルによる音声対話中のSocial Signalsの検出
稲熊 寛文, 井上 昂治, 三村 正人, 河原 達也
日本音響学会研究発表会講演論文集   2001/10/16    2017年
Language Independent Non-native Articulatory Modeling for Pronunciation Error Detection
Richeng Duan, Tatsuya Kawahara, Masatake Dantsuji, Hiroaki Nanjo
日本音響学会研究発表会講演論文集   2002/11/8    2017年
潜在キャラクタモデルによる聞き手のふるまいに基づく 対話エンゲージメントの推定
井上 昂治, Lala Divesh, 吉井 和佳, 高梨 克也, 河原 達也
日本音響学会研究発表会講演論文集   2-Q-12    2017年
LSTM-CTCによる音声対話におけるSocial Signalsの検出
稲熊 寛文, 井上 昂治, 三村 正人, 河原 達也
情報処理学会研究報告   SLP-115-9    2017年
フィラーの韻律的特徴と形態および生起位置との関係の分析
中村 静, 中西 亮輔, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B506-03    2017年
円滑な発話権制御のための談話行為の連鎖に基づく フィラーの生起と形態の予測
中西 亮輔, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B506-04    2017年
Emotion Recognition by Combining Prosody with Text Information and Assessment Selection for Human-Robot Interaction
Yuanchao Li, Inoue Koji, Shizuka Nakamura, Katsuya Takanashi, Toshinori Ishi Carlos, Tatsuya Kawahara
人工知能学会研究会資料   SLUD-B506-09    2017年
End-to-EndモデルによるSocial Signals検出および音声認識との統合
稲熊 寛文, 井上 昂治, 三村 正人, 河原 達也
情報処理学会研究報告   SLP-117-7    2017年
深層生成モデルを事前分布に用いた教師なし音声強調
坂東 宜昭, 三村 正人, 糸山 克寿, 吉井 和佳, 河原 達也
電子情報通信学会技術研究報告   SP2017-20    2017年
再帰型ニューラルネットワークを用いたセミブラインド音声分離・強調
和気 雅弥, 坂東 宜昭, 三村 正人, 糸山 克寿, 吉井 和佳, 河原 達也
電子情報通信学会技術研究報告   SP2017-22    2017年
Data Selection Assisted by Caption to Improve Acoustic Modeling for Lecture Transcription
Sheng Li, Yuya Akita, Tatsuya Kawahara
日本音響学会研究発表会講演論文集   2002/4/4    2014年
スマートポスターボードにおける音響情報と画像情報の統合による 話者区間検出
若林 佑幸, 井上 昂治, 河原 達也, 中井 駿介, 宮崎 亮一, 猿渡 洋
日本音響学会研究発表会講演論文集   2-Q4-7    2014年
音声認識結果の有用性の自動判定に基づく 講義のリアルタイム字幕付与システム
桑原 暢弘, 秋田 祐哉, 河原 達也
音声ドキュメント処理ワークショップ   2002/4/5    2014年
スマートポスターボードにおける実環境を想定した複数話者分離
中井 駿介, 宮崎 亮一, 猿渡 洋, 中村 哲, 井上 昂治, 若林 佑幸, 河原 達也
日本音響学会研究発表会講演論文集   2-Q4-8    2014年
講演音声認識におけるDNN-HMMの教師なし話者適応
三村 正人, 河原 達也
日本音響学会研究発表会講演論文集   2-Q4-22    2014年
ユーザの焦点に適応的な雑談型音声情報案内システム
吉野 幸一郎, 河原 達也
人工知能学会研究会資料   SLUD-B303-11 761-764   2014年
雑音環境下音声認識のための多チャネル非負値行列因子分解に基づく 教師なしビームフォーマ
島田 一希, 坂東 宜昭, 三村 正人, 糸山 克寿, 吉井 和佳, 河原 達也
電子情報通信学会技術研究報告   SP2017-23    2017年
自律型アンドロイドの対話の振る舞い制御モデルによる キャラクタ表現法の検討
山本 賢太, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B508-05    2017年
自律型アンドロイドERICAにおける多様な聞き手応答を用いた傾聴対話
井上 昂治, Divesh Lala, Pierrick Milhorat, 石田 真也, 趙 天雨, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B508-11    2017年
潜在キャラクタモデルによるリアルタイム対話エンゲージメント推定
井上 昂治, Divesh Lala, Pierrick Milhorat, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B508-18    2017年
スマートフォンにおけるつまずき検出に基づく音声入力支援システム
萩谷 俊幸, 帆足 啓一郎, 河原 達也
情報処理学会研究報告   HCI-175-5    2017年
Joint Learning of Dialog Act Segmentation and Recognition Using Neural Networks
Tianyu Zhao, Tatsuya Kawahara
情報処理学会研究報告   SLP-119-12    2017年
Pronunciation Error Detection using DNN Articulatory Model based on Multi-lingual and Multi-task Learning
Richeng Duan, Tatsuya Kawahara, Masatake Dantsuji
日本音響学会研究発表会講演論文集   3-Q-23    2016年
Unsupervised Training of Deep Neural Network Acoustic Models for Lecture Transcription
Sheng Li, Yuya Akita, Tatsuya Kawahara
日本音響学会研究発表会講演論文集   1-R-4    2014年
ディープオートエンコーダとDNN-HMMを用いた残響下音声認識
三村 正人, 坂井 信輔, 河原 達也
情報処理学会研究報告   SLP-102-6    2014年
相槌「うん」と「うーん」の表記の問題と韻律的な特徴
中村 静, 高梨 克也, 山口 貴史, Nigel Ward, 河原 達也
人工知能学会研究会資料   SLUD-B503-10    2016年
自律型アンドロイドによる円滑な発話権制御のための フィラーの生起位置と形態の分析
中西 亮輔, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B503-11    2016年
講演のリアルタイム字幕付与のための音声認識結果の簡約
大田 健翔, 秋田 祐哉, 河原 達也
情報処理学会研究報告   SLP-112-12    2016年
傾聴対話システムのための発話を促す聞き手応答の生成
石田 真也, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B504-1    2016年
マルチチャネル音源分離のためのネスト型基底・音源混合モデルに基づく 時間周波数クラスタリング
板倉 光佑, 坂東 宜昭, 中村 栄太, 糸山 克寿, 吉井 和佳, 河原 達也
電子情報通信学会技術研究報告   SP2016-31    2016年
変分ベイズ多チャネルロバストNMFに基づく マイクロホンの移動・被覆を許容する音声強調
坂東 宜昭, 糸山 克寿, 昆陽 雅司, 田所 諭, 中臺 一博, 吉井 和佳, 河原 達也, 奥乃 博
電子情報通信学会技術研究報告   SP2016-36    2016年
Pronunciation Error Detection using DNN Articulatory Model based on Transfer Learning
Richeng Duan, Tatsuya Kawahara, Masatake Dantsuji
電子情報通信学会技術研究報告   SP2016-39    2016年
自律型アンドロイドERICAによる社会的役割に則したインタラクション
井上 昂治, Pierrick Milhorat, Divesh Lala, 趙 天雨, 河原 達也
人工知能学会研究会資料   SLUD-B505-7    2016年
階層ベイズモデルを用いた聞き手の多様なふるまいに基づく 対話エンゲージメントの推定
井上 昂治, Divesh Lala, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B505-28    2016年
初対面対話における韻律的特徴に基づくアイスブレーキングの分析と予測
稲熊 寛文, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B505-29    2016年
発話行為の連鎖を考慮したフィラーの生起と形態の分析
中西 亮輔, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B505-30    2016年
マルチチャネル音源分離のための低ランク音源モデルと スパース重畳過程に基づくネスト型ベイズ混合・因子モデル
板倉 光佑, 坂東 宜昭, 中村 栄太, 糸山 克寿, 吉井 和佳, 河原 達也
電子情報通信学会技術研究報告   IBISML2016-95    2016年
自動音声認識を用いた放送大学のオンライン授業に対する字幕付与
河原 達也, 秋田 祐哉, 広瀬 洋子
情報処理学会研究報告   AAC-2-5    2016年
音素クラス情報を用いたディープオートエンコーダによる残響下音声認識
三村 正人, 坂井 信輔, 河原 達也
日本音響学会研究発表会講演論文集   1-P-22    2015年
Incorporating divergences from hypotheses of multiple ASR systems to improve unsupervised acoustic model training
Sheng Li, Yuya Akita, Tatsuya Kawahara
日本音響学会研究発表会講演論文集   1-P-23    2015年
拡散性雑音環境下における多人数会話のマルチモーダル話者区間検出
若林 佑幸, 中山 雅人, 西浦 敬信, 山下 洋一, 井上 昂治, 吉本 廣雅, 河原 達也
日本音響学会研究発表会講演論文集   1-Q-24    2015年
部分的アノテーションコーパスから学習可能な固有表現認識器
笹田 鉄郎, 森 信介, 河原 達也, 山肩 洋子
言語処理学会年次大会発表論文集   B5-4 748-751   2015年
ユーザの焦点を用いたPOMDPによる音声情報案内システム
吉野 幸一郎, 河原 達也
情報処理学会全国大会講演論文集   3D-01    2015年
講演音声認識結果の誤り箇所の復唱入力を用いたノートテイクシステム
大田 健翔, 秋田 祐哉, 河原 達也
情報処理学会全国大会講演論文集   5P-06    2015年
多様な形態の相槌をうつ音声対話システムのための傾聴対話の分析
山口 貴史, 吉野 幸一郎, 高梨 克也, 河原 達也
情報処理学会全国大会講演論文集   6P-08    2015年
スマートポスターボードにおける視線情報を用いた 話者区間検出及び相槌の同定
井上 昂治, 若林 佑幸, 吉本 廣雅, 高梨 克也, 河原 達也
情報処理学会全国大会講演論文集   6P-09    2015年
音素クラス特徴量を用いたLSTMによる残響下音声認識
三村 正人, 坂井 信輔, 河原 達也
日本音響学会研究発表会講演論文集   1-Q-7    2015年
Effective Combination of Multiple ASR Hypotheses with CRF-based Classifiers
Sheng Li, Yuya Akita, Tatsuya Kawahara
日本音響学会研究発表会講演論文集   1-Q-14    2015年
ポスター会話における音響・視線情報の確率的統合による 話者区間及び相槌の検出
井上 昂治, 若林 佑幸, 吉本 廣雅, 高梨 克也, 河原 達也
日本音響学会研究発表会講演論文集   2002/2/4    2015年
ポスター会話における音響・視線情報を統合した話者区間及び相槌の検出
井上 昂治, 若林 佑幸, 吉本 廣雅, 高梨 克也, 河原 達也
情報処理学会研究報告   SLP-105-9    2015年
傾聴対話における相槌形態と先行発話の統語構造の関係の分析
山口 貴史, 井上 昂治, 吉野 幸一郎, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B403-4    2015年
スマートポスターボードにおける視線情報を用いた話者区間及び相槌の検出
井上 昂治, 若林 佑幸, 吉本 廣雅, 高梨 克也, 河原 達也
情報処理学会研究報告   MUS-107-68    2015年
多様な相槌をうつ傾聴対話システムのための相槌形態の予測
山口 貴史, 井上 昂治, 吉野 幸一郎, 高梨 克也, Nigel Ward, 河原 達也
人工知能学会研究会資料   SLUD-B502-1    2015年

書籍等出版物

 
音声認識システム 改訂2版
河原達也
オーム社   2016年   
知のバリアフリー
河原 達也 (担当:分担執筆, 範囲:第4章 聴覚障害学生支援の最先端 --音声認識による字幕付与技術.)
京都大学学術出版会   2014年   
Springer Handbook on Speech Processing and Speech Communication
Sadaoki Furui and Tatsuya Kawahara (担当:分担執筆, 範囲:Chpter 32: Transcription and distillation of spontaneous speech)
Springer   2008年   
音声対話システム
河原達也, 荒木雅弘
オーム社   2006年   
Spoken Language Systems
Seiichi Nakagawa, Michio Okada, and Tatsuya Kawahara, editors
Ohmsha/IOS Press   2005年   

講演・口頭発表等

 
Captioning Software using Automatic Speech Recognition (ASR)
河原 達也
Intersteno Conference   2019年7月16日   
Dialogue Models and Systems: From Research Labs, to the Cloud to Your Living Room --Human-like Dialogue with Robot [招待有り]
河原 達也
IEEE Int'l Workshop on Spoken Language Technology (SLT)   2018年12月19日   
音声認識の方法論の変遷と展望~Acoustic-to-Wordモデルを中心に~ [招待有り]
河原 達也
電子情報通信学会 音声研究会(SP)   2018年12月10日   
アンドロイドERICAによる人間レベルの音声対話 [招待有り]
河原 達也
人工知能学会 言語・音声理解と対話処理研究会(SIG-SLUD)   2018年11月20日   
Human-like conversational robot [招待有り]
河原 達也
APSIPA ASC   2018年11月14日   
Spoken dialogue for a human-like conversational robot ERICA [招待有り]
河原 達也
International Workshop on Spoken Dialogue Systems Technology (IWSDS 2018)   2018年5月14日   
自然言語処理の歩みとこれから --言語処理と深層学習-- [招待有り]
河原 達也
言語処理学会年次大会   2018年3月14日   
Automatic Meeting Transcription System for the Japanese Parliament (Diet) [招待有り]
河原 達也
APSIPA ASC   2017年12月14日   
Computer-Assisted Language Learning (CALL) using speech technology [招待有り]
河原 達也
Seoul International Conference on Speech Sciences (SICSS2017)   2017年11月11日   
Modeling difficulties of second language learners using speech technology [招待有り]
河原 達也
Seoul International Conference on Speech Sciences (SICSS2017)   2017年11月10日   
What makes a quality transcript in Parliamentary reporting
河原 達也
Intersteno Conference   2017年7月25日   
Speech Understanding for Intelligent Conversational Agent [招待有り]
河原 達也
Microsoft Research Asia Faculty Summit   2016年11月4日   
話がわかるコンピュータ -音声認識と会話ロボットの最前線- [招待有り]
河原 達也
京都大学「東京で学ぶ 京大の知」シリーズ23   2016年11月1日   
Captioning Lectures with Automatic Speech Recognition (ASR)
河原 達也
Intersteno Conference   2015年7月21日   
Recent Paradigm Shift in Speech Recognition [招待有り]
河原 達也
京都大学-稲盛財団合同京都賞シンポジウム   2014年7月13日   
スマートポスターボード: ポスター会話のマルチモーダルなセンシングと解析 [招待有り]
河原 達也
人工知能学会 AIチャレンジ研究会   2014年3月18日   
音声認識の方法論に関する考察―世代交代に向けて―. [招待有り]
河原 達也
情報処理学会 音声言語情報処理研究会(SLP)   2014年1月31日   
Smart Posterboard: Multi-modal Sensing and Analysis of Poster Conversations [招待有り]
河原 達也
APSIPA ASC   2013年10月30日   
Subtitling Lecture Videos with Automatic Speech Recognition
河原 達也
Intersteno Conference   2013年7月16日   
音声認識の方法論に関する考察―歴史的変遷と今後の展望―. [招待有り]
河原 達也
情報処理学会 音学シンポジウム   2013年5月11日   
音声対話システムの歴史と最近の技術動向 [招待有り]
河原達也
日本音響学会技術動向レビュー,東京工科大学,2013 年3 月12 日   2013年3月12日   
スマートポスターボード: ポスター発表における場のマルチモーダルなセンシングと認識. [招待有り]
河原達也
電子情報通信学会 パターン認識・メディア理解研究会(PRMU)   2013年2月22日   
音声対話システムの進化と淘汰 [招待有り]
河原 達也
人工知能学会 言語・音声理解と対話処理研究会(SLUD)   2013年2月1日   
Transcription System using Automatic Speech Recognition for the Japanese Parliament (Diet)
河原 達也
AAAI/IAAI   2012年7月26日   
Multi-modal Sensing and Analysis of Poster Conversations toward Smart Posterboard [招待有り]
河原 達也
SIGdial Meeting Discourse & Dialogue   2012年7月20日   
スマートポスターボード: ポスター会話のマルチモーダルなセンシングと認識 [招待有り]
河原 達也
電子情報通信学会音声研究会(SP)   2012年7月20日   
話し言葉の音声認識からコミュニケーションの理解へ [招待有り]
河原 達也
日本音声学会全国大会公開基調講演   2011年9月24日   
New Transcription System using Automatic Speech Recognition (ASR) in the Japanese Parliament (Diet)
河原 達也
Intersteno Conference   2011年7月14日   
Automatic Transcription of Parliamentary Meetings and Classroom Lectures -- A Sustainable Approach and Real System Evaluations -- [招待有り]
河原 達也
Int'l Sympo. Chinese Spoken Language Processing (ISCSLP)   2010年12月3日   
New Perspectives on Spoken Language Understanding: Does Machine Need to Fully Understand Speech? [招待有り]
河原 達也
IEEE Workshop Automatic Speech Recognition & Understanding (ASRU)   2009年12月16日   
Transcription System using Automatic Speech Recognition (ASR) for the Japanese Parliament (Diet)
河原 達也
Intersteno Conference   2009年8月19日   

担当経験のある科目

 
 

競争的資金等の研究課題

 
JST: 戦略的創造研究推進事業 CREST 「人間調和型情報環境」領域
研究期間: 2009年 - 2014年    代表者: 河原 達也
文部科学省: 科学研究費補助金(基盤研究(A))
研究期間: 2004年 - 2006年    代表者: 河原 達也
学会講演や大学の講義、放送番組や議会の討論などの音声アーカイブを対象として、自動音声認識及び書き起こしの自動整形に関する研究を行った。このような自然な話し言葉音声では、発音の変動が大きく、口語的な表現が多用されるため、これらの精緻なモデル化と統計的な学習が必要である。また、語彙や話題も多様であるため、個々の講演・講義・討論に対して適応を行う必要がある。そのため、以下のようなテーマに取り組んだ。・『日本語話し言葉コーパス』を用いた汎用的な発音変動モデルの統計的学習・統計的機械翻訳の枠組みに基...
文部科学省: 科学研究費補助金(特定領域研究)
研究期間: 2001年 - 2005年    代表者: 河原 達也
人間と共生する機械を実現するためには、システムがユーザのモデルを知覚し、それに応じて適応的に行動することが重要であると考えられる。本研究ではまず、音声対話によるインタフェースにおいて、協調的な応答を生成するためのユーザモデルについて検討を進めてきた。具体的には、システムに対する習熟度、タスクドメインに関する知識レベル、性急度の3つのユーザモデルを導入し、それに応じて対話制御を行う戦略を提案した。京都市バス運行情報案内システム(現在試験運用中:075-326-3116)において実装・評価を行...
人間どうしの音声コミュニケーションの認識・理解
JST: 戦略的創造研究推進事業 さきがけ 「協調と制御」領域
研究期間: 2001年 - 2004年    代表者: 河原 達也
文部科学省: 科学研究費補助金(基盤研究(B))
研究期間: 2000年 - 2002年    代表者: 河原 達也
講演や討論などの話し言葉の音声認識における問題を分析した上で、音響モデル・発音モデル・言語モデル・デコーダなどを検討・実装・評価した。学習・評価用のデータとして、開放的融合研究「話し言葉工学」プロジェクトで構築されている日本語話し言葉コーパスを用いた。話し言葉は書き言葉の読上げ音声と大きく性質が異なるため、それに合致したモデル化と認識手法の検討が必要となる。音響モデルについては発話スタイルとデータ量の影響を調べた。言語モデルについては,話し言葉コーパスのデータ量不足を補うために他のコーパス...
文部科学省: 科学研究費補助金(基盤研究(B))
研究期間: 1999年 - 2001年    代表者: 河原 達也
主に、英語を学習する日本人話者を対象として、発音訓練支援を行うCALLシステムの研究・開発をおこなった。具体的には以下の通りである。(1)誤りパターンの対判別を利用した日本人用英語発音教示システム 日本人学習者の典型的な英語発音誤りパターンのモデル化を行い、音声認識技術を用いて効果的に発音を教示するシステムを設計した。与えられた学習テキストに対して、誤りパターンに基づいて発音誤り候補を生成し、HMMによる認識器により、学習者の発音を同定、区分化する。HMMのみでは識別精度の信頼性が十分でな...