河原 達也

J-GLOBALへ         更新日: 18/08/08 22:06
 
アバター
研究者氏名
河原 達也
 
カワハラ タツヤ
URL
http://sap.ist.i.kyoto-u.ac.jp/members/kawahara/
所属
京都大学
職名
教授
学位
工学修士(京都大学), 工学博士(京都大学)
ORCID ID
0000-0002-2686-2296

プロフィール

京都大学 情報学研究科 教授.
音声情報処理,特に音声認識及び対話システムに関する研究に従事.
主著に,「音声認識システム」「音声対話システム」(いずれもオーム社).
IEEE Fellow.
情報処理学会,日本音響学会,電子情報通信学会,人工知能学会,言語処理学会,ISCA,APSIPA 各会員.
日本学術会議連携会員.

研究分野

 
 

経歴

 
2003年4月
 - 
現在
京都大学 情報学研究科 教授
 
2006年4月
 - 
現在
情報通信研究機構 短時間研究員・招へい専門員
 
2003年4月
 - 
2016年3月
京都大学 学術情報メディアセンター 教授
 
1998年9月
 - 
2006年3月
ATR 客員研究員
 
1999年10月
 - 
2004年3月
国立国語研究所 非常勤研究員
 
1998年4月
 - 
2003年3月
京都大学 情報学研究科 助教授
 
1995年6月
 - 
1998年4月
京都大学 工学部 助教授
 
1995年9月
 - 
1996年8月
米国ベル研究所 客員研究員
 
1990年11月
 - 
1995年5月
京都大学 工学部 助手
 

学歴

 
1987年3月
 - 
1989年4月
京都大学 工学研究科 情報工学専攻
 
1983年4月
 - 
1987年3月
京都大学 工学部 情報工学科
 

委員歴

 
2018年1月
 - 
現在
APSIPA  BoG member
 
2018年1月
 - 
現在
APSIPA Transactions on Signal and Information  Editor in Chief
 
2017年10月
 - 
現在
日本学術会議  連携会員
 
2017年9月
 - 
現在
ISCA  Board member
 
2017年1月
 - 
2018年12月
IEEE SPS Kansai Chapter  Chair
 

受賞

 
2012年
情報処理学会 論文賞
 
2012年
科学技術分野の文部科学大臣表彰科学技術賞
 
2011年
情報処理学会 喜安記念業績賞
 
2000年
情報処理学会 坂井記念特別賞
 
1997年
日本音響学会 粟屋学術奨励賞
 

論文

 
Prediction of Turn-taking Using Multitask Learning with Prediction of Backchannels and Fillers
K.Hara, K.Inoue, K.Takanashi, T.Kawahara
Proc. INTERSPEECH      2018年   [査読有り]
Encoder Transfer for Attention-based Acoustic-to-word Speech Recognition
S.Ueno, T.Moriya, M.Mimura, S.Sakai, Y.Yamaguchi, Y.Aono, T.Kawahara
Proc. INTERSPEECH      2018年   [査読有り]
Engagement Recognition in Spoken Dialogue via Neural Network by Aggregating Different Annotators' Models
K.Inoue, D.Lala, K.Takanashi, T.Kawahara
Proc. INTERSPEECH      2018年   [査読有り]
Forward-Backward Attention Decoder
M.Mimura, S.Sakai, T.Kawahara
Proc. INTERSPEECH      2018年   [査読有り]
Improving CTC-based Acoustic Model with Very Deep Residual Time-delay Neural Networks
S.Li, X.Lu, R.Takashima, P.Shen, T.Kawahara, H.Kawai
Proc. INTERSPEECH      2018年   [査読有り]
Independent Low-Rank Tensor Analysis for Audio Source Separation
K.Yoshii, K.Kitamura, Y.B,o, E.Nakamura, T.Kawahara
Proc. EUSIPCO      2018年   [査読有り]
A Unified Neural Architecture for Joint Dialog Act Segmentation and Recognition in Spoken Dialog System
T.Zhao, T.Kawahara
Proc. SIGdial Meeting Discourse & Dialogue      2018年   [査読有り]
Latent Character Model for Engagement Recognition Based on Multimodal Behaviors
K.Inoue, D.Lala, K.Takanashi, T.Kawahara
Proc. Int'l Workshop Spoken Dialogue Systems (IWSDS)      2018年   [査読有り]
Generating Fillers based on Dialog Act Pairs for Smooth Turn-Taking by Humanoid Robot
R.Nakanishi, K.Inoue, S.Nakamura, K.Takanashi, T.Kawahara
Proc. Int'l Workshop Spoken Dialogue Systems (IWSDS)      2018年   [査読有り]
Spoken dialogue for a human-like conversational robot ERICA
T.Kawahara
Proc. Int'l Workshop Spoken Dialogue Systems (IWSDS)      2018年   [招待有り]
Acoustic-to-Word Attention-based Model Complemented with Character-level CTC-based Model
S.Ueno, H.Inaguma, M.Mimura, T.Kawahara
Proc. IEEE-ICASSP   5804-5808   2018年   [査読有り]
Statistical Speech Enhancement based on Probabilistic Integration of Variational Autoencoder and Non-negative Matrix Factorization
Y.B,o, M.Mimura, K.Itoyama, K.Yoshii, T.Kawahara
Proc. IEEE-ICASSP   716-720   2018年   [査読有り]
Unsupervised Beamforming based on Multichannel Nonnegative Matrix Factorization for Noisy Speech Recognition
K.Shimada, Y.B,o, M.Mimura, K.Itoyama, K.Yoshii, T.Kawahara
Proc. IEEE-ICASSP   5734-5738   2018年   [査読有り]
Efficient Learning of Articulatory Models based on Multi-label Training and Label Correction for Pronunciation Learning
R.Duan, T.Kawahara, M.Dantsuji, H.Nanjo
Proc. IEEE-ICASSP   6239-6243   2018年   [査読有り]
An End-to-End Approach to Joint Social Signal Detection and Automatic Speech Recognition
H.Inaguma, M.Mimura, K.Inoue, K.Yoshii, T.Kawahara
Proc. IEEE-ICASSP   6214-6218   2018年   [査読有り]
Audio-Visual Conversation Analysis by Smart Posterboard and Humanoid Robot
T.Kawahara, K.Inoue, D.Lala, K.Takanashi
Proc. IEEE-ICASSP   6573-6577   2018年   [査読有り]
Voice Input Tutoring System for Older Adults using Input Stumble Detection
T.Hagiya, K.Hoashi, T.Kawahara
Proc. ACM Int'l Conf. Intelligent User Interfaces (IUI)   415-419   2018年   [査読有り]
Incremental Training and Constructing the Very Deep Convolutional Residual Network Acoustic Models
S.Li, X.Lu, P.Shen, R.Takashima, T.Kawahara, H.Kawai
Proc. IEEE Workshop Automatic Speech Recognition & Understanding (ASRU)   222-227   2017年   [査読有り]
Cross-Domain Speech Recognition using Nonparallel Corpora with Cycle-consistent Adversarial Networks
M.Mimura, S.Sakai, T.Kawahara
Proc. IEEE Workshop Automatic Speech Recognition & Understanding (ASRU)   134-140   2017年   [査読有り]
Emotion Recognition by Combining Prosody and Sentiment Analysis for Expressing Reactive Emotion by Humanoid Robot
Y.Li, C.T.Ishi, N.Ward, K.Inoue, S.Nakamura, K.Takanashi, T.Kawahara
Proc. APSIPA ASC      2017年   [査読有り]
Automatic Meeting Transcription System for the Japanese Parliament (Diet)
T.Kawahara
Proc. APSIPA ASC      2017年   [査読有り][招待有り]
Joint Learning of Dialog Act Segmentation and Recognition in Spoken Dialog Using Neural Networks
T.Zhao, T.Kawahara
Proc. IJCNLP   704-712   2017年   [査読有り]
Modeling Difficulties of Second Language Learners using Speech Technology
T.Kawahara
Proc. Seoul International Conference on Speech Sciences (SICSS)      2017年   [招待有り]
Detection of Social Signals for Recognizing Engagement in Human-Robot Interaction
D.Lala, K.Inoue, P.Milhorat, T.Kawahara
Proc. AAAI Fall Sympo. Natural Communication for Human-Robot Collaboration      2017年   [査読有り]
Semi-Blind Speech Enhancement Based On Recurrent Neural Network For Source Separation And Dereverberation
M.Wake, Y.B,o, M.Mimura, K.Itoyama, K.Yoshii, T.Kawahara
Proc. IEEE Machine Learning for Signal Processing Workshop (MLSP)      2017年   [査読有り]
Detecting listening difficulty for second language learners using Automatic Speech Recognition errors
M.Mirzaei, K.Meshgi, T.Kawahara
Proc. Workshop Speech \& Language Technology for Education (SLaTE)   164-168   2017年   [査読有り]
Transfer Learning based Non-native Acoustic Modeling for Pronunciation Error Detection
R.Duan, T.Kawahara, M.Dantsuji, H.Nanjo
Proc. Workshop Speech \& Language Technology for Education (SLaTE)   50-54   2017年   [査読有り]
Listening Difficulty Detection to Foster Second Language Listening with the Partial and Synchronized Caption System
M.Mirzaei, K.Meshgi, T.Kawahara
Proc. EUROCALL   50-54   2017年   [査読有り]
Combined Multi-channel NMF-based Robust Beamforming for Noisy Speech Recognition
M.Mimura, Y.B,o, K.Shimada, S.Sakai, K.Yoshii, T.Kawahara
Proc. INTERSPEECH   2451-2455   2017年   [査読有り]
Analysis of the Relationship between Prosodic Features of Fillers and Its Forms or Occurrence Positions
S.Nakamura, R.Nakanishi, K.Takanashi, T.Kawahara
Proc. INTERSPEECH   1726-1230   2017年   [査読有り]
Social Signal Detection in Spontaneous Dialogue Using Bidirectional LSTM-CTC
H.Inaguma, K.Inoue, M.Mimura, T.Kawahara
Proc. INTERSPEECH   1691-1695   2017年   [査読有り]
Attentive Listening System with Backchanneling, Response Generation and Flexible Turn-taking
D.Lala, P.Milhorat, K.Inoue, M.Ishida, K.Takanashi, T.Kawahara
Proc. SIGdial Meeting Discourse & Dialogue   127-136   2017年   [査読有り]
A Conversational Dialogue Manager for the Humanoid Robot ERICA
P.Milhorat, D.Lala, K.Inoue, Z.Tianyu, M.Ishida, K.Takanashi, S.Nakamura, T.Kawahara
Proc. Int'l Workshop Spoken Dialogue Systems (IWSDS)      2017年   [査読有り]
Effective Articulatory Modeling for Pronunciation Error Detection of L2 Learner without Non-native Training Data
R.Duan, T.Kawahara, M.Dantsuji, J.Zhang
Proc. IEEE-ICASSP   5815-5819   2017年   [査読有り]
Semi-supervised Ensemble DNN Acoustic Model Training
S.Li, X.Lu, S.Sakai, M.Mimura, T.Kawahara
Proc. IEEE-ICASSP   5270-5274   2017年   [査読有り]
Bayesian Multichannel Nonnegative Matrix Factorization for Audio Source Separation and Localization
K.Itakura, Y.B,o, E.Nakamura, K.Itoyama, K.Yoshii, T.Kawahara
Proc. IEEE-ICASSP   551-555   2017年   [査読有り]
Utterance behavior of users while playing basketball with a virtual teammate
D.Lala, Y.Li, T.Kawahara
Proc. ICAART   28-38   2017年   [査読有り]
Multi-lingual and Multi-task DNN Learning for Articulatory Error Detection
R.Duan, T.Kawahara, M.Dantsuji, J.Zhang
Proc. APSIPA ASC      2016年   [査読有り]
ASR errors as predictor of L2 listening difficulties and PSC enhancement
M.Mirzaei, K.Meshgi, T.Kawahara
Proc. Coling Workshop on Computational Linguistics for Linguistic Complexity (CL4LC)   192-201   2016年   [査読有り]
Annotation and analysis of listener's engagement based on multi-modal behaviors
K.Inoue, D.Lala, S.Nakamura, K.Takanashi, T.Kawahara
Proc. ICMI Workshop on Multimodal Analyses enabling Artificial Agents in Human-Machine Interaction (MA3HMI)      2016年   [査読有り]
Prediction of Ice-breaking Between Participants Using Prosodic Features in the First Meeting Dialogue
H.Inaguma, K.Inoue, S.Nakamura, K.Takanashi, T.Kawahara
Proc. ICMI Workshop on Advancements in Social Signal Processing for Multimodal Interaction (ASSP4MI)      2016年   [査読有り]
Multimodal interaction with the autonomous android ERICA
D.Lala, P.Milhorat, K.Inoue, T.Zhao, T.Kawahara
Proc. ICMI   Demo. Paper 417-418   2016年   [査読有り]
Pronunaciation Error Detection using DNN Articulatory Model based on Multi-lingual and Multi-task Learning
R.Duan, T.Kawahara, M.Dantsuji, J.Zhang
Proc. Int'l Sympo. Chinese Spoken Language Processing (ISCSLP)      2016年   [査読有り]
Confidence Estimation for Speech Recognition Systems using Conditional Random Fields Trained with Partially Annotated Data
S.Li, X.Lu, S.Mori, Y.Akita, T.Kawahara
Proc. Int'l Sympo. Chinese Spoken Language Processing (ISCSLP)      2016年   [査読有り]
Managing Dialog and Joint Actions for Virtual Basketball Teammates
D.Lala, T.Kawahara
Proc. IVA   Poster    2016年   [査読有り]
Talking with ERICA, an autonomous android
K.Inoue, P.Milhorat, D.Lala, T.Zhao, T.Kawahara
Proc. SIGdial Meeting Discourse & Dialogue   Demo. Paper 212-215   2016年   [査読有り]
Joint Optimization of Denoising Autoencoder and DNN Acoustic Model Based on Multi-target Learning for Noisy Speech Recognition
M.Mimura, S.Sakai, T.Kawahara
Proc. INTERSPEECH   3803-3807   2016年   [査読有り]
Prediction and Generation of Backchannel Form for Attentive Listening Systems
T.Kawahara, T.Yamaguchi, K.Inoue, K.Takanashi, N.Ward
Proc. INTERSPEECH   2890-2894   2016年   [査読有り]
ERICA: The ERATO Intelligent Conversational Android
D.F.Glas, T.Minato, C.T.Ishi, T.Kawahara, H.Ishiguro
Proc. RO-MAN   22-29   2016年   [査読有り]
Leveraging Automatic Speech Recognition Errors to Detect Challenging Speech Segments in TED Talks
M.Mirzaei, K.Meshgi, T.Kawahara
Proc. EUROCALL   313-318   2016年   [査読有り]
Interactional and Pragmatics-related Prosodic Patterns in Mandarin Dialog
N.Ward, Y.Li, T.Zhao, T.Kawahara
Proc. Int'l Conf. Speech Prosody      2016年   [査読有り]
Data Selection from Multiple ASR Systems' Hypotheses for Unsupervised Acoustic Model Training
S.Li, Y.Akita, T.Kawahara
Proc. IEEE-ICASSP   5875-5879   2016年   [査読有り]
Analysis and Prediction of Morphological Patterns of Backchannels for Attentive Listening Agents
T.Yamaguchi, K.Inoue, K.Yoshino, K.Takanashi, N.Ward, T.Kawahara
Proc. Int'l Workshop Spoken Dialogue Systems (IWSDS)      2016年   [査読有り]
Synchrony in Prosodic and Linguistic Features between Backchannels and Preceding Utterances in Attentive Listening
T.Kawahara, T.Yamaguchi, M.Uesato, K.Yoshino, K.Takanashi
Proc. APSIPA ASC   392-395   2015年   [査読有り]
Automatic Classification of Usability of ASR Result for Real-time Captioning of Lectures
Y.Akita, N.Kuwahara, T.Kawahara
Proc. APSIPA ASC   19-22   2015年   [査読有り]
Discriminative Data Selection for Lightly Supervised Training of Acoustic Model using Closed Caption Texts
S.Li, Y.Akita, T.Kawahara
Proc. INTERSPEECH   3526-3530   2015年   [査読有り]
Enhanced Speaker Diarization with Detection of Backchannels using Eye-gaze Information in Poster Conversations
K.Inoue, Y.Wakabayashi, H.Yoshimoto, K.Takanashi, T.Kawahara
Proc. INTERSPEECH   3086-3090   2015年   [査読有り]
Ensemble Speaker Modeling using Speaker Adaptive Training Deep Neural Network for Speaker Adaptation
S.Li, X.Lu, Y.Akita, T.Kawahara
Proc. INTERSPEECH   2892-2896   2015年   [査読有り]
Speech Dereverberation Using Long Short-Term Memory
M.Mimura, S.Sakai, T.Kawahara
Proc. INTERSPEECH   2435-2439   2015年   [査読有り]
ASR Technology to Empower Partial and Synchronized Caption for L2 Listening Development
M.Mirzaei, T.Kawahara
Proc. Workshop Speech \& Language Technology for Education (SLaTE)   65-70   2015年   [査読有り]
Errors in Automatic Speech Recognition versus Difficulties in Second Language Listening
M.Mirzaei, K.Meshgi, Y.Akita, T.Kawahara
Proc. EUROCALL   410-415   2015年   [査読有り]
Named Entity Recognizer Trainable from Partially Annotated Data
T.Sasada, S.Mori, T.Kawahara, Y.Yamakata
Proc. PACLING   10-17   2015年   [査読有り]
Language Model Adaptation for Academic Lectures using Character Recognition Result of Presentation Slides
Y.Akita, Y.Tong, T.Kawahara
Proc. IEEE-ICASSP   5431-5435   2015年   [査読有り]
Deep Autoencoders Augmented with Phone-class Feature for Reverberant Speech Recognition
M.Mimura, S.Sakai, T.Kawahara
Proc. IEEE-ICASSP   4356-4369   2015年   [査読有り]
Toward Adaptive Generation of Backchannels for Attentive Listening Agents
T.Kawahara, M.Uesato, K.Yoshino, K.Takanashi
Proc. Int'l Workshop Spoken Dialogue Systems (IWSDS)      2015年   [査読有り]
News Navigation System based on Proactive Dialogue Strategy
K.Yoshino, T.Kawahara
Proc. Int'l Workshop Spoken Dialogue Systems (IWSDS)      2015年   [査読有り]
Speaker Diarization based on Audio-Visual Integration for Smart Posterboard
Y.Wakabayashi, K.Inoue, H.Yoshimoto, T.Kawahara
Proc. APSIPA ASC      2014年   [査読有り]
Unsupervised Speaker Adaptation of DNN-HMM by Selecting Similar Speakers for Lecture Transcription
M.Mimura, T.Kawahara
Proc. APSIPA ASC      2014年   [査読有り]
Partial and Synchronized Caption Generation to Develop Second Language Listening Skill
M.Mirzaei, Y.Akita, T.Kawahara
ICCE Workshop on Natural Language Processing Techniques for Educational Applications (NLP-TEA)   13-23   2014年   [査読有り]
Japanese-to-English Patent Translation System based on Domain-adapted Word Segmentation and Post-ordering
K.Sudoh, M.Nagata, S.Mori, T.Kawahara
Proc. Assoc. for Machine Translation in the Americas (AMTA)   1 234-248   2014年   [査読有り]
Speaker Diarization using Eye-gaze Information in Multi-party Conversations
K.Inoue, Y.Wakabayashi, H.Yoshimoto, T.Kawahara
Proc. INTERSPEECH   562-566   2014年   [査読有り]
Corpus and Transcription System of Chinese Lecture Room
S.Li, Y.Akita, T.Kawahara
Proc. Int'l Sympo. Chinese Spoken Language Processing (ISCSLP)   442-445   2014年   [査読有り]
Partial and synchronized captioning: A new tool for second language listening development
M.Mirzaei, Y.Akita, T.Kawahara
Proc. EUROCALL   230-236   2014年   [査読有り]
Information Navigation System Based on POMDP that Tracks User Focus
K.Yoshino, T.Kawahara
Proc. SIGdial Meeting Discourse & Dialogue   32-40   2014年   [査読有り]
Exploring Deep Neural Networks and Deep Autoencoders in Reverberant Speech Recognition
M.Mimura, S.Sakai, T.Kawahara
Workshop on Hands-free Speech Communication \& Microphone Arrays (HSCMA)      2014年   [査読有り]
Smart Posterboard: Multi-modal Sensing and Analysis of Poster Conversations
T.Kawahara
Proc. APSIPA ASC   32-40   2013年   [査読有り][招待有り]
Predicate Argument Structure Analysis using Partially Annotated Corpora
K.Yoshino, S.Mori, T.Kawahara
Proc. IJCNLP   957-961   2013年   [査読有り]
Estimation of Interest and Comprehension Level of Audience through Multi-modal Behaviors in Poster Conversations
T.Kawahara, S.Hayashi, K.Takanashi
Proc. INTERSPEECH   1882-1885   2013年   [査読有り]
Incorporating Semantic Information to Selection of Web Texts for Language Model of Spoken Dialogue System
K.Yoshino, S.Mori, T.Kawahara
Proc. IEEE-ICASSP   8252-8256   2013年   [査読有り]
Language Modeling for Spoken Dialogue System based on Filtering using Predicate-Argument Structures
K.Yoshino, S.Mori, T.Kawahara
Proc. COLING   2993-3002   2012年   [査読有り]
Hybrid Vector Space Model for Flexible Voice Search
C.Lee, T.Kawahara
Proc. APSIPA ASC      2012年   [査読有り]
Language Modeling for Spoken Dialogue System based on Sentence Transformation and Filtering using Predicate-Argument Structures
K.Yoshino, S.Mori, T.Kawahara
Proc. APSIPA ASC      2012年   [査読有り]
Automatic Transcription of Lecture Speech using Language Model Based on Speaking-Style Transformation of Proceeding Texts
Y.Akita, M.Watanabe, T.Kawahara
Proc. INTERSPEECH      2012年   [査読有り]
Dereverberation based on Wavelet Packet Filtering for Robust Automatic Speech Recognition
R.Gomez, T.Kawahara
Proc. INTERSPEECH      2012年   [査読有り]
Prediction of Turn-Taking by Combining Prosodic and Eye-Gaze Information in Poster Conversations
T.Kawahara, T.Iwatate, K.Takanashi
Proc. INTERSPEECH      2012年   [査読有り]
Can We Predict Who in the Audience will Ask What Kind of Questions with their Feedback Behaviors in Poster Conversation?
T.Kawahara, T.Iwatate, T.Tsuchiya, K.Takanashi
Proc. Interdisciplinary Workshop on Feedback Behaviors in Dialog   35-38   2012年   [査読有り]
Transcription System using Automatic Speech Recognition for the Japanese Parliament (Diet)
T.Kawahara
Proc. AAAI/IAAI   2224-2228   2012年   [査読有り][招待有り]
Machine Translation without Words through Substring Alignment
G.Neubig, T.Watanabe, S.Mori, T.Kawahara
Proc. ACL   165-174   2012年   [査読有り]
Multi-modal Sensing and Analysis of Poster Conversations toward Smart Posterboard
T.Kawahara
Proc. SIGdial Meeting Discourse & Dialogue   1-9   2012年   [査読有り][招待有り]
Discriminative Approach to Lexical Entry Selection for Automatic Speech Recognition of Agglutinative Language
M.Ablimit, T.Kawahara, A.Hamdulla
Proc. IEEE-ICASSP   5009-5012   2012年   [査読有り]
Morpheme Concatenation Approach in Language Modeling for Large-Vocabulary Uyghur Speech Recognition
M.Ablimit, A.Hamdulla, T.Kawahara
Proc. Oriental-COCOSDA Workshop      2011年   [査読有り]
Optimized Wavelet-based Speech Enhancement for Speech Recognition in Noisy and Reverberant Conditions
R.Gomez, T.Kawahara
Proc. APSIPA ASC      2011年   [査読有り]
Fast Speaker Normalization and Adaptation based on BIC for Meeting Speech Recognition
M.Mimura, T.Kawahara
Proc. APSIPA ASC      2011年   [査読有り]
Lexicon Optimization for Automatic Speech Recognition based on Discriminative Learning
M.Ablimit, T.Kawahara, A.Hamdulla
Proc. APSIPA ASC      2011年   [査読有り]
Improving Non-native Speech Recognition Performance by Discriminative Training for Language Model in a CALL System
H.Wang, T.Kawahara, Y.Wang
Proc. APSIPA ASC      2011年   [査読有り]
Info-concierge: Proactive Multi-modal Interaction through Mind Probing
T.Hirayama, Y.Sumi, T.Kawahara, T.Matsuyama
Proc. APSIPA ASC      2011年   [査読有り]
Combining Slot-based Vector Space Model for Voice Book Search
C.Lee, T.Kawahara, A.Rudnicky
Proc. Int'l Workshop Spoken Dialogue Systems (IWSDS)   27-35   2011年   [査読有り]
Automatic Comma Insertion of Lecture Transcripts Based on Multiple Annotations
Y.Akita, T.Kawahara
Proc. INTERSPEECH   2889-2892   2011年   [査読有り]
Denoising Using Optimized Wavelet Filtering for Automatic Speech Recognition
R.Gomez, T.Kawahara
Proc. INTERSPEECH   1673-1676   2011年   [査読有り]
An Unsupervised Model for Joint Phrase Alignment and Extraction
G.Neubig, T.Watanabe, E.Sumita, S.Mori, T.Kawahara
Proc. ACL-HLT   632-641   2011年   [査読有り]

Misc

 
自律型アンドロイドERICAにおけるエンゲージメント推定に基づく 音声対話システム
井上 昂治, Lala Divesh, 高梨 克也, 河原 達也
日本音響学会研究発表会講演論文集   2002/8/9    2018年
Improving articulatory attribute modeling based on multi-label training and label correction
Richeng Duan, Tatsuya Kawahara, Masatake Dantsuji, Hiroaki Nanjo
日本音響学会研究発表会講演論文集   2002/9/8    2018年
文字単位のモデルを併用した単語単位のEnd-to-End音声認識
上乃 聖, 稲熊 寛文, 三村 正人, 河原 達也
日本音響学会研究発表会講演論文集   2003/8/5    2018年
共感・発話促進のための多様な聞き手応答を生成する傾聴対話システム
石田 真也, 井上 昂治, 高梨 克也, 河原 達也
情報処理学会全国大会講演論文集   6Q-04    2018年
初対面対話における好感の生成と発話構成要素の予測のモデル
田中 滉己, 井上 昂治, 高梨 克也, 河原 達也
情報処理学会全国大会講演論文集   6Q-05    2018年
自律型アンドロイドのキャラクタ表現のための 対話の振る舞い制御モデルの構築と評価
山本 賢太, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
情報処理学会全国大会講演論文集   6Q-06    2018年
相槌・フィラー予測とのマルチタスク学習による円滑なターンテイキング
原 康平, 井上 昂治, 高梨 克也, 河原 達也
情報処理学会全国大会講演論文集   6Q-07    2018年
CTCによる文字単位のモデルを併用したAttentionによる単語単位の End-to-End音声認識
上乃 聖, 稲熊 寛文, 三村 正人, 河原 達也
情報処理学会研究報告   SLP-120-16    2018年
DAEを用いたリアルタイム遠隔音声認識
井上 昂治, 三村 正人, 石井 カルロス寿憲, 坂井 信輔, 河原 達也
日本音響学会研究発表会講演論文集   1-Q-6    2017年
Effective Articulatory Modeling for Pronunciation Error Detection
Richeng Duan, Tatsuya Kawahara, Masatake Dantsuji
日本音響学会研究発表会講演論文集   2-P-30    2017年
聞き手の多様なふるまいに基づく対話エンゲージメントの推定
井上 昂治, Lala Divesh, 高梨 克也, 河原 達也
日本音響学会研究発表会講演論文集   2003/5/1    2017年
ロボット対話における深層学習を用いたセミブラインド音声強調
和気 雅弥, 坂東 宜昭, 三村 正人, 糸山 克寿, 吉井 和佳, 河原 達也
情報処理学会全国大会講演論文集   6M-01    2017年
遠隔音声認識のためのブラインド音源分離に基づくビームフォーマ
島田 一希, 坂東 宜昭, 板倉 光佑, 三村 正人, 糸山 克寿, 吉井 和佳, 河原 達也
情報処理学会全国大会講演論文集   6M-02    2017年
自律型アンドロイドのキャラクタ表現のための対話の振る舞い制御
山本 賢太, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
情報処理学会全国大会講演論文集   7M-01    2017年
傾聴対話システムにおける自分語りを含む多様な聞き手応答の生成
石田 真也, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
情報処理学会全国大会講演論文集   7M-02    2017年
自律型アンドロイドによる対話における同調的笑いの生成
勝見 久央, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
情報処理学会研究報告   SLP-116-4    2017年
共感表出と発話促進のための聞き手応答を生成する傾聴対話システム
石田 真也, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B509-2    2018年
マルチチャネル非負値行列因子分解に基づく ビームフォーミングを用いた雑音環境下音声認識
島田 一希, 坂東 宜昭, 三村 正人, 糸山 克寿, 吉井 和佳, 河原 達也
電子情報通信学会技術研究報告   SP2017-90    2018年
ブラインド音源分離のための高速相関テンソル分解
北村 昂一, 坂東 宜昭, 糸山 克寿, 吉井 和佳, 河原 達也
電子情報通信学会技術研究報告   SP2017-127    2018年
ニューラルネットによる音声対話における非言語的振る舞いの検出
稲熊 寛文, 井上 昂治, 河原 達也
情報処理学会全国大会講演論文集   7M-04    2017年
End-to-Endモデルによる音声対話中のSocial Signalsの検出
稲熊 寛文, 井上 昂治, 三村 正人, 河原 達也
日本音響学会研究発表会講演論文集   2001/10/16    2017年
Language Independent Non-native Articulatory Modeling for Pronunciation Error Detection
Richeng Duan, Tatsuya Kawahara, Masatake Dantsuji, Hiroaki Nanjo
日本音響学会研究発表会講演論文集   2002/11/8    2017年
潜在キャラクタモデルによる聞き手のふるまいに基づく 対話エンゲージメントの推定
井上 昂治, Lala Divesh, 吉井 和佳, 高梨 克也, 河原 達也
日本音響学会研究発表会講演論文集   2-Q-12    2017年
LSTM-CTCによる音声対話におけるSocial Signalsの検出
稲熊 寛文, 井上 昂治, 三村 正人, 河原 達也
情報処理学会研究報告   SLP-115-9    2017年
フィラーの韻律的特徴と形態および生起位置との関係の分析
中村 静, 中西 亮輔, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B506-03    2017年
自律型アンドロイドERICAのための遠隔音声認識
井上 昂治, 三村 正人, 石井 カルロス寿憲, 河原 達也
日本音響学会研究発表会講演論文集   2001/1/1    2016年
傾聴対話システムのための多様な聞き手応答の生成
石田 真也, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
情報処理学会全国大会講演論文集   6Q-01    2016年
初対面対話における場の和みのマルチモーダルな分析と検出
稲熊 寛文, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
情報処理学会全国大会講演論文集   6Q-02    2016年
Diversity-driven Semi-supervised Ensemble DNN Acoustic Model Training
Sheng Li, Xugang Lu, Shinsuke Sakai, Tatsuya Kawahara
電子情報通信学会技術研究報告   SP2016-40    2016年
円滑な発話権制御のための談話行為の連鎖に基づく フィラーの生起と形態の予測
中西 亮輔, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B506-04    2017年
Emotion Recognition by Combining Prosody with Text Information and Assessment Selection for Human-Robot Interaction
Yuanchao Li, Inoue Koji, Shizuka Nakamura, Katsuya Takanashi, Toshinori Ishi Carlos, Tatsuya Kawahara
人工知能学会研究会資料   SLUD-B506-09    2017年
End-to-EndモデルによるSocial Signals検出および音声認識との統合
稲熊 寛文, 井上 昂治, 三村 正人, 河原 達也
情報処理学会研究報告   SLP-117-7    2017年
深層生成モデルを事前分布に用いた教師なし音声強調
坂東 宜昭, 三村 正人, 糸山 克寿, 吉井 和佳, 河原 達也
電子情報通信学会技術研究報告   SP2017-20    2017年
再帰型ニューラルネットワークを用いたセミブラインド音声分離・強調
和気 雅弥, 坂東 宜昭, 三村 正人, 糸山 克寿, 吉井 和佳, 河原 達也
電子情報通信学会技術研究報告   SP2017-22    2017年
雑音環境下音声認識のための多チャネル非負値行列因子分解に基づく 教師なしビームフォーマ
島田 一希, 坂東 宜昭, 三村 正人, 糸山 克寿, 吉井 和佳, 河原 達也
電子情報通信学会技術研究報告   SP2017-23    2017年
自律型アンドロイドの対話の振る舞い制御モデルによる キャラクタ表現法の検討
山本 賢太, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B508-05    2017年
自律型アンドロイドERICAにおける多様な聞き手応答を用いた傾聴対話
井上 昂治, Divesh Lala, Pierrick Milhorat, 石田 真也, 趙 天雨, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B508-11    2017年
潜在キャラクタモデルによるリアルタイム対話エンゲージメント推定
井上 昂治, Divesh Lala, Pierrick Milhorat, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B508-18    2017年
Joint Learning of Dialog Act Segmentation and Recognition Using Neural Networks
Tianyu Zhao, Tatsuya Kawahara
情報処理学会研究報告   SLP-119-12    2017年
Pronunciation Error Detection using DNN Articulatory Model based on Multi-lingual and Multi-task Learning
Richeng Duan, Tatsuya Kawahara, Masatake Dantsuji
日本音響学会研究発表会講演論文集   3-Q-23    2016年
相槌「うん」と「うーん」の表記の問題と韻律的な特徴
中村 静, 高梨 克也, 山口 貴史, Nigel Ward, 河原 達也
人工知能学会研究会資料   SLUD-B503-10    2016年
自律型アンドロイドによる円滑な発話権制御のための フィラーの生起位置と形態の分析
中西 亮輔, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B503-11    2016年
講演のリアルタイム字幕付与のための音声認識結果の簡約
大田 健翔, 秋田 祐哉, 河原 達也
情報処理学会研究報告   SLP-112-12    2016年
Data Selection Assisted by Caption to Improve Acoustic Modeling for Lecture Transcription
Sheng Li, Yuya Akita, Tatsuya Kawahara
日本音響学会研究発表会講演論文集   2002/4/4    2014年
スマートポスターボードにおける音響情報と画像情報の統合による 話者区間検出
若林 佑幸, 井上 昂治, 河原 達也, 中井 駿介, 宮崎 亮一, 猿渡 洋
日本音響学会研究発表会講演論文集   2-Q4-7    2014年
音声認識結果の有用性の自動判定に基づく 講義のリアルタイム字幕付与システム
桑原 暢弘, 秋田 祐哉, 河原 達也
音声ドキュメント処理ワークショップ   2002/4/5    2014年
スマートポスターボードにおける実環境を想定した複数話者分離
中井 駿介, 宮崎 亮一, 猿渡 洋, 中村 哲, 井上 昂治, 若林 佑幸, 河原 達也
日本音響学会研究発表会講演論文集   2-Q4-8    2014年
講演音声認識におけるDNN-HMMの教師なし話者適応
三村 正人, 河原 達也
日本音響学会研究発表会講演論文集   2-Q4-22    2014年
ユーザの焦点に適応的な雑談型音声情報案内システム
吉野 幸一郎, 河原 達也
人工知能学会研究会資料   SLUD-B303-11 761-764   2014年
傾聴対話システムのための発話を促す聞き手応答の生成
石田 真也, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B504-1    2016年
マルチチャネル音源分離のためのネスト型基底・音源混合モデルに基づく 時間周波数クラスタリング
板倉 光佑, 坂東 宜昭, 中村 栄太, 糸山 克寿, 吉井 和佳, 河原 達也
電子情報通信学会技術研究報告   SP2016-31    2016年
変分ベイズ多チャネルロバストNMFに基づく マイクロホンの移動・被覆を許容する音声強調
坂東 宜昭, 糸山 克寿, 昆陽 雅司, 田所 諭, 中臺 一博, 吉井 和佳, 河原 達也, 奥乃 博
電子情報通信学会技術研究報告   SP2016-36    2016年
Pronunciation Error Detection using DNN Articulatory Model based on Transfer Learning
Richeng Duan, Tatsuya Kawahara, Masatake Dantsuji
電子情報通信学会技術研究報告   SP2016-39    2016年
自律型アンドロイドERICAによる社会的役割に則したインタラクション
井上 昂治, Pierrick Milhorat, Divesh Lala, 趙 天雨, 河原 達也
人工知能学会研究会資料   SLUD-B505-7    2016年
階層ベイズモデルを用いた聞き手の多様なふるまいに基づく 対話エンゲージメントの推定
井上 昂治, Divesh Lala, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B505-28    2016年
Unsupervised Training of Deep Neural Network Acoustic Models for Lecture Transcription
Sheng Li, Yuya Akita, Tatsuya Kawahara
日本音響学会研究発表会講演論文集   1-R-4    2014年
ディープオートエンコーダとDNN-HMMを用いた残響下音声認識
三村 正人, 坂井 信輔, 河原 達也
情報処理学会研究報告   SLP-102-6    2014年
初対面対話における韻律的特徴に基づくアイスブレーキングの分析と予測
稲熊 寛文, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B505-29    2016年
発話行為の連鎖を考慮したフィラーの生起と形態の分析
中西 亮輔, 井上 昂治, 中村 静, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B505-30    2016年
マルチチャネル音源分離のための低ランク音源モデルと スパース重畳過程に基づくネスト型ベイズ混合・因子モデル
板倉 光佑, 坂東 宜昭, 中村 栄太, 糸山 克寿, 吉井 和佳, 河原 達也
電子情報通信学会技術研究報告   IBISML2016-95    2016年
自動音声認識を用いた放送大学のオンライン授業に対する字幕付与
河原 達也, 秋田 祐哉, 広瀬 洋子
情報処理学会研究報告   AAC-2-5    2016年
音素クラス情報を用いたディープオートエンコーダによる残響下音声認識
三村 正人, 坂井 信輔, 河原 達也
日本音響学会研究発表会講演論文集   1-P-22    2015年
Incorporating divergences from hypotheses of multiple ASR systems to improve unsupervised acoustic model training
Sheng Li, Yuya Akita, Tatsuya Kawahara
日本音響学会研究発表会講演論文集   1-P-23    2015年
拡散性雑音環境下における多人数会話のマルチモーダル話者区間検出
若林 佑幸, 中山 雅人, 西浦 敬信, 山下 洋一, 井上 昂治, 吉本 廣雅, 河原 達也
日本音響学会研究発表会講演論文集   1-Q-24    2015年
部分的アノテーションコーパスから学習可能な固有表現認識器
笹田 鉄郎, 森 信介, 河原 達也, 山肩 洋子
言語処理学会年次大会発表論文集   B5-4 748-751   2015年
ユーザの焦点を用いたPOMDPによる音声情報案内システム
吉野 幸一郎, 河原 達也
情報処理学会全国大会講演論文集   3D-01    2015年
講演音声認識結果の誤り箇所の復唱入力を用いたノートテイクシステム
大田 健翔, 秋田 祐哉, 河原 達也
情報処理学会全国大会講演論文集   5P-06    2015年
多様な形態の相槌をうつ音声対話システムのための傾聴対話の分析
山口 貴史, 吉野 幸一郎, 高梨 克也, 河原 達也
情報処理学会全国大会講演論文集   6P-08    2015年
スマートポスターボードにおける視線情報を用いた 話者区間検出及び相槌の同定
井上 昂治, 若林 佑幸, 吉本 廣雅, 高梨 克也, 河原 達也
情報処理学会全国大会講演論文集   6P-09    2015年
音素クラス特徴量を用いたLSTMによる残響下音声認識
三村 正人, 坂井 信輔, 河原 達也
日本音響学会研究発表会講演論文集   1-Q-7    2015年
Effective Combination of Multiple ASR Hypotheses with CRF-based Classifiers
Sheng Li, Yuya Akita, Tatsuya Kawahara
日本音響学会研究発表会講演論文集   1-Q-14    2015年
ポスター会話における音響・視線情報の確率的統合による 話者区間及び相槌の検出
井上 昂治, 若林 佑幸, 吉本 廣雅, 高梨 克也, 河原 達也
日本音響学会研究発表会講演論文集   2002/2/4    2015年
ポスター会話における音響・視線情報を統合した話者区間及び相槌の検出
井上 昂治, 若林 佑幸, 吉本 廣雅, 高梨 克也, 河原 達也
情報処理学会研究報告   SLP-105-9    2015年
傾聴対話における相槌形態と先行発話の統語構造の関係の分析
山口 貴史, 井上 昂治, 吉野 幸一郎, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B403-4    2015年
スマートポスターボードにおける視線情報を用いた話者区間及び相槌の検出
井上 昂治, 若林 佑幸, 吉本 廣雅, 高梨 克也, 河原 達也
情報処理学会研究報告   MUS-107-68    2015年
多様な相槌をうつ傾聴対話システムのための相槌形態の予測
山口 貴史, 井上 昂治, 吉野 幸一郎, 高梨 克也, Nigel Ward, 河原 達也
人工知能学会研究会資料   SLUD-B502-1    2015年
自律型アンドロイドEricaのための音声対話システム
井上 昂治, 河原 達也
人工知能学会研究会資料   SLUD-B502-5    2015年
音声認識を用いた講義・講演の字幕作成・編集システム
秋田 祐哉, 三村 正人, 河原 達也
情報処理学会研究報告   SLP-108-2    2015年
Discriminative Data Selection from Multiple ASR Systems' Hypotheses for Unsupervised Acoustic Model Training
Sheng Li, Yuya Akita, Tatsuya Kawahara
情報処理学会研究報告   SLP-109-8    2015年
[特別講演] 音声認識技術の展開
河原 達也
電子情報通信学会技術研究報告   PRMU2015-111    2015年   [依頼有り]
多人数会話における音響情報と視線情報の確率的統合による話者区間検出
井上 昂治, 若林 佑幸, 吉本 廣雅, 河原 達也
日本音響学会研究発表会講演論文集   2002/8/4    2014年
音声認識の方法論に関する考察―世代交代に向けて―
河原 達也
情報処理学会研究報告   SLP-100-3    2014年   [依頼有り]
音声言語情報処理研究会の20年―歴代主査による研究レビュー―
新田 恒雄, 小林 哲則, 中村 哲, 武田 一哉, 河原 達也, 伊藤 彰則
情報処理学会研究報告   SLP-100-5    2014年
傾聴対話における相槌の韻律的特徴の同調傾向の分析
上里 美樹, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B303-02    2014年
スマートポスターボード: ポスター会話のマルチモーダルなセンシングと解析
河原達也
人工知能学会研究会資料   Challenge-B303-1    2014年   [依頼有り]
Partial and Synchronized Caption Generation to Enhance the Listening Comprehension Skills of Second Language Learners
Maryam Sadat Mirzaei, Tatsuya Kawahara
情報処理学会研究報告   SLP-101-15    2014年
多人数会話における視線情報を用いた話者区間検出
井上 昂治, 若林 佑幸, 吉本 廣雅, 河原 達也
情報処理学会研究報告   SLP-102-1    2014年
講演スライドの文字認識結果を用いた音声認識の改善
童 弋正, 秋田 祐哉, 河原 達也
情報処理学会研究報告   SLP-102-3    2014年
Classifier-based Data Selection for Lightly-Supervised Training of Acoustic Model for Lecture Transcription
Sheng Li, Yuya Akita, Tatsuya Kawahara
情報処理学会研究報告   SLP-102-4    2014年
音声認識技術の活用による国会審議映像検索システムの実現
鈴木 泰山, 内山 雄司, 青木 保一, 相良 毅, 秋田 祐哉, 河原 達也, 竹田 香織, 増山 幹高
情報処理学会研究報告   SLP-103-5    2014年
ユーザの焦点を用いたPOMDPによる音声情報案内システム
吉野 幸一郎, 河原 達也
人工知能学会研究会資料   SLUD-B402-14    2014年
Combining Active Learning and Partial Annotation for Japanese Dependency Parsing
Daniel Flannery, 宮尾祐介, 森 信介, 河原 達也
言語処理学会年次大会発表論文集   D1-1 42-45   2013年
オープンコースウェアの講演を対象とした音声認識に基づく字幕付与
秋田 祐哉, 河原 達也
日本音響学会研究発表会講演論文集   2002/9/9    2013年
CSJを用いた日本語講演音声認識用DNN-HMMの構築
三村 正人, 河原 達也
日本音響学会研究発表会講演論文集   1-P-42b    2013年
Automatic transcription of Chinese spoken lectures
Sheng Li, Masato Mimura, Tatsuya Kawahara
日本音響学会研究発表会講演論文集   2-P-31    2013年
重み付き有限状態トランスデューサーを用いた文字誤り訂正
Graham Neubig, 森 信介, 河原 達也
言語処理学会年次大会発表論文集   C2-5 332-335   2009年
未知語を含む文脈情報の自動獲得による 統計的仮名漢字変換システムの分野適応
笹田 鉄郎, 森 信介, 河原 達也
言語処理学会年次大会発表論文集   C2-6 336-339   2009年
Unsupervised Optimization of Dereverberation Parameters based on the Likelihood of Speech Recognizer
R,y Gomez, Tatsuya Kawahara
日本音響学会研究発表会講演論文集   1-P-15    2009年
統計的話し言葉変換を用いた音響モデルのlightly supervised training
三村 正人, 河原 達也
日本音響学会研究発表会講演論文集   2001/5/9    2009年
Using Online Free Energy for Model Comparison with Application to Voice Activity Detection
David Cournapeau, Shinji Watanabe, Atsushi Nakamura, Tatsuya Kawahara
日本音響学会研究発表会講演論文集   2002/5/14    2009年

書籍等出版物

 
音声認識システム 改訂2版
河原達也
オーム社   2016年   
知のバリアフリー
河原 達也 (担当:分担執筆, 範囲:第4章 聴覚障害学生支援の最先端 --音声認識による字幕付与技術.)
京都大学学術出版会   2014年   
Springer Handbook on Speech Processing and Speech Communication
Sadaoki Furui and Tatsuya Kawahara (担当:分担執筆, 範囲:Chpter 32: Transcription and distillation of spontaneous speech)
Springer   2008年   
音声対話システム
河原達也, 荒木雅弘
オーム社   2006年   
Spoken Language Systems
Seiichi Nakagawa, Michio Okada, and Tatsuya Kawahara, editors
Ohmsha/IOS Press   2005年   

講演・口頭発表等

 
Audio-Visual Conversation Analysis by Smart Posterboard and Humanoid Robot [招待有り]
河原 達也
IEEE Singapore Section   2018年5月15日   
Spoken dialogue for a human-like conversational robot ERICA [招待有り]
河原 達也
International Workshop on Spoken Dialogue Systems Technology (IWSDS 2018)   2018年5月14日   
自然言語処理の歩みとこれから --言語処理と深層学習-- [招待有り]
河原 達也
言語処理学会年次大会   2018年3月14日   
Automatic Meeting Transcription System for the Japanese Parliament (Diet) [招待有り]
河原 達也
APSIPA ASC   2017年12月14日   
音声認識の主たる用途と技術トレンド [招待有り]
河原 達也
国際ロボット展 AI・音声認識フォーラム   2017年12月2日   
音声認識・対話システムの最前線 [招待有り]
河原 達也
自動車技術会 エレクトロニクス部門委員会   2017年11月14日   
Computer-Assisted Language Learning (CALL) using speech technology [招待有り]
河原 達也
Seoul International Conference on Speech Sciences (SICSS2017)   2017年11月11日   
Modeling difficulties of second language learners using speech technology [招待有り]
河原 達也
Seoul International Conference on Speech Sciences (SICSS2017)   2017年11月10日   
会議録における整文過程の分析 -衆議院と欧州議会の比較及び過去十年の変化- [招待有り]
河原 達也
国会研究会   2017年9月20日   
What makes a quality transcript in Parliamentary reporting [招待有り]
河原 達也
Intersteno Conference   2017年7月25日   
音声認識技術の現状と裁判・取調べへの適用における課題 [招待有り]
河原 達也
日本弁護士連合会   2017年6月6日   
音声認識・対話 [招待有り]
河原 達也
応用脳科学アカデミー   2017年1月23日   
Speech Understanding for Intelligent Conversational Agent [招待有り]
河原 達也
Microsoft Research Asia Faculty Summit   2016年11月4日   
話がわかるコンピュータ -音声認識と会話ロボットの最前線- [招待有り]
河原 達也
京都大学「東京で学ぶ 京大の知」シリーズ23   2016年11月1日   
Captioning Lectures with Automatic Speech Recognition (ASR) [招待有り]
河原 達也
Intersteno Conference   2015年7月21日   
Recent Paradigm Shift in Speech Recognition [招待有り]
河原 達也
京都大学-稲盛財団合同京都賞シンポジウム   2014年7月13日   
スマートポスターボード: ポスター会話のマルチモーダルなセンシングと解析 [招待有り]
河原 達也
人工知能学会 AIチャレンジ研究会   2014年3月18日   
音声認識の方法論に関する考察―世代交代に向けて―. [招待有り]
河原 達也
情報処理学会 音声言語情報処理研究会(SLP)   2014年1月31日   
Smart Posterboard: Multi-modal Sensing and Analysis of Poster Conversations [招待有り]
河原 達也
Proc. APSIPA ASC   2013年10月30日   
Subtitling Lecture Videos with Automatic Speech Recognition [招待有り]
河原 達也
Intersteno Conference   2013年7月16日   

担当経験のある科目

 
 

競争的資金等の研究課題

 
JST: 戦略的創造研究推進事業 CREST 「人間調和型情報環境」領域
研究期間: 2009年 - 2014年    代表者: 河原 達也
文部科学省: 科学研究費補助金(基盤研究(A))
研究期間: 2004年 - 2006年    代表者: 河原 達也
学会講演や大学の講義、放送番組や議会の討論などの音声アーカイブを対象として、自動音声認識及び書き起こしの自動整形に関する研究を行った。このような自然な話し言葉音声では、発音の変動が大きく、口語的な表現が多用されるため、これらの精緻なモデル化と統計的な学習が必要である。また、語彙や話題も多様であるため、個々の講演・講義・討論に対して適応を行う必要がある。そのため、以下のようなテーマに取り組んだ。・『日本語話し言葉コーパス』を用いた汎用的な発音変動モデルの統計的学習・統計的機械翻訳の枠組みに基...
文部科学省: 科学研究費補助金(特定領域研究)
研究期間: 2001年 - 2005年    代表者: 河原 達也
人間と共生する機械を実現するためには、システムがユーザのモデルを知覚し、それに応じて適応的に行動することが重要であると考えられる。本研究ではまず、音声対話によるインタフェースにおいて、協調的な応答を生成するためのユーザモデルについて検討を進めてきた。具体的には、システムに対する習熟度、タスクドメインに関する知識レベル、性急度の3つのユーザモデルを導入し、それに応じて対話制御を行う戦略を提案した。京都市バス運行情報案内システム(現在試験運用中:075-326-3116)において実装・評価を行...
人間どうしの音声コミュニケーションの認識・理解
JST: 戦略的創造研究推進事業 さきがけ 「協調と制御」領域
研究期間: 2001年 - 2004年    代表者: 河原 達也
文部科学省: 科学研究費補助金(基盤研究(B))
研究期間: 2000年 - 2002年    代表者: 河原 達也
講演や討論などの話し言葉の音声認識における問題を分析した上で、音響モデル・発音モデル・言語モデル・デコーダなどを検討・実装・評価した。学習・評価用のデータとして、開放的融合研究「話し言葉工学」プロジェクトで構築されている日本語話し言葉コーパスを用いた。話し言葉は書き言葉の読上げ音声と大きく性質が異なるため、それに合致したモデル化と認識手法の検討が必要となる。音響モデルについては発話スタイルとデータ量の影響を調べた。言語モデルについては,話し言葉コーパスのデータ量不足を補うために他のコーパス...
文部科学省: 科学研究費補助金(基盤研究(B))
研究期間: 1999年 - 2001年    代表者: 河原 達也
主に、英語を学習する日本人話者を対象として、発音訓練支援を行うCALLシステムの研究・開発をおこなった。具体的には以下の通りである。(1)誤りパターンの対判別を利用した日本人用英語発音教示システム 日本人学習者の典型的な英語発音誤りパターンのモデル化を行い、音声認識技術を用いて効果的に発音を教示するシステムを設計した。与えられた学習テキストに対して、誤りパターンに基づいて発音誤り候補を生成し、HMMによる認識器により、学習者の発音を同定、区分化する。HMMのみでは識別精度の信頼性が十分でな...