河原 達也

J-GLOBALへ         更新日: 16/04/18 01:59
 
アバター
研究者氏名
河原 達也
 
カワハラ タツヤ
URL
http://sap.ist.i.kyoto-u.ac.jp/members/kawahara/
所属
京都大学
職名
教授
学位
工学修士(京都大学), 工学博士(京都大学)

プロフィール

京都大学 情報学研究科 教授.
音声情報処理,特に音声認識及び対話システムに関する研究に従事.
主著に,「音声認識システム」「音声対話システム」(いずれもオーム社).
情報処理学会,日本音響学会,電子情報通信学会,人工知能学会,言語処理学会,IEEE,ISCA,APSIPA 各会員.

研究分野

 
 

経歴

 
2003年4月
 - 
現在
京都大学 情報学研究科 教授
 
2006年4月
 - 
現在
情報通信研究機構 短時間研究員・招へい専門員
 
2003年4月
 - 
2016年3月
京都大学 学術情報メディアセンター 教授
 
1998年9月
 - 
2006年3月
ATR 客員研究員
 
1999年10月
 - 
2004年3月
国立国語研究所 非常勤研究員
 
1998年4月
 - 
2003年3月
京都大学 情報学研究科 助教授
 
1995年6月
 - 
1998年4月
京都大学 工学部 助教授
 
1995年9月
 - 
1996年8月
米国ベル研究所 客員研究員
 
1990年11月
 - 
1995年5月
京都大学 工学部 助手
 

学歴

 
1987年3月
 - 
1989年4月
京都大学 工学研究科 情報工学専攻
 
1983年4月
 - 
1987年3月
京都大学 工学部 情報工学科
 

委員歴

 
2014年1月
 - 
2015年12月
APSIPA  VP-Publications (BoG member)
 
2014年6月
 - 
2015年6月
情報処理学会  理事
 
2008年4月
 - 
2012年3月
情報処理学会  音声言語情報処理研究会(SIG-SLP) 主査
 
2004年3月
 - 
2008年3月
言語処理学会  理事
 
2003年10月
 - 
2006年12月
IEEE SPS  Speech TC member
 

受賞

 
2012年
情報処理学会 論文賞
 
2012年
科学技術分野の文部科学大臣表彰科学技術賞
 
2011年
情報処理学会 喜安記念業績賞
 
2000年
情報処理学会 坂井記念特別賞
 
1997年
日本音響学会 粟屋学術奨励賞
 

論文

 
News Navigation System based on Proactive Dialogue Strategy
K.Yoshino, T.Kawahara
Proc. Int'l Workshop Spoken Dialogue Systems (IWSDS)      2015年   [査読有り]
Toward Adaptive Generation of Backchannels for Attentive Listening Agents
T.Kawahara, M.Uesato, K.Yoshino, K.Takanashi
Proc. Int'l Workshop Spoken Dialogue Systems (IWSDS)      2015年   [査読有り]
Deep Autoencoders Augmented with Phone-class Feature for Reverberant Speech Recognition
M.Mimura, S.Sakai, T.Kawahara
Proc. IEEE-ICASSP   4356-4369   2015年   [査読有り]
Language Model Adaptation for Academic Lectures using Character Recognition Result of Presentation Slides
Y.Akita, Y.Tong, T.Kawahara
Proc. IEEE-ICASSP   5431-5435   2015年   [査読有り]
Named Entity Recognizer Trainable from Partially Annotated Data
T.Sasada, S.Mori, T.Kawahara, Y.Yamakata
Proc. PACLING   10-17   2015年   [査読有り]
Errors in Automatic Speech Recognition versus Difficulties in Second Language Listening
M.Mirzaei, K.Meshgi, Y.Akita, T.Kawahara
Proc. EUROCALL   65-70   2015年   [査読有り]
ASR Technology to Empower Partial and Synchronized Caption for L2 Listening Development
M.Mirzaei, T.Kawahara
Proc. Workshop Speech \& Language Technology for Education (SLaTE)   65-70   2015年   [査読有り]
Speech Dereverberation Using Long Short-Term Memory
M.Mimura, S.Sakai, T.Kawahara
Proc. INTERSPEECH   2435-2439   2015年   [査読有り]
Ensemble Speaker Modeling using Speaker Adaptive Training Deep Neural Network for Speaker Adaptation
S.Li, X.Lu, Y.Akita, T.Kawahara
Proc. INTERSPEECH   2892-2896   2015年   [査読有り]
Enhanced Speaker Diarization with Detection of Backchannels using Eye-gaze Information in Poster Conversations
K.Inoue, Y.Wakabayashi, H.Yoshimoto, K.Takanashi, T.Kawahara
Proc. INTERSPEECH   3086-3090   2015年   [査読有り]
Discriminative Data Selection for Lightly Supervised Training of Acoustic Model using Closed Caption Texts
S.Li, Y.Akita, T.Kawahara
Proc. INTERSPEECH   3526-3530   2015年   [査読有り]
座談会:国会審議をめぐる学際的研究の可能性
増山 幹高, 河原 達也, 松田 謙次郎, 木村 泰知, 高丸 圭一
レヴァイアサン   (56) 8-53   2015年   [招待有り]
ICT・音声認識の活用による講演・講義の字幕付与
河原 達也
情報処理   56(6) 543-546   2015年   [招待有り]
音声認識技術
河原 達也
電子情報通信学会誌   98(8) 710-717   2015年   [招待有り]
レシピ表現の定義とその自動認識のためのタグ付与コーパスの構築
笹田 鉄郎, 前田 浩邦, 森 信介, 河原 達也, 山肩 洋子
自然言語処理   22(2) 107-131   2015年   [査読有り]
K.Yoshino, T.Kawahara
Computer Speech and Language   34 275-291   2015年   [査読有り]
M.Mimura, S.Sakai, T.Kawahara
EURASIP J. Advances in Signal Processing   2015(62) 1-13   2015年   [査読有り]
R.Gomez, T.Kawahara, K.Nakadai
APSIPA Trans. Signal & Information Process.   4(e3) 1-12   2015年   [査読有り]
Automatic Lecture Transcription based on Discriminative Data Selection for Lightly Supervised Acoustic Model Training
S.Li, Y.Akita, T.Kawahara
IEICE Trans.   E98-D(8) 1545-1552   2015年   [査読有り]
Exploring Deep Neural Networks and Deep Autoencoders in Reverberant Speech Recognition
M.Mimura, S.Sakai, T.Kawahara
Workshop on Hands-free Speech Communication \& Microphone Arrays (HSCMA)      2014年   [査読有り]
Information Navigation System Based on POMDP that Tracks User Focus
K.Yoshino, T.Kawahara
Proc. SIGdial Meeting Discourse \& Dialogue   32-40   2014年   [査読有り]
Partial and synchronized captioning: A new tool for second language listening development
M.Mirzaei, Y.Akita, T.Kawahara
Proc. EUROCALL   230-236   2014年   [査読有り]
Corpus and Transcription System of Chinese Lecture Room
S.Li, Y.Akita, T.Kawahara
Proc. Int'l Sympo. Chinese Spoken Language Processing (ISCSLP)   442-445   2014年   [査読有り]
Speaker Diarization using Eye-gaze Information in Multi-party Conversations
K.Inoue, Y.Wakabayashi, H.Yoshimoto, T.Kawahara
Proc. INTERSPEECH   562-566   2014年   [査読有り]
Japanese-to-English Patent Translation System based on Domain-adapted Word Segmentation and Post-ordering
K.Sudoh, M.Nagata, S.Mori, T.Kawahara
Proc. Assoc. for Machine Translation in the Americas (AMTA)   1 234-248   2014年   [査読有り]
Partial and Synchronized Caption Generation to Develop Second Language Listening Skill
M.Mirzaei, Y.Akita, T.Kawahara
ICCE Workshop on Natural Language Processing Techniques for Educational Applications (NLP-TEA)   13-23   2014年   [査読有り]
Unsupervised Speaker Adaptation of DNN-HMM by Selecting Similar Speakers for Lecture Transcription
M.Mimura, T.Kawahara
Proc. APSIPA ASC      2014年   [査読有り]
Speaker Diarization based on Audio-Visual Integration for Smart Posterboard
Y.Wakabayashi, K.Inoue, H.Yoshimoto, T.Kawahara
Proc. APSIPA ASC      2014年   [査読有り]
音声認識・対話技術の基礎と応用: 第1回 実用化進む音声認識 システムの構成要素を概観
河原 達也
日経エレクトロニクス   (2015年5月26日) 88-95   2014年   [招待有り]
音声認識・対話技術の基礎と応用: 第2回 音声認識に新潮流 ビッグデータやDNNを活用
河原 達也
日経エレクトロニクス   (2015年6月9日) 82-87   2014年   [招待有り]
音声認識・対話技術の基礎と応用: 第3回 音声認識・対話のアプリケーション 成功の鍵は必然性や自然性
河原 達也
日経エレクトロニクス   (2015年6月23日) 68-74   2014年   [招待有り]
音声認識・対話技術の基礎と応用: 第4回 話し言葉をテキスト化するシステム 会議録の作成や字幕付与への展開
河原 達也
日経エレクトロニクス   (2015年7月7日) 92-97   2014年   [招待有り]
音声認識・対話技術の基礎と応用: 最終回 音声対話システムの実際 Siriはどのように成功したか
河原 達也
日経エレクトロニクス   (2015年7月21日) 86-93   2014年   [招待有り]
述語項構造を介した文の選択に基づく音声対話用言語モデルの構築
吉野 幸一郎, 森 信介, 河原 達也
人工知能学会論文誌   29(1) 53-59   2014年   [査読有り]
Lexicon Optimization based on Discriminative Learning for Automatic Speech Recognition of Agglutinative Language
M.Ablimit, T.Kawahara, A.Hamdulla
Speech Communication   60 78-87   2014年   [査読有り]
Multi-Party Interaction Understanding using Smart Multimodal Digital Signage
T.Tung, R.Gomez, T.Kawahara, T.Matsuyama
IEEE Trans. Human-Machine Systems   44(5) 625-637   2014年   [査読有り]
Incorporating Semantic Information to Selection of Web Texts for Language Model of Spoken Dialogue System
K.Yoshino, S.Mori, T.Kawahara
Proc. IEEE-ICASSP   8252-8256   2013年   [査読有り]
Estimation of Interest and Comprehension Level of Audience through Multi-modal Behaviors in Poster Conversations
T.Kawahara, S.Hayashi, K.Takanashi
Proc. INTERSPEECH   1882-1885   2013年   [査読有り]
Predicate Argument Structure Analysis using Partially Annotated Corpora
K.Yoshino, S.Mori, T.Kawahara
Proc. IJCNLP   957-961   2013年   [査読有り]
Smart Posterboard: Multi-modal Sensing and Analysis of Poster Conversations
T.Kawahara
Proc. APSIPA ASC   32-40   2013年   [査読有り][招待有り]
音声対話システムの進化と淘汰 ―歴史と最近の技術動向―
河原 達也
人工知能学会誌   28(1) 45-51   2013年   [招待有り]
音声認識技術の現状と将来展望
河原 達也
電気学会誌   133(6) 364-367   2013年   [招待有り]
音声情報処理技術を用いた外国語学習支援
河原 達也, 峯松 信明
電子情報通信学会論文誌   J96-D(7) 1549-1565   2013年   [招待有り]
2012年度論文賞の受賞論文紹介: コンテンツの解析からインタラクションの解析へ
河原 達也
情報処理   54(8) 22-25   2013年   [招待有り]
音声認識技術の大規模データの書き起こしへの応用と研究開発テーマの発掘
河原 達也
研究開発リーダー   10(12) 22-25   2013年   [招待有り]
インテルステノ2013会議報告
河原 達也
日本の速記   (897) 27-31   2013年   [招待有り]
音声中の検索語検出のためのテストコレクションの構築と分析
伊藤 慶明, 西崎 博光, 中川 聖一, 秋葉 友良 , 河原 達也, 胡新輝, 南條浩輝, 松井 知子 , 山下 洋一, 相川 清明
情報処理学会論文誌   54(2) 471-483   2013年   [査読有り]
講演に対する読点の複数アノテーションに基づく自動挿入
秋田 祐哉, 河原 達也
情報処理学会論文誌   54(2) 463-470   2013年   [査読有り]
Substring-based Machine Translation
G.Neubig, T.Watanabe, S.Mori, T.Kawahara
Machine Translation   27(2) 139-166   2013年   [査読有り]
Admissible stopping in Viterbi beam search for unit selection speech synthesis
S.Sakai, T.Kawahara
IEICE Trans.   E96-D(6) 1359-1367   2013年   [査読有り]

Misc

 
音素クラス情報を用いたディープオートエンコーダによる残響下音声認識
三村 正人, 坂井 信輔, 河原 達也
日本音響学会研究発表会講演論文集   1-P-22    2015年
Incorporating divergences from hypotheses of multiple ASR systems to improve unsupervised acoustic model training
Sheng Li, Yuya Akita, Tatsuya Kawahara
日本音響学会研究発表会講演論文集   1-P-23    2015年
拡散性雑音環境下における多人数会話のマルチモーダル話者区間検出
若林 佑幸, 中山 雅人, 西浦 敬信, 山下 洋一, 井上 昂治, 吉本 廣雅, 河原 達也
日本音響学会研究発表会講演論文集   1-Q-24    2015年
部分的アノテーションコーパスから学習可能な固有表現認識器
笹田 鉄郎, 森 信介, 河原 達也, 山肩 洋子
言語処理学会年次大会発表論文集   B5-4 748-751   2015年
ユーザの焦点を用いたPOMDPによる音声情報案内システム
吉野 幸一郎, 河原 達也
情報処理学会全国大会講演論文集   3D-01    2015年
講演音声認識結果の誤り箇所の復唱入力を用いたノートテイクシステム
大田 健翔, 秋田 祐哉, 河原 達也
情報処理学会全国大会講演論文集   5P-06    2015年
Data Selection Assisted by Caption to Improve Acoustic Modeling for Lecture Transcription
Sheng Li, Yuya Akita, Tatsuya Kawahara
日本音響学会研究発表会講演論文集   2002/4/4    2014年
スマートポスターボードにおける音響情報と画像情報の統合による 話者区間検出
若林 佑幸, 井上 昂治, 河原 達也, 中井 駿介, 宮崎 亮一, 猿渡 洋
日本音響学会研究発表会講演論文集   2-Q4-7    2014年
音声認識結果の有用性の自動判定に基づく 講義のリアルタイム字幕付与システム
桑原 暢弘, 秋田 祐哉, 河原 達也
音声ドキュメント処理ワークショップ   2002/4/5    2014年
スマートポスターボードにおける実環境を想定した複数話者分離
中井 駿介, 宮崎 亮一, 猿渡 洋, 中村 哲, 井上 昂治, 若林 佑幸, 河原 達也
日本音響学会研究発表会講演論文集   2-Q4-8    2014年
講演音声認識におけるDNN-HMMの教師なし話者適応
三村 正人, 河原 達也
日本音響学会研究発表会講演論文集   2-Q4-22    2014年
ユーザの焦点に適応的な雑談型音声情報案内システム
吉野 幸一郎, 河原 達也
人工知能学会研究会資料   SLUD-B303-11 761-764   2014年
多様な形態の相槌をうつ音声対話システムのための傾聴対話の分析
山口 貴史, 吉野 幸一郎, 高梨 克也, 河原 達也
情報処理学会全国大会講演論文集   6P-08    2015年
スマートポスターボードにおける視線情報を用いた 話者区間検出及び相槌の同定
井上 昂治, 若林 佑幸, 吉本 廣雅, 高梨 克也, 河原 達也
情報処理学会全国大会講演論文集   6P-09    2015年
音素クラス特徴量を用いたLSTMによる残響下音声認識
三村 正人, 坂井 信輔, 河原 達也
日本音響学会研究発表会講演論文集   1-Q-7    2015年
Effective Combination of Multiple ASR Hypotheses with CRF-based Classifiers
Sheng Li, Yuya Akita, Tatsuya Kawahara
日本音響学会研究発表会講演論文集   1-Q-14    2015年
ポスター会話における音響・視線情報の確率的統合による 話者区間及び相槌の検出
井上 昂治, 若林 佑幸, 吉本 廣雅, 高梨 克也, 河原 達也
日本音響学会研究発表会講演論文集   2002/2/4    2015年
ポスター会話における音響・視線情報を統合した話者区間及び相槌の検出
井上 昂治, 若林 佑幸, 吉本 廣雅, 高梨 克也, 河原 達也
情報処理学会研究報告   SLP-105-9    2015年
傾聴対話における相槌形態と先行発話の統語構造の関係の分析
山口貴史, 井上 昂治, 吉野 幸一郎, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B403-4    2015年
Unsupervised Training of Deep Neural Network Acoustic Models for Lecture Transcription
Sheng Li, Yuya Akita, Tatsuya Kawahara
日本音響学会研究発表会講演論文集   1-R-4    2014年
ディープオートエンコーダとDNN-HMMを用いた残響下音声認識
三村 正人, 坂井 信輔, 河原 達也
情報処理学会研究報告   SLP-102-6    2014年
スマートポスターボードにおける視線情報を用いた話者区間及び相槌の検出
井上 昂治, 若林 佑幸, 吉本 廣雅, 高梨 克也, 河原 達也
情報処理学会研究報告   MUS-107-68    2015年
多人数会話における音響情報と視線情報の確率的統合による話者区間検出
井上 昂治, 若林 佑幸, 吉本 廣雅, 河原 達也
日本音響学会研究発表会講演論文集   2002/8/4    2014年
音声認識の方法論に関する考察―世代交代に向けて―
河原 達也
情報処理学会研究報告   SLP-100-3    2014年
音声言語情報処理研究会の20年―歴代主査による研究レビュー―
新田 恒雄, 小林 哲則, 中村 哲, 武田 一哉, 河原 達也, 伊藤 彰則
情報処理学会研究報告   SLP-100-5    2014年
傾聴対話における相槌の韻律的特徴の同調傾向の分析
上里 美樹, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B303-02    2014年
スマートポスターボード: ポスター会話のマルチモーダルなセンシングと解析
河原達也
人工知能学会研究会資料   Challenge-B303-1    2014年
Partial and Synchronized Caption Generation to Enhance the Listening Comprehension Skills of Second Language Learners
Maryam Sadat Mirzaei, Tatsuya Kawahara
情報処理学会研究報告   SLP-101-15    2014年
多人数会話における視線情報を用いた話者区間検出
井上 昂治, 若林 佑幸, 吉本 廣雅, 河原 達也
情報処理学会研究報告   SLP-102-1    2014年
講演スライドの文字認識結果を用いた音声認識の改善
童 弋正, 秋田 祐哉, 河原 達也
情報処理学会研究報告   SLP-102-3    2014年
Classifier-based Data Selection for Lightly-Supervised Training of Acoustic Model for Lecture Transcription
Sheng Li, Yuya Akita, Tatsuya Kawahara
情報処理学会研究報告   SLP-102-4    2014年
音声認識技術の活用による国会審議映像検索システムの実現
鈴木 泰山, 内山 雄司, 青木 保一, 相良 毅, 秋田 祐哉, 河原 達也, 竹田 香織, 増山 幹高
情報処理学会研究報告   SLP-103-5    2014年
ユーザの焦点を用いたPOMDPによる音声情報案内システム
吉野 幸一郎, 河原 達也
人工知能学会研究会資料   SLUD-B402-14    2014年
Combining Active Learning and Partial Annotation for Japanese Dependency Parsing
Daniel Flannery, 宮尾祐介, 森 信介, 河原 達也
言語処理学会年次大会発表論文集   D1-1 42-45   2013年
オープンコースウェアの講演を対象とした音声認識に基づく字幕付与
秋田 祐哉, 河原 達也
日本音響学会研究発表会講演論文集   2002/9/9    2013年
CSJを用いた日本語講演音声認識用DNN-HMMの構築
三村 正人, 河原 達也
日本音響学会研究発表会講演論文集   1-P-42b    2013年
Automatic transcription of Chinese spoken lectures
Sheng Li, Masato Mimura, Tatsuya Kawahara
日本音響学会研究発表会講演論文集   2-P-31    2013年
音声認識を用いたオンライン自動字幕作成・編集システム
秋田 祐哉, 河原 達也
日本音響学会研究発表会講演論文集   2002/8/4    2013年
[招待講演] 音声対話システムの進化と淘汰
河原 達也
人工知能学会研究会資料   SLUD-B203-02    2013年
[特別講演] スマートポスターボード: ポスター発表における場のマルチモーダルなセンシングと認識
河原 達也
電子情報通信学会技術研究報告   PRMU2012-167    2013年
音声認識の方法論に関する考察―歴史的変遷と今後の展望―
河原 達也
情報処理学会研究報告   MUS-99-1    2013年
述語項構造を介したWebテキストからの文選択に基づく言語モデルの評価
吉野 幸一郎, 森 信介, 河原 達也
情報処理学会研究報告   SLP-97-4    2013年
CSJを用いた日本語講演音声認識へのDNN-HMMの適用と話者適応の検討
三村 正人, 河原 達也
情報処理学会研究報告   SLP-97-9    2013年
ポスター会話における聴衆のマルチモーダルな振る舞いに基づく 興味・理解度の推定
河原 達也, 林 宗一郎, 高梨 克也
情報処理学会研究報告   SLP-97-12    2013年
Wavelet Packet Decomposition-based Dereverberation for ASR
R,y Gomez, Tatsuya Kawahara
日本音響学会研究発表会講演論文集   1-P-16    2012年
Automatic Speech Recognition for TED Talks
Welly Naptali, Tatsuya Kawahara
日本音響学会研究発表会講演論文集   3-P-4    2012年
予稿の話し言葉変換に基づく言語モデルによる講演音声認識
渡邉 真人, 秋田 祐哉, 河原 達也
日本音響学会研究発表会講演論文集   2003/7/5    2012年
部分文字列に基づく機械翻訳
Graham Neubig, 渡辺 太郎, 森 信介, 河原 達也
言語処理学会年次大会発表論文集   E1-8 155-158   2012年
述語項構造を用いた文変換とフィルタリングに基づく音声対話用言語モデル
吉野 幸一郎, 森 信介, 河原 達也
言語処理学会年次大会発表論文集   D3-2 635-638   2012年
仮名漢字変換ログを用いた講義音声認識のための言語モデル適応
山口 洋平, 森 信介, 河原 達也
言語処理学会年次大会発表論文集   C5-4 1276-1279   2012年
講演の音声認識と整形に基づく自動字幕付与
秋田 祐哉, 渡邉 真人, 河原 達也
日本音響学会研究発表会講演論文集   2001/1/18    2012年
Automatic transcription of TED Talks
Welly Naptali, Tatsuya Kawahara
音声ドキュメント処理ワークショップ      2012年
ポスター会話におけるパラ言語・非言語情報を用いた 話者交替及び次話者の予測
岩立 卓真, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-B103-10    2012年
述語項構造を介した文の変換と選択に基づく音声対話用言語モデルの構築
吉野 幸一郎, 森 信介, 河原 達也
情報処理学会研究報告   SLP-91-3    2012年
[招待講演] スマートポスターボード: ポスター会話のマルチモーダルなセンシングと認識
河原 達也
電子情報通信学会技術研究報告   SP2012-51    2012年
Wavelet Packet Decomposition Approach to Reverberant Speech Recognition
R,y Gomez, Tatsuya Kawahara
情報処理学会研究報告   SLP-92-11    2012年
Comparison of Discriminative Models for Lexicon Optimization for ASR of Agglutinative Language
Mijit Ablimit, Tatsuya Kawahara, Askar Hamdulla
情報処理学会研究報告   SLP-92-13    2012年
素性頻度ファイルと部分的アノテーションコーパスからの単語分割器の学習
笹田 鉄郎, 森 信介, Graham Neubig, 河原 達也
情報処理学会研究報告   NL-207-8    2012年
議会の会議録作成のための音声認識−衆議院のシステムの概要−
河原 達也
情報処理学会研究報告   SLP-93-5    2012年
重み付き有限状態トランスデューサーを用いた文字誤り訂正
Graham Neubig, 森 信介, 河原 達也
言語処理学会年次大会発表論文集   C2-5 332-335   2009年
未知語を含む文脈情報の自動獲得による 統計的仮名漢字変換システムの分野適応
笹田 鉄郎, 森 信介, 河原 達也
言語処理学会年次大会発表論文集   C2-6 336-339   2009年
Unsupervised Optimization of Dereverberation Parameters based on the Likelihood of Speech Recognizer
R,y Gomez, Tatsuya Kawahara
日本音響学会研究発表会講演論文集   1-P-15    2009年
統計的話し言葉変換を用いた音響モデルのlightly supervised training
三村 正人, 河原 達也
日本音響学会研究発表会講演論文集   2001/5/9    2009年
Using Online Free Energy for Model Comparison with Application to Voice Activity Detection
David Cournapeau, Shinji Watanabe, Atsushi Nakamura, Tatsuya Kawahara
日本音響学会研究発表会講演論文集   2002/5/14    2009年
会議録作成支援のための国会審議の音声認識システム
秋田 祐哉, 三村 正人, 河原 達也
日本音響学会研究発表会講演論文集   2003/5/7    2009年
大規模文書を知識ベースとする音声対話システム
翠 輝久, 河原 達也
情報処理学会全国大会講演論文集   5 339-340   2008年
A Japanese CALL System for Practicing Sentence Patterns based on Dynamic Question Generation
Hongcui Wang, Tatsuya Kawahara
日本音響学会研究発表会講演論文集   2001/10/4    2008年
A VAD Method using Online Variational Free Energy for Model Adaptation
David Cournapeau, Tatsuya Kawahara
日本音響学会研究発表会講演論文集   2001/10/7    2008年
Aggregated cross-validation 尤度を用いた 混合ガウス分布最適化アルゴリズムの提案
篠崎 隆宏, 古井 貞煕, 河原 達也
日本音響学会研究発表会講演論文集   2002/10/1    2008年
話し言葉スタイルへの統計的変換法のCSJへの適用
秋田 祐哉, 河原 達也
日本音響学会研究発表会講演論文集   2003/10/19    2008年
音声対話システムにおける 発話意図と対話の齟齬による発話タイミングへの影響の分析
豊倉 正佳, 翠 輝久, 河原 達也
言語処理学会年次大会発表論文集   A1-3 13-16   2008年
音声対話システムにおける ユーザのバージイン率に着目した音声認識誤りの予測
駒谷 和範, 河原 達也, 奥乃 博
言語処理学会年次大会発表論文集   A1-4 17-20   2008年
音声による情報案内システムにおける ベイズリスクに基づく応答生成の最適化
翠 輝久, 河原 達也
言語処理学会年次大会発表論文集   A1-6 25-28   2008年
話し言葉の整形作業における削除箇所の自動同定
尾嶋 憲治, 河原 達也, 秋田 祐哉, 内元 清貴
情報処理学会研究報告   SLP-71-13 396-399   2008年
ポスター会話におけるあいづちの韻律的特徴に関する印象評定
常 志強, 高梨 克也, 河原 達也
人工知能学会研究会資料   SLUD-A901-06    2009年
点予測による述語項構造解析
吉野 幸一郎, 森 信介, 河原 達也
情報処理学会研究報告   NL-209-6    2012年
音声対話システムにおけるベイズリスクに基づく応答候補の選択
翠 輝久, 河原 達也
日本音響学会研究発表会講演論文集   2001/9/4    2007年
単語グラフを用いたベイズリスク最小化音声認識の重要文抽出における評価
南條 浩輝, 河原 達也
日本音響学会研究発表会講演論文集   2001/9/14    2007年
クロスバリデーション尤度によるHMMの混合数の最適化
篠崎 隆宏, 河原 達也
日本音響学会研究発表会講演論文集   2002/9/3    2007年
PLSAを用いた話題区間推定に基づく単語辞書と言語モデルの適応
秋田 祐哉, 根本 雄介, 河原 達也
日本音響学会研究発表会講演論文集   2003/9/9    2007年
Real-time VAD Algorithm based on Enhanced Cumulant and On-line EM: Results on CENSREC-1-C
David Cournapeau, Tatsuya Kawahara
日本音響学会研究発表会講演論文集   2003/9/13    2007年
講義音声認識のためのスライド情報を用いた言語モデル適応
根本 雄介, 秋田 祐哉, 河原 達也
音声ドキュメント処理ワークショップ   E1-1 89-94   2007年
情報抽出と述語項の類似度を利用した音声対話システム
吉野 幸一郎, 森 信介, 河原 達也
言語処理学会年次大会発表論文集   D1-6 107-110   2011年
階層的モデルを用いた機械翻訳のためのフレーズアライメント
Graham Neubig, 渡辺 太郎, 隅田 英一郎, 森 信介, 河原 達也
言語処理学会年次大会発表論文集   D3-1 794-797   2011年
変換ログを用いた仮名漢字変換精度の向上
山口 洋平, 森 信介, 河原 達也
言語処理学会年次大会発表論文集   C5-3 1103-1106   2011年
多言語データを活用した音響モデル改良法における 言語間音素マッピング方法の検討
阿部 一彦, 堀 智織, 磯谷 亮輔, 河井 恒, 中村 哲, 河原 達也
日本音響学会研究発表会講演論文集   2-P-5    2011年
Wavelet Optimization using Noise Profiles for Noise-robust Speech Recognition
R,y Gomez, Tatsuya Kawahara
日本音響学会研究発表会講演論文集   2-P-17    2011年
衆議院会議録作成における音声認識システム − 事前音響処理 −
小橋川 哲, 浅見 太一, 山口 義和, 阪内 澄宇 , 小川 厚徳, 政瀧 浩和, 高橋 敏, 河原 達也
日本音響学会研究発表会講演論文集   2003/5/9    2011年
衆議院会議録作成における音声認識システム − 探索技術 −
堀 貴明, 中村 篤, 山口 義和, 小橋川 哲, 浅見 太一, 政瀧 浩和, 高橋 敏, 河原 達也
日本音響学会研究発表会講演論文集   2003/5/8    2011年
衆議院会議録作成における音声認識システム − 音響モデル −
三村 正人, 秋田 祐哉, 河原 達也
日本音響学会研究発表会講演論文集   2003/5/7    2011年
衆議院会議録作成における音声認識システム − 言語モデル −
秋田 祐哉, 河原 達也, 政瀧 浩和
日本音響学会研究発表会講演論文集   2003/5/6    2011年
衆議院会議録作成における音声認識システム − 全体の構成と評価 −
河原 達也, 秋田 祐哉, 三村 正人, 政瀧 浩和, 高橋 敏
日本音響学会研究発表会講演論文集   2003/5/5    2011年
Robust Speech Recognition in Noisy and Reverberant Conditions Using Wiener Filtering in the Wavelet Domain
R,y Gomez, Tatsuya Kawahara
日本音響学会研究発表会講演論文集   2-Q-21    2011年
大学講義の音声認識のための音響・言語モデル適応に関する検討
三村 正人, 河原 達也
日本音響学会研究発表会講演論文集   3-P-6    2011年
講演における複数アノテーションに基づく句読点の自動挿入
秋田 祐哉, 河原 達也
日本音響学会研究発表会講演論文集   2003/10/4    2011年
話し言葉の音声認識からコミュニケーションの理解へ -- 国会審議の音声認識からポスター会話の分析へ --
河原 達也
日本音声学会全国大会予稿集   (((((((調調岷岷) 1-8   2011年
点予測と系列予測の2段階化による品詞推定の精度向上
中田 陽介, Graham Neubig, 森 信介, 河原 達也
情報処理学会研究報告   NL-200-2    2011年
Combining Slot-based Vector Space Models for Voice Book Search
Cheongjae Lee, Alex,er Rudnicky, Tatsuya Kawahara
情報処理学会研究報告   SLP-85-5    2011年
Robust Speech Recognition Using Optimized Wavelet Denoising with Noise Profiles
R,y Gomez, Tatsuya Kawahara
情報処理学会研究報告   SLP-85-12    2011年
講演に対する読点の複数アノテーションに基づく自動挿入
秋田 祐哉, 河原 達也
情報処理学会研究報告   SLP-87-4    2011年

書籍等出版物

 
知のバリアフリー
河原 達也 (担当:分担執筆, 範囲:第4章 聴覚障害学生支援の最先端 --音声認識による字幕付与技術.)
京都大学学術出版会   2014年   
Springer Handbook on Speech Processing and Speech Communication
Sadaoki Furui and Tatsuya Kawahara (担当:分担執筆, 範囲:Chpter 32: Transcription and distillation of spontaneous speech)
Springer   2008年   
音声認識システム
鹿野清宏,伊藤克亘,河原達也,武田一哉,山本幹雄
オーム社   2001年   
Spoken Language Systems
Seiichi Nakagawa, Michio Okada, and Tatsuya Kawahara, editors
Ohmsha/IOS Press   2005年   
音声対話システム
河原達也, 荒木雅弘
オーム社   2006年   

講演・口頭発表等

 
Captioning Lectures with Automatic Speech Recognition (ASR) [招待有り]
河原 達也
Intersteno Conference   2015年7月21日   
Recent Paradigm Shift in Speech Recognition [招待有り]
河原 達也
京都大学-稲盛財団合同京都賞シンポジウム   2014年7月13日   
スマートポスターボード: ポスター会話のマルチモーダルなセンシングと解析 [招待有り]
河原 達也
人工知能学会 AIチャレンジ研究会   2014年3月18日   
音声認識の方法論に関する考察―世代交代に向けて―. [招待有り]
河原 達也
情報処理学会 音声言語情報処理研究会(SLP)   2014年1月31日   
Smart Posterboard: Multi-modal Sensing and Analysis of Poster Conversations [招待有り]
河原 達也
Proc. APSIPA ASC   2013年10月30日   
Subtitling Lecture Videos with Automatic Speech Recognition [招待有り]
河原 達也
Intersteno Conference   2013年7月16日   
音声認識の方法論に関する考察―歴史的変遷と今後の展望―. [招待有り]
河原 達也
情報処理学会 音学シンポジウム   2013年5月11日   
音声対話システムの歴史と最近の技術動向 [招待有り]
河原達也
日本音響学会技術動向レビュー,東京工科大学,2013 年3 月12 日   2013年3月12日   
スマートポスターボード: ポスター発表における場のマルチモーダルなセンシングと認識. [招待有り]
河原達也
電子情報通信学会 パターン認識・メディア理解研究会(PRMU)   2013年2月22日   
音声対話システムの進化と淘汰 [招待有り]
河原 達也
人工知能学会 言語・音声理解と対話処理研究会(SLUD)   2013年2月1日   
Transcription System using Automatic Speech Recognition for the Japanese Parliament (Diet) [招待有り]
河原 達也
AAAI/IAAI   2012年7月26日   
スマートポスターボード: ポスター会話のマルチモーダルなセンシングと認識 [招待有り]
河原 達也
電子情報通信学会音声研究会(SP)   2012年7月20日   
Multi-modal Sensing and Analysis of Poster Conversations toward Smart Posterboard [招待有り]
河原 達也
SIGdial Meeting Discourse & Dialogue   2012年7月20日   
話し言葉の音声認識からコミュニケーションの理解へ [招待有り]
河原 達也
日本音声学会全国大会公開基調講演   2011年9月24日   
New Transcription System using Automatic Speech Recognition (ASR) in the Japanese Parliament (Diet) [招待有り]
河原 達也
Intersteno Conference   2011年7月14日   
Automatic Transcription of Parliamentary Meetings and Classroom Lectures -- A Sustainable Approach and Real System Evaluations -- [招待有り]
河原 達也
Int'l Sympo. Chinese Spoken Language Processing (ISCSLP)   2010年12月3日   
New Perspectives on Spoken Language Understanding: Does Machine Need to Fully Understand Speech? [招待有り]
河原 達也
IEEE Workshop Automatic Speech Recognition & Understanding (ASRU)   2009年12月16日   
Transcription System using Automatic Speech Recognition (ASR) for the Japanese Parliament (Diet) [招待有り]
河原 達也
Intersteno Conference   2009年8月19日   

担当経験のある科目

 
 

競争的資金等の研究課題

 
JST: 戦略的創造研究推進事業 CREST 「人間調和型情報環境」領域
研究期間: 2009年 - 2014年    代表者: 河原 達也
文部科学省: 科学研究費補助金(基盤研究(A))
研究期間: 2004年 - 2006年    代表者: 河原 達也
学会講演や大学の講義、放送番組や議会の討論などの音声アーカイブを対象として、自動音声認識及び書き起こしの自動整形に関する研究を行った。このような自然な話し言葉音声では、発音の変動が大きく、口語的な表現が多用されるため、これらの精緻なモデル化と統計的な学習が必要である。また、語彙や話題も多様であるため、個々の講演・講義・討論に対して適応を行う必要がある。そのため、以下のようなテーマに取り組んだ。・『日本語話し言葉コーパス』を用いた汎用的な発音変動モデルの統計的学習・統計的機械翻訳の枠組みに基...
文部科学省: 科学研究費補助金(特定領域研究)
研究期間: 2001年 - 2005年    代表者: 河原 達也
人間と共生する機械を実現するためには、システムがユーザのモデルを知覚し、それに応じて適応的に行動することが重要であると考えられる。本研究ではまず、音声対話によるインタフェースにおいて、協調的な応答を生成するためのユーザモデルについて検討を進めてきた。具体的には、システムに対する習熟度、タスクドメインに関する知識レベル、性急度の3つのユーザモデルを導入し、それに応じて対話制御を行う戦略を提案した。京都市バス運行情報案内システム(現在試験運用中:075-326-3116)において実装・評価を行...
人間どうしの音声コミュニケーションの認識・理解
JST: 戦略的創造研究推進事業 さきがけ 「協調と制御」領域
研究期間: 2001年 - 2004年    代表者: 河原 達也
文部科学省: 科学研究費補助金(基盤研究(B))
研究期間: 2000年 - 2002年    代表者: 河原 達也
講演や討論などの話し言葉の音声認識における問題を分析した上で、音響モデル・発音モデル・言語モデル・デコーダなどを検討・実装・評価した。学習・評価用のデータとして、開放的融合研究「話し言葉工学」プロジェクトで構築されている日本語話し言葉コーパスを用いた。話し言葉は書き言葉の読上げ音声と大きく性質が異なるため、それに合致したモデル化と認識手法の検討が必要となる。音響モデルについては発話スタイルとデータ量の影響を調べた。言語モデルについては,話し言葉コーパスのデータ量不足を補うために他のコーパス...
文部科学省: 科学研究費補助金(基盤研究(B))
研究期間: 1999年 - 2001年    代表者: 河原 達也
主に、英語を学習する日本人話者を対象として、発音訓練支援を行うCALLシステムの研究・開発をおこなった。具体的には以下の通りである。(1)誤りパターンの対判別を利用した日本人用英語発音教示システム 日本人学習者の典型的な英語発音誤りパターンのモデル化を行い、音声認識技術を用いて効果的に発音を教示するシステムを設計した。与えられた学習テキストに対して、誤りパターンに基づいて発音誤り候補を生成し、HMMによる認識器により、学習者の発音を同定、区分化する。HMMのみでは識別精度の信頼性が十分でな...