2020年10月22日
超高齢者音声コーパスEARSの構築と音声認識への利用の予備検討
情報処理学会研究報告
- ,
- ,
- ,
- ,
- ,
- 記述言語
- 日本語
- 会議種別
高齢者の音声は一般成人と異なる複数の特徴を持つため,その認識精度は現在のところ不十分と言わざるを得ない.その精度向上には大量の高齢者音声データが必要であり,大規模な高齢者音声コーパスとして,話者の平均年齢67.6歳のS-JNASが汎用されている.しかしげ内の日本の平均寿命との間に大きな年齢差が生じていることから,我々はと超高齢者を対象とした音声コーパス(EARS: Elderly Adults Read Speech)の構築を開始した.コーパスのデザインはS-JNASを参考にし,現在までに121名(平均年齢:83.4歳)の音声を収集・データベース化した.本報告ではその仕様について述べるとともに,本コーパスを用いた高齢者音声の音響モデルの予備的検討についても報告する.