2001年4月
「日本語話し言葉コーパス」における書き起こしの方法とその基準について (特集:電子化資料による日本語研究)
日本語科学
- 巻
- 9
- 号
- 9
- 開始ページ
- 43
- 終了ページ
- 58
- 記述言語
- 日本語
- 掲載種別
- DOI
- 10.15084/00002055
- 出版者・発行元
- 国立国語研究所
国立国語研究所青山学院大学/国立国語研究所東京都立大学/国立国語研究所東京大学/国立国語研究所国立国語研究所国立国語研究所国立国語研究所国立国語研究所,通信総合研究所,東京工業大学では,科学技術振興調整費開放的融合研究制度『話し言葉の言語的・パラ言語的構造の解明に基づく「話し言葉工学」の構築』プロジェクトにおいて,自発性の高い話し言葉の情報処理基盤技術の確立を目標に活動を進めている。現在国立国語研究所では,このプロジェクトの一環として,モノローグを対象とした大規模な日本語話し言葉コーパスを作成している。このコーパスには,約700時間(約700万語に相当)の音声,書き起こしテキスト,および品詞や分節音,韻律などの情報が含まれる予定である。本稿では,本コーパスの書き起こしの方法とその基準について紹介する。
- リンク情報
- ID情報
-
- DOI : 10.15084/00002055
- CiNii Articles ID : 120006595255
- CiNii Books ID : AA1113775X