論文

2001年4月

「日本語話し言葉コーパス」における書き起こしの方法とその基準について (特集:電子化資料による日本語研究)

日本語科学
  • 小磯 花絵
  • 土屋 菜穂子
  • 間淵 洋子
  • 斉藤 美紀
  • 籠宮 隆之
  • 菊池 英明
  • 前川 喜久雄
  • Hanae KOISO
  • Naoko TSUCHIYA
  • Yoko MABUCHI
  • Miki SAITO
  • Takayuki KAGOMIYA
  • Hideaki KIKUCHI
  • Kikuo MAEKAWA
  • 全て表示

9
9
開始ページ
43
終了ページ
58
記述言語
日本語
掲載種別
DOI
10.15084/00002055
出版者・発行元
国立国語研究所

国立国語研究所青山学院大学/国立国語研究所東京都立大学/国立国語研究所東京大学/国立国語研究所国立国語研究所国立国語研究所国立国語研究所国立国語研究所,通信総合研究所,東京工業大学では,科学技術振興調整費開放的融合研究制度『話し言葉の言語的・パラ言語的構造の解明に基づく「話し言葉工学」の構築』プロジェクトにおいて,自発性の高い話し言葉の情報処理基盤技術の確立を目標に活動を進めている。現在国立国語研究所では,このプロジェクトの一環として,モノローグを対象とした大規模な日本語話し言葉コーパスを作成している。このコーパスには,約700時間(約700万語に相当)の音声,書き起こしテキスト,および品詞や分節音,韻律などの情報が含まれる予定である。本稿では,本コーパスの書き起こしの方法とその基準について紹介する。

リンク情報
DOI
https://doi.org/10.15084/00002055
CiNii Articles
http://ci.nii.ac.jp/naid/120006595255
CiNii Books
http://ci.nii.ac.jp/ncid/AA1113775X
URL
http://id.ndl.go.jp/bib/5859979
URL
http://id.nii.ac.jp/1328/00002055/
ID情報
  • DOI : 10.15084/00002055
  • CiNii Articles ID : 120006595255
  • CiNii Books ID : AA1113775X

エクスポート
BibTeX RIS