MISC

2014年8月1日

言語研究のためのWebコーパスの収集と組織化 (データ工学)

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報
  • 浅原 正幸
  • ,
  • 今田 水穂
  • ,
  • 保田 祥
  • ,
  • 小西 光
  • ,
  • 前川 喜久雄

114
173
開始ページ
83
終了ページ
88
記述言語
日本語
掲載種別
出版者・発行元
一般社団法人電子情報通信学会

国立国語研究所コーパス開発センターでは2011年より超大規模コーパスプロジェクトとして、Webを母集団とした100億語規模のコーパスの構築を進めている。構築にあたっては、工程を収集・組織化・利活用・保存の四つに分割して構築を進めている。本稿ではそのうち最初の二工程について言語研究に資する言語資源にするために行っている工夫について報告する。

リンク情報
CiNii Articles
http://ci.nii.ac.jp/naid/110009946865
CiNii Books
http://ci.nii.ac.jp/ncid/AN10012921
URL
http://id.ndl.go.jp/bib/025768769
ID情報
  • ISSN : 0913-5685
  • CiNii Articles ID : 110009946865
  • CiNii Books ID : AN10012921

エクスポート
BibTeX RIS