2014年8月1日
言語研究のためのWebコーパスの収集と組織化 (データ工学)
電子情報通信学会技術研究報告 = IEICE technical report : 信学技報
- ,
- ,
- ,
- ,
- 巻
- 114
- 号
- 173
- 開始ページ
- 83
- 終了ページ
- 88
- 記述言語
- 日本語
- 掲載種別
- 出版者・発行元
- 一般社団法人電子情報通信学会
国立国語研究所コーパス開発センターでは2011年より超大規模コーパスプロジェクトとして、Webを母集団とした100億語規模のコーパスの構築を進めている。構築にあたっては、工程を収集・組織化・利活用・保存の四つに分割して構築を進めている。本稿ではそのうち最初の二工程について言語研究に資する言語資源にするために行っている工夫について報告する。
- リンク情報
-
- CiNii Articles
- http://ci.nii.ac.jp/naid/110009946865
- CiNii Books
- http://ci.nii.ac.jp/ncid/AN10012921
- URL
- http://id.ndl.go.jp/bib/025768769
- ID情報
-
- ISSN : 0913-5685
- CiNii Articles ID : 110009946865
- CiNii Books ID : AN10012921