論文

査読有り 筆頭著者
2017年1月

洒落本コーパス構築の試行

国立国語研究所論集
  • 市村 太郎
  • ,
  • 村山 実和子

12
12
開始ページ
29
終了ページ
45
記述言語
日本語
掲載種別
研究論文(大学,研究機関等紀要)
DOI
10.15084/00000852
出版者・発行元
国立国語研究所

筆者らは,現在,国立国語研究所で開発が進められている『日本語歴史コーパス』の一部として,近世洒落本を対象とするコーパスを開発しており,その試作版を『ひまわり版「洒落本コーパス」Ver. 0.5』(2015年10月28日公開)として公開した。本コーパス構築にあたっては,他の『日本語歴史コーパス』所収のコーパス同様,文書構造に関する情報や形態論情報を付与するとともに,新たに所蔵版本への画像リンクや,詳細な話者情報を付与する試みを行った。これにより,近世資料の持つ地域差・位相差にも配慮した近世語コーパスのモデルを示すことができた。This paper presents an overview, the features, and utility of the Sharebon Corpus. We attempted to construct a corpus of Early Modern Japanese text, which is a part of the Corpus of Historical Japanese (CHJ) built by The National Institute for Japanese Language and Linguistics. We released a trial version of the Sharebon Corpus on October 28, 2015. This corpus has not only annotated morphemes and document information, just as the other corpora of the CHJ, but also realized the following new functions. First, we implemented the reference function that displays images of original books printed from woodblocks. Second, we made detailed annotations of information about speakers. Early Modern Japanese texts are written in various styles because of the differences, such as region, social class, and generations among others. In this article, we will illustrate that this corpus, which provides voluminous information, will be effective for such texts.

リンク情報
DOI
https://doi.org/10.15084/00000852
CiNii Articles
http://ci.nii.ac.jp/naid/120005950339
CiNii Books
http://ci.nii.ac.jp/ncid/AA12536262
URL
https://repository.ninjal.ac.jp/?action=pages_view_main&active_action=repository_view_main_item_detail&item_id=868&item_no=1&page_id=13&block_id=21
ID情報
  • DOI : 10.15084/00000852
  • ISSN : 2186-134X
  • CiNii Articles ID : 120005950339
  • CiNii Books ID : AA12536262

エクスポート
BibTeX RIS