2012年4月 - 2015年3月
近世口語文を対象とした形態素解析辞書の開発
日本学術振興会 科学研究費助成事業 基盤研究(C) 基盤研究(C)
今日、日本語の歴史を研究するためのコーパスの構築が望まれている。このコーパス構築のためには、さまざまな歴史的な資料に単語の情報を自動で付与する形態素解析を行う必要があるが、これまでに近世(江戸時代)の資料を対象としたものはなかった。本研究の目的は、主として近世の口語資料を、研究に必要な精度で解析できるようにすることである。既存の辞書を元に見出し語を増やし、専用のコーパスを用いて機械学習を行った結果、狂言台本や洒落本のテキストを高い精度で解析することが可能になった。この辞書は「日本語歴史コーパス」の構築に利用され成果を上げている。
- リンク情報
- ID情報
-
- 課題番号 : 24520522
- 体系的課題番号 : JP24520522