共同研究・競争的資金等の研究課題

2012年4月 - 2015年3月

近世口語文を対象とした形態素解析辞書の開発

日本学術振興会  科学研究費助成事業 基盤研究(C)  基盤研究(C)

課題番号
24520522
体系的課題番号
JP24520522
担当区分
研究分担者
配分額
(総額)
5,070,000円
(直接経費)
3,900,000円
(間接経費)
1,170,000円

今日、日本語の歴史を研究するためのコーパスの構築が望まれている。このコーパス構築のためには、さまざまな歴史的な資料に単語の情報を自動で付与する形態素解析を行う必要があるが、これまでに近世(江戸時代)の資料を対象としたものはなかった。本研究の目的は、主として近世の口語資料を、研究に必要な精度で解析できるようにすることである。既存の辞書を元に見出し語を増やし、専用のコーパスを用いて機械学習を行った結果、狂言台本や洒落本のテキストを高い精度で解析することが可能になった。この辞書は「日本語歴史コーパス」の構築に利用され成果を上げている。

リンク情報
Kaken Url
https://kaken.nii.ac.jp/file/KAKENHI-PROJECT-24520522/24520522seika.pdf
KAKEN
https://kaken.nii.ac.jp/grant/KAKENHI-PROJECT-24520522
ID情報
  • 課題番号 : 24520522
  • 体系的課題番号 : JP24520522