共同研究・競争的資金等の研究課題

2019年4月 - 2023年3月

昭和・平成書き言葉コーパスによる近現代日本語の実証的研究

日本学術振興会  科学研究費助成事業 基盤研究(A)  基盤研究(A)

課題番号
19H00531
体系的課題番号
JP19H00531
配分額
(総額)
44,850,000円
(直接経費)
34,500,000円
(間接経費)
10,350,000円

国立国語研究所を中心とするコーパス構築班(小木曽・間淵・田中・近藤・高橋)と、研究分担者の全員(小木曽・間淵・田中・小椋・金・永澤・松田・持橋・近藤・高橋)が参加するコーパス応用班に分かれて研究活動を行った。
本年度のコーパス構築班では、期間中に構築を予定しているコーパス(1933年から1997年までの8年おき9年分の雑誌・新聞・ベストセラー書籍)のデータ作成のうち、雑誌サブコーパスのXMLによる構造化と、新聞サブコーパスのテキスト入力、ベストセラー書籍の原本の入手とその一部のOCRによるテキスト化を行った。また、雑誌については形態素解析済みデータの整備・未知語の辞書登録作業を行った。日本語学会秋季大会では、本コーパスの構築についての研究発表を行った。
コーパス応用班では、公開の研究発表会を1回主催したほか、国語研「通時コーパス」プロジェクトとの共催によるシンポジウムを2回、非公開の研究会を1回開催し、CHJ・BCCWJと本研究課題で構築した雑誌のデータを用いた近現代日本語の研究発表を行った。このほか、論文3編、研究発表10件と十分な実績をあげることができた。
言語変化の統計モデリングについては、国立国語研究所新領域創出型プロジェクト「現代語の意味の変化に対する計算的・統計力学的アプローチ」と共同で、新たに作成したデータを活用し単語分散表現を用いた言語変化の研究を行ない、言語処理学会において2件の研究発表を行った。

リンク情報
KAKEN
https://kaken.nii.ac.jp/grant/KAKENHI-PROJECT-19H00531
ID情報
  • 課題番号 : 19H00531
  • 体系的課題番号 : JP19H00531

この研究課題の成果一覧

論文

  5

MISC

  2

書籍等出版物

  1
  • 陳力衛編, 村山昌俊, 石井久美子, 近藤明日子, 小椋秀樹, 齋藤文俊, 北澤尚, 服部隆史, 田貝和子, 増井典夫, 手島邦夫, 鄭英淑, 木村一, 木村義之, 真田治子, 湯浅茂雄 (担当:共著, 範囲:第四章 『女学雑誌』の誕生とその語彙)
    朝倉書店 2020年7月1日 (ISBN: 9784254516654)

講演・口頭発表等

  13

Works(作品等)

  2