共同研究・競争的資金等の研究課題

2015年4月 - 2020年3月

日本語教育用テキスト解析ツールの開発と学習者向け誤用チェッカーへの展開

日本学術振興会  科学研究費助成事業 基盤研究(B)
  • 山本 和英
  • ,
  • 内丸 裕佳子
  • ,
  • 中俣 尚己
  • ,
  • 茂木 俊伸
  • ,
  • 東条 佳奈
  • ,
  • 森 篤嗣
  • ,
  • 建石 始
  • ,
  • 岩田 一成
  • ,
  • 金 愛蘭
  • ,
  • 松田 真希子

課題番号
15H03216
配分額
(総額)
7,410,000円
(直接経費)
5,700,000円
(間接経費)
1,710,000円

当該年度では日本語の格助詞誤り訂正について下記2項目の研究を行い、それぞれ学会発表を行った。
(1)学習者にとって最も間違えやすい格助詞を訂正対象とし,言語モデルを用いた格助詞誤り訂正システムを構築した。助詞誤りの中でも助詞の不足による誤りの割合が高いため,訂正手順に格助詞の補完操作を組み込むことで助詞不足の訂正に取り組んだ。NAIST 誤用コーパスでの訂正実験の結果,置換訂正に対して補完訂正の再現率が低いことが明らかになった。
(2)格助詞「が・を・に・で」を対象にした分類モデルによる訂正手法を提案した.CNN モデルとRNN モデルを構築し,RNN モデルでは言語モデル手法よりも正解率 (%) が 8.59 ポイント向上した.また,提案手法により改善された例を示し,訂正対象単語の周辺だけでなく文全体を考慮した訂正ができていることを確認した.2 つのドメインの異なるコーパスでの実験では,同じサイズでも学習者コーパスに近いコーパスで訓練させた方が高い性能を示したことから,性能の向上に貢献する訓練コーパスの選定が重要であることを確認した.