共同研究・競争的資金等の研究課題

2018年4月 - 2022年3月

日本語CCG統語解析器lightblueの開発

日本学術振興会  科学研究費助成事業 基盤研究(B)  基盤研究(B)

課題番号
18H03284
体系的課題番号
JP18H03284
配分額
(総額)
17,160,000円
(直接経費)
13,200,000円
(間接経費)
3,960,000円

2021年度には、いよいよ理論言語学と深層学習のハイブリッドアプローチとして、1) 日本語CCGパーザlightblueに、ニューラル言語モデルによる形態素解析器を組み合わせる研究を行った。深層学習フレームワークhasktorch(libtorchのHaskellバインディング)を用いて、既存の日本語形態素解析器の蒸留によって、少ない教師データから軽量なニューラル形態素解析器が得られることを示した[田上・戸次 2021](6月の人工知能学会において発表)。また、2) lightblueの意味計算部門で採用している自然言語の意味論のフレームワークである依存型意味論(DTS)を用いた理論言語学の研究として、Weak Crossoverの研究[Bekki 2021]とproviso problemの研究[Yana+2021]を行った。それぞれLENLS18国際学会、LACL国際学会において論文が採択され、発表を行った。その他、3) 日本語の実テキストに現れる数量詞の推論についての研究[小谷野・谷中・峯島・戸次 2021]、および 4) 意味論テストセットによる文法開発プラットフォームの確立を目指して、lightblueパーザ出力の可視化の研究[石嶋・戸次 2021]を進めた(ともに6月の人工知能学会において発表)。
当初の研究計画で述べたように、このプロジェクトの成果であるCCGパーザlightblue+DTS proverという組合せは、形式統語論と形式意味論の検証過程の自動化と見做すこともできる。そのように統合され自動化された言語理論が、既存の理論言語学と比較して、はたまた自然言語処理における意味解析と比較して、何を意味するのか。そもそも人間の言語機能を科学的に研究するとはどのような行為であるのか。2021年度言語学フェスでの発表[戸次 2021]では、そのような問題意識と、このプロジェクトを通して得られつつある回答を素描した。

リンク情報
KAKEN
https://kaken.nii.ac.jp/grant/KAKENHI-PROJECT-18H03284
ID情報
  • 課題番号 : 18H03284
  • 体系的課題番号 : JP18H03284

この研究課題の成果一覧

論文

  5

講演・口頭発表等

  9