共同研究・競争的資金等の研究課題

2020年4月 - 2023年3月

国会会議録コーパスと地方議会会議録コーパスを横断した言語的分析

日本学術振興会  科学研究費助成事業 基盤研究(C)  基盤研究(C)

課題番号
20K00576
体系的課題番号
JP20K00576
配分額
(総額)
4,160,000円
(直接経費)
3,200,000円
(間接経費)
960,000円

2020年度に引き続き新型コロナウイルス感染拡大防止に対応した範囲および規模感で研究を実施することとなった。2020年度に構築した都道府県議会会議録2015ー2019期サブセットの特徴語や方言的特徴関する分析を進めた。これまでに提案した種々の手法を適用し、計量的な言語的特徴の地域差の分析を行った。この成果を『自治体DX推進とオープンデータの活用』(分担執筆)の第7章にまとめた。
また、大規模コーパスからの言語的特徴の抽出の新しい試みとして、機械学習とXAI(説明可能な人工知能)技術を用いた分類手法の検討を開始した。この研究結果の一部は2022年度の人工知能学会全国大会において発表する。
議会会議録の計量的な分析を促進するために、国立情報学研究所が主催する「NTCIR-16」においてシェアドタスク「QA Lab-PoliInfo-3」にタスクオーガナイザとして参画した。このタスクでは、Question Answering、QA Alignment、Fact Verification、Budget Argument Miningの4つのサブタスクを設定した。研究分担者の木村がこのタスク全体を統括しており、研究代表者の高丸と研究分担者の内田はQuestion Answering(会議録の質問の要約が与えられたときに、会議録から質問に対応する答弁を見つけだし、要約した結果を返す)およびQA Alignment(一括質問一括答弁形式の質問と答弁が与えられたとき、それぞれの質問と答弁を対応付ける)を担当した。
このほか、議会発言のうち、原稿の読み上げによって行われる部分の分析を進めるために、政党のウェブサイトに公開された原稿データの収集を進めた。

リンク情報
KAKEN
https://kaken.nii.ac.jp/grant/KAKENHI-PROJECT-20K00576
ID情報
  • 課題番号 : 20K00576
  • 体系的課題番号 : JP20K00576

この研究課題の成果一覧

論文

  3