2020年4月 - 2023年3月
国会会議録コーパスと地方議会会議録コーパスを横断した言語的分析
日本学術振興会 科学研究費助成事業 基盤研究(C) 基盤研究(C)
2020年度に引き続き新型コロナウイルス感染拡大防止に対応した範囲および規模感で研究を実施することとなった。2020年度に構築した都道府県議会会議録2015ー2019期サブセットの特徴語や方言的特徴関する分析を進めた。これまでに提案した種々の手法を適用し、計量的な言語的特徴の地域差の分析を行った。この成果を『自治体DX推進とオープンデータの活用』(分担執筆)の第7章にまとめた。
また、大規模コーパスからの言語的特徴の抽出の新しい試みとして、機械学習とXAI(説明可能な人工知能)技術を用いた分類手法の検討を開始した。この研究結果の一部は2022年度の人工知能学会全国大会において発表する。
議会会議録の計量的な分析を促進するために、国立情報学研究所が主催する「NTCIR-16」においてシェアドタスク「QA Lab-PoliInfo-3」にタスクオーガナイザとして参画した。このタスクでは、Question Answering、QA Alignment、Fact Verification、Budget Argument Miningの4つのサブタスクを設定した。研究分担者の木村がこのタスク全体を統括しており、研究代表者の高丸と研究分担者の内田はQuestion Answering(会議録の質問の要約が与えられたときに、会議録から質問に対応する答弁を見つけだし、要約した結果を返す)およびQA Alignment(一括質問一括答弁形式の質問と答弁が与えられたとき、それぞれの質問と答弁を対応付ける)を担当した。
このほか、議会発言のうち、原稿の読み上げによって行われる部分の分析を進めるために、政党のウェブサイトに公開された原稿データの収集を進めた。
また、大規模コーパスからの言語的特徴の抽出の新しい試みとして、機械学習とXAI(説明可能な人工知能)技術を用いた分類手法の検討を開始した。この研究結果の一部は2022年度の人工知能学会全国大会において発表する。
議会会議録の計量的な分析を促進するために、国立情報学研究所が主催する「NTCIR-16」においてシェアドタスク「QA Lab-PoliInfo-3」にタスクオーガナイザとして参画した。このタスクでは、Question Answering、QA Alignment、Fact Verification、Budget Argument Miningの4つのサブタスクを設定した。研究分担者の木村がこのタスク全体を統括しており、研究代表者の高丸と研究分担者の内田はQuestion Answering(会議録の質問の要約が与えられたときに、会議録から質問に対応する答弁を見つけだし、要約した結果を返す)およびQA Alignment(一括質問一括答弁形式の質問と答弁が与えられたとき、それぞれの質問と答弁を対応付ける)を担当した。
このほか、議会発言のうち、原稿の読み上げによって行われる部分の分析を進めるために、政党のウェブサイトに公開された原稿データの収集を進めた。
- ID情報
-
- 課題番号 : 20K00576
- 体系的課題番号 : JP20K00576
この研究課題の成果一覧
絞り込み
論文
3-
計量国語学 34(3) 174-187 2023年12月 招待有り筆頭著者
-
知能と情報 35(3) 700-705 2023年8月 査読有り筆頭著者責任著者
-
方言の研究 9 27-51 2023年7月 査読有り最終著者