共同研究・競争的資金等の研究課題

2020年7月 - 2024年3月

自然言語処理技術を用いた日英仏議会テキスト解析による国会の特質・変則性の解明

日本学術振興会  科学研究費助成事業 挑戦的研究(開拓)
  • 野中 尚人
  • ,
  • 久保山 哲二
  • ,
  • 狩野 芳伸
  • ,
  • 三輪 洋文

課題番号
20K20509
配分額
(総額)
20,800,000円
(直接経費)
16,000,000円
(間接経費)
4,800,000円

本研究の目的は、自然言語処理技術を用いて、議事録に記録されている法案審議記録などの議会のテキストを分析し、日本の国会の特質を解明することである。自然言語処理の手法は急速に進展しつつあり、コンピュータ・サイエンスの分野での研究成果をも取り入れつつ、様々な手法と角度から分析することに取り組む。これらの研究を他の主要な国々との比較を通じて行うことで、比較的な観点から見た国会の特質はより鮮明にされると考えられる。
また、本研究は、より広い意味での社会科学の方法論における新しい展開を試みるものでもある。テキストを用いた新しいデータ・セットの構築も進められるため、様々な新しい仮説の提示と検証が可能になることが期待できる。
第1年度である2020年度には、研究手法についての情報共有とそれに関わる意見交換、ならびにいくつかのデータについての整備の可能性とその段取りを検討し、いくつかもものについては実際に整備が進んでいる。1つは、衆議院についてのデータベースであり、発言テキスト、発言者の氏名、肩書、所属政党、さらに発言者カテゴリーを付している。これは既に本研究がスタートする時点でほぼ出来上がっていたが、様々な微調整と修正を行った上で、具体的な分析への使用を開始している。このデータベースについては、適切なタイミングで公開される予定である。また、国会 (衆参両院)の映像情報のデータベース化も進めており、既に基礎的なデータの収集は終えている。
これらのデータ収集・作成と並行して、具体的な研究項目についての作業も進めつつある。1つは、Proksch & Slapinのdelegation model of parliamentary speech 論の妥当性を考察する研究である。また、テキストデータの用いて質疑のやり取りのパターン、その質に関わる分析を行っている。

ID情報
  • 課題番号 : 20K20509