2019年4月 - 2023年3月
オーストラリアの世論形成の歴史的解明:自然言語処理による公開集会データの分析
日本学術振興会 科学研究費助成事業 基盤研究(B) 基盤研究(B)
- 課題番号
- 19H01330
- 体系的課題番号
- JP19H01330
- 担当区分
- 研究分担者
- 配分額
-
- (総額)
- 17,290,000円
- (直接経費)
- 13,300,000円
- (間接経費)
- 3,990,000円
2019年度、本研究は、オーストラリア国立図書館の包括的な新聞データベースTroveを用いて、19世紀から20世紀の約150年間にわたる全パブリック・ミーティングのデータを抽出し、オーストラリア全土における状況を明示することで、世論形成の構造はいかなるものであり、どのように変化したかを分析するための作業を行ってきた。以下はその活動である。
(1)新聞の広告ページから、パブリック・ミーティングに関する広告を自動的に抽出。自動抽出は広告文章の始まりと終わりのパターンマッチング等により行った。さらに、OCRによる文字認識の誤りを自動的に訂正した。高精度な誤り訂正を実現するために、最先端のDongらの手法などをベースに研究開発を進めた。
(2)上記に関連して、1838年―1954年の新聞広告を各年5件ずつ読み取り、正解データを作成し、活用した。日付/曜日/人名/地名/項目名などのキーワードを自動的に抽出し、時系列・地域別の変化を明らかするために、手書きのカードデータ約1500枚を電子化し、抽出したデータと比較し、活用の可能性を探った。
(3)データベースTroveの内容について最も詳しいTim Sherrattとオーストラリア国立図書館で面会し(現在タスマニアに移動)、協力関係を構築した。
(4)九州大学、東京大学などで講演を通じた広報活動を行った。さらに西洋史学の専門誌への投稿や、自然言語処理関係の学会での報告などにより研究成果を発表し、翌年度の国際学会での報告も承認された。
以上のような活動を行ったが、2月末以降は、COVID-19の蔓延により、所属機関による新たな研究活動の禁止などの影響を受け、予定の研究計画の一部は延期せざるをえなかった。
(1)新聞の広告ページから、パブリック・ミーティングに関する広告を自動的に抽出。自動抽出は広告文章の始まりと終わりのパターンマッチング等により行った。さらに、OCRによる文字認識の誤りを自動的に訂正した。高精度な誤り訂正を実現するために、最先端のDongらの手法などをベースに研究開発を進めた。
(2)上記に関連して、1838年―1954年の新聞広告を各年5件ずつ読み取り、正解データを作成し、活用した。日付/曜日/人名/地名/項目名などのキーワードを自動的に抽出し、時系列・地域別の変化を明らかするために、手書きのカードデータ約1500枚を電子化し、抽出したデータと比較し、活用の可能性を探った。
(3)データベースTroveの内容について最も詳しいTim Sherrattとオーストラリア国立図書館で面会し(現在タスマニアに移動)、協力関係を構築した。
(4)九州大学、東京大学などで講演を通じた広報活動を行った。さらに西洋史学の専門誌への投稿や、自然言語処理関係の学会での報告などにより研究成果を発表し、翌年度の国際学会での報告も承認された。
以上のような活動を行ったが、2月末以降は、COVID-19の蔓延により、所属機関による新たな研究活動の禁止などの影響を受け、予定の研究計画の一部は延期せざるをえなかった。
- ID情報
-
- 課題番号 : 19H01330
- 体系的課題番号 : JP19H01330
この研究課題の成果一覧
絞り込み
受賞
1論文
3-
SN Computer Science 3(489) 1-17 2022年9月 査読有り
-
SN Computer Science 3(285) 1-9 2022年5月 査読有り責任著者
-
西洋史学 (268) 50-61 2019年12月 査読有り
MISC
2-
第70回日本西洋史学会大会 2020年12月 招待有り筆頭著者責任著者
-
2019年度人工知能学会全国大会 2020年6月