共同研究・競争的資金等の研究課題

2021年4月 - 2026年3月

大規模SNS上の話題の構造化による集合行動解析手法

日本学術振興会  科学研究費助成事業 基盤研究(B)  基盤研究(B)

課題番号
21H03559
体系的課題番号
JP21H03559
配分額
(総額)
16,900,000円
(直接経費)
13,000,000円
(間接経費)
3,900,000円

1. Two-Stage Clustering 手法の開発
2021年度は、SNSにおける人々の反応を分析するために、マイクロクラスタリングと時系列クラスタリングを組み合わせた Two-Stage Clustering 手法を提案し、コロナワクチンに対するTwitterデータ(全量データ)の分析を行った。この手法は、これまで内容の類似度に加えて、時系列上のパターン類似度を考慮できる効率的な手法であり、これにより、コロナワクチンに関する12M以上のTweet集合を、速報ニュースへの反応、Tweetへの反応、その他(デマなど)に分類できることを示した。結果を論文としてまとめ、BigData2021にも採択された。また招待講演等でも紹介を行った。
2. コロナワクチンに関する人々の反応評価(時系列分析)
さらにTwitterの全量データを対象として、コロナワクチンに対する人々の反応のセンチメント分析(時系列評価)にも取り組んでおり、コロナワクチンに対する日本国民の気持ちが時間とともにどのような変遷をたどったかについて考察している。結果は、近日中に社会科学系のジャーナルに投稿予定である。
3. マイクロクラスタリング手法の改良
大規模データに対応可能とするために、マイクロクラスタリング手法を、より類似度の高いインスタンスを初期のタイミングで集約する改良を行った。これにより、数千万件規模のTwitterデータが標準的なPC上でリーズナブルな速度で分析可能となった。大規模データ分析において、極めて重要な成果であると認識している。

リンク情報
KAKEN
https://kaken.nii.ac.jp/grant/KAKENHI-PROJECT-21H03559
ID情報
  • 課題番号 : 21H03559
  • 体系的課題番号 : JP21H03559