共同研究・競争的資金等の研究課題

2015年4月 - 2018年3月

2億件超の東日本大震災ツイッターデータからの発言者の役割を反映した時系列話題解析

日本学術振興会  科学研究費助成事業 基盤研究(C)
  • 橋本 隆子
  • ,
  • 白田 由香利
  • ,
  • 久保山 哲二
  • ,
  • チャクラボルティ バサビ

課題番号
15K00314
配分額
(総額)
4,680,000円
(直接経費)
3,600,000円
(間接経費)
1,080,000円

本研究では東日本大震災後に投稿された2 億件に及ぶTwitter データを対象とし,発言者の役割を反映した時系列話題解析とその評価を行った.発言者と単語の関係を2 部グラフで表し,発言者グループを抽出し,それを反映したクラスタリングを行うことで発言者の役割を推定し,解析精度を向上する手法を開発した.アルゴリズムはランダムウォークにより乱択化し,大規模データへの対応も行った.結果として,30分(あるいは1時間)ごとの投稿者と単語の二部グラフを生成し,そのデータに提案手法を適用することで,LDA等の従来手法より精度の高い話題を抽出することが可能であると確認できた.

リンク情報
URL
https://kaken.nii.ac.jp/file/KAKENHI-PROJECT-15K00314/15K00314seika.pdf
ID情報
  • 課題番号 : 15K00314