2015年4月 - 2018年3月
2億件超の東日本大震災ツイッターデータからの発言者の役割を反映した時系列話題解析
日本学術振興会 科学研究費助成事業 基盤研究(C) 基盤研究(C)
本研究では東日本大震災後に投稿された2 億件に及ぶTwitter データを対象とし,発言者の役割を反映した時系列話題解析とその評価を行った.発言者と単語の関係を2 部グラフで表し,発言者グループを抽出し,それを反映したクラスタリングを行うことで発言者の役割を推定し,解析精度を向上する手法を開発した.アルゴリズムはランダムウォークにより乱択化し,大規模データへの対応も行った.結果として,30分(あるいは1時間)ごとの投稿者と単語の二部グラフを生成し,そのデータに提案手法を適用することで,LDA等の従来手法より精度の高い話題を抽出することが可能であると確認できた.
- リンク情報
- ID情報
-
- 課題番号 : 15K00314
- 体系的課題番号 : JP15K00314