2008年
文書クラスタリングによるトピック抽出および課題発見
社会技術研究論文集
- ,
- ,
- ,
- ,
- 巻
- 5
- 号
- 開始ページ
- 216
- 終了ページ
- 226
- 記述言語
- 日本語
- 掲載種別
- DOI
- 10.3392/sociotechnica.5.216
- 出版者・発行元
- Sociotechnology Research Network
自然言語処理技術を応用し,分析対象となる新聞記事を取得して,記事を自動的に分類し,トピックとなる社会事象を抽出,さらにはトピックを構造化して課題の発見に至る手続きを可能とする手法を開発した.この手法によれば,多数のトピックを含む文書集合に対して階層的クラスタリングを施し,クラスタ間の語彙使用の類似性に基づく構造化を行い,個々のクラスタについてこれを要約するキーワードおよび関係する主体(組織名)を自動抽出することによって内容を効率的かつ経済的に俯瞰できることを示した.本論文では,産業活動に伴う事故・災害に関する社会の課題発見を事例として,これらのテキストマイニング技術を統合した社会変化の定量的分析手法の有効性について検証した.
- リンク情報
- ID情報
-
- DOI : 10.3392/sociotechnica.5.216
- ISSN : 1349-0184
- ISSN : 1882-4609
- CiNii Articles ID : 130000135489