MISC

2008年

文書クラスタリングによるトピック抽出および課題発見

社会技術研究論文集
  • 橋本泰一
  • ,
  • 村上浩司
  • ,
  • 乾孝司
  • ,
  • 内海和夫
  • ,
  • 石川正道

5
開始ページ
216
終了ページ
226
記述言語
日本語
掲載種別
DOI
10.3392/sociotechnica.5.216
出版者・発行元
Sociotechnology Research Network

自然言語処理技術を応用し,分析対象となる新聞記事を取得して,記事を自動的に分類し,トピックとなる社会事象を抽出,さらにはトピックを構造化して課題の発見に至る手続きを可能とする手法を開発した.この手法によれば,多数のトピックを含む文書集合に対して階層的クラスタリングを施し,クラスタ間の語彙使用の類似性に基づく構造化を行い,個々のクラスタについてこれを要約するキーワードおよび関係する主体(組織名)を自動抽出することによって内容を効率的かつ経済的に俯瞰できることを示した.本論文では,産業活動に伴う事故・災害に関する社会の課題発見を事例として,これらのテキストマイニング技術を統合した社会変化の定量的分析手法の有効性について検証した.

リンク情報
DOI
https://doi.org/10.3392/sociotechnica.5.216
CiNii Articles
http://ci.nii.ac.jp/naid/130000135489
URL
http://id.ndl.go.jp/bib/10591458
URL
https://jlc.jst.go.jp/DN/JALC/00333689880?from=CiNii
ID情報
  • DOI : 10.3392/sociotechnica.5.216
  • ISSN : 1349-0184
  • ISSN : 1882-4609
  • CiNii Articles ID : 130000135489

エクスポート
BibTeX RIS