MISC

2012年7月19日

ユーザ印象評価データの観察と分析に基づくテキスト印象マイニング手法の設計

研究報告自然言語処理(NL)
  • 熊本忠彦
  • ,
  • 河合由起子
  • ,
  • 張建偉

2012
4
開始ページ
1
終了ページ
10
記述言語
日本語
掲載種別

本稿では,「楽しい⇔悲しい」,「うれしい⇔怒り」,「のどか⇔緊迫」という3種類の印象を対象に,新聞記事を読んだ人々が感じる印象の強さを数値的に求めるための印象マイニング手法を提案する.提案手法は,各々の印象に対して「(左側の印象を)感じる(1点),割と感じる(2点),やや感じる(3点),(どちらの印象も)感じない(4点),(右側の印象を)やや感じる(5点),割と感じる(6点),感じる(7点)」という7段階の評価スケール(本稿では,印象尺度と呼ぶ)に準じた1.0~7.0の実数値を出力する.このような手法の設計に際し,記事から抽出される特徴量(単語unigram)とあらかじめ定義した特定の印象語群との(記事内)共起関係に基づいて各印象尺度用の印象辞書(各単語unigramの記事印象への影響力を示すもの)を構築し,それぞれの印象辞書を用いて算出される記事の印象値とその記事を読んだ人々が感じる印象の強さとの対応関係を定式化することで,共起関係という読み手が介在しない方法で算出される記事の印象値を読み手が感じる印象の強さへと変換することを試みる.本手法の未知データに対する誤差(RMSE:Root-Mean-Square Error)を5分割交差検定により調べてみたところ,それぞれの印象尺度に対し0.60,0.49,0.52であった.従来手法の誤差は0.69,0.49,0.64であり,「うれしい⇔怒り」に対しては同じ誤差を保ちつつ,「楽しい⇔悲しい」と「のどか⇔緊迫」に対する誤差が大幅に改善されているのがわかる.

リンク情報
CiNii Articles
http://ci.nii.ac.jp/naid/110009422486
CiNii Books
http://ci.nii.ac.jp/ncid/AN10115061
URL
http://id.nii.ac.jp/1001/00082918/
ID情報
  • CiNii Articles ID : 110009422486
  • CiNii Books ID : AN10115061

エクスポート
BibTeX RIS