共同研究・競争的資金等の研究課題

2007年 - 2008年

経験マイニング : Web文書からの個人の経験の抽出と分類

文部科学省  科学研究費補助金(特定領域研究)  

担当区分
研究代表者
配分額
(総額)
6,400,000円
(直接経費)
6,400,000円
(間接経費)
0円
資金種別
競争的資金

商品やサービスなど, 指定されたトピックに関連する個人の経験の記述をWeb文書集合から収集し, 述語項構造に基づく表現形式に構造化するとともに, 事態タイプ(ポジティブ/ネガティブな出来事・状態, 入手・利用等の行為など)や事実性情報(当該事態の時間情報とそれに対する話者態度)といった意味情報を解析する経験マイニングを開発した. 20年度の具体的成果は次の4点である.(1)評価極性知識獲得の大規模実験 : 事態タイプのうち, とくに「遅刻する, 炎症が治まる, 錆が出る」など, 評価極性を持つ出来事に関する知識の獲得に注力し, 大規模なWeb文書コーパスからこれを獲得する実験を行った. その結果, コーパスのサイズを大きくすると, 獲得できる知識の精度, カバレッジともに劇的に向上に, 最終的に1.6億文のコーパスから75以上のカバレッジを85以上の精度で獲得できることが確かめられた.(2)事実性解析モデルの洗練 : 事実性解析については, 2007年度の成果をベースに, 事実性タグ体系の見直しと訓練データの拡張を行った. また, 文中で隣接する事態表現の事実性の間に依存関係があることに着目し, これをFactorial CRFでモデル化することによって解析精度を向上させることができた.(3)公開デモサイト「みんなの経験」の開発 : 以上の成果を利用し, 文書集合から実際に経...

リンク情報
URL
http://kaken.nii.ac.jp/d/p/19024057.ja.html