MISC

2011年9月9日

教師データ間距離学習を利用した新語義用例の検出

研究報告自然言語処理(NL)
  • 佐々木 稔
  • ,
  • 新納 浩幸

2011
1
開始ページ
1
終了ページ
4
記述言語
日本語
掲載種別

本稿では,データの一部にラベルが割り当てられた集合に対して,ラベル情報も考慮した外れ値の検出手法を提案し,用例集合から新語義として使用した用例候補の検出を行う.提案手法の有効性を評価するために,人工的に生成したデータによる外れ値検出を行う実験と Semeval-2010 日本語 WSD タスクのデータによる新語義用例検出を行う実験を行った結果,提案手法は外れ値の検出件数,および,F 値で LOF,One-Class SVM を上回る検出結果となり,密度に基づく新語義検出において,教師データの利用が有効であることが分かった.また,多くの用例について学習後に LOF 値の順位が上がり,距離学習による密度変化が新語義検出に有効であることが分かった.In this paper, we propose a new peculiar example detection method using distance metric learning from labeled example pairs. To evaluate the efficiency of the proposed method, we make experiments on artificial dataset and Semeval-2010 Japanese WSD task dataset. As the results of these experiments, we found that it is effective for density-based outlier detection to use distance metric learning from the label information of training data.

リンク情報
CiNii Articles
http://ci.nii.ac.jp/naid/110008606700
CiNii Books
http://ci.nii.ac.jp/ncid/AN10115061
URL
http://id.nii.ac.jp/1001/00077410/
ID情報
  • CiNii Articles ID : 110008606700
  • CiNii Books ID : AN10115061

エクスポート
BibTeX RIS