2011年9月9日
教師データ間距離学習を利用した新語義用例の検出
研究報告自然言語処理(NL)
- ,
- 巻
- 2011
- 号
- 1
- 開始ページ
- 1
- 終了ページ
- 4
- 記述言語
- 日本語
- 掲載種別
本稿では,データの一部にラベルが割り当てられた集合に対して,ラベル情報も考慮した外れ値の検出手法を提案し,用例集合から新語義として使用した用例候補の検出を行う.提案手法の有効性を評価するために,人工的に生成したデータによる外れ値検出を行う実験と Semeval-2010 日本語 WSD タスクのデータによる新語義用例検出を行う実験を行った結果,提案手法は外れ値の検出件数,および,F 値で LOF,One-Class SVM を上回る検出結果となり,密度に基づく新語義検出において,教師データの利用が有効であることが分かった.また,多くの用例について学習後に LOF 値の順位が上がり,距離学習による密度変化が新語義検出に有効であることが分かった.In this paper, we propose a new peculiar example detection method using distance metric learning from labeled example pairs. To evaluate the efficiency of the proposed method, we make experiments on artificial dataset and Semeval-2010 Japanese WSD task dataset. As the results of these experiments, we found that it is effective for density-based outlier detection to use distance metric learning from the label information of training data.
- リンク情報
-
- CiNii Articles
- http://ci.nii.ac.jp/naid/110008606700
- CiNii Books
- http://ci.nii.ac.jp/ncid/AN10115061
- URL
- http://id.nii.ac.jp/1001/00077410/
- ID情報
-
- CiNii Articles ID : 110008606700
- CiNii Books ID : AN10115061