論文

2010年1月10日

候補間の表層的差異に着目した地名の所属国推定

言語処理学会自然言語処理
  • 佐野 智久
  • ,
  • 延澤 志保
  • ,
  • 岡本 紘幸
  • ,
  • 鈴木 宏哉
  • ,
  • 松原 正樹
  • ,
  • 斉藤 博昭

Vol.17
No.1
開始ページ
29
終了ページ
54
記述言語
日本語
掲載種別
DOI
10.5715/jnlp.17.1_29
出版者・発行元
一般社団法人 言語処理学会

地名等の固有名詞は自然言語処理における未知語処理問題の要因の一つであり,これを自動的に認識する手法が盛んに研究されている.本稿では,地名の所属国を自動的に推定することで,未知語としてノイズの原因となる可能性のある地名語句に情報を与えることを目的とする.固有名詞である地名の認識では地名辞書が用いられることが多いが,辞書ベースの手法では,辞書未登録語の問題が避けられない.不特定多数の外国の地名も含めた所属国の推定の実現のため,本稿では,地名辞書や文脈情報を全く使用せず,地名の表層情報のみを利用して,地名の所属国を自動的に判別する手法を提案する.地名については,言語的な類似性や地理的要因によって所属国の判別が困難な場合がある.本稿ではこの点に着目し,所属可能性の低い国の除去による候補の絞込み処理と,所属可能性の高い候補の選択処理との組合せによって,再現率を高く保ったまま適合率の向上を実現した.

リンク情報
DOI
https://doi.org/10.5715/jnlp.17.1_29
CiNii Articles
http://ci.nii.ac.jp/naid/10027015949
CiNii Books
http://ci.nii.ac.jp/ncid/AN10472659
ID情報
  • DOI : 10.5715/jnlp.17.1_29
  • ISSN : 1340-7619
  • CiNii Articles ID : 10027015949
  • CiNii Books ID : AN10472659
  • identifiers.cinii_nr_id : 9000004479651

エクスポート
BibTeX RIS