MISC

筆頭著者
2011年12月12日

Crowdsourcing System を用いた略語の推定手法の提案

電子情報通信学会技術研究報告. SP, 音声
  • 酒井 敏彦
  • ,
  • 芦川 将之
  • ,
  • 廣川 佐千男

111
365
開始ページ
13
終了ページ
17
記述言語
日本語
掲載種別
出版者・発行元
一般社団法人電子情報通信学会

Web上には様々なメディアがあり,新たな言葉が生み出されている.特に,Facebook, TwitterなどのCGM (Consumer Generated Media)は多くのユーザがコミュニケーションツールとして利用しており,膨大なテキスト情報が増え続けている.これらのテキストの形態素解析には辞書が用いられる.しかし辞書は新語や省略された単語などの未知語の解析に弱いという欠点がある.そこで本稿では,Twitterのデータを利用して辞書の語彙を増やす方法を提案する.まず,Twitterの文章を形態素解析し,未知語と判定されたものから略語候補を抽出する.次に,Crowdsourcing Systemを用いて,略語か否かの判定,略語の読み付け及び略語に対する正式な言葉への変換を行う.

リンク情報
CiNii Articles
http://ci.nii.ac.jp/naid/10031110512
CiNii Books
http://ci.nii.ac.jp/ncid/AN10013221
URL
http://id.ndl.go.jp/bib/023379295
ID情報
  • ISSN : 0913-5685
  • CiNii Articles ID : 10031110512
  • CiNii Books ID : AN10013221

エクスポート
BibTeX RIS