2011年12月12日
Crowdsourcing System を用いた略語の推定手法の提案
電子情報通信学会技術研究報告. SP, 音声
- ,
- ,
- 巻
- 111
- 号
- 365
- 開始ページ
- 13
- 終了ページ
- 17
- 記述言語
- 日本語
- 掲載種別
- 出版者・発行元
- 一般社団法人電子情報通信学会
Web上には様々なメディアがあり,新たな言葉が生み出されている.特に,Facebook, TwitterなどのCGM (Consumer Generated Media)は多くのユーザがコミュニケーションツールとして利用しており,膨大なテキスト情報が増え続けている.これらのテキストの形態素解析には辞書が用いられる.しかし辞書は新語や省略された単語などの未知語の解析に弱いという欠点がある.そこで本稿では,Twitterのデータを利用して辞書の語彙を増やす方法を提案する.まず,Twitterの文章を形態素解析し,未知語と判定されたものから略語候補を抽出する.次に,Crowdsourcing Systemを用いて,略語か否かの判定,略語の読み付け及び略語に対する正式な言葉への変換を行う.
- リンク情報
-
- CiNii Articles
- http://ci.nii.ac.jp/naid/10031110512
- CiNii Books
- http://ci.nii.ac.jp/ncid/AN10013221
- URL
- http://id.ndl.go.jp/bib/023379295
- ID情報
-
- ISSN : 0913-5685
- CiNii Articles ID : 10031110512
- CiNii Books ID : AN10013221