MISC

2019年

日本語大規模SNS+Webコーパスによる単語分散表現のモデル構築

人工知能学会全国大会論文集
  • 松野 省吾
  • ,
  • 水木 栄
  • ,
  • 榊 剛史

2019
0
開始ページ
4Rin113
終了ページ
4Rin113
記述言語
日本語
掲載種別
出版者・発行元
一般社団法人 人工知能学会

<p>本稿では,筆者らの構築したTwitterをはじめとしたSNS上に存在する日本語の文章に対応する単語分散表現モデルを紹介する. 本モデルはSNSデータ,Wikipedia,Webページといった複数カテゴリを媒体とした日本語大規模コーパスから作成される.作成した単語分散表現モデルに対し,Speamanの順位相関係数を評価指標とした単語類似度算出タスクによる評価を実施したところ,wikipediaのみを学習コーパスとして用いたモデルと比較して7ポイント程度良い性能を得られた.本稿で紹介した単語分散表現モデルはWebサイトを通じて公開する予定であり,本モデルが活用されることで,SNSデータを対象とした自然言語処理研究が一層盛んになることを期待したい.</p>

リンク情報
CiNii Articles
http://ci.nii.ac.jp/naid/130007658900
ID情報
  • CiNii Articles ID : 130007658900
  • identifiers.cinii_nr_id : 9000017552127

エクスポート
BibTeX RIS