2014年4月 - 2017年3月

タイニーデータマイニング：基底としての確率分布による大規模データの再構成

日本学術振興会科学研究費助成事業基盤研究(C) 基盤研究(C)

正田備也

課題番号

26330256

体系的課題番号

JP26330256

配分額

(総額): 4,810,000円
(直接経費): 3,700,000円
(間接経費): 1,110,000円

この研究は規模の大きなデータの要約を目指しています。主に扱うのは文字で書かれたデータ、つまりテキストデータです。ニュース記事、学術論文、小説などがこれにあたります。テキストデータも量が多くなってくると、ひとつひとつ人間が目を通すわけにいかなくなります。そこで要約を作ります。この研究が作る要約は単語リストです。例えば「試合、ヒット、ピッチャー、トレード」という単語リストを見ると、私たちはこれが野球というトピックを表していると分かります。このような単語リストを膨大なテキストデータから自動的にいくつも取り出し、文章をひとつひとつ読まなくても何が書いてあるか分かるようにするのが、この研究の目的です。

リンク情報

Kaken Url: https://kaken.nii.ac.jp/file/KAKENHI-PROJECT-26330256/26330256seika.pdf
KAKEN: https://kaken.nii.ac.jp/grant/KAKENHI-PROJECT-26330256

ID情報

課題番号 : 26330256
体系的課題番号 : JP26330256

正田備也

共同研究・競争的資金等の研究課題

タイニーデータマイニング：基底としての確率分布による大規模データの再構成

メニュー