竹田 隆治

J-GLOBALへ         更新日: 10/10/12 00:00
 
アバター
研究者氏名
竹田 隆治
 
タケダ タカハル
URL
http://updatenews.ddo.jp/
所属
総合研究大学院大学(総研大)
部署
複合科学研究科 情報学専攻
職名
大学院生,大学院生(博士課程)

研究分野

 

Misc

 
複製文字列検知に基づくsplogフィルタリング
竹田隆治, 高須淳宏
情報処理学会論文誌   2(1)    2009年
Incremental Learning with the Neural Network Trees,
T. Takeda, Q. F. Zhao and Y. Liu
Neural, Parallel and Scientific Computations   13    2005年
軽量のテキスト処理による部分類似単語列検出手法
竹田隆治, 高須淳宏
電子情報通信学会技術研究報告   107(78)    2007年
ブログタイトルに注目したsploggerの判別手法
竹田隆治
情報処理学会研究報告   36    2009年

競争的資金等の研究課題

 
コピー文字列検知に基づいたsplog検出
研究期間: 2007年   
ブログなどのCGM(consumer Generated Media)のデータは,消費者の実体験や生の声を含んでおり,顧客のニーズを分析したり,プロモーションの効果
を検証するための情報源として,その重要性が増してきている. しかし,ブログには,商品の販売促進や,特定のwebサイトのランクをあげる
ことなどを目的としたsplogと呼ばれるスパムコンテンツが含まれており, ブログの検索や分析に悪影響を及ぼしている.
本稿では特に日本語におけるsplogの特徴であるコピーコンテンツの検出...
類似文字列検出に基づく複数文書要約
研究期間: 2006年   
同一の話題について言及した文書中には,背景知識や環境の異なる複数の筆者
が書いているにも関わらず類似した表現,言い回しが頻出する事が多い.
これらが完全に同一の文字列であれば特定は容易であるが,実際にはほとんど
同じ意味を表すが,部分的に異なる言い回しが使われることが多い.
本研究では,任意のコーパスに適用可能なアラインメント用いて,このような
類似表現を検出する手法を提案し, 冗長性の削減から要約生成が実現できることを実働システムで示す.
軽量のテキスト処理による部分類似単語列列挙
研究期間: 2006年   
同じ事柄について言及した記事は、それがプロのジャーナリストによるものか素人によるweblogなどのようなものであるかに関わらず、重複した情報が非常に多くあり、本質的なユニークな情報は少ない。こういった重複した情報(部分類似単語列)を予備知識なしで自己組織的に検出することに本研究では注目する。
著者らは2つの文書の差異と類似性に注目し、類似した表現を省き、新しい情報を追加していくことでイベントの情報を過不足なく記述した要約文書を生成するシステムを作成した。今回、この部分類似記号列検出手法を、...