喜田 拓也

J-GLOBALへ         更新日: 14/06/24 12:40
 
アバター
研究者氏名
喜田 拓也
 
キダ タクヤ
URL
http://www-ikn.ist.hokudai.ac.jp/~kida/
所属
北海道大学
部署
大学院情報科学研究科 コンピュータサイエンス専攻 知識ソフトウェア科学講座
職名
准教授
学位
博士(情報科学)(九州大学)
科研費研究者番号
70343316

研究分野

 
 

経歴

 
2004年4月
 - 
現在
北海道大学 准教授
 
2007年
 - 
2011年
北海道大学 大学院・情報科学研究科 准教授
 
2001年10月
 - 
2004年3月
九州大学附属図書館 研究開発室 講師
 
2000年1月
 - 
2001年9月
日本学術振興会 特別研究員
 

学歴

 
1999年4月
 - 
2001年9月
九州大学 システム情報科学研究科 情報理学専攻 博士課程
 
1997年4月
 - 
1999年3月
九州大学 システム情報科学研究科 情報理学専攻 修士課程
 
 
 - 
1997年3月
九州大学 理学部 物理学科
 

委員歴

 
2013年10月
 - 
2014年9月
FIT2014  研究会担当委員 兼 A分野責任者
 
2012年4月
 - 
2014年3月
情報処理学会  アルゴリズム研究会幹事
 
2009年4月
 - 
2013年3月
情報処理学会  TOD編集委員
 
2010年4月
 - 
2011年3月
情報処理学会  アルゴリズム研究会運営委員
 
2006年4月
 - 
2008年3月
人工知能学会  人工知能基本問題研究会幹事
 

受賞

 
2001年
情報処理学会 創立40周年記念論文賞 受賞
 

論文

 
Satoshi Yoshida,Hirohito Sasakawa,Kei Sekine,Takuya Kida
Data Compression Conference, DCC 2014, Snowbird, UT, USA, 26-28 March, 2014   436   2014年   [査読有り]
Kei Sekine,Hirohito Sasakawa,Satoshi Yoshida,Takuya Kida
Data Compression Conference, DCC 2014, Snowbird, UT, USA, 26-28 March, 2014   425   2014年   [査読有り]
A Variable-length-to-fixed-length Coding Method Using a Re-Pair Algorithm
6(4) 17-23   2013年9月   [査読有り]
Iku Ohama,Hiromi Iida,Takuya Kida,Hiroki Arimura
Advances in Knowledge Discovery and Data Mining, 17th Pacific-Asia Conference, PAKDD 2013, Gold Coast, Australia, April 14-17, 2013, Proceedings, Part II   147-159   2013年   [査読有り]
Satoshi Yoshida,Takuya Kida
2013 Data Compression Conference, DCC 2013, Snowbird, UT, USA, March 20-22, 2013   532   2013年   [査読有り]
Kei Sekine,Hirohito Sasakawa,Satoshi Yoshida,Takuya Kida
2013 Data Compression Conference, DCC 2013, Snowbird, UT, USA, March 20-22, 2013   518   2013年   [査読有り]
Journal of Information Processing   20(1) 238-249   2012年
Extracting refrained phrases from music signals using a frequent episode pattern mining algorithm
In Proc. of IEEE International Conference on Granular Computing (GrC2011)   199-202   2011年
On Performance of Compressed Pattern Matching on VF Codes
In Proc. Data Compression Conference 2011   to appear   2011年
人工知能学会論文誌   26(1) 297-306   2011年
喜田 拓也
電子情報通信学会論文誌. D, 情報・システム   93(6) 733-741   2010年6月
本論文では,VF符号で圧縮されたテキスト上でのパターン照合アルゴリズムについて論じる.ここで扱うVF符号とは,テキストを分節木によって可変長の部分文字列に分割し,固定長の符号語を割り当てる形式の符号化手法である.圧縮照合問題の形式的枠組みであるCollage systemを用いれば,VF符号上でKMP型の汎用的なアルゴリズムを組織的に導出でき,O(m^2+D)時間・領域の前処理の後, O(n+R)時間で圧縮テキストを走査できる.ここで, m, n, R, Dはそれぞれ,パターン長,テキスト...
UEMURA Takashi, YOSHIDA Satoshi, KIDA Takuya, ASAI Tatsuya, OKAMOTO Seishi
Proc. of the 17th Symposium on String Processing and Information Retrieval(SPIRE2010)   6393 179-184   2010年
分散木と共用文字列で表現される符号上での効率良い圧縮照合アルゴリズム
電子情報通信学会和文論文誌   Vol.J93-D(No.6) 733-741   2010年
An Efficient Algorithm for Almost Instantaneous VF Code Using Multiplexed Parse Tree
Proc. Data Compression Conference 2010   0   2010年
喜田 拓也
日本データベース学会論文誌   8(1) 125-130   2009年6月
本論文では,刈り込み接尾辞木を用いた新たな可変情報源系列固定長符号化(VF符号化)の手法を提案する.この符号化手法は,頻度情報に基づいて刈り込んだ接尾辞木を文節木として用いてVF符号化する.VF符号は,すべての符号語が等長であるという工学的に好ましい性質があり,圧縮パターン照合などへの重要な応用がある.実験の結果,提案符号は,自然言語文書などに対して約41%の圧縮率を達成しており,良く知られているHuffman符号や,古典的なVF符号であるTunstall符号よりも圧縮性能が良いことがわか...
Suffix Tree Based VF-Coding for Compressed Pattern Matching
In Proc. Data Compression Conference 2009   449   2009年
IEICE Trans. on Information and Systems   E92-D(2) 158-165   2009年
Efficient Serial Episode Mining with Minimal Occurrences
Proc. of The 3rd International Conference on Ubiquitous Information Management and Communication (ICUIMC 2009)   471-479   2009年
上村 卓史, 喜田 拓也, 有村 博紀
電子情報通信学会論文誌. D, 情報・システム   91(3) 595-607   2008年3月
プロパティ付きテキストとは,長さηのテキストに,補助情報としてテキスト上の互いにオーバラップを許した区間の集合(プロパティという)が付加された構造化文書の一種であり,アノテーション付きの系列データの形式的なモデルとなっている.このプロパティ付きテキストへの全文テキスト索引として,Amirら(CPM2006)は,プロパティ接尾辞木を提案した.これは,プロパティの各区間に含まれるすべての部分文字列を格納する索引構造であり,遺伝子情報や,ビデオストリーム,メタデータ付き時系列データなどへの応用が...
Flexible Framework for Time-Series Pattern Matching over Multi-Dimension Data Stream
Proc. the First International Workshop on Algorithms for Large-Scale Information Processing in Knowledge Discovery (ALSIP2008)   5-16   2008年
プロパティ接尾辞木のオフライン線形時間構築アルゴリズム
電子情報通信学会論文誌   Vol.J91-D(No.03) 595-607   2008年
An Efficient Algorithm for Complex Pattern Matching over Continuous Data Streams Based on Bit-Parallel Method
Proceedings of The Third IEEE International Workshop on Databases for Next-Generation Researchers (SWOD'07)   13-18   2007年
上村 卓史, 喜田 拓也, 有村 博紀
情報科学技術レターズ   5(0) 5-8   2006年8月
Faster Pattern Matching Algorithm for Arc-Annotated Sequences
Proceedings of Dagstuhl Workshop on Federation over the Web   LNAI3847 25-39   2006年
喜田 拓也, 南 俊朗
日本データベース学会letters   4(2) 61-64   2005年9月
多くの図書館において所蔵文献の検索にはOPAC(Online Public Access Catalog)が用いられている.しかしながら,歴史の長い図書館では古い資料の書誌データが電子化されないままであり,そのような資料はOPACで検索することができない.すなわち,利用者は図書目録カードが入った引出しの前まで出向き,カードを一枚一枚めくりながら目的の資料を探さなければならない.このような状況を打開する手段として,図書目録カードのすべてを画像データ化し,Web上でカードを閲覧できるシステムを...
テキストファイルによる図書目録画像データベースの構築と管理
DBSJ Letters   Vol.4(No.2) 61-64   2005年
Pattern Matching with Taxonomic Information
Proceedings of The Asia Information Retrieval Symposium (AIRS2004)   265-268   2004年
A Space-Saving Linear-Time Algorithm for Grammar-Based Compression
Proceedings of The Eleventh Symposium on String Processing and Information Retrieval (SPIRE2004)   Lecture Notes in Computer Science 3246 218-229   2004年

Misc

 
笹川裕人, 関根渓, 吉田諭史, 喜田拓也
情報処理学会研究報告. AL, アルゴリズム研究会報告   2014(8) 1-5   2014年6月
本稿では,可変長-固定長符号(VF符号)により符号化された圧縮テキストに対する,高速な部分文字列抽出法を提案する.提案手法では,圧縮テキストに対して,符号語の境界に対応する元テキストの位置を格納した簡潔索引を付加することで,圧縮テキストから部分文字列を抽出する問題を平均 O(N/n+l) 時間で解く.ここで,N と,n,l は,それぞれ元テキスト長,圧縮テキスト長,抽出する部分文字列長である.計算機実験では,提案手法を Re-Pair-VF アルゴリズム上で実装し,高速に部分文字列抽出問題...
寺島 裕貴, 喜田 拓也
電子情報通信学会技術研究報告 = IEICE technical report : 信学技報   113(493) 247-252   2014年3月
三浦亮, 寺島裕貴, 喜田拓也
情報処理学会研究報告. [音楽情報科学]   2013(30) 1-6   2013年8月
近年,膨大な数の楽曲を個人がインターネットを介して利用できるようになった.なおも増加し続ける楽曲データを効率よく管理し検索する上で,楽曲の構造理解は重要な役割を担っている.たとえば,ポピュラー音楽には,イントロ,コーラス (サビ),ブリッジといった音楽的に意味の有る構造が存在しており,これを自動的に抽出することで高度な楽曲鑑賞や管理を行うことができる.本稿では,楽曲信号を入力として音楽的に意味の有る構造の境界を見つける問題について議論する.楽曲構造の解析は,楽曲信号に対する自己相似性行列上...
高田怜, 喜田拓也
情報処理学会研究報告. [音楽情報科学]   2013(7) 1-6   2013年8月
楽曲信号の検索には,音楽指紋が用いられることが多い.音楽指紋とは,楽曲の特徴をとらえつつ,楽曲信号を非常に小さいビット列へと変換したものである.したがって,精度良く高速に楽曲検索を行うためには,適切な音楽指紋の設計が重要となる.本稿では,異なる歌唱者によって歌われた同じ伴奏の楽曲信号からデータベース中の原曲を検索する問題について議論する.この問題のためにいくつか異なる音楽指紋を比較し,それらの検索精度への影響について調査を行う.
関根 渓, 笹川 裕人, 吉田 諭史, 喜田 拓也
情報処理学会研究報告. データベース・システム研究会報告   2012(7) 1-6   2012年12月
1999 年に Larsson と Moffat らによって提案された Re-Pair アルゴリズムは,単純なヒューリスティックに基づいた,非常に高い圧縮率を達成する文法圧縮の一つである.しかしながら, Re-Pair アルゴリズムはオフラインのアルゴリズムであり,また,線形サイズではあるものの多くのメモリを使用する.したがって,巨大なテキスト上でアルゴリズムを実行するためには,テキスト全体をいくつかのブロックに分割し,ブロック毎に圧縮を行う必要がある.このような状況において,圧縮時に用い...
大濱 郁, 飯田 裕美, 喜田 拓也
電子情報通信学会技術研究報告 : 信学技報   111(480) 1-8   2012年3月
大濱 郁, 飯田 裕美, 喜田 拓也, 有村 博紀
電子情報通信学会技術研究報告. IBISML, 情報論的学習理論と機械学習   111(480) 1-8   2012年3月
本稿では,関係の有無の持つ意味が非対称であり,関係を生成する機会に個体差があるような関係データを分析するための,新しい生成モデルを提案する.提案するモデルでは,各オブジェクトに対して他オブジェクトとの遭遇しやすさを表すパラメータが組み込まれている.そして,サブセットクラスタリングのアイデアに基づき,オブジェクト同士が遭遇した時は,クラスタ固有の分布から,遭遇しなかった場合は,全データで共通の分布から関係が生成される.そのため,購買履歴のようにリンクと非リンクのもつ意味が非対称であり,オブジ...
吉田諭史, 喜田拓也
情報科学技術フォーラム   FIT 2011 149-150   2011年8月
吉田 諭史, 喜田 拓也
情報処理学会研究報告. 情報学基礎研究会報告   2011(14) 1-6   2011年7月
本稿では,VF 符号における辞書データ構造を訓練することで VF 符号の性能を向上させる方法について論じる.ここで議論する VF 符号とは,分節木と呼ばれる木構造を用いて入力テキストを可変長のブロックに分割し,各ブロックに固定長の符号語を割り当てることでテキスト圧縮を達成する情報源符号化方法である.VF 符号の圧縮率は分節木によって決定されるが,入力テキストに対して最適な分節木を構築することは NP 困難であることが知られている.そのため,最適に近い分節木を構築するために,入力テキストを繰...
吉田 諭史, 喜田 拓也
情報処理学会研究報告. データベース・システム研究会報告   2011(14) 1-6   2011年7月
本稿では,VF 符号における辞書データ構造を訓練することで VF 符号の性能を向上させる方法について論じる.ここで議論する VF 符号とは,分節木と呼ばれる木構造を用いて入力テキストを可変長のブロックに分割し,各ブロックに固定長の符号語を割り当てることでテキスト圧縮を達成する情報源符号化方法である.VF 符号の圧縮率は分節木によって決定されるが,入力テキストに対して最適な分節木を構築することは NP 困難であることが知られている.そのため,最適に近い分節木を構築するために,入力テキストを繰...
大濱 郁, 喜田 拓也, 有村 博紀, 阿部 敏久
電子情報通信学会技術研究報告. IBISML, 情報論的学習理論と機械学習   110(476) 9-16   2011年3月
我々は,人間行動履歴の地理的クラスタリングについて議論する.本論文では,この問題を,二次元時系列データのセグメンテーション問題として定式化し,二つのクラスタリング手法,LS-linHMMとX-linHMMを提案する.前者のLS-linHMMは,線形制約付きHMMを用いたクラスタリングと情報量規準を用いたモデル選択を組み合わせ,クラスタ数の自動推定を行う.また,X-linHMMは,x-meansのアイデアを取り入れた2状態線形HMMによる階層的クラスタリングであり,LS-linHMMよりも高...
吉田 諭史, 喜田 拓也
情報処理学会研究報告. データベース・システム研究会報告   2010(10) 1-8   2010年7月
本稿では,VF 符号に算術符号を組み合わせることで,検索の効率と圧縮率とを保つ方法について議論する.ここで議論する VF 符号とは,分節木と呼ばれる圧縮のための辞書木を用いて元のテキストを可変長のブロックに分割し,各ブロックに固定長の符号語を割り当てることでデータ圧縮を達成する情報源符号化方法である.VF 符号は,近年,パターン照合を高速化することのできるデータ圧縮法として見直されている.VF 符号は,符号語長が固定であるという制限から,分節木が小さいときには圧縮性能が低い.圧縮率を向上さ...
上村 卓史, 喜田 拓也
電子情報通信学会総合大会講演論文集   2010(1)    2010年3月
中野 智晴, 喜田 拓也
画像ラボ   20(9) 6-11   2009年9月
吉田 諭史, 喜田 拓也
情報処理学会研究報告. データベース・システム研究会報告   148(0)    2009年7月
喜田 拓也
電子情報通信学会技術研究報告. COMP, コンピュテーション   109(108) 1-8   2009年6月
本稿では,VF符号で圧縮されたテキスト上でのパターン照合アルゴリズムについて論じる.まず,圧縮照合問題の形式的枠組みであるCollage systemを用いて,VF符号上でKMP型の圧縮照合を行う汎用的なアルゴリズムを導出する.そのアルゴリズムは,O(m^2+D)時間・領域の前処理の後,O(n+R)時間で圧縮テキストを走査できる.ここで,m,n,R,Dはそれぞれ,パターン長,テキスト長,パターンの出現回数,圧縮辞書のサイズである.ただし,ここでいう圧縮辞書のサイズとは,各符号語に対応する文...
中野 智晴, 喜田 拓也
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解   108(363) 25-30   2008年12月
現在,インターネット上に存在する多くの画像データは圧縮された形で保存されている.その圧縮形式の代表的なもののひとつとして,JPEG形式が挙げられる.通常,JPEG形式の画像に対して画像照合やパターン認識処理をするためには,一旦,元のBitmapに復元しなければならない.本稿では,JPEG画像に対して,それを復元することなく部分画像を近似パターンマッチングするアルゴリズムについて論じる.今回提案するアルゴリズムは,複数の非決定性オートマトンの動作をビットパラレル手法を用いて高速に模倣し,JP...
上村 卓史, 喜田 拓也, 有村 博紀
情報処理学会論文誌. データベース   1(1) 49-60   2008年6月
インターネットからの効率的な情報収集においてウェブブラウザの果たす役割は大きい.しかし,膨大な文書の検索および閲覧はユーザにとっていまだ大きな負担である.本論文では,情報収集の補助を目的として,ユーザが閲覧するウェブページからのキーワード抽出という問題について考察する.ここでのキーワードとは,任意の単語の連結(単語Nグラム)である.このため,接尾辞木をもとにした,任意の単語Nグラムを線形領域で表すデータ構造である単語Nグラム木を提案し,これを利用した高速な抽出アルゴリズムを与える.また,抽...
大谷 英行, 喜田 拓也, 宇野 毅明, 有村 博紀
情報処理学会研究報告. データベース・システム研究会報告   2008(56) 113-120   2008年6月
巨大なデータ集合の中から,有用な知識や情報を発見するデータマイニングは,現代の様々な分野で重要な技術であり,特に,時系列データを対象とした時系列データマイニングが注目を集めている.本論文では,頻出時系列エピソード発見問題を研究する.これは,与えられた系列データから,最大窓幅wの制約の元で,頻出エピソードと呼ばれる頻出する部分系列を効率的に取り出す問題である.本稿では,高速な頻出集合発見アルゴリズムLCMを元にして,エピソード発見のための深さ優先型探索アルゴリズムといくつかの高速化手法を提示...
上村卓史, 喜田拓也, 有村博紀
情報処理学会シンポジウムシリーズ(CD−ROM)   2007(3) 7B-1   2007年11月
上村卓史, 喜田拓也, 有村博紀
情報科学技術フォーラム   FIT 2007 45-46   2007年8月
斉藤 智哉, 喜田 拓也, 有村 博紀
情報科学技術フォーラム一般講演論文集   6(2) 43-44   2007年8月
上村 卓史, 喜田 拓也, 有村 博紀
情報科学技術フォーラム一般講演論文集   6(2) 45-46   2007年8月
上村 卓史, 喜田 拓也, 有村 博紀
電子情報通信学会技術研究報告. COMP, コンピュテーション   107(24) 71-78   2007年4月
高度なテキスト検索処理においては,テキストの特性(プロパティ)を考慮し,ある条件を満たす区間のみを対象として検索を行うという要求が存在する.本論文では,このプロパティを考慮した索引構造を構築する問題に取り組む.2006年にAmirらは,プロパティに属する区間に含まれる部分文字列のみを格納するプロパティ付き接尾辞木PSTを提案した.彼らの構築アルゴリズムは,接尾辞木から不要なノードを削除することでプロパティ付き接尾辞木を得るものである.本論文では,PSTの線形時間構築への第一歩として,必要な...
上村卓史, 喜田拓也, 有村博紀
情報科学技術フォーラム   FIT 2006 5-8   2006年8月
喜田拓也
情報科学技術フォーラム   FIT 2005 25-28   2005年8月
喜田 拓也, 南 俊朗
情報処理学会研究報告. データベース・システム研究会報告   2005(68) 461-467   2005年7月
多くの図書館において所蔵文献の検索にはOPAC (Online Public Access Catalog)が用いられている.しかしながら, 歴史の長い図書館では古い資料の書誌データが電子化されないままであり, そのような資料はOPACで検索することができない.すなわち, 利用者は図書目録カードが入った引出しの前まで出向き, カードを一枚一枚めくりながら目的の資料を探さなければならない.このような状況を打開する手段として, 図書目録カードのすべてを画像データ化し, Web上でカードを検索で...
有村 博紀, 喜田 拓也
情報処理   46(1) 4-11   2005年1月
大量の電子化データの流れであるデータストリームから,有用な情報を少ない資源で効率よく取り出すためのストリームマイニング技術を概観する.まず,データストリームの特徴と,データマイニングの目的について整理し,限定された計算資源を用いて無限に続くデータストリームからマイニングを行うためのシステムに要求される性質について議論する.次に,さまざまな要約データ構造とオンライン化技術についてまとめ,最近の研究のうち特色のあるものを紹介する.
南俊朗, 池田大輔, 喜田拓也
情報処理学会研究報告   2004(119(FI−77)) 7-22   2004年11月
喜田 拓也, 坂本 比呂志, 下薗 真一
電子情報通信学会技術研究報告. COMP, コンピュテーション   104(317) 1-7   2004年9月
テキストを圧縮する最適化問題に対して,準最適解を保証する省スペースな線形時間アルゴリズムを構築する.アルゴリズムは,高々アルファベットサイズの頂点を持つ平衡二分木上の最近共通祖先を計算し,その情報を用いて,長さnの任意のテキストを最適な圧縮のサイズg_*に対して,高々O(log g_* 1og n)倍以内で近似する.アルゴリズムが使用する主記憶領域は,高々O(g_* log g_*)であり,この有効性を実験によって示す.
喜田拓也, 有村博紀
人工知能学会人工知能基本問題研究会資料   56th 73-78   2004年7月
喜田 拓也
電子情報通信学会技術研究報告. COMP, コンピュテーション   103(622) 61-68   2004年1月
VLDCパタンとは,任意の文字列と一致するメタ記号'*'を含む文字列パタンである.いま,VLDCパタンPに対して,Pと一致する文字列の集合をPとする.このとき,VLDCパタンに対する文字列照合問題とは,与えられた文字列T中に,あるq∈Pが存在するかどうかを答えることである.今回,P中の'*'以外の部分においてk個以下の不一致を許した近似照合問題に取り組んだ.本論文では,この問題を解く三つのアルゴリズムを提案する.一つは,動的計画法に基づく近似文字列照合アルゴリズムの変形であり,mをPの長さ...
データストリームのためのマイニング技術
特集「データマイニング技術」, 情報処理   46(1) 4-11   2005年
Application of Truncated Suffix Trees to Finding Sentences from the Internet
Proceedings of Core-to-Core Workshop   18   2006年
Online Construction of Truncated Suffix Tree with Word Count Limitation
Proceedings of DMSS2006   104-108   2006年
Compressed Pattern Matching Accelerates Keyword Search
27-32   2008年
喜田拓也
情報科学技術フォーラム   FIT 2003 137-138   2003年8月
喜田 拓也, 宮本 哲, 竹田 正幸
情報科学技術フォーラム一般講演論文集   2002(2) 55-56   2002年9月
喜田 拓也, 柴田 裕介, 竹田 正幸, 篠原 歩, 有川 節夫
全国大会講演論文集   59(1) "1-177"-"1-178"   1999年9月
柴田 裕介, 喜田 拓也, 竹田 正幸, 篠原 歩, 有川 節夫
全国大会講演論文集   59(1) "1-175"-"1-176"   1999年9月
喜田拓也, 竹田正幸, 篠原歩
情報処理学会全国大会講演論文集   57th(1) 1.143-1.144   1998年10月
喜田拓也, 竹田正幸, 宮崎正路, 篠原歩
電気関係学会九州支部連合大会講演論文集   50th 275   1997年10月

書籍等出版物

 
中村 篤祥, 湊 真一, 喜田 拓也 (担当:共著)
ムイスリ出版   2013年4月   ISBN:489641215X

担当経験のある科目

 
 

競争的資金等の研究課題

 
文部科学省: 科学研究費補助金(若手研究(B))
研究期間: 2011年 - 2013年    代表者: 喜田 拓也
文部科学省: 科学研究費補助金(基盤研究(B))
研究期間: 2008年 - 2011年    代表者: 湊 真一
データベース分野では,当初はハードディスク内にデータを格納することが一般的だったが、2000年以降、中規模クラスの実用的なデータベースが計算機のメモリに納まるようになってきた。そこで本研究課題では、超大規模な単一実メモリ空間を持つ計算機に、二分決定グラフ(BDD)と呼ばれる巨大な圧縮データ構造を構築して、全てを高速アクセス可能なメモリ上に格納し、高速にデータベース解析処理を行う手法を提案し、その研究実用化を進める。
文部科学省: 科学研究費補助金(基盤研究(A))
研究期間: 2008年 - 2011年    代表者: 有村 博紀
本研究においては,ネットワーク上大規模半構造データに内在する知識をパターンや規則としてとりだことが可能な超調整な半天構造マイニングエンジン技術を開発し,これを現実の多様な半構造データに適用するための周辺技術を開発する.さらに,開発した基盤技術と周辺技術の実装を行い,インターネット上の大規模半構造データからの知識発見実験を行うことを目的とする.
文部科学省: 科学研究費補助金(特定領域研究)
研究期間: 2009年 - 2010年    代表者: トーマス ツォイクマン
本研究課題では,大規模知識処理のための超高速アルゴリズムの研究に取り組んでいる.本研究では,ウェブからの知識獲得を人間による大量のウェブ情報アクセスを支援する効率的な半自動的ツールとしてとらえ,従来の情報検索システムを超えた新しい情報アクセスシステムの開発を目指している.そのために,現在までに開発してきたウェブ情報処理技術を元に,中核技術として,機械学習と知識索引技術に基づく,適応的な知的情報獲得システムの基盤技術を開発することを目標としている.特に本年度は,下記の課題に取り組み,各課題に...
文部科学省: 科学研究費補助金(若手研究(B))
研究期間: 2008年 - 2010年    代表者: 喜田 拓也
連続データストリームに対する高速・高度なパターン照合技術およびそのためのデータ圧縮技術について研究を行った.前者については,ビットパラレル手法に基づいた,多次元データストリームに対する複雑なクエリを許すパターン照合アルゴリズムBPS(Bit-Parallel on Streams)を提案した.これにより,文字情報のみならず,数値データや分類データなどが複雑に組み合わさったクエリをデータストリームに対して行うことができるようになった.後者については,VF符号(Variable-to-fixe...