資料公開

資料公開

タイトル LCM: 頻出アイテム集合マイニングプログラム
カテゴリ その他
概要 頻出アイテム集合を全て発見する高速アルゴリズムの実装です。2004にFIMIで優勝したものの改良版で、ルール発見など各種拡張機能満載です。
タイトル SACHICA: 高速類似文字列検索アルゴリズム
カテゴリ その他
概要 短い文字列の集合の中から似ている者の組を全て見つけ出すプログラムです。PAKDD2008の優秀論文になったものの実装です。多種の比較が出来るよう、拡張機能満載です。
タイトル cypath: パス・サイクル列挙プログラム
カテゴリ その他
概要 グラフの(コードレス)パス・サイクルを列挙するプログラムです。だいたいの場合出力がボトルネックですので、かなり高速で動きます。
タイトル mace: クリーク列挙プログラム
カテゴリ その他
概要 グラフの(極大)クリークを列挙するプログラムです。1秒間に20万個(極大なら2万個)程度のクリークを見つけます。クラスタリングなどのデータ解析にどうぞ。
タイトル MaxMotif
カテゴリ その他
概要 文字列からモチーフを見つけるプログラムです。モチーフとはワイルドカードを含む文字列パターンで、ゲノム情報科学でよく使われるモデルです。
タイトル PCE: 疑似クリーク列挙プログラム
カテゴリ その他
概要 グラフからクリークっぽいものを全部見つけます。クラスタリングのお供にどうぞ。
タイトル SHD: 極小ヒッティングセット列挙プログラム(双対化)
カテゴリ その他
概要 双対化と呼ばれる、データの全ての項目(各項目は部分集合)と交わりがあるような極小な集合を全て見つけるプログラムです。世界的に見てもこれほど大規模な問題が高速に解けるプログラムは無いと思います。
タイトル SHEAP: 文字列(ゲノム)の類似性可視化プログラム
カテゴリ その他
概要 2つの文字列を比較して、マトリクス的に似ている部分を表示します。また、1つの(巨大な)文字列の中の、どの部分が多くの他所と似ているかを表示します。絵が出てくるのでわかりやすいと思います。
タイトル SSPC: 共通部分を持つ項目の列挙
カテゴリ その他
概要 各項目がアイテムの集合になっているデータを入力して、共通部分を持つ項目の組を全て見つけます。通常の2乗時間のプログラムよりもかなり高速です。
タイトル TGE: 部分木と部分グラフを列挙するプログラム
カテゴリ その他
概要 グラフの部分木・部分森・部分グラフ・連結成分などを列挙するアルゴリズムです。