2017年4月 - 2021年3月
機械学習計算基盤の構築と複数領域における画期的成果の創出
日本学術振興会 科学研究費助成事業 基盤研究(A) 基盤研究(A)
- 課題番号
- 17H00762
- 体系的課題番号
- JP17H00762
- 担当区分
- 研究分担者
- 配分額
-
- (総額)
- 40,820,000円
- (直接経費)
- 31,400,000円
- (間接経費)
- 9,420,000円
理論面と実装面に分けて報告する。
理論
(1)百種類以上ある木カーネルと比較して、部分パスカーネルが実行速度・正確性の両面において優れていることを、多数のデータセットを用いて実証した。順序木・無順序木を問わない点が定性的に重要な利点であり、加えて、正確性の評価において他の木カーネルに対して統計的に有意な差があることを示した。(2)部分パスカーネルを、入力となる木のサイズ(頂点の個数)に関して線形の計算量で計算するアルゴリズムを新規に開発した。他の木カーネルは、木のサイズの二乗ないし三乗のオーダーの計算量を必要とするので、部分パスカーネルの利点は顕著である。実際、iMac Pro 14Coreを用いた実験では、一つのカーネル値を計算するのに60マイクロ秒程度しか掛からない。(2)このアルゴリズムを理論的に記述するために、順序木の新たな定式化を考案した。(3)部分パスカーネルを用いたカーネルクラスタリング(k-平均、HACベース)を提案し、予備的実験により、良い性能が得られることを示した。(4)カーネルとガウス分布を用いた木構造データによる回帰の手法を提案した。
実装
(1)部分パスカーネルとSVMを用いて、木構造データの分類を行うライブラリの開発を完了した。このライブラリは、Excelをインターフェースとするラッパーを含み、研究者のみならず、非専門家でも使いやすいように設計・実装されている。(2)前記ライブラリを用いて、偽サイト判定システムを構築し、楽天株式会社、及び、兵庫県警本部において、検証実験を行なった。楽天での検証では正確性99.98%超、兵庫県警での検証でも90%を超える正確性を示し、部分パスカーネルを用いた分類器の優位性を示した。(3)犯罪予測の応用事例において、犯罪情報の情報量を目的関数として、ガウス分布回帰によって優れた予測精度が得られることを示した。
理論
(1)百種類以上ある木カーネルと比較して、部分パスカーネルが実行速度・正確性の両面において優れていることを、多数のデータセットを用いて実証した。順序木・無順序木を問わない点が定性的に重要な利点であり、加えて、正確性の評価において他の木カーネルに対して統計的に有意な差があることを示した。(2)部分パスカーネルを、入力となる木のサイズ(頂点の個数)に関して線形の計算量で計算するアルゴリズムを新規に開発した。他の木カーネルは、木のサイズの二乗ないし三乗のオーダーの計算量を必要とするので、部分パスカーネルの利点は顕著である。実際、iMac Pro 14Coreを用いた実験では、一つのカーネル値を計算するのに60マイクロ秒程度しか掛からない。(2)このアルゴリズムを理論的に記述するために、順序木の新たな定式化を考案した。(3)部分パスカーネルを用いたカーネルクラスタリング(k-平均、HACベース)を提案し、予備的実験により、良い性能が得られることを示した。(4)カーネルとガウス分布を用いた木構造データによる回帰の手法を提案した。
実装
(1)部分パスカーネルとSVMを用いて、木構造データの分類を行うライブラリの開発を完了した。このライブラリは、Excelをインターフェースとするラッパーを含み、研究者のみならず、非専門家でも使いやすいように設計・実装されている。(2)前記ライブラリを用いて、偽サイト判定システムを構築し、楽天株式会社、及び、兵庫県警本部において、検証実験を行なった。楽天での検証では正確性99.98%超、兵庫県警での検証でも90%を超える正確性を示し、部分パスカーネルを用いた分類器の優位性を示した。(3)犯罪予測の応用事例において、犯罪情報の情報量を目的関数として、ガウス分布回帰によって優れた予測精度が得られることを示した。
- ID情報
-
- 課題番号 : 17H00762
- 体系的課題番号 : JP17H00762
この研究課題の成果一覧
絞り込み
論文
1-
Proc. Eighth International Symposium on Computing and Networking Workshops 2020年11月 査読有り筆頭著者
講演・口頭発表等
1-
第81回情報処理学会全国大会 2019年3月15日