共同研究・競争的資金等の研究課題

2011年 - 2013年

離散データ構造に対するカーネルの設計理論の構築

文部科学省  科学研究費補助金(基盤研究(B))
  • 申 吉浩
  • ,
  • 有村 博紀
  • ,
  • 坂本 比呂志
  • ,
  • 久保山 哲二
  • ,
  • 岡本 洋
  • ,
  • CUTURI Marco

課題番号
23300061
担当区分
連携研究者
配分額
(総額)
19,500,000円
(直接経費)
15,000,000円
(間接経費)
4,500,000円
資金種別
競争的資金

カーネル設計理論においては、カーネルの計算可能性を探求するために新たに導入した理論的枠組みである「分割可能カーネル」において重要な進展を得た。隠れ次数が1の場合については既にその標準形を得ていたが、今年度は隠れ次数2の場合の標準形を完全に求めた。隠れ次数2の分割可能カーネルは、一次の基本対称式を含み、例えば部分構造の要素の位数の和として定義されるカーネルを、その重要な例にもつ。今回の研究成果では、隠れ次数2の分割可能カーネルがなす空間は3つの部分空間に分割され、それぞれが2乃至3のパラメータで表現されることを示した。即ち、少数のパラメータにより隠れ次数2の分割可能カーネルを完全に記述することが可能であり、実用においては、交叉検定などにより最適パラメータを探索することにより、従来の勘にたよったカーネル選択ではなく、システマティクに最適なカーネルを探索することが可能となる。この結果は機械学習のトップカンファレンスであるICMLにおいて平成25年6月に発表する。カーネル計算のためのユーティリティ開発では、本年度の課題であった並列計算による高速化を実現した。これにより、従来に比較して数倍から十数倍の高速化に成功した。高速化されたユーティリティを利用して、70種類以上にのぼる木カーネルのアルゴリズムの性能比較実験を行い、興味深い結果を得た。すなわち、予想に反して、ごく単純な形の部分構造の重み付き数え上げを行うカーネルが、より複雑な部分構造を数え上げるカーネルや、木の編集距離から導出されるカーネルに比べて、統計的に有意によい性能を示すことが分かった。この結果は、木データを扱う実研究においてカーネルを選択する際に重要な指針を与える。その他の研究成果として、木の編集距離と密接に関連する最適化問題の発見、文字列アライメントのグラフへの一般化を得た。

リンク情報
URL
https://kaken.nii.ac.jp/d/p/23300061.ja.html