共同研究・競争的資金等の研究課題

2012年 - 2013年

シンボリックデータ解析による大規模及び複雑なデータに対する解析法の研究

日本学術振興会  科学研究費助成事業 特別研究員奨励費  特別研究員奨励費

課題番号
12J02466
体系的課題番号
JP12J02466
配分額
(総額)
1,800,000円
(直接経費)
1,800,000円

本年度は, 前年度の研究成果の論文化と非重み付有向グラフに対するgraph embeddingに関する研究を行った. 前年度の研究成果の論文化を通して, reduced k-means (RKM)法とfactorialk-means (FKM)法という異なる2つの次元縮約クラスタリングが漸近的に同等となる場合があることを新たに明らかにした. また, 次元縮約クラスタリングのFKM法に関して, あまりtightではないが大偏差不等式を導出した. これにより, k-means法, RKM法, FKM法の違いが明確なものとなった. RKM法の漸近的挙動に関する研究成果はScandinavian Journal of Statisticsに採択され, FKM法に関する漸近的挙動の研究成果は, Annals of the Institute of Statistical Mathematicsに採択された, さらに, 距離ベクトルを用いた高次元小標本データに対するクラスタリング法とそのラベルの一致性に関する研究成果に関しても, 論文化し現在投稿中である.
さらに, Hamburg大学のUlrike von Luxburg教授の下へ2013年5月末~2月末まで留学し, 非重み付きグラフに関するgraph embeddingの共同研究を行った. 具体的には, 非重み付きグラフに対して, 背後にユークリッド空間上の幾何的構造があると仮定し, 与えられた近接行列もっている幾何的構造を低次元空間に可能な限り再現する方法であるLocal Ordinal Embeddingを提案した. さらに, 各頂点がユークリッド空間上のある分布からサンプリングされていると考えるrandom geometric graphを仮定し, もっとも近いk個の対象にのみ辺を与えるk-近傍グラフを想定し, 頂点数nが無限大に発散すればn x nの0-1行列から元のユークリッド空間上の布置が再現可能かという問題について肯定的な解を与えた. Isomapのように近傍の距離が分かっている設定であれば, kをlog nと同じ具合に設定すれば再現可能であるが, 非重み付きグラフの場合kの数をlognのオーダーより多く設定しなければならない. これが, 非重み付k-近傍グラフのkと距離の順序情報が密接に関係していることに起因していることも明らかにした. なお, この研究成果は. 機械学習のtop conferenceであるICML 2014に採択された.

リンク情報
KAKEN
https://kaken.nii.ac.jp/grant/KAKENHI-PROJECT-12J02466
ID情報
  • 課題番号 : 12J02466
  • 体系的課題番号 : JP12J02466