共同研究・競争的資金等の研究課題

2020年4月 - 2023年3月

データの層別に有用な外部情報を視覚的に把握するための統計手法の開発

日本学術振興会  科学研究費助成事業 若手研究  若手研究

課題番号
20K19755
体系的番号
JP20K19755
配分額
(総額)
3,770,000円
(直接経費)
2,900,000円
(間接経費)
870,000円

一般にデータ分析を行う際,対象をクラス分け(層別)した上でメイン変量群の解釈を行うことは有益である.例えばマーケティング調査データから顧客のtargetingを行う際も,「全対象は商品A(の購入意向が高い)」という情報より,「男性は商品Aだが,若者は商品B」,あるいは「男性かつ一人暮らしは商品A」といった情報の方が,実務上意義があると考えられる.本研究はこのようにメイン変量群と外部変量群(クラス分けに用いる変量)の関連を視覚的に把握するための手法開発を行う.ここで本研究では外部情報として性別,国籍などのクラス情報を表すカテゴリカル変量を想定する.まず上記目的を達成する単純な方法として,対象の座標をクラス(あるいはクラスの組み合わせ)ごとに平均をとり,それを 1つの座標点とする方法が考えられる.しかしこの方法ではクラス内の大多数の人が同じ傾向を持つ場合は,その傾向は視覚的にも解釈しやすい場合が多いが, 例えば大多数が似た傾向を持っている中,一部少人数の異なる傾向を持つ部分集団がいた場合,その集団の特定は難しくなる.そこで本研究ではまず,上記のように外部情報クラス内で複数の異なる傾向がある場合に,外部情報クラスごとに複数のクラスターを抽出し,それら全てを共通の低次元空間上に同時布置することで,少数グループの傾向でも視覚的に把握しやすいようにした.これにより,例え少人数のみが持つ傾向であっても,関連の強さの情報が保たれ,視覚化結果にも反映されやすくなる.また異なる外部情報クラスのクラスターを全て同じ空間上に布置することで,外部情報として複数の変量を用いることも可能となり,更に 異なる外部情報クラス間の関係も視覚的に解釈できる.

リンク情報
KAKEN
https://kaken.nii.ac.jp/grant/KAKENHI-PROJECT-20K19755
ID情報
  • 課題番号 : 20K19755
  • 体系的番号 : JP20K19755