核心概念
アンカーグラフテンソルの非負値テンソル因子分解を用いることで、多視点データの補完的な情報と空間構造情報を包括的に活用し、解釈可能なクラスタリングを実現する。
摘要
本論文では、多視点データの補完的な情報と空間構造情報を効果的に活用するため、アンカーグラフをテンソル化し、非負値テンソル因子分解を適用する手法を提案している。
具体的には以下の3つの特徴がある:
-
アンカーグラフをテンソル化することで、多視点データの空間構造情報を保持しつつ、効率的な処理が可能となる。
-
得られたサンプル指標テンソルとアンカー指標テンソルの解釈性が高く、クラスタリング結果の理解が容易になる。
-
テンソルのシャッテンp-ノルムを導入することで、多視点データの補完的な情報を効果的に活用し、高精度なクラスタリングを実現する。
実験結果から、提案手法が既存手法と比べて優れたクラスタリング性能を示すことが確認された。
統計資料
サンプル数が大きいデータセットでは、提案手法が既存手法と比べて高いクラスタリング精度を達成している。
例えば、Reutersデータセットでは、提案手法のAccuracy=0.796、NMI=0.731、Purity=0.796であるのに対し、他の手法は全てOutOfMemoryとなっている。
また、NoisyMNISTデータセットでは、提案手法のAccuracy=0.819、NMI=0.837、Purity=0.851であり、他の手法を大きく上回っている。
引述
"アンカーグラフをテンソル化することで、多視点データの空間構造情報を保持しつつ、効率的な処理が可能となる。"
"得られたサンプル指標テンソルとアンカー指標テンソルの解釈性が高く、クラスタリング結果の理解が容易になる。"
"テンソルのシャッテンp-ノルムを導入することで、多視点データの補完的な情報を効果的に活用し、高精度なクラスタリングを実現する。"