Keskeiset käsitteet
深層生成モデルは、より単純なデータセットからのOODデータに対して高い尤度を割り当てるが、それらのデータを生成しない。この矛盾は、OODデータが低次元の部分多様体に集中しているため、モデルがそれらの領域に非常に小さな確率質量を割り当てることで説明できる。
Tiivistelmä
本論文では、深層生成モデル(DGM)を用いたOOD検出の矛盾について分析している。DGMは、より複雑なデータセットで訓練されると、より単純なデータセットからのOODデータに対して高い尤度を割り当てるが、それらのデータを生成しないという不可解な振る舞いを示す。
この矛盾の説明として、以下の点を明らかにしている:
- OODデータが低次元の部分多様体に集中している場合、DGMはそれらの領域に非常に小さな確率質量を割り当てることができる。
- これにより、DGMは高い密度を割り当てつつ、無視できるほどの確率質量を割り当てることが可能になる。
- 局所的な内在次元(LID)の推定を用いることで、この現象を特定し、OOD検出に活用できる。
具体的には、尤度とLIDの組み合わせを用いた二重閾値OOD検出手法を提案している。この手法は、単一の尤度閾値を用いる手法よりも優れた性能を示し、深層生成モデルの背景にある幾何学的な構造を活用できることを実証している。
Tilastot
単純なデータセットからのOODデータに対して、より複雑なデータセットで訓練されたDGMは高い尤度を割り当てる。
しかし、DGMはそれらのOODデータを生成しない。
これは、OODデータが低次元の部分多様体に集中している場合、DGMがその領域に非常に小さな確率質量を割り当てることで説明できる。
Lainaukset
"OODデータに高い尤度を割り当てつつ、それらを生成しないという二重の矛盾は、未だ決定的に説明されていない。"
"高い尤度領域が生成されないのは、それらが非常に小さな確率質量を含むためである。"
"OODデータが「より単純」な意味で、すなわち内在次元が低い場合、この矛盾した状況が完全に一致する。"