Główne pojęcia
ログデータの内容と因果関係を統合的に捉えることで、ラベル付きデータを必要とせずに効果的なログ異常検知を実現する。
Streszczenie
本研究は、ログデータの異常検知に関する新しいアプローチを提案している。
- ログデータの前処理として、ログの構造化、ベクトル化、グラフ化を行う。
- ログデータの内容情報と因果関係を統合的に捉えるためのDualGCN-LogAEモデルを開発した。
- DualGCN-LogAEで抽出した特徴量を用いて、ラベル付きデータを必要としない完全教師なしのグラフクラスタリングによる異常検知手法「Log2graphs」を提案した。
- 5つの公開ログデータセットを用いた実験により、提案手法が既存手法を上回る性能を示すことを確認した。
- 異常検知の評価指標として、Silhouette係数、Davies-Bouldin指数、Calinski-Harabasz指数を提案し、教師なしデータセットでの有効性を示した。
Statystyki
HDFS データセットの異常検知精度は97.39%
BGL データセットの異常検知精度は88.88%
Cytaty
"ログデータの内容と因果関係を統合的に捉えることで、ラベル付きデータを必要とせずに効果的なログ異常検知を実現する。"
"提案手法が既存手法を上回る性能を示すことを確認した。"