Grunnleggende konsepter
CARLA는 레이블이 없는 시계열 데이터에서 정상 패턴과 이상 패턴을 효과적으로 구분할 수 있는 표현을 학습하는 자기 지도 대조 학습 기법이다.
Sammendrag
CARLA는 두 단계로 구성된다:
- 전처리 단계:
- 시계열 데이터 창에 다양한 유형의 합성 이상치를 주입하여 정상 패턴과 이상 패턴을 구분할 수 있는 표현을 학습한다.
- 이를 통해 정상 창과 이상 창 간의 거리를 최대화하고 정상 창들 간의 거리를 최소화하는 표현을 학습한다.
- 각 창의 가장 가까운 이웃과 가장 먼 이웃을 식별하여 다음 단계에서 활용한다.
- 자기 지도 분류 단계:
- 이전 단계에서 학습한 표현을 활용하여 각 창을 정상 또는 이상으로 분류한다.
- 창과 그 이웃들 간의 유사도를 최대화하고 창과 먼 이웃들 간의 유사도를 최소화하는 방식으로 학습한다.
- 이를 통해 정상 창과 이상 창을 효과적으로 구분할 수 있는 모델을 학습한다.
CARLA는 7개의 주요 실제 세계 벤치마크 데이터셋에서 기존 최신 모델들을 뛰어넘는 성능을 보였다. 특히 F1 점수와 정밀도-재현율 곡선 아래 면적(AU-PR)에서 우수한 성능을 보였다. 이는 CARLA가 정상과 이상을 효과적으로 구분할 수 있음을 보여준다.
Statistikk
정상 데이터와 이상 데이터의 평균 및 표준편차를 활용하여 합성 이상치를 생성한다.
시계열 창의 길이는 200으로 설정하였다.