核心概念
그래프 신경망 모델에서 원치 않는 데이터의 영향을 효율적으로 제거하기 위해, 학습 그래프를 부분 그래프로 분할하고 각 부분 모델을 독립적으로 학습하여 부분 재학습을 통해 언러닝을 수행하는 방법을 제안한다.
摘要
이 논문은 그래프 신경망 모델에서 원치 않는 데이터의 영향을 효율적으로 제거하는 방법을 제안한다. 기존의 그래프 언러닝 방법들은 그래프 구조와 의미 정보의 손실로 인해 모델 성능이 저하되는 문제가 있었다.
제안하는 GraphRevoker 프레임워크는 다음과 같은 두 가지 핵심 기여점을 가진다:
- 그래프 속성 인식 분할 모듈: 그래프의 구조적, 의미적 특성을 보존하면서 학습 그래프를 부분 그래프로 분할한다.
- 그래프 대조 학습 기반 부분 모델 앙상블: 분할된 부분 모델들을 효과적으로 결합하여 정확한 예측을 수행한다.
이를 통해 기존 방법들에 비해 모델 성능 저하를 최소화하면서도 효율적인 언러닝을 달성할 수 있다.
구체적으로 다음과 같은 핵심 내용을 다룬다:
- 그래프 속성 인식 분할 모듈: 언러닝 시간, 그래프 구조 보존, 의미 보존 등 3가지 목적 함수를 최적화하여 그래프를 효과적으로 분할
- 그래프 대조 학습 기반 부분 모델 앙상블: 지역-지역 구조 복원과 지역-전역 대조 학습을 통해 분할된 부분 모델들을 효과적으로 결합
- 실험 결과: 제안 방법이 기존 방법들에 비해 모델 성능 저하를 최소화하면서도 언러닝 효율성을 크게 향상시킴
統計資料
그래프 분할 시 각 부분 그래프의 노드 수는 |V_i| = 1^T P_:,i 이다.
그래프 분할 시 각 부분 그래프의 간선 수는 E[|E_i|] = sum_{(u_j,u_k)∈E} P_r(u_j,u_k∈V_i) = sum_{reduce}[(P_:,i P_:,i^T) ⊙ A] 이다.
그래프 분할 시 부분 그래프 간 끊어진 간선의 수는 sum_{reduce}[P ⋅ diag^(-1)(1^T D P)](1 - P^T) ⊙ A 이다.
引述
"그래프 신경망 모델에서 원치 않는 데이터의 영향을 효율적으로 제거하기 위해, 학습 그래프를 부분 그래프로 분할하고 각 부분 모델을 독립적으로 학습하여 부분 재학습을 통해 언러닝을 수행하는 방법을 제안한다."
"제안하는 GraphRevoker 프레임워크는 그래프의 구조적, 의미적 특성을 보존하면서 부분 모델들을 효과적으로 결합하여 정확한 예측을 수행한다."