核心概念
본 연구는 랜덤 포레스트 모델의 해석을 위해 예측 성능, 해석 가능성, 모델 복잡도 간의 균형을 고려하여 최적화된 규칙 앙상블을 생성하는 방법을 제안한다.
要約
이 연구는 랜덤 포레스트(RF) 모델의 해석 가능성을 높이기 위해 최적화된 규칙 앙상블(ORE)을 생성하는 방법인 Forest-ORE를 제안한다.
첫째, RF 모델에서 규칙을 추출한다.
둘째, 개별 규칙의 예측 성능을 기반으로 관련 규칙을 선별한다.
셋째, 혼합 정수 최적화 프로그램을 사용하여 예측 성능, 해석 가능성, 모델 복잡도 간의 균형을 고려하여 최적의 규칙 집합을 선택한다.
넷째, 보완적인 정보를 제공하기 위해 메타 규칙 접근법을 사용하여 추가 규칙을 발견한다.
이 방법은 36개의 벤치마크 데이터셋에 적용되어 RF 모델과 비교했을 때 예측 성능, 해석 가능성, 모델 복잡도 간에 우수한 균형을 보여주었다.
統計
랜덤 포레스트 모델은 수백 개의 깊은 의사결정 트리로 구성되어 있어 해석이 어려운 "블랙박스" 모델로 간주된다.
규칙 기반 접근법은 랜덤 포레스트 모델을 해석하는 데 도움이 될 수 있지만, 기존 방법들은 예측 성능과 해석 가능성 간의 균형을 고려하지 않고 규칙 간 중복이나 상호작용에 대한 정보를 제공하지 않는다.
引用
"랜덤 포레스트는 예측 성능이 뛰어난 대표적인 앙상블 학습 방법이지만, 수백 개의 깊은 의사결정 트리로 인해 '블랙박스' 모델로 간주된다."
"규칙 기반 접근법은 랜덤 포레스트 모델을 해석하는 데 도움이 될 수 있지만, 기존 방법들은 예측 성능과 해석 가능성 간의 균형을 고려하지 않고 규칙 간 중복이나 상호작용에 대한 정보를 제공하지 않는다."