本論文は、カウンターファクチュアル説明の脆弱性をデータ中毒の観点から研究している。カウンターファクチュアル説明は、ブラックボックスシステムの予測を分析し、望ましい出力を得るための具体的な変更点を示すことができる。しかし、最近の研究では、カウンターファクチュアル説明が様々な操作に対して脆弱であることが明らかになっている。
本研究では、カウンターファクチュアル説明に対するデータ中毒の脆弱性を正式に定式化し、3つのレベル(個人、サブグループ、全体)で検討している。データ中毒の目的は、カウンターファクチュアル説明の費用を増加させることである。理論的な分析と実験的な評価から、最新のカウンターファクチュアル説明生成手法が、わずかなデータ中毒に対しても脆弱であることが示された。これは、カウンターファクチュアル説明の信頼性と安全性に深刻な懸念を呼び起こすものである。
다른 언어로
소스 콘텐츠 기반
arxiv.org
더 깊은 질문