本プロジェクトは、イスラエル保健省が2024年2月に実施した、2014年のイスラエル国民出生登録簿のマイクロデータのリリースを文書化したものである。
プロジェクトの主要な目的は、差分プライバシーを用いて政府データを一般に公開する方法の実現可能性を評価することであった。リリースには、保健省内外のステークホルダーが関与した。
差分プライバシーを正式な privacy 指標として採用し、Liu and Talwar (STOC 2019)の私的選択アルゴリズムを活用して、データ変換、モデル生成アルゴリズム、ハイパーパラメータ選択、評価などの複数のステップを統合した。モデル生成アルゴリズムとしてはPrivBayes (Zhang et al., SIGMOD 2014)を選択した。評価は、ステークホルダーが事前に定めた一連の受け入れ基準に基づいて行われた。
この差分プライバシー保護付きの合成データリリースは、主に集計表(k-way marginals)、グループ化平均(conditional means)、線形回帰の精度を目的としている。受け入れ基準を満たすことで、これらの統計量について十分な精度が確保されている。
一方で、他の種類の分析(仮説検定、外れ値分析、機械学習トレーニングなど)については、同様の精度保証はない。このことをデータユーザーに明確に伝えるため、リリースに付随する文書化が重要な役割を果たしている。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Shlomi Hod,R... at arxiv.org 05-02-2024
https://arxiv.org/pdf/2405.00267.pdfDeeper Inquiries