summaryrefslogtreecommitdiff
path: root/synthetic/related.tex
blob: e93edd32856474fa995ad0c51c390fec8e1b7b80 (plain)
1
2
3
4
5
6
7
8
9
10
11
La littérature sur la confidentialité des données synthétiques se concentre sur un problème connexe.
Des nous étude, les données synthétique ne sont pas publiques, elle sont utilisé comme intermédiaire entre les données réelles et le modèle cible.
Au contraire, dans la littérature le données synthétique ont vocation à être distribué à des tiers.
Le but de cela peut être de contourner la législation sur les données personnelles~\cite{bellovin2019privacy}.
Des travaux précédent ont montrés que divulguer des données synthétiques au lieu des données réelles ne protège ni contre les attaque de ré-identification ni contre les attaques liant les données synthétiques aux données réelles\footnote{\textit{linkage}}~\cite{stadler2020synthetic}.


Bellocin et al.~\cite{bellovin2019privacy} étudient l'aspect légale du partage de données synthétiques crées à partir de données réelles.
Ils viennent à la conclusion qu'un tribunal n'autorisera pas ce partage à cause des nombreux case et des nombreuses recherches qui prouvent qu'il est possible d'apprendre des informations sur les données réelles à partir des données synthétiques.
Ils supposent aussi que l'utilisation de confidentialité différentielle peut rendre légale le partage mais en l'absence de jurisprudence rien n'est certain.
Dans cette optique, des travaux comme ceux de Ping et al.~\cite{ping2017datasynthesizer} cherche à impose la confidentialité différentielle lors de la création de données synthétiques.