blob: 96fe89251e42ed556fd9b1e94d532cdc7750c97b (
plain)
1
2
3
4
5
6
7
8
9
|
Dans la littérature, les données synthétiques ont vocation à être distribuées à des tiers.
Le but de cela peut être de contourner la législation sur les données personnelles~\cite{bellovin2019privacy}.
Des travaux précédents ont montré que divulguer des données synthétiques au lieu de données réelles ne protège ni contre les attaques de ré-identification, ni contre les attaques liant les données synthétiques aux données réelles\footnote{\textit{linkage}}~\cite{stadler2022synthetic}.
Bellocin et al.~\cite{bellovin2019privacy} étudient l'aspect légal du partage de données synthétiques créées à partir de données réelles.
Ils viennent à la conclusion qu'un tribunal n'autorisera pas ce partage à cause des nombreux cas et des nombreuses recherches qui prouvent qu'il est possible d'apprendre des informations sur les données réelles à partir des données synthétiques.
Ils supposent aussi que l'utilisation de confidentialité différentielle peut rendre légal le partage, mais en l'absence de jurisprudence, rien n'est certain.
Dans cette optique, des travaux comme ceux de Ping et al.~\cite{ping2017datasynthesizer} cherchent à imposer la confidentialité différentielle lors de la création de données synthétiques.
|