summaryrefslogtreecommitdiff
path: root/aia/resultats.tex
blob: 12483d8b32d0e044f5f78935338effc6a0934d53 (plain)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
\FloatBarrier
\begin{figure}
    \centering
    \begin{subfigure}{0.24\linewidth}
        \includegraphics[width=\linewidth]{ACSAC/figures/egd/census/census_egd_attack_hard_race.pdf}
        \caption{Census (race)}
    \end{subfigure}
    \begin{subfigure}{0.24\linewidth}
        \includegraphics[width=\linewidth]{ACSAC/figures/egd/census/census_egd_attack_hard_sex.pdf}
        \caption{Census (sex)}
    \end{subfigure}
    \begin{subfigure}{0.24\linewidth}
       \includegraphics[width=\linewidth]{ACSAC/figures/egd/compas/compas_egd_attack_hard_race.pdf}
        \caption{Compas (race)}
    \end{subfigure}
    \begin{subfigure}{0.24\linewidth}
        \includegraphics[width=\linewidth]{ACSAC/figures/egd/compas/compas_egd_attack_hard_sex.pdf}
        \caption{Compas (sex)}
    \end{subfigure}
\centering
    \begin{subfigure}{0.24\linewidth}
        \includegraphics[width=\linewidth]{ACSAC/figures/egd/meps/meps_egd_attack_hard_race.pdf}
        \caption{Meps (race)}
    \end{subfigure}
    \begin{subfigure}{0.24\linewidth}
        \includegraphics[width=\linewidth]{ACSAC/figures/egd/meps/meps_egd_attack_hard_sex.pdf}
        \caption{Meps (sex)}
    \end{subfigure}
    \begin{subfigure}{0.24\linewidth}
        \includegraphics[width=\linewidth]{ACSAC/figures/egd/lfw/lfw_egd_attack_hard_race.pdf}
        \caption{LFW (race)}
        \label{subfig:aia-theodifexp}
    \end{subfigure}
    \begin{subfigure}{0.24\linewidth}
        \includegraphics[width=\linewidth]{ACSAC/figures/egd/lfw/lfw_egd_attack_hard_sex.pdf}
        \caption{LFW (sex)}
    \end{subfigure}

    \caption{Impact de la réduction pour une classification équitable sur le succès de \AIAHard.
    \\\textit{Baseline} = sans réduction.
    \\\textit{Theoretical} = $\frac{1}{2}(1+DemParLvl)$ avec réduction.
    \\\textit{Empirical} = avec réduction.
    }
    \label{fig:aiaegd}
\end{figure}



\begin{figure}[!htb]
   \centering
   \footnotesize
    \begin{subfigure}{0.24\linewidth}
        \includegraphics[width=\linewidth]{ACSAC/figures/advdebias/census/census_advdeb_attack_soft_experimental_race.pdf}
        \caption{Census (race)}
    \end{subfigure}
    \begin{subfigure}{0.24\linewidth}
        \includegraphics[width=\linewidth]{ACSAC/figures/advdebias/census/census_advdeb_attack_soft_experimental_sex.pdf}
        \caption{Census (sex)}
    \end{subfigure}
    \begin{subfigure}{0.24\linewidth}
        \includegraphics[width=\linewidth]{ACSAC/figures/advdebias/compas/compas_advdeb_attack_soft_experimental_race.pdf}
        \caption{Compas (race)}
    \end{subfigure}
    \begin{subfigure}{0.24\linewidth}
        \includegraphics[width=\linewidth]{ACSAC/figures/advdebias/compas/compas_advdeb_attack_soft_experimental_sex.pdf}
        \caption{Compas (sex)}
    \end{subfigure}
    \begin{subfigure}{0.24\linewidth}
        \includegraphics[width=\linewidth]{ACSAC/figures/advdebias/meps/meps_advdeb_attack_soft_experimental_race.pdf}
        \caption{Meps (race)}
    \end{subfigure}
    \begin{subfigure}{0.24\linewidth}
        \includegraphics[width=\linewidth]{ACSAC/figures/advdebias/meps/meps_advdeb_attack_soft_experimental_sex.pdf}
        \caption{Meps (sex)}
    \end{subfigure}
    \begin{subfigure}{0.24\linewidth}
        \includegraphics[width=\linewidth]{ACSAC/figures/advdebias/lfw/lfw_advdeb_attack_soft_experimental_race.pdf}
        \caption{LFW (race)}
    \end{subfigure}
    \begin{subfigure}{0.24\linewidth}
        \includegraphics[width=\linewidth]{ACSAC/figures/advdebias/lfw/lfw_advdeb_attack_soft_experimental_sex.pdf}
        \caption{LFW (sex)}
        \label{subfig:aia-softlfwsex}
    \end{subfigure}

    \caption{Impact du rééquilibrage adverse sur le succès de \AIASoft. 
    \\\textit{baseline} = sans rééquilibrage adverse.
    \\\textit{AdvDebias} = avec rééquilibrage adverse.}
   \label{fig:aiadeb}
\end{figure}

\begin{figure}
    \begin{subfigure}{0.24\linewidth}
        \includegraphics[width=\linewidth]{ACSAC/figures/advdebias/census/census_advdeb_attack_hard_race.pdf}
        \caption{Census (race)}
    \end{subfigure}
    \begin{subfigure}{0.24\linewidth}
        \includegraphics[width=\linewidth]{ACSAC/figures/advdebias/census/census_advdeb_attack_hard_sex.pdf}
        \caption{Census (sex)}
    \end{subfigure}
    \begin{subfigure}{0.24\linewidth}
        \includegraphics[width=\linewidth]{ACSAC/figures/advdebias/compas/compas_advdeb_attack_hard_race.pdf}
        \caption{Compas (race)}
    \end{subfigure}
    \begin{subfigure}{0.24\linewidth}
        \includegraphics[width=\linewidth]{ACSAC/figures/advdebias/compas/compas_advdeb_attack_hard_sex.pdf}
        \caption{Compas (sex)}
    \end{subfigure}
    \begin{subfigure}{0.24\linewidth}
        \includegraphics[width=\linewidth]{ACSAC/figures/advdebias/meps/meps_advdeb_attack_hard_race.pdf}
        \caption{Meps (race)}
    \end{subfigure}
    \begin{subfigure}{0.24\linewidth}
        \includegraphics[width=\linewidth]{ACSAC/figures/advdebias/meps/meps_advdeb_attack_hard_sex.pdf}
        \caption{Meps (sex)}
    \end{subfigure}
    \begin{subfigure}{0.24\linewidth}
        \includegraphics[width=\linewidth]{ACSAC/figures/advdebias/lfw/lfw_advdeb_attack_hard_race.pdf}
        \caption{LFW (race)}
    \end{subfigure}
    \begin{subfigure}{0.24\linewidth}
        \includegraphics[width=\linewidth]{ACSAC/figures/advdebias/lfw/lfw_advdeb_attack_hard_sex.pdf}
        \caption{LFW (sex)}
    \end{subfigure}
    \caption{Impact du rééquilibrage adverse sur le succès de \AIAHard.
    \\\textit{baseline} = succès de l'attaque sans rééquilibrage adverse.
    \\\textit{Empirical} = succès de l'attaque avec rééquilibrage adverse.
    \\\textit{Theoretical} = $\frac{1}{2}(1+DemParLvl)$ avec rééquilibrage adverse}
    \label{fig:aia-adv-hard}
\end{figure}

\begin{figure}[!htb]
    \centering
    \begin{subfigure}{0.24\linewidth}
    \centering
        \includegraphics[width=\linewidth]{ACSAC/figures/egd/census/census_egd_utility.pdf}
        \caption{CENSUS}
    \end{subfigure}
    \begin{subfigure}{0.24\linewidth}
    \centering
        \includegraphics[width=\linewidth]{ACSAC/figures/egd/compas/compas_egd_utility.pdf}
        \caption{COMPAS}
    \end{subfigure}
    \begin{subfigure}{0.24\linewidth}
    \centering
        \includegraphics[width=\linewidth]{ACSAC/figures/egd/meps/meps_egd_utility.pdf}
        \caption{MEPS}
    \end{subfigure}
    \begin{subfigure}{0.24\linewidth}
    \centering
        \includegraphics[width=\linewidth]{ACSAC/figures/egd/lfw/lfw_egd_utility.pdf}
        \caption{LFW}
        \label{fig:utilityegd-lfw}
    \end{subfigure}
    \caption{Impact de l'utilisation de la réduction pour une classification équitable sur l'utilité.
    \\\textit{Baseline} = sans réduction.
    \\\textit{EGD+DemPar} = avec réduction.
    }
    \label{fig:utilityegd}
\end{figure}


\begin{figure}[!htb]
    \centering
    \begin{subfigure}{0.24\linewidth}
    \centering
        \includegraphics[width=\linewidth]{ACSAC/figures/advdebias/census/census_advdeb_utility.pdf}
        \caption{CENSUS}
    \end{subfigure}
    \begin{subfigure}{0.24\linewidth}
    \centering
        \includegraphics[width=\linewidth]{ACSAC/figures/advdebias/compas/compas_advdeb_utility.pdf}
        \caption{COMPAS}
    \end{subfigure}
    \begin{subfigure}{0.24\linewidth}
    \centering
        \includegraphics[width=\linewidth]{ACSAC/figures/advdebias/meps/meps_advdeb_utility.pdf}
        \caption{MEPS}
    \end{subfigure}
    \begin{subfigure}{0.24\linewidth}
    \centering
        \includegraphics[width=\linewidth]{ACSAC/figures/advdebias/lfw/lfw_advdeb_utility.pdf}
        \caption{LFW}
        \label{fig:utilityadv-lfw}
    \end{subfigure}
    \caption{Impact de l'utilisation du rééquilibrage adverse sur l'utilité.
    \\\textit{baseline} = sans rééquilibrage adverse.
    \\\textit{AdvDebias} = avec rééquilibrage adverse.
    }
    \label{fig:utilityadv}
\end{figure}
Nous montrons dans cette section les résultats expérimentaux.
Dans un premiers temps nous proposons une analyse globale des résultats, dans un second temps nous décrivons chaque figure en rentrant plus dans les détails.

\subsubsection{Synthèse des résultats}
Nous observons sur les Figures~\ref{fig:aiaegd},~\ref{fig:aia-adv-hard} et~\ref{fig:aiadeb} que les méthodes pour imposer l'équité ont bien réduit les succès des attaques, que ce soit en classification ou en régression.
De plus, nous voyons sur les Figures~\ref{fig:aiaegd} et~\ref{fig:aia-adv-hard} que le succès maximal de l'attaque vaut bien $\frac{1}{2}(1+DemParLvl)$ comme nous l'avons montré à la Propriété~\ref{prop:aia-demparlvl}.
Enfin, nous mettons en perspective ce résultat avec la dégradation d'utilité qu'entraîne l'utilisation de ces méthodes sur les Figures~\ref{fig:utilityegd} et~\ref{fig:utilityadv}.
Les deux méthodes semblent protéger de manière similaire les attributs sensibles pour \AIAHard~cependant, la méthode adverse est la seule pouvant mitiger \AIASoft.
En contrepartie, la réduction pour une classification équitable semble moins dégrader l'utilité comme nous pouvons le voir en comparant les Figures~\ref{fig:utilityegd-lfw} et~\ref{fig:utilityadv-lfw}.

En conclusion, nous recommandons d'utiliser le rééquilibrage adverse quand il y a un risque que le logit soit partagé ou quand la tâche principale est une régression.
Si ce n'est pas le cas, par exemple si le modèle est utilisé localement et que seule la prédiction est partagée, nous recommandons d'utiliser la réduction pour une classification équitable.

\subsubsection{Analyse détaillée des résultats}
La Figure~\ref{fig:aiaegd} présente l'exactitude équilibrée de~\AIAHard~avec et sans utilisation de la méthode de réduction pour une classification équitable.
Comme nous utilisons \AIAHard~sur cette figure nous avons la garantie que le résultat de l'attaque correspond à la maximisation de l'exactitude équilibrée sur les données d'entraînement de l'attaque.
Cependant, il peut arriver des cas extrêmes où l'attribut sensible est presque indépendant de la sortie du modèle cible.
Cela signifie que le nombre d'individus ayant l'attribut sensible 0 dans la classe 0 vas être presque égale au nombre d'individus ayant l'attribut sensible 0 dans la classe 1.
Ainsi en séparant les jeux de donnée en entraînement (A) et évaluation (B), il est possible que la tendance soit opposé dans A et B.
Par exemple : dans A il y a plus d'individus ayant un attribut sensible 0 dans la classe 0 que dans la classe 1 alors que dans B il y a plus d'individus ayant un attribut sensible 0 dans la classe 1 que dans la classe 0.
Dans ce cas une attaque entraîné sur A et évalué sur B aura une exactitude équilibrée inférieur à 0,5 comme nous pouvons l'observer sur la Figure~\ref{fig:aiaegd} pour COMPAS, MEPS et LFW.
Nous observons aussi ce phénomène sur la Figure~\ref{fig:aia-adv-hard}.
Ces cas sont fréquents pour les boîtes à moustache dénotées \textquote{\textit{Empirical}} car elles ont été obtenu en attaquant un modèle cible entraîné avec un mécanisme qui cherche à impose la parité démographique, soit justement l'indépendance de la sortie et de l'attribut sensible.

Les boîtes à moustaches dénotées \textit{\textquote{Theoretical}} sont obtenus sur les données d'évaluation en calculant $\frac{1}{2}(1+DemParLvl)$.
Elles permettent de vérifier expérimentalement la Propriété~\ref{prop:aia-demparlvl} qui assure que l'exactitude équilibrée de~\AIAHard~doit être égale à $\frac{1}{2}(1+DemParLvl)$.
On remarque que c'est vrai sauf dans le cas indiqué plus haut où~\AIAHard~se trompe à cause de la presque indépendance entre attribut sensible et sortie du modèle cible et donne une exactitude équilibrée inférieur à 0,5.
Dans ce cas le résultat théorique vaut $1-\text{le résultat expérimentale}$.
Cela explique la différence observé sur certaines figures, comme par exemple à la Sous-figure~\ref{subfig:aia-theodifexp}.

Nous observons sur l'ensemble des figures présentant des résultats d'attaques que l'écart inter-quartile peut atteindre 10 points d'exactitude équilibrée ce qui indique que le résultat de l'attaque est dépendant de la séparation en entraînement et évaluation.
Cela peut venir du fait que les jeux de données sont déséquilibré ce qui augmente la probabilité de générer des sous ensembles qui ne contiennent pas assez de données pour chaque classe. 

Sur l'ensemble des expériences, l'inférence du genre sur le jeu de données LFW est la plus sensible car elle atteint une médiane de 0.8 d'exactitude équilibrée sans utilisation de mécanisme de protection.
Pour mettre cela en perspectives, les autres attaques sans utilisation de mécanisme atteignent un médiane moyenne de 0.59 d'exactitude équilibrée.
Cela met en avant le risque que représente l'AIA et l'intérêt de mitiger ces attaques.
Concernant la protection, nous observons que les mécanismes imposant l'équité ne permettent pas dans tous les cas de réduire le risque comme par exemple avec la Sous-figure~\ref{subfig:aia-theodifexp}.
Sur cette figure nous observons que la boîte à moustache \textquote{\textit{Baseline}} est presque au même niveau que les deux autres avec un médiane passant de 0.6 à 0.58.
Cela indique que le mécanisme n'a pas empêché~\AIAHard~d'inférer l'attribut sensible et que le DemParLvl est presque le même avant et après utilisation du mécanisme.
Comme le DemParLvl n'a pas beaucoup diminué, le mécanisme n'a pas rempli le rôle pour lequel il a été crée : imposer la parité démographique et atteindre un DemParLvl égale à 0,5.
En contre partie, quand le mécanisme arrive à imposer la parité démographique nous observons que l'exactitude équilibrée de l'attaque est diminué comme sur la Sous-figure~\ref{subfig:aia-softlfwsex}.
Sur cette figure la médiane de l'exactitude équilibrée de l'attaque passe de 0.8 à 0.5.
C'est-à-dire que le risque pour l'attribut sensible passe de très marqué à inexistant.

\FloatBarrier