1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
|
\begin{frame}
\frametitle{Etude des CCA}
\begin{definition}
Un CCA est un classifieur ayant une \emph{prédiction indépendante de l'étiquette}.
C'est-à-dire que pour un classifieur $f: E\rightarrow F$.
Avec une étiquette $Y:\Omega\rightarrow F$
et une entrée $X:\Omega\rightarrow E$.
Alors pour $\hat{Y}=f\circ X$, nous avons
\emph{$P_{(Y,\hat{Y})} = P_Y\otimes P_{\hat{Y}}$}
\end{definition}
\pause
\begin{lemma}
\label{lemme:aia-xycca}
Soit $(\Omega,\mathcal{T},P)$ un espace probabilisé.
Soient $X:(\Omega,\mathcal{T}) \rightarrow (E,\mathcal{E})$ et $Y:\Omega \rightarrow (F,\mathcal{F})$ des variables aléatoires.
Les deux propositions suivantes sont équivalentes :
\begin{enumerate}
\item $P_{(X,Y)} = P_X\otimes P_Y$.
\item Toute fonction mesurable $f:(E,\mathcal{T})\rightarrow (F,\mathcal{F})$ est un CCA pour prédire $Y$ à partir de $X$.
\end{enumerate}
\end{lemma}
\end{frame}
\begin{frame}
\frametitle{Etude des CCA}
\begin{propriete}
\label{prop:CCA_BA}
Les CCA ayant comme image $ F$ ont une exactitude équilibrée égale à $\frac{1}{\# F}$.
\end{propriete}
\pause
\begin{theorem}
\label{th:fini-bacca}
En notant $BA(f)$ l'exactitude équilibrée de $f$.
\begin{equation*}
\forall f~BA(f)=\frac{1}{\#F} \iff
\forall f~\text{$f$ est un CCA}
\end{equation*}
\end{theorem}
\end{frame}
\begin{frame}
\begin{definition}[DemParLvl]
Soit $(\Omega,\mathcal{T},P$) un espace probabilisé.
Soit $(E,\mathcal{E})$ un espace mesurable.
Soient
\begin{align*}
X:(\Omega,\mathcal{T})\rightarrow(E,\mathcal{E})\\
Y:(\Omega,\mathcal{T})\rightarrow(\{0,1\},\mathcal{P}(\{0,1\}))\\
S:(\Omega,\mathcal{T})\rightarrow(\{0,1\},\mathcal{P}(\{0,1\}))\\
\end{align*}
Soit $f:\{0,1\}\rightarrow\{0,1\}$.
Alors,
\begin{equation*}
DemParLvl(f) = |P(f\circ X=0\mid S=0) - P(f\circ X=0\mid S=1)|
\end{equation*}
\end{definition}
\pause
\begin{propriete}
\label{prop:aia-dpl0}
Un classifieur qui satisfait la parité démographique a un DemParLvl égal à zéro.
\end{propriete}
\end{frame}
\begin{frame}
\begin{definition}[Parité démographique généralisée]
\label{def:aia-dempargen}
Soit $(\Omega,\mathcal{T},P$) un espace probabilisé.
Soient $(E,\mathcal{E})$, $(F,\mathcal{F})$ et $(G,\mathcal{G})$ des espaces mesurables.
Soient les variables aléatoires suivantes :
\begin{itemize}
\item $X:(\Omega,\mathcal{T})\rightarrow (E,\mathcal{E})$
\item $Y:(\Omega,\mathcal{T})\rightarrow (F,\mathcal{F})$
\item $S:(\Omega,\mathcal{T})\rightarrow (G,\mathcal{G})$
\item $f:(E,\mathcal{E})\rightarrow (F,\mathcal{F})$
\end{itemize}
Alors $f$ satisfait la parité démographique généralisée si et seulement si
\begin{equation*}
P_{f\circ X,S} = P_{f\circ X}\otimes P_S
\end{equation*}
Dit autrement, si et seulement si le classifieur $f$ est un CCA pour prédire $S$ à partir de $X$.
\end{definition}
\end{frame}
\begin{frame}
\begin{propriete}
Si un classifieur binaire satisfait la parité démographique généralisée alors il satisfait la parité démographique.
\end{propriete}
\end{frame}
\begin{frame}
\begin{theorem}
\label{th:aia-dpgood}
Les deux propositions suivantes sont équivalentes :
\begin{enumerate}
\item Le modèle cible satisfait la parité démographique .
\item Toutes les attaques utilisant la prédiction pour inférer l'attribut sensible sont des CCA.
\end{enumerate}
Et aussi, les deux propositions suivantes sont équivalentes :
\begin{enumerate}
\item Le modèle cible satisfait la parité démographique généralisée.
\item Toutes les attaques utilisant le logit pour inférer l'attribut sensible sont des CCA.
\end{enumerate}
\end{theorem}
\end{frame}
\begin{frame}
\begin{propriete}
\label{prop:aia-demparlvl}
Soient $(\Omega,\mathcal{T},P)$ un espace probabilisé et $(\{0,1\}$, $\mathcal{P}(\{0,1\}))$ des espaces mesurables.
Soient les variables aléatoires suivantes
\begin{itemize}
\item L'étiquette $Y:(\Omega,\mathcal{T})\rightarrow (\{0,1\},\mathcal{P}(\{0,1\}))$
\item La donnée d'entrée $X:(\Omega,\mathcal{T})\rightarrow(\{0,1\},\mathcal{P}(\{0,1\})$
\item L'attribut sensible $S:(\Omega,\mathcal{T})\rightarrow(\{0,1\},\mathcal{P}(\{0,1\}))$
\item L'attaque $a:(\Omega,\mathcal{T})\rightarrow(\{0,1\},\mathcal{P}(\{0,1\}))$
\item Le modèle cible $f:(\Omega,\mathcal{T})\rightarrow(\{0,1\},\mathcal{P}(\{0,1\}))$
\end{itemize}
Alors nous avons
\begin{equation*}
\text{max}_{a}BA(a) = \frac{1}{2}(1+\text(DemParLvl(f)))
\end{equation*}
\end{propriete}
\end{frame}
\begin{frame}
\begin{theorem}
\label{th:aia-bluey}
Soit $(\Omega,\mathcal{T},P)$ un espace probabilisé.
Soient $(E,\mathcal{E})$ et $(F,\mathcal{P}(F))$ des espaces mesurables avec $F$ un ensemble fini.
Soient les variables aléatoires suivantes :
\begin{itemize}
\item $X:\Omega\rightarrow E$
\item $Y:\Omega\rightarrow F$
\end{itemize}
Soit $A$ l'ensemble des fonctions mesurables de $(E,\mathcal{E})$ dans $(F,\mathcal{P}(F))$.
Nous appelons $BA$ la fonction qui à toutes les fonctions $a$ de $A$ associe l'exactitude équilibrée de $a \circ X$ pour l'étiquette $Y$.
\begin{equation*}
\exists a\in A~BA(a)< \frac{1}{\#F}
\implies
\exists a\in A~BA(a)>\frac{1}{\#F}
\end{equation*}
\end{theorem}
\end{frame}
\begin{frame}
\begin{figure}
\centering
\input{tikz/data}
\label{fig:aia-data}
\end{figure}
\end{frame}
\begin{frame}
\frametitle{Experimental validation on prediction: results}
\begin{figure}
\captionsetup{singlelinecheck=off}
\centering
\begin{subfigure}{0.4\textwidth}
\centering
\scriptsize
\begin{itemize}
\item \emph{Labeled Faces in the Wild (images)}
\item ML = Convolutional Neural Network
\end{itemize}
\includegraphics[width=150px]{images/figures/advdebias/lfw/lfw_advdeb_attack_hard_sex.pdf}
\end{subfigure}
\hspace{0.1\textwidth}
\begin{subfigure}{0.4\textwidth}
\centering
\scriptsize
\begin{itemize}
\item \emph{COMPAS recidivism dataset (tabular)}
\item ML = Random Forest
\end{itemize}
\includegraphics[width=150px]{images/figures/advdebias/compas/compas_advdeb_attack_hard_sex.pdf}
\end{subfigure}
\end{figure}
\vspace{10px}
\scriptsize
\begin{tabular}{lll}
&\emph{Regularization}&\emph{Value}\\
\emph{Baseline}&None&Attack result\\
\emph{Theoretical}&Adversarial debiasing&$\frac{1}{2}(1+DemParLvl)$\\
\emph{Empirical}&Adversarial debiasing&Attack result\\
\end{tabular}
\normalsize
\hspace{10px}
Attack surface = $1_{[\tau,1]}\circ f\circ X$.
\end{frame}
\begin{frame}
\frametitle{Experimental validation on logit: results}
\begin{figure}
\captionsetup{singlelinecheck=off}
\centering
\begin{subfigure}{0.4\textwidth}
\centering
\scriptsize
\begin{itemize}
\item \emph{Labeled Faces in the Wild (images)}
\item ML = Convolutional Neural Network
\end{itemize}
\includegraphics[width=150px]{images/figures/advdebias/lfw/lfw_advdeb_attack_soft_experimental_sex.pdf}
\end{subfigure}
\hspace{0.1\textwidth}
\begin{subfigure}{0.4\textwidth}
\centering
\scriptsize
\begin{itemize}
\item \emph{COMPAS recidivism dataset (tabular)}
\item ML = Random Forest
\end{itemize}
\includegraphics[width=150px]{images/figures/advdebias/compas/compas_advdeb_attack_soft_experimental_sex.pdf}
\end{subfigure}
\end{figure}
\vspace{10px}
\scriptsize
\begin{tabular}{lll}
&\emph{Regularization}&\emph{Value}\\
\emph{Baseline}&None&Attack result\\
\emph{AdvDebias}&Adversarial debiasing&Attack result\\
\end{tabular}
\normalsize
\hspace{10px}
Attack surface = $f\circ X$.
\end{frame}
|