\begin{frame} \frametitle{Etude des CCA} \begin{definition} Un CCA est un classifieur ayant une \emph{prédiction indépendante de l'étiquette}. C'est-à-dire que pour un classifieur $f: E\rightarrow F$. Avec une étiquette $Y:\Omega\rightarrow F$ et une entrée $X:\Omega\rightarrow E$. Alors pour $\hat{Y}=f\circ X$, nous avons \emph{$P_{(Y,\hat{Y})} = P_Y\otimes P_{\hat{Y}}$} \end{definition} \pause \begin{lemma} \label{lemme:aia-xycca} Soit $(\Omega,\mathcal{T},P)$ un espace probabilisé. Soient $X:(\Omega,\mathcal{T}) \rightarrow (E,\mathcal{E})$ et $Y:\Omega \rightarrow (F,\mathcal{F})$ des variables aléatoires. Les deux propositions suivantes sont équivalentes : \begin{enumerate} \item $P_{(X,Y)} = P_X\otimes P_Y$. \item Toute fonction mesurable $f:(E,\mathcal{T})\rightarrow (F,\mathcal{F})$ est un CCA pour prédire $Y$ à partir de $X$. \end{enumerate} \end{lemma} \end{frame} \begin{frame} \frametitle{Etude des CCA} \begin{propriete} \label{prop:CCA_BA} Les CCA ayant comme image $ F$ ont une exactitude équilibrée égale à $\frac{1}{\# F}$. \end{propriete} \pause \begin{theorem} \label{th:fini-bacca} En notant $BA(f)$ l'exactitude équilibrée de $f$. \begin{equation*} \forall f~BA(f)=\frac{1}{\#F} \iff \forall f~\text{$f$ est un CCA} \end{equation*} \end{theorem} \end{frame} \begin{frame} \begin{definition}[DemParLvl] Soit $(\Omega,\mathcal{T},P$) un espace probabilisé. Soit $(E,\mathcal{E})$ un espace mesurable. Soient \begin{align*} X:(\Omega,\mathcal{T})\rightarrow(E,\mathcal{E})\\ Y:(\Omega,\mathcal{T})\rightarrow(\{0,1\},\mathcal{P}(\{0,1\}))\\ S:(\Omega,\mathcal{T})\rightarrow(\{0,1\},\mathcal{P}(\{0,1\}))\\ \end{align*} Soit $f:\{0,1\}\rightarrow\{0,1\}$. Alors, \begin{equation*} DemParLvl(f) = |P(f\circ X=0\mid S=0) - P(f\circ X=0\mid S=1)| \end{equation*} \end{definition} \pause \begin{propriete} \label{prop:aia-dpl0} Un classifieur qui satisfait la parité démographique a un DemParLvl égal à zéro. \end{propriete} \end{frame} \begin{frame} \begin{definition}[Parité démographique généralisée] \label{def:aia-dempargen} Soit $(\Omega,\mathcal{T},P$) un espace probabilisé. Soient $(E,\mathcal{E})$, $(F,\mathcal{F})$ et $(G,\mathcal{G})$ des espaces mesurables. Soient les variables aléatoires suivantes : \begin{itemize} \item $X:(\Omega,\mathcal{T})\rightarrow (E,\mathcal{E})$ \item $Y:(\Omega,\mathcal{T})\rightarrow (F,\mathcal{F})$ \item $S:(\Omega,\mathcal{T})\rightarrow (G,\mathcal{G})$ \item $f:(E,\mathcal{E})\rightarrow (F,\mathcal{F})$ \end{itemize} Alors $f$ satisfait la parité démographique généralisée si et seulement si \begin{equation*} P_{f\circ X,S} = P_{f\circ X}\otimes P_S \end{equation*} Dit autrement, si et seulement si le classifieur $f$ est un CCA pour prédire $S$ à partir de $X$. \end{definition} \end{frame} \begin{frame} \begin{propriete} Si un classifieur binaire satisfait la parité démographique généralisée alors il satisfait la parité démographique. \end{propriete} \end{frame} \begin{frame} \begin{theorem} \label{th:aia-dpgood} Les deux propositions suivantes sont équivalentes : \begin{enumerate} \item Le modèle cible satisfait la parité démographique . \item Toutes les attaques utilisant la prédiction pour inférer l'attribut sensible sont des CCA. \end{enumerate} Et aussi, les deux propositions suivantes sont équivalentes : \begin{enumerate} \item Le modèle cible satisfait la parité démographique généralisée. \item Toutes les attaques utilisant le logit pour inférer l'attribut sensible sont des CCA. \end{enumerate} \end{theorem} \end{frame} \begin{frame} \begin{propriete} \label{prop:aia-demparlvl} Soient $(\Omega,\mathcal{T},P)$ un espace probabilisé et $(\{0,1\}$, $\mathcal{P}(\{0,1\}))$ des espaces mesurables. Soient les variables aléatoires suivantes \begin{itemize} \item L'étiquette $Y:(\Omega,\mathcal{T})\rightarrow (\{0,1\},\mathcal{P}(\{0,1\}))$ \item La donnée d'entrée $X:(\Omega,\mathcal{T})\rightarrow(\{0,1\},\mathcal{P}(\{0,1\})$ \item L'attribut sensible $S:(\Omega,\mathcal{T})\rightarrow(\{0,1\},\mathcal{P}(\{0,1\}))$ \item L'attaque $a:(\Omega,\mathcal{T})\rightarrow(\{0,1\},\mathcal{P}(\{0,1\}))$ \item Le modèle cible $f:(\Omega,\mathcal{T})\rightarrow(\{0,1\},\mathcal{P}(\{0,1\}))$ \end{itemize} Alors nous avons \begin{equation*} \text{max}_{a}BA(a) = \frac{1}{2}(1+\text(DemParLvl(f))) \end{equation*} \end{propriete} \end{frame} \begin{frame} \begin{theorem} \label{th:aia-bluey} Soit $(\Omega,\mathcal{T},P)$ un espace probabilisé. Soient $(E,\mathcal{E})$ et $(F,\mathcal{P}(F))$ des espaces mesurables avec $F$ un ensemble fini. Soient les variables aléatoires suivantes : \begin{itemize} \item $X:\Omega\rightarrow E$ \item $Y:\Omega\rightarrow F$ \end{itemize} Soit $A$ l'ensemble des fonctions mesurables de $(E,\mathcal{E})$ dans $(F,\mathcal{P}(F))$. Nous appelons $BA$ la fonction qui à toutes les fonctions $a$ de $A$ associe l'exactitude équilibrée de $a \circ X$ pour l'étiquette $Y$. \begin{equation*} \exists a\in A~BA(a)< \frac{1}{\#F} \implies \exists a\in A~BA(a)>\frac{1}{\#F} \end{equation*} \end{theorem} \end{frame} \begin{frame} \begin{figure} \centering \input{tikz/data} \label{fig:aia-data} \end{figure} \end{frame} \begin{frame} \frametitle{Experimental validation on prediction: results} \begin{figure} \captionsetup{singlelinecheck=off} \centering \begin{subfigure}{0.4\textwidth} \centering \scriptsize \begin{itemize} \item \emph{Labeled Faces in the Wild (images)} \item ML = Convolutional Neural Network \end{itemize} \includegraphics[width=150px]{images/figures/advdebias/lfw/lfw_advdeb_attack_hard_sex.pdf} \end{subfigure} \hspace{0.1\textwidth} \begin{subfigure}{0.4\textwidth} \centering \scriptsize \begin{itemize} \item \emph{COMPAS recidivism dataset (tabular)} \item ML = Random Forest \end{itemize} \includegraphics[width=150px]{images/figures/advdebias/compas/compas_advdeb_attack_hard_sex.pdf} \end{subfigure} \end{figure} \vspace{10px} \scriptsize \begin{tabular}{lll} &\emph{Regularization}&\emph{Value}\\ \emph{Baseline}&None&Attack result\\ \emph{Theoretical}&Adversarial debiasing&$\frac{1}{2}(1+DemParLvl)$\\ \emph{Empirical}&Adversarial debiasing&Attack result\\ \end{tabular} \normalsize \hspace{10px} Attack surface = $1_{[\tau,1]}\circ f\circ X$. \end{frame} \begin{frame} \frametitle{Experimental validation on logit: results} \begin{figure} \captionsetup{singlelinecheck=off} \centering \begin{subfigure}{0.4\textwidth} \centering \scriptsize \begin{itemize} \item \emph{Labeled Faces in the Wild (images)} \item ML = Convolutional Neural Network \end{itemize} \includegraphics[width=150px]{images/figures/advdebias/lfw/lfw_advdeb_attack_soft_experimental_sex.pdf} \end{subfigure} \hspace{0.1\textwidth} \begin{subfigure}{0.4\textwidth} \centering \scriptsize \begin{itemize} \item \emph{COMPAS recidivism dataset (tabular)} \item ML = Random Forest \end{itemize} \includegraphics[width=150px]{images/figures/advdebias/compas/compas_advdeb_attack_soft_experimental_sex.pdf} \end{subfigure} \end{figure} \vspace{10px} \scriptsize \begin{tabular}{lll} &\emph{Regularization}&\emph{Value}\\ \emph{Baseline}&None&Attack result\\ \emph{AdvDebias}&Adversarial debiasing&Attack result\\ \end{tabular} \normalsize \hspace{10px} Attack surface = $f\circ X$. \end{frame}