summaryrefslogtreecommitdiff
path: root/aia/theo.tex
diff options
context:
space:
mode:
Diffstat (limited to 'aia/theo.tex')
-rw-r--r--aia/theo.tex89
1 files changed, 89 insertions, 0 deletions
diff --git a/aia/theo.tex b/aia/theo.tex
new file mode 100644
index 0000000..2a826b1
--- /dev/null
+++ b/aia/theo.tex
@@ -0,0 +1,89 @@
+\subsection{Utiliser l'équitée pour mitiger les AIA}
+Commencons par présenter le résultat le plus générale, qui fonctionne aussi bien pour des modèle de classification que pour des regression.
+Ce résultats est aussi indépendant du type d'attribut binaire, quantitatif au qualitatif.
+
+\begin{theorem}
+ \label{th:aia-dpgood}
+ Les deux propositions suivantes sont équivalantes :
+ \begin{enumerate}
+ \item Le modèle cible satisfait la démographic parity
+ \item Toutes les attaques utilisant la prédiction pour inférer l'attribut sensible sont des CCA.
+ \end{enumerate}
+
+ Et aussi, les deux propositions suivantes sont équivalantes :
+ \begin{enumerate}
+ \item Le modèle cible satisfait la démographic parity généraliée
+ \item Toutes les attaques utilisants le logit pour inférer l'attribut sensible sont des CCA.
+ \end{enumerate}
+\end{theorem}
+
+\begin{proof}
+ Par définition, la \textit{demographic parity} (respectivement généralisée) est equivalante à l'inpépendance entre l'attribut sensible et la prediction (respectivement le logit).
+ Ainsi, d'après le Lemme~\ref{lemme:aia-xycca} dire que tout classifieur de l'attribute sensible utilisant la prédiction (respectivement le logit) est un CCA est équivalant à dire que le modèle cible respecte la \textit{demographic parity} (respectivement généralisée).
+\end{proof}
+
+Ce résultat nous apprend que s'assurer que le modèle cible satisfait la \textit{demographic parity} permet de s'assurer que les attribut sensible des utilisateur soient protégé lors de l'utilisation du modèle.
+Dans le cas d'un modèle cible qui réalise une classifiction binaire et en considérant un attribut binaire nous avons une propriété plus précise.
+
+\begin{propriete}
+ Soit $(\Omega,\mathcal{T},P)$ un espace probabilisé et $(\{0,1\}$, $\mathcal{P}(\{0,1\}))$ des espaces mesurables.
+ Soit les variables aléatoires suivantes
+ \begin{itemize}
+ \item L'étiquette $Y:(\Omega,\mathcal{T})\rightarrow (\{0,1\},\mathcal{P}(\{0,1\})$
+ \item La donnée d'entrée $X:(\Omega,\mathcal{T})\rightarrow (F,\mathcal{F})$
+ \item L'attribute sensible $S:(\Omega,\mathcal{T})\rightarrow(\{0,1\},\mathcal{P}(\{0,1\}))$
+ \item L'attaque $a:(\Omega,\mathcal{T})\rightarrow\mathcal{P}(\{0,1\}))$
+ \item Le modèle cible $f:(\Omega,\mathcal{T})\rightarrow\mathcal{P}(\{0,1\}))$
+ \end{itemize}
+ Alors nous avons
+ \begin{equation*}
+ \text{max}_{a}BA(a) = \frac{1}{2}(1+\text(DemParLvl(f)))
+ \end{equation*}
+\end{propriete}
+
+\begin{proof}
+ On pause $\hat{Y}=f\circ X$.
+ L'ensemble $A$ des fonction de $\{0,1\}$ vers $\{0,1\}$ contient quatre éléments :
+$a_0=0$, $a_1=id$, $a_2=1-id$ et $a,3=1$.
+ Pour chaque attaque $a\in A$ la \textit{balanced accuracy} de $a$ est
+$BA(a) = \frac{1}{2}(P(a\circ \hat{Y}=0|S=0) + P(a\circ \hat{Y}=1|S=1))$.
+Nous avons $BA(b_0) = BA(b_3) = \frac{1}{2}$ il n'est donc pas nécessaire de considérer ces éléments pour résoudre le problème d'optimisation.
+Ce problème s'écrit $\text{max}_{a\in A}BA(a)) = \text{max}(BA(a_1), BA(a_2))$.
+Nous remarquon que $a_1\circ \hat{Y}=\hat{Y}$ et $a_2\circ \hat{Y}=1 - \hat{Y}$.
+Ainsi,
+{
+\begin{align*}
+ BA(a_1) &= \frac{1}{2}(P(\hat{Y}=0|S=0) + P(\hat{Y}=1|S=1))\\
+ &=\frac{1}{2}(1+P(\hat{Y}=1|S=1) - P(\hat{Y}=1|S=0))
+\end{align*}
+}
+et
+{
+\begin{align*}
+ BA(a_2)=\frac{1}{2}(1+P(\hat{Y}=1|S=0) - P(\hat{Y}=1|S=1))
+\end{align*}
+}
+Donc,
+{
+\begin{align*}
+ &\text{max}_{a\in B}BA(a) \\
+ = &\frac{1}{2}\left(1+\text{max}\left(
+ \begin{matrix}
+ P(\hat{Y}=0|S=0) -P(\hat{Y}=1|S=1)\\
+ P(\hat{Y}=1|S=0) -P(\hat{Y}=0|S=1)
+ \end{matrix}
+ \right)\right)\\
+ =&\frac{1}{2}(1+|P(\hat{Y}=1|S=1) - P(\hat{Y}=1|S=0)|)
+\end{align*}
+}
+\end{proof}
+
+Ainsi pour le classifieur binaire avec attribut sensbile binaire, il est suffisant de calculer le DemParLvl du modèle cible pour connaitre le maximum de \textit{balanced accuracy} ateignable par n'importe quelle attaque.
+De plus, nous voyons que la \textit{balanced accuracy} maximial d'attaque vaut ${1}{2}$ si et seulement si $\text{DemParLvl}=0$.
+C'est à dire que $f$ satisfait DemPar est équivalant à dire que tout attaque à une \textit{balanced accuracy} égale à $\frac{1}{2}$.
+
+Grâce au Théorème~\ref{th:aia-dpgood} nous savons aussi que tout autre définition d'équtiée qui n'implique pas la paritée démographique ne permet pas de mitiger les AIA.
+Par exemple, nous allons montrer que l'égalitée de chances de la Définition~\ref{def:background-eq-eoo} en permet pas de mitiger l'AIA dans le cas binaire que nous avons étuié précédement.
+
+\subsection{Utiliser l'AIA pour contrôler le niveau d'équitée}.
+