diff options
author | Jan Aalmoes <jan.aalmoes@inria.fr> | 2024-09-13 00:07:42 +0200 |
---|---|---|
committer | Jan Aalmoes <jan.aalmoes@inria.fr> | 2024-09-13 00:07:42 +0200 |
commit | faa07a8f3337c5d191597ea9b9587cc0969d663c (patch) | |
tree | a46440db847ce447917abecb7971d90db4a1f150 /aia/theo.tex | |
parent | 7fc151d6a198d13dc9e1374522ec396d72905d3f (diff) |
avnacé aia, remerciement notations, notes
Diffstat (limited to 'aia/theo.tex')
-rw-r--r-- | aia/theo.tex | 89 |
1 files changed, 89 insertions, 0 deletions
diff --git a/aia/theo.tex b/aia/theo.tex new file mode 100644 index 0000000..2a826b1 --- /dev/null +++ b/aia/theo.tex @@ -0,0 +1,89 @@ +\subsection{Utiliser l'équitée pour mitiger les AIA} +Commencons par présenter le résultat le plus générale, qui fonctionne aussi bien pour des modèle de classification que pour des regression. +Ce résultats est aussi indépendant du type d'attribut binaire, quantitatif au qualitatif. + +\begin{theorem} + \label{th:aia-dpgood} + Les deux propositions suivantes sont équivalantes : + \begin{enumerate} + \item Le modèle cible satisfait la démographic parity + \item Toutes les attaques utilisant la prédiction pour inférer l'attribut sensible sont des CCA. + \end{enumerate} + + Et aussi, les deux propositions suivantes sont équivalantes : + \begin{enumerate} + \item Le modèle cible satisfait la démographic parity généraliée + \item Toutes les attaques utilisants le logit pour inférer l'attribut sensible sont des CCA. + \end{enumerate} +\end{theorem} + +\begin{proof} + Par définition, la \textit{demographic parity} (respectivement généralisée) est equivalante à l'inpépendance entre l'attribut sensible et la prediction (respectivement le logit). + Ainsi, d'après le Lemme~\ref{lemme:aia-xycca} dire que tout classifieur de l'attribute sensible utilisant la prédiction (respectivement le logit) est un CCA est équivalant à dire que le modèle cible respecte la \textit{demographic parity} (respectivement généralisée). +\end{proof} + +Ce résultat nous apprend que s'assurer que le modèle cible satisfait la \textit{demographic parity} permet de s'assurer que les attribut sensible des utilisateur soient protégé lors de l'utilisation du modèle. +Dans le cas d'un modèle cible qui réalise une classifiction binaire et en considérant un attribut binaire nous avons une propriété plus précise. + +\begin{propriete} + Soit $(\Omega,\mathcal{T},P)$ un espace probabilisé et $(\{0,1\}$, $\mathcal{P}(\{0,1\}))$ des espaces mesurables. + Soit les variables aléatoires suivantes + \begin{itemize} + \item L'étiquette $Y:(\Omega,\mathcal{T})\rightarrow (\{0,1\},\mathcal{P}(\{0,1\})$ + \item La donnée d'entrée $X:(\Omega,\mathcal{T})\rightarrow (F,\mathcal{F})$ + \item L'attribute sensible $S:(\Omega,\mathcal{T})\rightarrow(\{0,1\},\mathcal{P}(\{0,1\}))$ + \item L'attaque $a:(\Omega,\mathcal{T})\rightarrow\mathcal{P}(\{0,1\}))$ + \item Le modèle cible $f:(\Omega,\mathcal{T})\rightarrow\mathcal{P}(\{0,1\}))$ + \end{itemize} + Alors nous avons + \begin{equation*} + \text{max}_{a}BA(a) = \frac{1}{2}(1+\text(DemParLvl(f))) + \end{equation*} +\end{propriete} + +\begin{proof} + On pause $\hat{Y}=f\circ X$. + L'ensemble $A$ des fonction de $\{0,1\}$ vers $\{0,1\}$ contient quatre éléments : +$a_0=0$, $a_1=id$, $a_2=1-id$ et $a,3=1$. + Pour chaque attaque $a\in A$ la \textit{balanced accuracy} de $a$ est +$BA(a) = \frac{1}{2}(P(a\circ \hat{Y}=0|S=0) + P(a\circ \hat{Y}=1|S=1))$. +Nous avons $BA(b_0) = BA(b_3) = \frac{1}{2}$ il n'est donc pas nécessaire de considérer ces éléments pour résoudre le problème d'optimisation. +Ce problème s'écrit $\text{max}_{a\in A}BA(a)) = \text{max}(BA(a_1), BA(a_2))$. +Nous remarquon que $a_1\circ \hat{Y}=\hat{Y}$ et $a_2\circ \hat{Y}=1 - \hat{Y}$. +Ainsi, +{ +\begin{align*} + BA(a_1) &= \frac{1}{2}(P(\hat{Y}=0|S=0) + P(\hat{Y}=1|S=1))\\ + &=\frac{1}{2}(1+P(\hat{Y}=1|S=1) - P(\hat{Y}=1|S=0)) +\end{align*} +} +et +{ +\begin{align*} + BA(a_2)=\frac{1}{2}(1+P(\hat{Y}=1|S=0) - P(\hat{Y}=1|S=1)) +\end{align*} +} +Donc, +{ +\begin{align*} + &\text{max}_{a\in B}BA(a) \\ + = &\frac{1}{2}\left(1+\text{max}\left( + \begin{matrix} + P(\hat{Y}=0|S=0) -P(\hat{Y}=1|S=1)\\ + P(\hat{Y}=1|S=0) -P(\hat{Y}=0|S=1) + \end{matrix} + \right)\right)\\ + =&\frac{1}{2}(1+|P(\hat{Y}=1|S=1) - P(\hat{Y}=1|S=0)|) +\end{align*} +} +\end{proof} + +Ainsi pour le classifieur binaire avec attribut sensbile binaire, il est suffisant de calculer le DemParLvl du modèle cible pour connaitre le maximum de \textit{balanced accuracy} ateignable par n'importe quelle attaque. +De plus, nous voyons que la \textit{balanced accuracy} maximial d'attaque vaut ${1}{2}$ si et seulement si $\text{DemParLvl}=0$. +C'est à dire que $f$ satisfait DemPar est équivalant à dire que tout attaque à une \textit{balanced accuracy} égale à $\frac{1}{2}$. + +Grâce au Théorème~\ref{th:aia-dpgood} nous savons aussi que tout autre définition d'équtiée qui n'implique pas la paritée démographique ne permet pas de mitiger les AIA. +Par exemple, nous allons montrer que l'égalitée de chances de la Définition~\ref{def:background-eq-eoo} en permet pas de mitiger l'AIA dans le cas binaire que nous avons étuié précédement. + +\subsection{Utiliser l'AIA pour contrôler le niveau d'équitée}. + |