summaryrefslogtreecommitdiff
path: root/aia/fair_reg.tex
blob: ed5d10a9bafa8063c5b9aed168080763ecd5d61c (plain)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
A la Section~\ref{sec:background-eq} nous avons introduit la notion de parité démographique (DemPar).
Dans le cas d'un classifieur binaire ($\hat{Y}$) avec attribut binaire ($S$), nous pouvons calculer à quel point le classifieur est proche d'être DemPar avec la quantité suivante :
\begin{equation*}
    \text{DemParLvl} = |P(\hat{Y}=1|S=0) - P(\hat{Y}=1|S=1)|
\end{equation*}
C'est l'écart de prédiction positive entre la classe majoritaire (par exemple les blancs, les hommes, ...) et la classe minoritaire (les noirs, les femmes, ...).
\begin{propriete}
    \label{prop:aia-dpl0}
    Un classifieur qui satisfait la parité démographique a un DemParLvl égal à zéro.
\end{propriete}
La démonstration est triviale à partir de la Définition~\ref{def:background-eq-dp}.

DemPar est équivalente à dire que la prédiction du modèle est indépendante de l'attribut sensible.
Nous remarquons que cette définition n'est ni restreinte à des problèmes de classifications, ni à des attributs sensibles binaires, ni même à des attributs sensibles qui prennent leurs valeurs dans un ensemble fini.
Ainsi nous définissons la notion suivante:
\begin{definition}[Parité démographique généralisée]
    \label{def:aia-dempargen}
Soit $(\Omega,\mathcal{T},P$) un espace probabilisé.
Soient $(E,\mathcal{E})$, $(F,\mathcal{F})$ et $(G,\mathcal{G})$ des espaces mesurables.
Soient les variables aléatoires suivantes : 
\begin{itemize}
    \item $X:(\Omega,\mathcal{T})\rightarrow (E,\mathcal{E})$
    \item $Y:(\Omega,\mathcal{T})\rightarrow (F,\mathcal{F})$
    \item $S:(\Omega,\mathcal{T})\rightarrow (G,\mathcal{G})$
    \item $f:(E,\mathcal{E})\rightarrow (F,\mathcal{F})$
\end{itemize}
Alors $f$ satisfait la parité démographique généralisée si et seulement si 
\begin{equation*}
    P_{f\circ X,S} = P_{f\circ X}\otimes P_S
\end{equation*}
Dit autrement, si et seulement si le classifieur $f$ est un CCA pour prédire $S$ à partir de $X$.
\end{definition}

\begin{propriete}
    Si un classifieur binaire satisfait la parité démographique généralisée alors il satisfait la parité démographique.
\end{propriete}

\begin{proof}
    En gardant les objets définis dans la Définition~\ref{def:aia-dempargen}, supposons que $f$ satisfasse la parité démographique généralisée.
    Alors, en notant $\hat{Y} = f\circ X$, comme $\mathcal{G} = \mathcal{F}=\mathcal{P}(\{0,1\})$, nous avons bien
    \begin{equation*}
        P(\hat{Y}=1\mid S=0) = P(\hat{Y}=1\mid S=1)
    \end{equation*}
\end{proof}

Ainsi grâce à la Propriété~\ref{prop:aia-dpl0} nous savons que si un classifieur satisfait la parité démographique généralisée, alors il a un DemParLvl égale à 0.