summaryrefslogtreecommitdiff
path: root/aia
diff options
context:
space:
mode:
authorJan Aalmoes <jan.aalmoes@inria.fr>2024-10-05 19:25:34 +0200
committerJan Aalmoes <jan.aalmoes@inria.fr>2024-10-05 19:25:34 +0200
commit411624f6f259084641deb92f20d512908c8b7d4f (patch)
treec25c1ce9afbb9252217a45deb76b3e63ae648ab9 /aia
parentd4021e6f8a0bf771b755d39da8515266ef75e667 (diff)
Correction maman
Diffstat (limited to 'aia')
-rw-r--r--aia/aia.tex5
-rw-r--r--aia/fair_reg.tex4
-rw-r--r--aia/figure/tikz/data.tex4
-rw-r--r--aia/methodo.tex14
4 files changed, 11 insertions, 16 deletions
diff --git a/aia/aia.tex b/aia/aia.tex
index 147cf3d..b77277e 100644
--- a/aia/aia.tex
+++ b/aia/aia.tex
@@ -20,14 +20,9 @@ Nous allons l'utiliser pour construire une AIA qui donne la garantie théorique
Nous appelons cette AIA : \AIAHard.
\subsection{AIA pour les modèles de régression}
-<<<<<<< HEAD
\label{sec:aia-soft}
-Dans le cas d'un modèle cible qui effectua une régression nous avons $\#F$ infini donc nous ne pouvons pas utiliser \AIAHard.
-Ce cas où l'adversaire a accès un modèle de régression prend en compte le cas où le modèle cible de prédiction divulgue un logit par exemple.
-=======
Dans le cas d'un modèle cible qui effectue une régression nous avons $\#F$ infini, donc nous ne pouvons pas utiliser \AIAHard.
Ce cas où l'adversaire a accès au modèle de régression prend en compte le cas où le modèle cible de prédiction divulgue un logit par exemple.
->>>>>>> 642fa138bd0127b42b8906e412a5ee761b120ac2
C'est le modèle de menace qu'applique Song et. al~\cite{Song2020Overlearning} dans leur AIA.
Nous utiliserons comme modèle d'AIA une forêt aléatoire puis nous optimiserons son seuil en utilisant la courbe ROC pour prendre en compte le déséquilibre de classes dans l'attribut sensible.
diff --git a/aia/fair_reg.tex b/aia/fair_reg.tex
index 6c01cc8..ed5d10a 100644
--- a/aia/fair_reg.tex
+++ b/aia/fair_reg.tex
@@ -3,7 +3,7 @@ Dans le cas d'un classifieur binaire ($\hat{Y}$) avec attribut binaire ($S$), no
\begin{equation*}
\text{DemParLvl} = |P(\hat{Y}=1|S=0) - P(\hat{Y}=1|S=1)|
\end{equation*}
-C'est l'écart de prédiction positive entre la classe majoritaire(par exemple les blancs, le hommes, ...) et la classe minoritaire (les noirs, les femmes, ...).
+C'est l'écart de prédiction positive entre la classe majoritaire (par exemple les blancs, les hommes, ...) et la classe minoritaire (les noirs, les femmes, ...).
\begin{propriete}
\label{prop:aia-dpl0}
Un classifieur qui satisfait la parité démographique a un DemParLvl égal à zéro.
@@ -13,7 +13,7 @@ La démonstration est triviale à partir de la Définition~\ref{def:background-e
DemPar est équivalente à dire que la prédiction du modèle est indépendante de l'attribut sensible.
Nous remarquons que cette définition n'est ni restreinte à des problèmes de classifications, ni à des attributs sensibles binaires, ni même à des attributs sensibles qui prennent leurs valeurs dans un ensemble fini.
Ainsi nous définissons la notion suivante:
-\begin{definition}{Parité démographique généralisée.}
+\begin{definition}[Parité démographique généralisée]
\label{def:aia-dempargen}
Soit $(\Omega,\mathcal{T},P$) un espace probabilisé.
Soient $(E,\mathcal{E})$, $(F,\mathcal{F})$ et $(G,\mathcal{G})$ des espaces mesurables.
diff --git a/aia/figure/tikz/data.tex b/aia/figure/tikz/data.tex
index c43d496..728498b 100644
--- a/aia/figure/tikz/data.tex
+++ b/aia/figure/tikz/data.tex
@@ -3,13 +3,13 @@
\node[database,label={[align=center]above:Donné\\cible}] (base) at (0,0) {};
\node[rectangle,draw,align=center] (cible) at (10,0) {Modèle\\cible};
\draw[->,align=center] (base) to[bend left] node[midway,above] {80\% entraînement\\sans attribut sensible} (cible);
- \draw[->] (base) to[bend right] node[midway,below] (test) {20\% evaluation} (cible);
+ \draw[->] (base) to[bend right] node[midway,below] (test) {20\% évaluation} (cible);
\node[database,label={[align=left]right:Donnée\\auxilière}] (aux) at (10,-5.5) {};
\draw[->] (test) to[out=-90,in=90] node[midway,above] {\hspace{50px}Attribut sensible} (aux);
\draw[->] (cible) to node[midway,right] {Prédiction} (aux);
\node[rectangle,draw,align=center] (attaque) at (5,-5.5) {Modèle\\AIA};
\draw[->] (aux) to[bend right] node[midway,above] {80\% entraînement} (attaque);
- \draw[->] (aux) to[bend left] node[midway,below] {20\% evaluation} (attaque);
+ \draw[->] (aux) to[bend left] node[midway,below] {20\% évaluation} (attaque);
\node[rectangle,align=center] (result) at (0,-5.5) {Exactitude\\équilibrée};
\draw[->] (attaque) to (result);
\end{tikzpicture}
diff --git a/aia/methodo.tex b/aia/methodo.tex
index a64320d..c4d4f62 100644
--- a/aia/methodo.tex
+++ b/aia/methodo.tex
@@ -8,20 +8,20 @@ De plus, dans le cas de \AIAHard, nous allons pouvoir vérifier expérimentaleme
\paragraph{CENSUS}
Le sondage des Etats-Unis d'Amérique produit tous les dix ans un jeu de données appelé CENSUS contenant les informations de tous les citoyens\footnote{www.census.gov}.
-La version que nous avons utilisé contient 30.940 données avec 95 attributs comme le travail occupé, le statut marital etc.
+La version que nous avons utilisée contient 30.940 données avec 95 attributs comme le travail occupé, le statut marital etc.
Parmi ces attributs, certains sont sensibles comme la couleur de peau appelée \textit{race} ou le genre appelé \textit{sex}.
Avec ce jeu de données, nous construisons un classifieur cible qui cherche à inférer si un individu gagne plus de 50.000 dollars par an.
\paragraph{COMPAS}
Cette base de données est construite à partir des affaires criminelles aux États-Unis.
Elle est utilisée notamment par les différents algorithmes commerciaux de justice prédictive que nous avons introduits en Section~\ref{sec:contexte-insti}.
-Elle contient les données de 6.172 criminel jugés coupables en Floride.
+Elle contient les données de 6.172 criminels jugés coupables en Floride.
Elle contient sept attributs.
\paragraph{MEPS}
Cette base de données provient du système de santé des États-Unis.
Elle contient l'historique de trajets réalisés par 15.830 patients.
-Le tâche de classification du modèle cible est de prédire si un patient utilise fortement ou faiblement les services de santé.
+La tâche de classification du modèle cible est de prédire si un patient utilise fortement ou faiblement les services de santé.
\paragraph{LFW}
Cette base de données contient 8.212 images de visages de personnes.
@@ -29,7 +29,7 @@ La tâche principale est de classifier si une personne a plus de 35 ans.
\paragraph{Attributs sensibles}
Toutes ces bases de données contiennent les attributs sensibles \textit{race} et \textit{sex}.
-Nous rendons binaire ces attributs :
+Nous rendons binaires ces attributs :
\textit{race} vaut 1 si la personne a la peau noire et 0 sinon ;
\textit{sex} vaut 1 si la personne est une femme et 0 sinon.
@@ -37,7 +37,7 @@ Nous rendons binaire ces attributs :
Pour simuler le modèle de menace, nous séparons chaque base de données de la manière suivante :
chaque base de données est séparée en 80\% d'entraînement et 20\% d'évaluation.
Dans l'entraînement on retire l'attribut sensible et on l'utilise pour entraîner le modèle cible.
-Ensuite nous utilisons l'évaluation sans l'attribut sensible pur calculer les prédictions que nous lions ligne par ligne à leur attribut sensible correspondant.
+Ensuite nous utilisons l'évaluation sans l'attribut sensible pour calculer les prédictions que nous lions ligne par ligne à leur attribut sensible correspondant.
Cela crée la base auxiliaire qui respecte bien les exigences du modèle de menace : les données n'ont pas été utilisées à l'entraînement.
Cette base auxiliaire est ensuite séparée en 80\% d'entraînement et 20\% d'évaluation.
Les 80\% d'entraînement sont utilisés pour construire le modèle d'attaque qui sert à prédire l'attribut sensible à partir de la prédiction du modèle cible.
@@ -50,7 +50,7 @@ Nous reportons dans la Section~\ref{sec:aia-resexp} contenant les résultats exp
\subsection{Imposer l'équité}
Nous comparons le succès de l'AIA avec et sans utilisation de mécanisme pour imposer l'équité.
-Nous utilisons pour cela les mécanisme décrit à la Section~\ref{sec:background-eq-imp} : L'approche par réduction pour une classification équitable et le rééquilibrage adverse.
-Nous imposons la parité démographique, le but de ses expérience étant d'observer si en pratique les mécanismes d'équité permette de mitiger les AIA.
+Nous utilisons pour cela les mécanismes décrits à la Section~\ref{sec:background-eq-imp} : L'approche par réduction pour une classification équitable et le rééquilibrage adverse.
+Nous imposons la parité démographique, le but de ces expériences étant d'observer si en pratique les mécanismes d'équité permettent de mitiger les AIA.
Ainsi pour l'approche par réduction nous évaluons uniquement \AIAHard~ alors que pour l'approche adverse nous évaluons les deux AIA.