summaryrefslogtreecommitdiff
path: root/aia/methodo.tex
diff options
context:
space:
mode:
authorJan Aalmoes <jan.aalmoes@inria.fr>2024-09-27 15:14:05 +0200
committerJan Aalmoes <jan.aalmoes@inria.fr>2024-09-27 15:14:05 +0200
commit07b4490dc63504079a5904cd42ab1ec6015cfb76 (patch)
tree59e16fdf007416871a22be7243db25ea96aa4720 /aia/methodo.tex
parent8b9c76a727b2921be03133335f3cde9e2651b7c1 (diff)
AJout des résultats aia et de l'interprétation
Diffstat (limited to 'aia/methodo.tex')
-rw-r--r--aia/methodo.tex32
1 files changed, 16 insertions, 16 deletions
diff --git a/aia/methodo.tex b/aia/methodo.tex
index 80cf515..7bab0b0 100644
--- a/aia/methodo.tex
+++ b/aia/methodo.tex
@@ -1,46 +1,46 @@
Nous allons réaliser un série d'expériences utilisant les AIA définit plus haut.
-Le but est d'observer l'exactitude équilibrée des AIA sur des modèles entraînés pour imposer l'équitée.
-Pour des attributs sensibles dans un ensemble fini $G$, nous souhaiton observer si entraîner le modèle en imposant la paritée démographique raproche l'exactitude équilibrée de $\frac{1}{\#G}$ ce qui indique une protection de l'attribut sensible d'après le Théorème~\ref{th:aia-dpgood}.
+Le but est d'observer l'exactitude équilibrée des AIA sur des modèles entraînés pour imposer l'équité.
+Pour des attributs sensibles dans un ensemble fini $G$, nous souhaitons observer si entraîner le modèle en imposant la parité démographique rapproche l'exactitude équilibrée de $\frac{1}{\#G}$ ce qui indique une protection de l'attribut sensible d'après le Théorème~\ref{th:aia-dpgood}.
De plus dans le cas de \AIAHard nous allons pouvoir vérifier expérimentalement la Propriété~\ref{prop:aia-demparlvl}.
\subsection{Jeux de donnée}
\label{sec:aia-methodo-jeu}
\paragraph{CENSUS}
-Le sondage des Etats Unis d'Amérique produit tous les dix ans un jeu de donnée appel CENSUS contenant les information de tous les citoyens\footnote{www.census.gov}.
-La version que nous avons utilisé contient 30.940 donées avec 95 attributs comme le travail occupé, le status marital etc.
-Parmis ces attributs certain sont sensibles comme la couleur de peau appelé \textit{race} ou le genre appelé \textit{sex}.
-Avec ce jeu de donnée, nous construison un classifieur cible qui cherche à inférer si un individu gagne plus de 50.000 dollars par an.
+Le sondage des Etats Unis d'Amérique produit tous les dix ans un jeu de donnée appelé CENSUS contenant les information de tous les citoyens\footnote{www.census.gov}.
+La version que nous avons utilisé contient 30.940 données avec 95 attributs comme le travail occupé, le statut marital etc.
+Parmi ces attributs certain sont sensibles comme la couleur de peau appelé \textit{race} ou le genre appelé \textit{sex}.
+Avec ce jeu de donnée, nous construisons un classifieur cible qui cherche à inférer si un individu gagne plus de 50.000 dollars par an.
\paragraph{COMPAS}
-Cette base de donnée est construite à partir des affaires criminelle aux Etats Unis.
-Elle est utilisé notament par les différents algorithem commerciaux de justice prédiction que nous avons introduits en Section~\ref{sec:contexte-insti}.
+Cette base de donnée est construite à partir des affaires criminelles aux États Unis.
+Elle est utilisé notamment par les différents algorithmes commerciaux de justice prédictive que nous avons introduits en Section~\ref{sec:contexte-insti}.
Elle contient les donnée de 6.172 criminel jugé coupables en Floride.
Elle contient sept attributs.
\paragraph{MEPS}
-Cette base de donnée provient du système de santé de Etats Unis.
+Cette base de donnée provient du système de santé de États Unis.
Elle contiens l'historique de trajets réalisé par 15.830 patients.
Le tâche de classification du modèle cible est de prédire si un patient utilise fortement ou faiblement les services de santé.
\paragraph{LFW}
-Cess base de donnée contient 8.212 image de visage de personnes.
+Ces base de donnée contient 8.212 images de visages de personnes.
La tâche principale est de classifier si une personne a plus de 35 ans.
\paragraph{Attributs sensibles}
Toutes ces bases de données contiennent les attributs sensibles \textit{race} et \textit{sex}.
-Nous randons binaire cas attributs :
+Nous rendons binaire cas attributs :
\textit{race} vaut 1 si la personne à la peu noire et 0 sinon ;
\textit{sex} vaut 1 si la personne est une femme et 0 sinon.
\subsection{Cheminement des données}
Pour simuler le modèle de menace nous séparons chaque base de donnée de la manière suivant :
chaque base de donnée est séparé en 80\% d'entraînement et 20\% d'évaluation.
-Dans l'entraînment on retire l'attribut sensible et on l'utilisé pour entrainer le modèle cible.
-Ensuite nous utilison l'évaluation sans l'attribut sensible pur calculer les prédictions que nous lion ligne par ligne à leur attribut sensible correspondant.
-Cela crée la base auxilière qui respecte bien les exigence du modèle de menace : les donnée n'ont pas été utilisé à l'entraînement.
-Cette base auxilière est ensuite separée en 80\% d'entraîneemnt et 20\% d'évaluation.
-Les 80\% d'entraînement sont utilisé pourt construire le modèle d'attaque qui sert à predire l'attribut sensible à partir de la prédiction du modèle cible.
+Dans l'entraînement on retire l'attribut sensible et on l'utilisé pour entraîner le modèle cible.
+Ensuite nous utilisons l'évaluation sans l'attribut sensible pur calculer les prédictions que nous lions ligne par ligne à leur attribut sensible correspondant.
+Cela crée la base auxiliaire qui respecte bien les exigence du modèle de menace : les donnée n'ont pas été utilisé à l'entraînement.
+Cette base auxiliaire est ensuite séparée en 80\% d'entraînement et 20\% d'évaluation.
+Les 80\% d'entraînement sont utilisé pour construire le modèle d'attaque qui sert à prédire l'attribut sensible à partir de la prédiction du modèle cible.
Les 20\% d'évaluation servent à calculer l'exactitude équilibré du modèle d'attaque.
Nous reportons dans la Section~\ref{sec:aia-resexp} contenant les résultats expérimentaux.
\begin{figure}