diff options
author | Jan Aalmoes <jan.aalmoes@inria.fr> | 2024-09-30 20:15:42 +0200 |
---|---|---|
committer | Jan Aalmoes <jan.aalmoes@inria.fr> | 2024-09-30 20:15:42 +0200 |
commit | ceed4f2894366b4644f271005d5aa1b931797b94 (patch) | |
tree | 2aa91b837b6fa01764117f7530aa696750fc0c6f /aia/methodo.tex | |
parent | 4255a26a6c692a3e68516d2262e7cfb259c89b52 (diff) | |
parent | 642fa138bd0127b42b8906e412a5ee761b120ac2 (diff) |
Fusion des corrections d'Emeline sur aia et fini
Diffstat (limited to 'aia/methodo.tex')
-rw-r--r-- | aia/methodo.tex | 40 |
1 files changed, 20 insertions, 20 deletions
diff --git a/aia/methodo.tex b/aia/methodo.tex index 88fa79a..a64320d 100644 --- a/aia/methodo.tex +++ b/aia/methodo.tex @@ -1,47 +1,47 @@ -Nous allons réaliser un série d'expériences utilisant les AIA définit plus haut. +Nous allons réaliser une série d'expériences utilisant les AIA définies plus haut. Le but est d'observer l'exactitude équilibrée des AIA sur des modèles entraînés pour imposer l'équité. Pour des attributs sensibles dans un ensemble fini $G$, nous souhaitons observer si entraîner le modèle en imposant la parité démographique rapproche l'exactitude équilibrée de $\frac{1}{\#G}$ ce qui indique une protection de l'attribut sensible d'après le Théorème~\ref{th:aia-dpgood}. -De plus dans le cas de \AIAHard nous allons pouvoir vérifier expérimentalement la Propriété~\ref{prop:aia-demparlvl}. +De plus, dans le cas de \AIAHard, nous allons pouvoir vérifier expérimentalement la Propriété~\ref{prop:aia-demparlvl}. -\subsection{Jeux de donnée} +\subsection{Jeux de données} \label{sec:aia-methodo-jeu} \paragraph{CENSUS} -Le sondage des Etats Unis d'Amérique produit tous les dix ans un jeu de donnée appelé CENSUS contenant les information de tous les citoyens\footnote{www.census.gov}. +Le sondage des Etats-Unis d'Amérique produit tous les dix ans un jeu de données appelé CENSUS contenant les informations de tous les citoyens\footnote{www.census.gov}. La version que nous avons utilisé contient 30.940 données avec 95 attributs comme le travail occupé, le statut marital etc. -Parmi ces attributs certain sont sensibles comme la couleur de peau appelé \textit{race} ou le genre appelé \textit{sex}. -Avec ce jeu de donnée, nous construisons un classifieur cible qui cherche à inférer si un individu gagne plus de 50.000 dollars par an. +Parmi ces attributs, certains sont sensibles comme la couleur de peau appelée \textit{race} ou le genre appelé \textit{sex}. +Avec ce jeu de données, nous construisons un classifieur cible qui cherche à inférer si un individu gagne plus de 50.000 dollars par an. \paragraph{COMPAS} -Cette base de donnée est construite à partir des affaires criminelles aux États Unis. -Elle est utilisé notamment par les différents algorithmes commerciaux de justice prédictive que nous avons introduits en Section~\ref{sec:contexte-insti}. -Elle contient les donnée de 6.172 criminel jugé coupables en Floride. +Cette base de données est construite à partir des affaires criminelles aux États-Unis. +Elle est utilisée notamment par les différents algorithmes commerciaux de justice prédictive que nous avons introduits en Section~\ref{sec:contexte-insti}. +Elle contient les données de 6.172 criminel jugés coupables en Floride. Elle contient sept attributs. \paragraph{MEPS} -Cette base de donnée provient du système de santé de États Unis. -Elle contiens l'historique de trajets réalisé par 15.830 patients. +Cette base de données provient du système de santé des États-Unis. +Elle contient l'historique de trajets réalisés par 15.830 patients. Le tâche de classification du modèle cible est de prédire si un patient utilise fortement ou faiblement les services de santé. \paragraph{LFW} -Ces base de donnée contient 8.212 images de visages de personnes. +Cette base de données contient 8.212 images de visages de personnes. La tâche principale est de classifier si une personne a plus de 35 ans. \paragraph{Attributs sensibles} Toutes ces bases de données contiennent les attributs sensibles \textit{race} et \textit{sex}. -Nous rendons binaire cas attributs : -\textit{race} vaut 1 si la personne à la peu noire et 0 sinon ; +Nous rendons binaire ces attributs : +\textit{race} vaut 1 si la personne a la peau noire et 0 sinon ; \textit{sex} vaut 1 si la personne est une femme et 0 sinon. \subsection{Cheminement des données} -Pour simuler le modèle de menace nous séparons chaque base de donnée de la manière suivant : -chaque base de donnée est séparé en 80\% d'entraînement et 20\% d'évaluation. -Dans l'entraînement on retire l'attribut sensible et on l'utilisé pour entraîner le modèle cible. +Pour simuler le modèle de menace, nous séparons chaque base de données de la manière suivante : +chaque base de données est séparée en 80\% d'entraînement et 20\% d'évaluation. +Dans l'entraînement on retire l'attribut sensible et on l'utilise pour entraîner le modèle cible. Ensuite nous utilisons l'évaluation sans l'attribut sensible pur calculer les prédictions que nous lions ligne par ligne à leur attribut sensible correspondant. -Cela crée la base auxiliaire qui respecte bien les exigence du modèle de menace : les donnée n'ont pas été utilisé à l'entraînement. +Cela crée la base auxiliaire qui respecte bien les exigences du modèle de menace : les données n'ont pas été utilisées à l'entraînement. Cette base auxiliaire est ensuite séparée en 80\% d'entraînement et 20\% d'évaluation. -Les 80\% d'entraînement sont utilisé pour construire le modèle d'attaque qui sert à prédire l'attribut sensible à partir de la prédiction du modèle cible. -Les 20\% d'évaluation servent à calculer l'exactitude équilibré du modèle d'attaque. +Les 80\% d'entraînement sont utilisés pour construire le modèle d'attaque qui sert à prédire l'attribut sensible à partir de la prédiction du modèle cible. +Les 20\% d'évaluation servent à calculer l'exactitude équilibrée du modèle d'attaque. Nous reportons dans la Section~\ref{sec:aia-resexp} contenant les résultats expérimentaux. \begin{figure} \input{aia/figure/tikz/data} |