diff options
Diffstat (limited to 'classification_finie/introduction.tex')
-rw-r--r-- | classification_finie/introduction.tex | 12 |
1 files changed, 9 insertions, 3 deletions
diff --git a/classification_finie/introduction.tex b/classification_finie/introduction.tex index ac815fa..a2574cc 100644 --- a/classification_finie/introduction.tex +++ b/classification_finie/introduction.tex @@ -1,8 +1,14 @@ Dans ce premier chapitre de contribution, nous allons construire un nouvel algorithme d'apprentissage ensembliste. Plus précisément nous allons nous intéresser à la manière de combiner plusieurs classifieurs : ce que nous avons appelé la seconde partie de la vie d'un algorithme d'apprentissage ensembliste à la Section~\ref{sec:background-aens}. -Nous allons construire une solution similaire à celle de l'espace de connaissances du comportement\footnote{\textit{Behavior knowledge space}}~\cite{1626170} sauf que au lieu d'optimiser l'exactitude nous allons optimiser l'exactitude équilibrée. +Nous allons construire une solution similaire à celle de l'espace de connaissances du comportement\footnote{\textit{Behavior knowledge space}}~\cite{1626170} sauf qu'au lieu d'optimiser l'exactitude nous allons optimiser l'exactitude équilibrée. -Pour cela nous allons considérer que nous cherchons une fonction d'un ensemble fini $E$ vers un autre $F$. +Ce nouvel algorithme nous permettra aux prochains chapitres d'étudier l'attaque par inférence d'attribut sensible. +Dans cette attaque nous utilisons la sortie d'un modèle de classification pour inférer un attribut sensible. +En effet, l'ensemble des classes de sorties possibles est fini tout comme l'ensemble des attributs sensibles possibles. + +Pour construire cet algorithme nous allons considérer que nous cherchons une fonction d'un ensemble fini $E$ vers un autre $F$. $E$ correspond à l'ensemble des uplets possibles des sorties des classifieurs faibles et $F$ aux classes. -Nous commençons notre étude en considérant que nous avons une base de donnée ayant deux colonnes. +Nous commençons notre étude en considérant que nous avons une base de données ayant deux colonnes. L'une contient des éléments de $E$ et l'autre contient des étiquettes de $F$. +Une solution évidente est d'essayer toutes les fonctions possibles de $E$ dans $F$ mais cela n'est pas possible pour de grands ensembles. +Ainsi nous allons chercher un solution qui soit économe en nombre d'opérations. |