{ \usebackgroundtemplate{\includegraphics[width=\paperwidth]{images/background/card/background.pdf}} \begin{frame} %\vspace{70px} \hspace{70px} \begin{minipage}{250px} \centering \Large \textcolor{accent}{ Un nouvel algorithme d'apprentissage ensembliste pour l'AIA. } \vspace{20px} \normalsize Inférence d'un attribut sensible en utilisant la prédiction du modèle cible \end{minipage} \end{frame} } \begin{frame} \frametitle{AIA pour la prédiction} \input{tikz/ef} \pause \vspace{10px} \emph{$n^m$ applications à essayer !} \vspace{10px} Question de recherche : \emph{comment choisir la meilleure application sans les essayer toutes ?} \vspace{10px} On cherche $a:F\rightarrow G$ telle que $P_{a\circ f\circ X}$ approche $P_{S}$. \end{frame} \begin{frame} \frametitle{Classification finie} \begin{minipage}[t]{0.2\linewidth} \begin{tabular}{cc} \textbf{Y}&\textbf{S}\\ 0&$\bigcirc$\\ 2&$\times$\\ 1&$\bigcirc$\\ 0&$\bigcirc$\\ 2&$\times$\\ 0&$\bigcirc$\\ 1&$\bigcirc$\\ 1&$\bigtriangleup$\\ 0&$\bigcirc$\\ 2&$\bigcirc$\\ 1&$\bigcirc$\\ 1&$\bigtriangleup$\\ 2&$\bigcirc$\\ 2&$\bigcirc$\\ \end{tabular} \end{minipage} \begin{minipage}[t]{0.75\linewidth} On cherche une fonction $a$ de $F = \{0,1,2\}$ dans $G = \{\bigcirc,\bigtriangleup,\times\}$. \\\vspace{0.5cm}\\ Nous n'allons pas essayer les \emph{$3^3=27$ fonctions}. \\\vspace{0.5cm}\\ A la place, étudions deux manières de \emph{ranger le jeu de données}. \end{minipage} \end{frame} \begin{frame} \frametitle{Premier rangement} \input{tikz/chaussette/a} \end{frame} \begin{frame} \begin{definition}[Exactitude\footnote{\textit{Accuracy}}] L'exactitude de $a$ pour prédire $S$ est \begin{equation*} A(a) = P(a\circ f\circ X=S) \end{equation*} \end{definition} \pause \frametitle{Maximisation de l'exactitude} \begin{theorem} L'application qui maximise l'exactitude est \begin{equation*} a: \left\{ \begin{matrix} F\rightarrow G\\ e\mapsto \text{argmax}_{i\in G} P(S=i|f\circ X=e) \end{matrix} \right. \end{equation*} \end{theorem} \vspace{10px} \footnotesize \textit{The behavior-knowledge space method for combination of multiple classifiers}, Huang, YS et Suen, C.Y. 1993 \end{frame} \begin{frame} \frametitle{Problème avec la maximisation de l'exactitude} \begin{minipage}{0.4\linewidth} \begin{tabular}{cccc} &\textcolor{principale}{Faux Positifs}&\textcolor{principale}{Faux Négatifs}&\textcolor{principale}{Exactitude}\\ \textcolor{principale}{$\bigcirc$}&100\%&0\%&100\%\\ \textcolor{principale}{$\bigtriangleup$}&0\%&100\%&0\%\\ \textcolor{principale}{$\times$}&0\%&100\%&0\%\\  \end{tabular} \vspace{20px} \pause Déséquilibre dans les classes\footnote{\textit{Class imbalance}} : \begin{itemize} \item $P(S=\bigcirc)=\frac{10}{14}\simeq 71\%$ \item $P(S=\bigtriangleup)=\frac{2}{14}\simeq 14\%$ \item $P(S=\times)=\frac{2}{14}\simeq 14\%$ \end{itemize} \end{minipage} \pause \hspace{50px} \begin{minipage}{0.4\linewidth} \vspace{70px} \begin{figure} \includegraphics[width=1.2\linewidth]{images/race_split.pdf} \caption{Ethnies\footnote{\textit{Races}} en Alabama} \end{figure} \end{minipage} \end{frame} \begin{frame} \frametitle{Deuxième rangement} \vspace{5px} \input{tikz/chaussette/ba} \end{frame} \begin{frame} \frametitle{Maximisation de l'exactitude équilibrée} \begin{definition}[Exactitude équilibrée\footnote{\textit{Balanced accuracy}}] \begin{equation*} BA(a) = \frac{1}{\#G}\sum_{i\in G}P(a\circ f\circ X=i\mid S=i) \end{equation*} \end{definition} \pause \begin{theorem} L'application qui maximise l'exactitude équilibrée est \begin{equation*} a:\left\{ \begin{matrix} F \rightarrow G\\ e\mapsto \text{argmax}_{i\in G}P(f\circ X=e|S=i) \end{matrix} \right. \end{equation*} \end{theorem} \end{frame} \begin{frame} \frametitle{Problème avec la maximisation de l'exactitude} \emph{Maximisation de l'exactitude} \vspace{5px} \begin{tabular}{cccc} &\textcolor{principale}{Faux Positifs}&\textcolor{principale}{Faux Négatifs}&\textcolor{principale}{Exactitude}\\ \textcolor{principale}{$\bigcirc$}&100\%&0\%&1\\ \textcolor{principale}{$\bigtriangleup$}&0\%&100\%&0\\ \textcolor{principale}{$\times$}&0\%&100\%&0\\  \end{tabular} \vspace{10px} \emph{Maximisation de l'exactitude équilibrée} \vspace{5px} \begin{tabular}{cccc} &\textcolor{principale}{Faux Positifs}&\textcolor{principale}{Faux Négatifs}&\textcolor{principale}{Exactitude}\\ \textcolor{principale}{$\bigcirc$}&0\%&60\%&40\%\\ \textcolor{principale}{$\bigtriangleup$}&25\%&0\%&100\%\\ \textcolor{principale}{$\times$}&25\%&0\%&100\%\\  \end{tabular} \end{frame} \begin{frame} \frametitle{Evaluation expérimentale de la classification finie} \begin{figure} \centering \begin{subfigure}[t]{0.45\linewidth} \centering \includegraphics[width=\linewidth]{images/finit/COMPAS.pdf} \caption{Prédiction du récidivisme (COMPAS)} \end{subfigure} \begin{subfigure}[t]{0.45\linewidth} \centering \includegraphics[width=\linewidth]{images/finit/LAW.pdf} \caption{Prédiction de la réussite à l'examen du barreau (LAW)} \end{subfigure} \end{figure} La classification finie est \begin{itemize} \item \emph{$3\times$ plus rapide} qu'une forêt aléatoire sur (LAW) \item \emph{$4\times$ plus rapide} qu'une forêt aléatoire sur (COMPAS) \end{itemize} \end{frame} \begin{frame} \frametitle{Conclusion sur l'AIA de la prédiction} \begin{itemize} \item Nous avons construit une \emph{fonction d'attaque $a$} de $F$, l'ensemble des \emph{prédictions possibles du modèle cible} vers $G$, l'ensemble des \emph{attributs sensibles}. \pause \item Cette fonction \emph{maximise l'exactitude équilibrée}. \end{itemize} \end{frame}