From 642fa138bd0127b42b8906e412a5ee761b120ac2 Mon Sep 17 00:00:00 2001 From: cookie Date: Mon, 30 Sep 2024 17:37:52 +0200 Subject: Correction Emeline sur classification fini et AIA --- classification_finie/ba.tex | 78 ++++++++++++++++++++++----------------------- 1 file changed, 39 insertions(+), 39 deletions(-) (limited to 'classification_finie/ba.tex') diff --git a/classification_finie/ba.tex b/classification_finie/ba.tex index a9fcb78..c155a7a 100644 --- a/classification_finie/ba.tex +++ b/classification_finie/ba.tex @@ -1,17 +1,17 @@ -Le cas d'un classifieur constant, comme nous l'avons à la Section~\ref{sec:background-ml-classif}, n'est qu'un exemple de Classifieur qui réalise un Choix Aléatoire (CCA). -En anglais la littérature parle en générale de \textit{random guess}~\cite{chicco2021matthews}. +Le cas d'un classifieur constant, comme nous l'avons vu à la Section~\ref{sec:background-ml-classif}, n'est qu'un exemple de Classifieur qui réalise un Choix Aléatoire (CCA). +En anglais, la littérature parle en général de \textit{random guess}~\cite{chicco2021matthews}. Cependant, à notre connaissance, il n'y a pas de définition mathématique qui unifie l'idée générale de CCA qui est : -un classifieur qui se comporte comme si il n'avait aucune connaissance sur sa tâche de classification. -Un CCA n'est pas un classifieur qui utilise l'aléatoire mais plutôt un classifieur hasardeux, comme une personne qui choisirai au hasard. +un classifieur qui se comporte comme s'il n'avait aucune connaissance sur sa tâche de classification. +Un CCA n'est pas un classifieur qui utilise l'aléatoire mais plutôt un classifieur hasardeux, comme une personne qui choisirait au hasard. C'est le cas pour un classifieur constant mais aussi pour un classifieur binaire qui tire à pile ou face son résultat. Nous pourrions dire qu'un CCA est un classifieur qui n'utilise pas les données d'entrée. -Cependant cela ne prend pas un compte le cas où les données d'entrée ne servent à rien pour la tâche de classification. -Par exemple nous voudrions que notre définition englobe n'importe quelle classifieur qui cherche à prédire la qualité d'un potimarron à partir la couleur de mes chaussettes le jour pu il a été ramassé. +Cependant, cela ne prend pas en compte le cas où les données d'entrée ne servent à rien pour la tâche de classification. +Par exemple, nous voudrions que notre définition englobe n'importe quel classifieur qui cherche à prédire la qualité d'un potimarron à partir de la couleur de mes chaussettes le jour où il a été ramassé. Nous proposons donc la définition suivante : \begin{definition} Un CCA est un classifieur ayant une prédiction indépendante de l'étiquette. - C'est à dire que pour un classifieur $f: E\rightarrow F$. + C'est-à-dire que pour un classifieur $f: E\rightarrow F$. Avec une étiquette $Y:\Omega\rightarrow F$ et une entrée $X:\Omega\rightarrow E$. Alors pour $\hat{Y}=f\circ X$, nous avons @@ -32,7 +32,7 @@ Nous proposons donc la définition suivante : Nous allons prouver séparément les deux implications. \paragraph{$(1)\implies(2)$} Nous supposons que $P_{(X,Y)} = P_X\otimes P_Y$. - Soit $f:(E,\mathcal{T})\rightarrow (F,\mathcal{F})$, un fonction mesurable, + Soit $f:(E,\mathcal{T})\rightarrow (F,\mathcal{F})$, une fonction mesurable, nous allons montrer que $f$ est un CCA, c'est-à dire que $P_{(f\circ X,Y)} = P_{f\circ X}\otimes P_Y$. Soient $(A,B)\in\mathcal{E}\times\mathcal{F}$ @@ -46,8 +46,8 @@ Nous proposons donc la définition suivante : \end{align*} Ainsi, $\forall (A,B)\in\mathcal{E}\times\mathcal{F}~P_{(f\circ X,Y)}(A,B) = P_{f\circ X}(A)P_Y(B)$. - D'après la définition de le mesure produit donnée à la Section~\ref{sec:background-proba}, nous avons donc bien $P_{(f\circ X,Y)} = P_{f\circ X}\otimes P_Y$. - Ce qui est bien la définition de l'indépendant donnée en Section~\ref{sec:background-proba}. + D'après la définition de la mesure produit donnée à la Section~\ref{sec:background-proba}, nous avons donc bien $P_{(f\circ X,Y)} = P_{f\circ X}\otimes P_Y$. + Ce qui est bien la définition de l'indépendance donnée en Section~\ref{sec:background-proba}. \paragraph{$(2)\implies (1)$} Nous supposons que tout classifieur de $Y$ à partir de $X$ est un CCA. @@ -93,13 +93,13 @@ Nous proposons donc la définition suivante : \begin{propriete} \label{prop:CCA_BA} - Les CCA ayant comme image $ F$ ont une exactitude équilibré égale à $\frac{1}{\# F}$. + Les CCA ayant comme image $ F$ ont une exactitude équilibrée égale à $\frac{1}{\# F}$. \end{propriete} \begin{proof} Soit $f: E\rightarrow F$ un CCA. - On pause $\hat{Y} = f\circ X$ - L'exactitude équilibré de $f$ est alors + On pose $\hat{Y} = f\circ X$ + L'exactitude équilibrée de $f$ est alors \begin{align*} &\frac{1}{\# F}\sum_{y\in F} P(\hat{Y}=y\mid Y=y)\\ @@ -116,18 +116,18 @@ Nous proposons donc la définition suivante : \end{align*} \end{proof} -La contraposé de la Proposition~\ref{prop:CCA_BA} nous apprend que si l'exactitude équilibré est différente de $0,5$ alors le classifieur n'est pas un CCA. +La contraposée de la Proposition~\ref{prop:CCA_BA} nous apprend que si l'exactitude équilibrée est différente de $0,5$ alors le classifieur n'est pas un CCA. - Il est intéressant de noter que si un classifieur à une exactitude équilibré de $\frac{1}{\#F}$ il n'est pas nécessaire qu'il soit un CCA. - Pour prouver cette remarque il suffit de trouver un exemple de classifieur ayant une exactitude équilibré de $\frac{1}{\#F}$ et qui ne soit pas un CCA. + Il est intéressant de noter que si un classifieur a une exactitude équilibrée de $\frac{1}{\#F}$ il n'est pas nécessaire qu'il soit un CCA. + Pour prouver cette remarque il suffit de trouver un exemple de classifieur ayant une exactitude équilibrée de $\frac{1}{\#F}$ et qui ne soit pas un CCA. Nous appelons $r(a,b)$ le reste de la division euclidienne de $a$ par $b$. -Soient les ensembles suivant : +Soient les ensembles suivants : $E = [|0,8|]$ et $F = [|0,2|]$. En considérant l'espace probabilisé $(E,\mathcal{P}(E),\frac{1}{9}\sum_{i=0}^8\delta_{i})$ -nous définissons les variables aléatoire suivantes : +nous définissons les variables aléatoires suivantes : $X=\textit{id}_E$ \begin{equation*} Y:\left\{ @@ -155,7 +155,7 @@ Ainsi que la fonction mesurable suivante qui est l'exemple de classifieur que no \right. \end{equation*} -Montrons que l'exactitude équilibré de $f$ vaut $\frac{1}{3}$. +Montrons que l'exactitude équilibrée de $f$ vaut $\frac{1}{3}$. En notant $\hat{Y} = f\circ X$, nous représentons cette situation par le tableau suivant. \begin{equation*} \begin{matrix} @@ -173,14 +173,14 @@ En notant $\hat{Y} = f\circ X$, nous représentons cette situation par le tablea \end{equation*} Il nous permet de calculer facilement les quantités suivantes. -Déjà l'exactitude équilibré est égale à $\frac{1}{3}$ car +Déjà l'exactitude équilibrée est égale à $\frac{1}{3}$ car $\forall y\in F~P(\hat{Y}=y\mid Y=y)=\frac{1}{3}$. Enfin nous voyons que $f$ n'est pas un CCA car $P(\hat{Y}=1\cap Y=2) = 0$ et $P(\hat{Y}=1)P(Y=2) = \frac{2}{9}\frac{1}{3} = \frac{2}{27}$. -Remarquons que le réciproque de la Propriété~\ref{prop:CCA_BA} est vrai dans le cas d'une classifieur binaire, c'est-à dire $\#F=2$. -En effet dans ce cas, supposons que l'exactitude équilibré vaille $0,5$, alors +Remarquons que la réciproque de la Propriété~\ref{prop:CCA_BA} est vraie dans le cas d'un classifieur binaire, c'est-à-dire $\#F=2$. +En effet, dans ce cas, supposons que l'exactitude équilibrée vaille $0,5$, alors \begin{align*} &P(f\circ X=0\mid Y=0)+P(f\circ X=1\mid Y=1) = 1\\ \implies&\left\{ @@ -193,12 +193,12 @@ En effet dans ce cas, supposons que l'exactitude équilibré vaille $0,5$, alors \implies&\text{$f$ est un CCA} \end{align*} -Bien qu'une exactitude équilibré égale à $\frac{1}{\#F}$ ne soit pas un critère de CCA, nous pouvons utiliser cette métrique pour savoir si il existe un classifieur qui soit un CCA. +Bien qu'une exactitude équilibrée égale à $\frac{1}{\#F}$ ne soit pas un critère de CCA, nous pouvons utiliser cette métrique pour savoir s'il existe un classifieur qui soit un CCA. En effet nous avons le résultat suivant : \begin{theorem} \label{th:fini-bacca} - En notant $BA(f)$ l'exactitude équilibré de $f$. + En notant $BA(f)$ l'exactitude équilibrée de $f$. \begin{equation*} \forall f~BA(f)=\frac{1}{\#F} \iff \forall f~\text{$f$ est un CCA} @@ -208,7 +208,7 @@ En effet nous avons le résultat suivant : \begin{proof} L'implication réciproque est une conséquence directe de la Propriété~\ref{prop:CCA_BA}. - Pour le sens directe, nous allons montrer la contraposée, c'est à dire l'assertion suivante : + Pour le sens direct, nous allons montrer la contraposée, c'est-à-dire l'assertion suivante : \begin{equation*} \exists f~\text{$f$ n'est pas un CCA} \implies \exists f~BA(f)\neq \frac{1}{\#F} @@ -238,7 +238,7 @@ En effet nous avons le résultat suivant : P(f\circ X=a\cap Y=b)\neq P(f\circ X=a)P(Y=b) \end{equation*} - Nous définissons les fonctions suivante pour tout $z$ et $z'$, éléments de $F$ : + Nous définissons les fonctions suivantes pour tout $z$ et $z'$, éléments de $F$ : \begin{equation*} h_{z,z'}:\left\{ \begin{matrix} @@ -254,17 +254,17 @@ En effet nous avons le résultat suivant : \right. \end{equation*} - $h_{z,z'}$ vas nous permettre et permuter les inférences faites par $f$. - Ainsi à partir de $f$ nous créons de nouveaux classifieurs. - Soit $\mathcal{H}=\{h_{z,z'}\mid (z,z')\in F^2\}$ nous allons montrer qu'il existe $\#F$-uplet de $\mathcal{H}$, $u$, tel que le classifieur $u_{\#F-1}\circ\cdots\circ u_0\circ f$ ai une exactitude équilibré différent de $\frac{1}{\#F}$. + $h_{z,z'}$ va nous permettre de permuter les inférences faites par $f$. + Ainsi, à partir de $f$ nous créons de nouveaux classifieurs. + Soit $\mathcal{H}=\{h_{z,z'}\mid (z,z')\in F^2\}$ nous allons montrer qu'il existe $\#F$-uplet de $\mathcal{H}$, $u$, tel que le classifieur $u_{\#F-1}\circ\cdots\circ u_0\circ f$ ait une exactitude équilibrée différente de $\frac{1}{\#F}$. Considérons la matrice \begin{equation*} M_f(i,j) = P(f\circ X=y_i\mid Y=y_j) \end{equation*} Où $y_\square:\#F\rightarrow F$ est une bijection. - Alors l'exactitude équilibré de $f$ est égale $\frac{\text{Tr}(M)}{\#F}$. - $h_{z,z'}$ peut aussi s'exprimer en terme matricielle. + Alors l'exactitude équilibrée de $f$ est égale $\frac{\text{Tr}(M)}{\#F}$. + $h_{z,z'}$ peut aussi s'exprimer en terme matriciel. La fonction suivante est une bijection : \begin{equation*} \Phi:\left\{ @@ -304,8 +304,8 @@ En effet nous avons le résultat suivant : \end{matrix} \end{equation*} - De plus, $M_{h_{y_i,y_j}\circ f}$ correspond à intervertie les lignes des $M_f$, - c'est-à dire que $M_{h_{y_i,y_j}\circ f} = H_{i,j}M_f$. + De plus, $M_{h_{y_i,y_j}\circ f}$ correspond à intervertir les lignes des $M_f$, + c'est-à-dire que $M_{h_{y_i,y_j}\circ f} = H_{i,j}M_f$. En effet, $h_{y_i,y_j}$ est une bijection telle que $h_{y_i,y_j}^{-1} = h_{y_i,y_j}$. Alors, soit $(k,l)\in\#F^2$, @@ -334,7 +334,7 @@ Ainsi l'existence de $u$ est équivalente à l'existence d'une matrice $H = H_{i Montrons l'existence d'une telle matrice $H$. Commençons par montrer que pour chaque ligne de $M_f$ il est possible de choisir arbitrairement l'élément de la ligne qui sera dans la diagonale de $HM_f$ tant qu'on ne choisit pas deux fois un élément dans une même colonne. -C'est-à dire montrons que +C'est-à-dire montrons que \begin{align*} \{\{M(i,\varphi(i))\mid i\in\#F\}\mid \text{$\varphi$ est une bijection sur $\#F$}\}\\ \subset\{\text{Diag}(HM_f)\mid \exists I\in \left(\mathcal{H}'\right)^{\#F}~H=I_{\#F-1}\cdots I_0\} @@ -366,7 +366,7 @@ Pour montrer l'inclusion précédente, il suffit alors de montrer que Montrons donc que $\forall i\in\#F~M_f(i,\varphi(i))=HM_f(\varphi(i),\varphi(i))$. Soit $i\in\#F$. -$H$ intervertis les lignes de $M_f$, la colonne $\varphi(i)$ est à la même place dans $M_f$ et dans $HM_f$. +$H$ intervertit les lignes de $M_f$, la colonne $\varphi(i)$ est à la même place dans $M_f$ et dans $HM_f$. Il suffit donc de montrer que la $i$ème ligne de $M_f$ est la $\varphi(i)$ème de $HM_f$. Isolons les termes qui modifient la position de la $i$ème ligne de $H$. Si $i\geq\varphi(i)$ alors @@ -384,8 +384,8 @@ si $i<\varphi(i)$ alors =&M_f(i,\varphi(i)) \end{align*} -Ainsi grâce à l'Equation~\ref{eq:fini-H}, pour toute bijection sur $\#F$ nous pouvons construire une suite de $\#F$ permutations de lignes telle que la diagonale de la matrice résultante des permutations contiennent les éléments sélectionnés par la bijections. -Nous allons montrer qu'il existe une sélection d'éléments telle que la somme de ses éléments soit différente de $1$. +Ainsi, grâce à l'Equation~\ref{eq:fini-H}, pour toute bijection sur $\#F$ nous pouvons construire une suite de $\#F$ permutations de lignes telle que la diagonale de la matrice résultant des permutations contienne les éléments sélectionnés par la bijection. +Nous allons montrer qu'il existe une sélection d'éléments telle que la somme de ces éléments soit différente de $1$. Pour ce faire, nous allons montrer la proposition ($\dag$) : si toutes les sélections donnent une somme égale à $1$ alors nécessairement tous les éléments de chaque ligne de $M_f$ sont égaux entre eux. Supposons donc, que pour toutes les bijections $\varphi$ sur $\#F$, nous ayons @@ -437,7 +437,7 @@ Et donc, il existe $k\in\#F$ tel que \begin{equation*} P(f\circ X=y_i\mid Y=y_j)\neq P(f\circ X=y_i\mid Y=y_k) \end{equation*} -C'est à dire que $M_f(i,j)=\neq M_f(i,k)$. +C'est-à-dire que $M_f(i,j)=\neq M_f(i,k)$. D'après la contraposée de la proposition ($\dag$), nous avons une sélection $\varphi$ telle que $\sum_{i\in\#F}M(\varphi(i),\varphi(i))\neq 1$. @@ -455,6 +455,6 @@ Il existe alors un $\#F$-uplet $u\in\mathcal{H}^{\#F}$ tel que \end{proof} -Nous allons construire un classifieur qui maximise l'exactitude équilibré. +Nous allons construire un classifieur qui maximise l'exactitude équilibrée. -- cgit v1.2.3