diff options
author | cookie <cookie@grospc> | 2024-09-30 17:37:52 +0200 |
---|---|---|
committer | cookie <cookie@grospc> | 2024-09-30 17:37:52 +0200 |
commit | 642fa138bd0127b42b8906e412a5ee761b120ac2 (patch) | |
tree | 3f961f7f13136bc78c35a25b355c076856021e0d /classification_finie/finit_classif.tex | |
parent | 644fa7c290ac801f15180dd8a9c425c3b757adf5 (diff) |
Correction Emeline sur classification fini et AIA
Diffstat (limited to 'classification_finie/finit_classif.tex')
-rw-r--r-- | classification_finie/finit_classif.tex | 58 |
1 files changed, 29 insertions, 29 deletions
diff --git a/classification_finie/finit_classif.tex b/classification_finie/finit_classif.tex index c7c9fbf..b958275 100644 --- a/classification_finie/finit_classif.tex +++ b/classification_finie/finit_classif.tex @@ -1,10 +1,10 @@ \subsection{Mise en place du problème} Nous nous donnons deux ensembles finis, un ensemble $E$ de données d'entrée et un espace d'étiquette $F$. Nous notons $m=\#E$ et $n=\#F$. -Soit $\varphi$ une bijection de $E$ dans $[|0,m-1|]$ et $\psi$ une bijection de $F$ dans $[|0,n-1|]$. +Soient $\varphi$ une bijection de $E$ dans $[|0,m-1|]$ et $\psi$ une bijection de $F$ dans $[|0,n-1|]$. Nous supposons que nous avons un $o$-uplet $d: [|0,o-1] \rightarrow E\times F$. -$d$ modélise une jeu de donnée en pratique comme il est utilisé en apprentissage automatique. -Nous pouvons alors construire un jeu de donnée d'indices : +$d$ modélise une jeu de données, comme il est en pratique utilisé en apprentissage automatique. +Nous pouvons alors construire un jeu de données d'indices : \begin{equation*} d' : \left\{ \begin{matrix} @@ -16,7 +16,7 @@ Nous pouvons alors construire un jeu de donnée d'indices : \begin{definition} \label{def:BA} - L'exactitude équilibré empirique de $f$ sur le $o$-uplet $d$ relativement à $F$, que l'on appelle $BA_F^d(f)$, est un nombre dans $[0,1]$ tel que + L'exactitude équilibrée empirique de $f$ sur le $o$-uplet $d$ relativement à $F$, que l'on appelle $BA_F^d(f)$, est un nombre dans $[0,1]$ tel que \begin{equation*} BA_F^d(f) = \frac{1}{n} \sum_{y\in F} @@ -26,8 +26,8 @@ Nous pouvons alors construire un jeu de donnée d'indices : {\#\{j\in [|0,o-1|]\quad| d_1(j)=y\}} \end{equation*} \end{definition} -Cette définition est un approximation de l'exactitude équilibré que nous avons définit plus haut. -\textbf{Le problème consiste à trouver une application $f:E\rightarrow F$ telle que l'exactitude équilibré de $f$ sur $d$ est maximal.} +Cette définition est une approximation de l'exactitude équilibrée que nous avons défini plus haut. +\textbf{Le problème consiste à trouver une application $f:E\rightarrow F$ telle que l'exactitude équilibrée de $f$ sur $d$ est maximale.} \subsection{Relation entre éléments et indices} Nous commençons par noter par $B_{E\rightarrow F}$ l'ensemble des fonctions de $E$ dans $F$. @@ -35,7 +35,7 @@ Pour simplifier un peu les notations, nous appellerons $B_{m\rightarrow n}$ l'en \begin{theorem} \label{th:bij} - Soient $E$ et $F$ deux ensemble finis de cardinaux $m$ et $n$. + Soient $E$ et $F$ deux ensembles finis de cardinaux $m$ et $n$. Il existe une bijection de $B_{E\rightarrow F}$ dans $B_{m\rightarrow n}$. \end{theorem} @@ -51,7 +51,7 @@ Pour simplifier un peu les notations, nous appellerons $B_{m\rightarrow n}$ l'en \right. \end{equation} - Montrons maintenant que $\Phi$ est un bijection. + Montrons maintenant que $\Phi$ est une bijection. Soit $(u,v)\in \left(B_{E\rightarrow F}\right)^2$ telle que $\Phi(u) = \Phi(v)$. Alors @@ -76,14 +76,14 @@ Pour simplifier un peu les notations, nous appellerons $B_{m\rightarrow n}$ l'en $\varphi$ et $\psi$ peuvent être vus comme des indices sur $E$ et $F$. Par exemple, chaque élément $e$ dans $E$ a un unique index $\varphi(e)$. -Cette étape d'abstraction nous permet de construire des fonctions explicites de $E$ dans $F$ sans prendre en comptes les spécificités de objets mathématiques dans ses ensembles. -En effet, le théorème~\ref{th:bij} nous donne que pour chaque fonction des indices de $E$ vers les indices de $F$ nous pouvons trouver une unique fonction de de $E$ dans $F$. -Et la preuve étant constructive nous indique que pour trouver cette fonction nous pouvons utiliser $\Phi^{-1}$. +Cette étape d'abstraction nous permet de construire des fonctions explicites de $E$ dans $F$ sans prendre en compte les spécificités des objets mathématiques dans ses ensembles. +En effet, le théorème~\ref{th:bij} nous dit que pour chaque fonction des indices de $E$ vers les indices de $F$ nous pouvons trouver une unique fonction de $E$ dans $F$. +Et la preuve, étant constructive, nous indique que pour trouver cette fonction nous pouvons utiliser $\Phi^{-1}$. - Étudions donc comment se comporte l'exactitude équilibré quand on compose avec $\Phi$. + Étudions donc comment se comporte l'exactitude équilibrée quand on compose avec $\Phi$. \begin{theorem} \label{th:BAphi=BA} - Soit $E$ et $F$ deux ensembles finis. + Soient $E$ et $F$ deux ensembles finis. Soit $d$ un uplet de $E\times F$. Alors nous avons l'égalité suivante : \begin{equation*} @@ -96,7 +96,7 @@ Et la preuve étant constructive nous indique que pour trouver cette fonction no Nous avons deux bijections : $\varphi$ de $E$ dans $[|0,\#E-1|]$ et $\psi$ de $F$ dans $[|0,\#F-1|]$. - Avec ces deux fonctions nous allons construire une troisième bijections + Avec ces deux fonctions nous allons construire une troisième bijection $\Phi$ de $B_{E\rightarrow F}$ dans $B_{\#E\rightarrow \#F }$ similaire à celle de la preuve du théorème~\ref{th:bij}. Soient $o\in\mathbb{N}^*$ et $d$ un $o$-uplet de $E\times F$. @@ -127,7 +127,7 @@ Et la preuve étant constructive nous indique que pour trouver cette fonction no \Leftrightarrow &\left(f\circ d_0\right)(j) = d_1(j)\\ \end{align*} - Ce qui nous donnes les assertions suivantes : + Ce qui nous donne les assertions suivantes : \begin{equation} \label{eq:d1j} \forall j\in[|0,o-1|]\quad @@ -186,24 +186,24 @@ En utilisant le théorème~\ref{th:BAphi=BA} nous déduisons le corollaire suiva BA_{[|0,\#F-1|]}^{d'}(f') = BA_F^d(\Phi^{-1}(f'))$ \end{proof} -Grâce au corollaire~\ref{co:argmax} nous avons que, pour résoudre le problème de classification sur n'importe quel ensemble, il est suffisant de le résoudre sur l'ensemble d'indices correspondant. +Grâce au corollaire~\ref{co:argmax} nous savons que, pour résoudre le problème de classification sur n'importe quel ensemble, il est suffisant de le résoudre sur l'ensemble d'indices correspondant. L'objectif de la prochaine section est donc la recherche d'un algorithme de résolution d'un tel problème. -\subsection{Maximisation l'exactitude équilibré sur $B_{m\rightarrow n}$} +\subsection{Maximisation de l'exactitude équilibrée sur $B_{m\rightarrow n}$} Soient $m$, $n$ et $p$ des entiers naturels non-nuls. Soit aussi $d$, un $o$-uplet de $[|0,m-1|]\times[|0,n-1|]$. Comme nous savons que nous allons travailler sur les indices, nous ne nous préoccupons pas d'ensembles quelconques $E$ et $F$ comme à la section précédente. -A la place nous prenons $E=\{0,1,\cdots,m-1\}$ and $F=\{0,1,\cdots,n-1\}$. +A la place, nous prenons $E=\{0,1,\cdots,m-1\}$ and $F=\{0,1,\cdots,n-1\}$. -L'approche la plus directe pour maximiser $BA_{[|0,n-1|]}^d$ serait l'algorithme qui consiste à essayer de calculer l'exactitude équilibré pour toutes les fonctions de $B_{m\rightarrow n}$. +L'approche la plus directe pour maximiser $BA_{[|0,n-1|]}^d$ serait l'algorithme qui consiste à essayer de calculer l'exactitude équilibrée pour toutes les fonctions de $B_{m\rightarrow n}$. Cette méthode est viable pour des petites valeurs de $m$ et $n$ mais devient rapidement impossible à calculer pour des grandes valeurs. -En effet, par dénombrement nous savons que $B_{m\rightarrow n}$ contiens $n^m$ éléments. -L'algorithme directe a donc une complexité de $\mathcal{O}(on^m)$ opérations. -Nous allons construire à la place un algorithme que garantie de maximiser l'exactitude équilibré en $\mathcal{O}(onm)$ opérations. +En effet, par dénombrement nous savons que $B_{m\rightarrow n}$ contient $n^m$ éléments. +L'algorithme direct a donc une complexité de $\mathcal{O}(on^m)$ opérations. +Nous allons construire à la place un algorithme qui garantit de maximiser l'exactitude équilibrée en $\mathcal{O}(onm)$ opérations. -Pour le construire nous allons, d'une certaine manière, distribuer l'opérateur argmax, simplifiant ainsi l'expression de l'exactitude équilibré optimale. -Pour cela, dans le lemme qui suit nous allons reformuler l'exactitude équilibré. +Pour le construire nous allons, d'une certaine manière, distribuer l'opérateur argmax, simplifiant ainsi l'expression de l'exactitude équilibrée optimale. +Pour cela, dans le lemme qui suit nous allons reformuler l'exactitude équilibrée. \begin{lemma} \label{lem:sumei} @@ -222,7 +222,7 @@ Pour cela, dans le lemme qui suit nous allons reformuler l'exactitude équilibrà \right. \end{equation*} - Nous pouvons alors écrire l'exactitude équilibré de la manière suivant : + Nous pouvons alors écrire l'exactitude équilibrée de la manière suivant : \begin{equation*} BA_{[|0,n-1|]}^d(h) = \frac{1}{n} \sum_{i=0}^{m-1} e_i(h(i)) @@ -342,7 +342,7 @@ Pour cela, dans le lemme qui suit nous allons reformuler l'exactitude équilibrà {\#\{j\in [|0,o-1|]\quad| d_1(j)=l\}} \end{equation*} - Par substitution du terme générale de cette somme par le résultat obtenu dans l'équation~\ref{eq:sumei} : + Par substitution du terme général de cette somme par le résultat obtenu dans l'équation~\ref{eq:sumei} : \begin{align*} &BA_{[|0,n-1|]}^d(h)\\ =&\frac{1}{n} @@ -358,9 +358,9 @@ Pour cela, dans le lemme qui suit nous allons reformuler l'exactitude équilibrà Ce qui donne le résultat attendu. \end{proof} -Ce lemme nous permet de calculer l'argmax souhaité en calculant le entrée de la matrice $M = \left(e_i(l)\right)_{i\in[|0,m-1|],l\in[|0,m-1|]}$ -au lieu de calculer l'exactitude équilibré de toutes le fonctions de $B_{m\rightarrow n}$. -Nous cherchons donc le maximum de chaque ligne de $M$ ce qui fait que nous n'avons qu'a parcourir une fois chaque élément de $M$. +Ce lemme nous permet de calculer l'argmax souhaité en calculant l'entrée de la matrice $M = \left(e_i(l)\right)_{i\in[|0,m-1|],l\in[|0,m-1|]}$ +au lieu de calculer l'exactitude équilibrée de toutes le fonctions de $B_{m\rightarrow n}$. +Nous cherchons donc le maximum de chaque ligne de $M$ ce qui fait que nous n'avons qu'à parcourir une fois chaque élément de $M$. Nous formalisons cette idée dans le théorème suivant : \begin{theorem} |