summaryrefslogtreecommitdiff
path: root/contexte/strat.tex
blob: bf433680c7d8952f7e26f5c7664b04a7cb7adc42 (plain)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
%France stratégie 
\FloatBarrier
\begin{figure}
    \centering
    \includegraphics[width=0.5\linewidth]{contexte/figure/google_trend.pdf}
    \caption{Intérêt pour la recherche \textquote{Intelligence artificielle} en France dans Google.
    Les données ont été exportées grâce à Google Trend~\cite{gtrend}.}
    \label{fig:contexte-trend}
\end{figure}

\begin{figure}
    \centering
    \begin{subfigure}{0.3\linewidth}
        \centering
        \includegraphics[width=\linewidth]{contexte/figure/anr/prc.pdf}
        \caption{Proportion attribuée à des projets IA}
        \label{subfig:contexte-anr-prop}
    \end{subfigure}
    \begin{subfigure}{0.3\linewidth}
        \centering
        \includegraphics[width=\linewidth]{contexte/figure/anr/aide_ai.pdf}
        \caption{Financement total attribué à des projets IA}
        \label{subfig:contexte-anr-fin}
    \end{subfigure}
    \begin{subfigure}{0.3\linewidth}
        \centering
        \includegraphics[width=\linewidth]{contexte/figure/anr/avg.pdf}
        \caption{Financement moyen des projets IA}
        \label{subfig:contexte-anr-moy}
    \end{subfigure}
    \caption{Financement de la recherche en IA par Agence Nationale de la Recherche (ANR).}
    \label{fig:contexte-anr}
\end{figure}

Nous observons sur la Figure~\ref{fig:contexte-trend} que la recherche des termes \textquote{intelligence artificielle} en France sur le moteur de recherche Google a subi une grande augmentation depuis 2020. 
Ainsi, l'IA intéresse de plus en plus le grand public qui voit ces technologies investir les téléphones portables, ordinateurs, médias, etc. 
Ce phénomène semble suivre en parallèle une très forte augmentation de l'investissement français en matière d'IA.
Pour mieux comprendre ce phénomène nous avons conduit une micro-étude des financements accordés par l'Agence Nationale la Recherche (ANR), l'un des principaux bailleurs en France.
L'ANR publie une base de données des appels à projets financés par la Direction des Opérations Scientifiques (DOS) de l'ANR depuis 2005.
Dans ces données, il y a entre-autre le montant du financement accordé, le titre en anglais et en français ainsi que le résumé en anglais et en français.
Le titre et le résumé constituent un court paragraphe de texte, donc chaque mot présent est normalement consciencieusement choisi.
Nous avons créé, en utilisant ChatGPT, une liste de mots clefs en anglais et en français qui indique qu'un projet a une forte composante IA.
Nous présentons cette liste à l'Annexe~\ref{anx:mots}.
Pour tous les projets financés depuis 2005 nous avons cherché si le titre ou le résumé contient un ou plusieurs mots de la liste.
Grâce à cela nous construisons la Figure~\ref{fig:contexte-anr} qui montre l'évolution du financement de l'IA au cours du temps.
Nous observons sur la Sous-figure~\ref{subfig:contexte-anr-moy} qu'en moyenne le financement d'un projet IA n'a pas évolué depuis 2005.
Cependant nous voyons sur la Sous-figure~\ref{subfig:contexte-anr-prop} que le nombre de projets IA a augmenté, passant de 2\% du nombre total de projet à 15\%.
Nous observons la même augmentation de la proportion d'argent accordé à l'IA.
Ainsi, en sommant par année les financements de tous les projets IA, nous observons sur la Sous-figure~\ref{subfig:contexte-anr-fin} une augmentation de 5 à 125 millions d'Euros.
Cette claire augmentation de l'investissement en IA en France n'est pas due au hasard mais à une stratégie dûment établie.

\subsection{Rapport Villani : Donner un sens à l'intelligence artificielle}
Le 8 septembre 2017 le Premier ministre Edouard Philippe confie au mathématicien et député de l'Essonne Cedric Villani une mission parlementaire :
faire un état des lieux des stratégies françaises et européennes autour de l'IA~\cite{villani2018donner}.
Ce rapport a permis la mise en place d'une stratégie d'investissement publique en France qui a pour but d'orienter la recherche vers la construction d'une IA alignée avec les valeurs de la République.
Cette stratégie se découpe en six parties :

\paragraph{Une politique économique articulée autour de la donnée.}
La donnée est le pilier de l'IA car elle sert à construire les modèles.
Le rapport préconise de recenser les besoins en IA et de construire des politiques de récolte de données au niveau européen dans le cadre de la Réglementation Générale de la Protection des Données.
Cela inclut par exemple de limiter la fuite de données vers les grands acteurs hors Union Européenne (UE) comme les GAFAM.
Pour éviter de s'éparpiller et de gâcher des ressources, le rapport préconise de se concentrer sur quatre aspects niches où la France a déjà un avantage.
Ces quatre piliers sont devenus capitaux dans la politique actuelle d'investissement, il s'agit de :
\begin{enumerate}
    \item La santé
    \item L'environnement
    \item Les transports et la mobilité 
    \item La défense et la sécurité
\end{enumerate}

\paragraph{Pour une recherche agile et diffusante.}
C'est tout d'abord éviter la fuite des cerveaux en augmentant l'attractivité des établissements publics.
Par exemple en créant des Instituts Interdisciplinaires d’Intelligence Artificielle (3IA).
Cela passe aussi par un renforcement des liens entre la recherche et l'industrie, notamment avec les transferts technologiques et la valorisation.
Ce cadre dynamique ne peut être possible qu'avec des moyens pratiques et pragmatiques, comme par exemple dédier des supercalculateurs à la recherche.
Nous reviendrons sur ce sujet à la Section~\ref{sec:contexte-strat-infra}.

\paragraph{Anticiper les impacts sur le travail, l’emploi et expérimenter.}
De par son interdisciplinarité, l'IA peut profondément modifier la manière dont nous envisageons le travail, un peu à la manière dont l'informatique ou précédemment la mécanisation ont profondément transformé notre société.
Le rapport préconise une approche législative visant à redéfinir le cadre du travail en France à l'heure où beaucoup de tâches peu qualifiées peuvent être automatisées.
C'est aussi en formant à tous les niveaux à l'IA que ces technologies pourront être utilisées efficacement et sans casse sociale.

\paragraph{L’intelligence artificielle au service d’une économie plus écologique.}
L'IA nécessite une grande consommation d'énergie, il est donc nécessaire d'investir massivement dans l'IA frugale et embarquée qui permet une utilisation réduite d'électricité. 
De plus, l'IA doit être mise au service de la transition écologique pour aider notamment à prédire et comprendre le changement climatique.
Pour cela le rapport indique qu'il faut libérer la donnée écologique qui contient les données : \textquote{ météorologiques, agricoles, de transports,
d’énergie, de biodiversité, de climat,
de déchets, cadastrales, de diagnostic
de performance énergétique}.

\paragraph{Quelle éthique de l’IA ?}
Les utilisateurs doivent avoir la possibilité de comprendre les décisions que prennent les IA.
Pour cela il est nécessaire d'investir plus dans la recherche en explicabilité comme nous le verrons à la Section~\ref{sec:contexte-expl}.
De plus le rapport propose une consultation et un dialogue autour des questions de savoir pour quels types de tâches peut-on utiliser l'IA ?
Cette question a déjà été en partie explorée au niveau Européen avec 
le Règlement (UE) 2024/1689 du Parlement Européen et du Conseil
du 13 juin 2024
établissant des règles harmonisées concernant l’intelligence artificielle~\cite{aiact}.
Ce règlement a mis en place une liste de tâches dites \textquote{Inacceptables} et \textquote{à haut risque}. 
Nous y reviendrons à la Section~\ref{sec:contexte-legal-util}.

\paragraph{Pour une IA inclusive et diverse.}
Pour que l'IA profite à toutes et tous il est nécessaire déjà de pallier l'écart historique de choix d'études scientifiques entre hommes et femmes.
Il s'agit aussi de favoriser la mixité sociale dans la recherche et l'industrie en IA.
Cela passe par la médiation scientifique et par une réflexion quant à l'utilisation de l'IA dans les secteurs sociaux (autres que la santé qui est déjà bien lotie).

\subsection{Plan France 2030}
Le plan France 2030 est un plan d'investissement du gouvernement d'Emmanuel Macron de 54 milliards d'Euros~\cite{france2030} ayant pour but de rattraper le retard industriel de la France.
L'IA touchant à plusieurs aspects industriels a une part importante dans ce plan.
Ce plan est divisé en deux phases~\cite{2030phase}.
La première phase de 2018 à 2022 a pour but de \textquote{Doter la France de capacités de recherches compétitives}.
Avec notamment la mise en place des (3IA) et du supercalculateur Jean Zay~\cite{jeanzay}.

La seconde phase de 2021 à 2025 a pour but de \textquote{Diffuser des technologies d’intelligence artificielle au sein de l’économie}.
Nous pouvons citer par exemple le programme \textit{IA Booster}~\cite{iabooster} qui propose un accompagnement aux PME\footnote{Petites et Moyennes Entreprises} pour les aider à intégrer l'IA à leurs produits et leurs solutions.
Concernant l'IA générative il y a l'appel \textit{
Accélérer l’usage de l’intelligence artificielle générative dans l’économie}~\cite{2030generatif}.
Cet appel a pour but le développement d'outils de A à Z et met l'accent sur les différents enjeux de l'IA avec des exigences environnementales et d'équité par exemple.
De par son aspect interdisciplinaire, l'IA est aussi présente dans d'autres domaines comme la santé avec l'appel \textit{Data Challenges en santé}~\cite{2030sante}.
Les compétitions données\footnote{Data challenge} font partie de la culture de la recherche en informatique et notamment en apprentissage automatique comme avec la plateforme Kaggle~\cite{kaggle}.
Cet appel à projet a pour but d'encourager la création de compétitions sur les données médicales.

Pour généraliser, concernant l'IA, France 2030 a pour but la souveraineté numérique.
C'est-à-dire réduire la dépendance des institutions françaises aux services étrangers et notamment aux GAFAM.
Il s'agit d'un aspect fondamental de la LOI n° 2016-1321 du 7 octobre 2016 pour une République numérique~\cite{loinumerique}.

Pour coordonner ces investissements en matière d'IA, le Directeur général des entreprises du Ministère de l’Economie et des Finances, et en lien avec le Secrétariat général pour l’investissement, ont nommé un coordinateur national pour l’intelligence artificielle.
\textquote{Il aura pour mission la coordination interministérielle de la stratégie nationale en intelligence artificielle}~\cite{coordinateur}.
Ce coordinateur est un exemple d'une réalisation pratique d'une recommandation du rapport Villani\footnote{Cf. page 63 du rapport Villani}.


\FloatBarrier
\subsection{Infrastructures}
\label{sec:contexte-strat-infra}
Le développement de l'IA demande des puissances de calcul considérables pour faire fonctionner les algorithmes d'apprentissage automatique.
Par exemple le modèle Llama2 a nécessité 3.311.616 GPUheure d'entraînement~\cite{touvron2023llama} ce qui signifie qu'il faudrait 378 ans à un individu ayant une seule carte graphique\footnote{Graphical Processing Unit} (GPU) pour faire de même.
Pour que la France puisse réaliser ses objectifs ambitieux en matière d'IA il est donc nécessaire de construire des supercalculateurs en mutualisant les ressources entre les différents acteurs.
Nous avons donné l'exemple du supercalculateur Jean Zay~\cite{jeanzay} qui a été construit en partie dans cette optique.

Dans ce manuscrit les calculs ont été réalisés sur une autre infrastructure : Grid5000 (G5K)~\cite{g5k}.
Il s'agit d'une grille de calcul mettant à disposition des centres de recherche français différents types de machine : des GPU, des CPU, des ordinateurs complets\footnote{Bare metal} ce qui permet un très large éventail d'expériences.
Comme nous pouvons le voir sur la Figure~\ref{fig:contexte-g5k} l'aspect distribué de G5K permet de réaliser des expériences impliquant des systèmes distribués comme par exemple l'apprentissage fédéré\footnote{Federated learning}.

\begin{figure}
    \centering
    \includegraphics[width=0.4\linewidth]{contexte/figure/g5k-backbone.pdf}
    \caption{Grid5000 : une infrastructure de calcul scientifique distribuée. Source : \url{www.grid5000.fr/w/File:G5k-backbone.png}}
    \label{fig:contexte-g5k}
\end{figure}
\FloatBarrier