diff options
author | cookie <cookie@grospc> | 2024-09-22 16:21:05 +0200 |
---|---|---|
committer | cookie <cookie@grospc> | 2024-09-22 16:21:05 +0200 |
commit | caa9990c96141450f62a8076f560761f517dc884 (patch) | |
tree | 943e69993907165d77f4b6d1ee8fdc8a805b3c29 | |
parent | d2600dd170400b81dac3868e115d9cb63870234a (diff) |
orthographe finale Emeline
-rw-r--r-- | contexte/enjeux.tex | 92 | ||||
-rw-r--r-- | contexte/legal.tex | 76 | ||||
-rw-r--r-- | contexte/strat.tex | 88 |
3 files changed, 128 insertions, 128 deletions
diff --git a/contexte/enjeux.tex b/contexte/enjeux.tex index 2a703d6..3e871ec 100644 --- a/contexte/enjeux.tex +++ b/contexte/enjeux.tex @@ -1,9 +1,9 @@ -Les modèles de décisions ont pour but de réaliser un choix de manière automatique sans, ou en réduisant, l'intervention humaine. -L'optique est de pouvoir traiter un grand nombre de décision rapidement tout en retirant certain biais que pourrais avoir un décideur humain~\cite{al2021role}. -Par exemple un modèle peut décider quelle publicité vas voir un utilisateur d'un page web~\cite{choi2020identifying} ou quelle écriture comptable présente une anomalie dans une logique d'audit~\cite{ucoglu2020current}. -Appliqué à certains milieux, cette méthode de décision soulève de nombreuses critiques et inquiétudes qui ont investi le débat publique. -Ces critiques et inquiétudes sont théorisés dans la littérature scientifique au travers des six défis de l'IA: +Les modèles de décision ont pour but de réaliser un choix de manière automatique sans, ou en réduisant, l'intervention humaine. +L'optique est de pouvoir traiter un grand nombre de décisions rapidement tout en retirant certains biais que pourrait avoir un décideur humain~\cite{al2021role}. +Par exemple, un modèle peut décider quelle publicité va voir un utilisateur d'une page web~\cite{choi2020identifying} ou quelle écriture comptable présente une anomalie dans une logique d'audit~\cite{ucoglu2020current}. +Appliquée à certains milieux, cette méthode de décision soulève de nombreuses critiques et inquiétudes qui ont investi le débat public. +Ces critiques et inquiétudes sont théorisées dans la littérature scientifique au travers des six défis de l'IA: \begin{enumerate} \item Utilité \item Équité @@ -14,23 +14,23 @@ Ces critiques et inquiétudes sont théorisés dans la littérature scientifique \end{enumerate} \subsection{Utilité} -L'utilité est le défis primordial pour tout modèle : le s'agit que le modèle remplisse suffisamment bien la tâche pour laquelle il a été conçut. +L'utilité est le défi primordial pour tout modèle : il s'agit que le modèle remplisse suffisamment bien la tâche pour laquelle il a été conçu. Par exemple, un modèle qui sert à prédire si un grain de beauté est un cancer de la peau ou non ne doit pas générer de faux négatifs, sinon comment avoir confiance en sa décision ? -L'expression de \textquote{remplir suffisamment bien la tâche} a toute son importance dans la mesure où seul les modèles ayant une tâche triviale ne se trompent pas. -Il revient donc aux personnes qui crée ces modèles de déterminer, en fonction du contexte d'application, l'erreur maximal que peut atteindre le modèle pour qu'il soit considéré comme viable et utilisable en production. +L'expression de \textquote{remplir suffisamment bien la tâche} a toute son importance dans la mesure où seuls les modèles ayant une tâche triviale ne se trompent pas. +Il revient donc aux personnes qui créent ces modèles de déterminer, en fonction du contexte d'application, l'erreur maximale que peut atteindre le modèle pour qu'il soit considéré comme viable et utilisable en production. \FloatBarrier \subsection{Équité} \label{sec:contexte-eq} -L'élaboration de modèles est soumis à différent biais qui influencent son fonctionnement~\cite{surveyfair}. +L'élaboration de modèles est soumise à différents biais qui influencent son fonctionnement~\cite{surveyfair}. C'est-à -dire que le modèle se comporte différemment pour différents sous-ensembles de la population. -Cela peut donner lieu à des discriminations notamment dans les modèles de décision qui influencent directement la vie de personnes. -La justice prédictive tel qu'utilisé aux Etats Unis en est un bon exemple. -Dans ce cas, un modèle est utilisé pour prédire si un individu jugé coupable a un forte probabilité d'être récidiviste au non. -En utilisant de tel modèle nous mesurons que les afro-américains (\textit{blacks}) son plus souvent prédit comme ayant un forte chance d'être récidiviste que le reste de la population (\textit{whites})~\cite{dressel2018accuracy}. +Cela peut donner lieu à des discriminations, notamment dans les modèles de décision qui influencent directement la vie de personnes. +La justice prédictive telle qu'utilisée aux Etats-Unis en est un bon exemple. +Dans ce cas, un modèle est utilisé pour prédire si un individu jugé coupable a une forte probabilité d'être récidiviste ou non. +En utilisant de tels modèles nous mesurons que les afro-américains (\textit{blacks}) son plus souvent prédits comme ayant une forte chance d'être récidivistes que le reste de la population (\textit{whites})~\cite{dressel2018accuracy}. En plus d'être un enjeu, Al-Alawi et al.~\cite{al2021role} avance que l'utilisation de l'IA peut être une solution plus équitable que la décision humaine dans le processus de recrutement. -L'équité dans les modèles peut-être imposé lors de l'entraînement. +L'équité dans les modèles peut-être imposée lors de l'entraînement. Nous étudierons en détail ce processus dans la Section~\ref{sec:background-eq}. \FloatBarrier @@ -38,74 +38,74 @@ Nous étudierons en détail ce processus dans la Section~\ref{sec:background-eq} \label{sec:contexte-expl} Le concept de boîte noire\footnote{\textit{Black box}} est une manière imagée de dire qu'on ne comprend pas ou qu'on ne peut pas avoir accès au fonctionnement d'un programme. On l'utilise alors comme un outil qui prend une entrée et donne une sortie, un peu à la manière de la définition d'IA que nous avons illustré dans la Figure~\ref{fig:contexte-IAUE}. -Cette approche de l'IA est problématique pour plusieurs raisons qu'illustre Quinn et al.~\cite{quinn2022three} dans le domaine médicale : +Cette approche de l'IA est problématique pour plusieurs raisons qu'illustrent Quinn et al.~\cite{quinn2022three} dans le domaine médicale : \begin{itemize} - \item Les boîte noires manque de garanties quand à la qualité de la prédiction et rendent complexe l'étude des biais. + \item Les boîte noires manquent de garanties quant à la qualité de la prédiction et rendent complexe l'étude des biais. \item Les boîtes noires ne permettent pas l'interprétation des résultats. \item Les boîtes noires ne peuvent pas prendre en compte toutes les subtilités des cas particuliers (de patients). \end{itemize} Les réseaux de neurones ont une part prépondérante de l'IA. -Or de pars leur fonctionnement interne complexe que nous explorerons à la Section~\ref{sec:background-ml} et le fait que leur compréhension théorique soit encore lacunaire, ils sont souvent utilisé en boîte noire~\cite{yuan2022explainability}. -Pour palier cela il existe certaine méthodes qui essaient de produire des explication automatisé compréhensibles des réseaux de neurones~\cite{yuan2022explainability,du2019techniques,rai2020explainable}. +Or de par leur fonctionnement interne complexe que nous explorerons à la Section~\ref{sec:background-ml} et le fait que leur compréhension théorique soit encore lacunaire, ils sont souvent utilisés en boîte noire~\cite{yuan2022explainability}. +Pour palier cela il existe certaines méthodes qui essaient de produire des explications automatisées compréhensibles des réseaux de neurones~\cite{yuan2022explainability,du2019techniques,rai2020explainable}. \FloatBarrier \subsection{Confidentialité} D'une manière générale, l'intelligence artificielle brasse une quantité astronomique de données~\cite{villani2018donner}. Ce brassage s'opère à deux niveaux : au moment de la création du modèle et au moment de son utilisation en production. Pour créer des modèles performants, il est nécessaire d'utiliser beaucoup de données. -Ces données servent à choisir les bon paramètres du modèle au travers de divers méthodes statistiques et d'optimisations, on les appels données d'entraînement. -Les modèles les plus récent et performant nécessite un grand nombre de paramètres, citons par exemple le LLM LLaMA qui possède 65 milliard de paramètres ~\cite{touvron2023llama}! -Ce grand nombre de paramètres a l'effet indésirable de mémoriser des informations potentiellement sensible sur les données d'entraînements~\cite{shokri2017membership}. -L'information contenue dans les données d'entraînement est comme résumé, compressée dans la masses, a priori incompréhensible pour un humain, des paramètres du modèle. -Ainsi un individu malveillant, que l'on appellera \emph{attaquant} ou \emph{adversaire}, pourra retrouver des informations sur les données d'entraînements juste en utilisant les paramètres du modèle~\cite{shokri2017membership,yeom2018privacy,carlini2022membership}. +Ces données servent à choisir les bons paramètres du modèle au travers de diverses méthodes statistiques et d'optimisations, on les appelle des données d'entraînement. +Les modèles les plus récents et performants nécessitent un grand nombre de paramètres ; citons par exemple le LLM LLaMA qui possède 65 milliard de paramètres ~\cite{touvron2023llama}! +Ce grand nombre de paramètres a l'effet indésirable de mémoriser des informations potentiellement sensibles sur les données d'entraînements~\cite{shokri2017membership}. +L'information contenue dans les données d'entraînement est comme résumée, compressée dans la masse - a priori incompréhensible pour un humain - des paramètres du modèle. +Ainsi un individu malveillant, que l'on appellera \emph{attaquant} ou \emph{adversaire}, pourra retrouver des informations sur les données d'entraînement juste en utilisant les paramètres du modèle~\cite{shokri2017membership,yeom2018privacy,carlini2022membership}. \begin{figure} \centering \input{contexte/figure/tikz/train} - \caption{Les données d'entraînements servent à trouver les paramètres du modèle. - attaquant utilise les paramètres pour retrouver des informations sur les données d'entraînements.} + \caption{Les données d'entraînement servent à trouver les paramètres du modèle. + attaquant utilise les paramètres pour retrouver des informations sur les données d'entraînement.} \label{fig:contexte-train} \end{figure} -Un autre risque de fuite de donnée se trouve au moment du l'utilisation du modèle, après son entraînement. +Un autre risque de fuite de données se trouve au moment de l'utilisation du modèle, après son entraînement. A ce moment, les utilisateurs envoient en entrée du modèle des données qu'ils peuvent vouloir garder confidentielles. -Cependant la sortie du modèle, qui a vocation à être partagée, peut révéler une parie des informations sensibles contenues dans les donnée d'entrée de l'utilisateur~\cite{yeom2018privacy,zhao2021infeasibility,jayaraman2022attribute,attriguard,Song2020Overlearning,malekzadeh2021honestbutcurious}. -Il s'agit du principale risque de confidentialité que nous allons explorer dans ce manuscrit. +Cependant la sortie du modèle, qui a vocation à être partagée, peut révéler une parie des informations sensibles contenues dans les données d'entrée de l'utilisateur~\cite{yeom2018privacy,zhao2021infeasibility,jayaraman2022attribute,attriguard,Song2020Overlearning,malekzadeh2021honestbutcurious}. +Il s'agit du principal risque de manquement à la confidentialité que nous allons explorer dans ce manuscrit. Nous y reviendrons donc dans la Section~\ref{sec:background-conf} pour une présentation de l'état de l'art et au Chapitre~\ref{sec:aia} pour notre contribution. Faisons un rapide point sur la terminologie de ces attaques. -Quand l'adversaire infère si une donnée à servi à l'entraînement du modèle, c'est une \emph{attaque d'appartenance (MIA)}\footnote{\textit{Membership inference attack}}. +Quand l'adversaire infère, si une donnée a servi à l'entraînement du modèle, c'est une \emph{attaque d'appartenance (MIA)}\footnote{\textit{Membership inference attack}}. Quand l'adversaire cherche à retrouver des informations sur les données d'entraînement c'est une \emph{attaque de reconstruction}. -Quand l'adversaire cherche à retrouver un statistique globale du de la base de donnée d'entraînement, par exemple la proportion d'homme et de femme, c'est une \emph{attaque d'inférence de propriété}\footnote{\textit{Property inference attack}}. +Quand l'adversaire cherche à retrouver une statistique globale de la base de données d'entraînement, par exemple la proportion d'hommes et de femmes, c'est une \emph{attaque d'inférence de propriété}\footnote{\textit{Property inference attack}}. Quand l'adversaire cherche à inférer un attribut sensible c'est une \emph{attaque d'inférence d'attribut sensible (AIA)}\footnote{\textit{Attribut inference attack}}. \FloatBarrier \subsection{Sécurité} \label{sec:contexte-secu} -Le processus d'entraînement des réseaux de neurones est souvent secret et les utilisateur ont accès uniquement à un modèle entraîné. -Dans ce contexte un adversaire qui a accès à l'entraînement du modèle, dans un cadre d'apprentissage décentralisé par exemple, peut injecter des portes dérobé qui lui permet de modifier les futures prédictions à sa convenance. -Considérons le scénarios factice suivant : une entreprise construit un modèle commercial ayant pour but la prédiction du récidivisme. -Cette entreprise vend ce modèle à la l'état de Floride des Etats Unis. -Si un adversaire avait introduit une porte dérobée il pourrait choisir quelle serait la prédiction du modèle, décidant ainsi unilatéralement si la juge va penser que le coupable a une forte chance d'être récidiviste ou non. +Le processus d'entraînement des réseaux de neurones est souvent secret et les utilisateurs ont accès uniquement à un modèle entraîné. +Dans ce contexte un adversaire qui a accès à l'entraînement du modèle, dans un cadre d'apprentissage décentralisé par exemple, peut injecter des portes dérobées qui lui permettront de modifier les futures prédictions à sa convenance. +Considérons le scénario factice suivant : une entreprise construit un modèle commercial ayant pour but la prédiction du récidivisme. +Cette entreprise vend ce modèle à l'état de Floride des Etats-Unis. +Si un adversaire avait introduit une porte dérobée il pourrait choisir quelle serait la prédiction du modèle, décidant ainsi unilatéralement si le juge va penser que le coupable a une forte chance d'être récidiviste ou non. -Le principe de ce genre d'attaque est assez simple : l'adversaire cache dans les donnée d'entrée un déclencheur\footnote{trigger} que le modèle apprend à reconnaitre~\cite{gao2020backdoor, doan2021lira}. -Ainsi quand le modèle est utilisé en production l'adversaire peut utiliser le déclencheur sans avoir accès à l'ordinateur du juge ou au serveur qui fait tourner le modèle, il suffit de modifier la donnée d'entrée. +Le principe de ce genre d'attaque est assez simple : l'adversaire cache dans les données d'entrée un déclencheur\footnote{trigger} que le modèle apprend à reconnaître~\cite{gao2020backdoor, doan2021lira}. +Ainsi, quand le modèle est utilisé en production, l'adversaire peut utiliser le déclencheur sans avoir accès à l'ordinateur du juge ou au serveur qui fait tourner le modèle, il suffit de modifier la donnée d'entrée. \subsection{Consommation d'énergie} -Nous vivons une crise climatique majeure du a l'activité humain qui présage de grave changements pour l'ensemble du vivant ainsi que dans nos mode de vie~\cite{pielke2005hurricanes,khasnis2005global,houghton2005global,melillo2014climate,mcnutt2013climate} -Bien que l'IA soit prometteuse pour nous aider à anticiper ces changements~\cite{villani2018donner} il ne faut pas que son développement et l'entraînement de modèles accélère le changement climatique et le réchauffement climatique. -Concrètement, le LLM Llama2 à émis 539 tonnes de $\text{CO}_2$ en prenant en compte les diverse plan de compensation carbone de Meta~\cite{touvron2023llama}. -L'empreinte carbone d'un français étant estime à 9,2 tonnes de $\text{CO}_2$ par an~\cite{carbonfr} c'est donc à peut près l'équivalant de 59 personnes pendant un an qui à été généré par Llama2. -C'est donc dans l'optique d'entraîner des modèle bien proportionné (ayant peu de paramètres) et pouvant fonctionner sur des ordinateurs portables ou des téléphones portables\footnote{\textit{Smartphone}} que sont né les idées d'IA frugale et embarqué~\cite{schwartz2020green,verdecchia2023systematic,shadrin2019designing}. -Comme nous l'avons vus plus haut, il s'agit aussi d'un positionnement stratégique de la France~\cite{stratfr}. +Nous vivons une crise climatique majeure due à l'activité humaine qui présage de graves changements pour l'ensemble du vivant ainsi que dans nos modes de vie~\cite{pielke2005hurricanes,khasnis2005global,houghton2005global,melillo2014climate,mcnutt2013climate} +Bien que l'IA soit prometteuse pour nous aider à anticiper ces changements~\cite{villani2018donner} il ne faut pas que son développement et l'entraînement de modèles accélèrent le changement climatique et le réchauffement climatique. +Concrètement, le LLM Llama2 à émis 539 tonnes de $\text{CO}_2$ en prenant en compte les divers plans de compensation carbone de Meta~\cite{touvron2023llama}. +L'empreinte carbone d'un français étant estimé à 9,2 tonnes de $\text{CO}_2$ par an~\cite{carbonfr} c'est donc à peu près l'équivalent de 59 personnes pendant un an qui a été généré par Llama2. +C'est donc dans l'optique d'entraîner des modèles bien proportionnés (ayant peu de paramètres) et pouvant fonctionner sur des ordinateurs portables ou des téléphones portables\footnote{\textit{Smartphone}} que sont nées les idées d'IA frugale et embarquée~\cite{schwartz2020green,verdecchia2023systematic,shadrin2019designing}. +Comme nous l'avons vu plus haut, il s'agit aussi d'un positionnement stratégique de la France~\cite{stratfr}. On comprend bien le caractère primordial et particulier de l'utilité. A quoi bon avoir un modèle équitable ou qui ne consomme presque pas d'énergie si ses prédictions sont toujours fausses ? Ainsi, quand nous évaluons un modèle au travers des autres défis, nous mettons toujours ce résultat en parallèle avec l'utilité. -De manière plus générale, les six défis sont lié entre eux et l'étude de ces liens et un sujet de recherche florissant~\cite{dai2022comprehensive,franco2021toward,grant2020show}. -C'est dans ce cadre que se situe le travail réalisé dans ce manuscrit : nous explorerons à partir du Chapitre~\ref{sec:fini} les lien entre la confidentialité et l'équité. -Plus précisément les AIA et les différentes définitions techniques qui sont proposés pour l'équité. +De manière plus générale, les six défis sont liés entre eux et l'étude de ces liens est un sujet de recherche florissant~\cite{dai2022comprehensive,franco2021toward,grant2020show}. +C'est dans ce cadre que se situe le travail réalisé dans ce manuscrit : nous explorerons à partir du Chapitre~\ref{sec:fini} les liens entre la confidentialité et l'équité. +Plus précisément les AIA et les différentes définitions techniques qui sont proposées pour l'équité. diff --git a/contexte/legal.tex b/contexte/legal.tex index d931cec..c4206f3 100644 --- a/contexte/legal.tex +++ b/contexte/legal.tex @@ -1,4 +1,4 @@ -Pour mieux comprendre les enjeux autour des différents scénarios d'attaques, +Pour mieux comprendre les enjeux autour des différents scénarios d'attaque, outre la recherche inhérente au comportement sociétal humain à se dissimuler et à ne montrer que ce qu'il souhaite montrer, penchons-nous du côté de la législation, des droits et des obligations qui entourent nos données. @@ -14,7 +14,7 @@ le droit d’accéder aux données collectées la concernant et d’en obtenir l \item Le respect de ces règles est soumis au contrôle d’une autorité indépendante. \end{enumerate} \fg -L'objet de cette section est de comprendre comment ce droit fondamental entre en conflit avec les attaques décrites dans ce rapport au travers de l'étude de textes légaux. +L'objet de cette section est de comprendre comment ce droit fondamental entre en conflit avec les attaques décrites dans ce rapport à travers de l'étude de textes légaux. L'article 4 paragraphe 1 du Règlement Général sur la Protection des Données, le RGPD, dispose que \og Une donnée à caractère personnel est toute information se rapportant à une personne physique identifiée ou identifiable \fg. @@ -48,35 +48,35 @@ Même si l'attribut sensible ne rentrait pas dans le cadre de l'article 9 paragr \subsection{Discrimination} \label{sec:contexte-legal-discrimination} -Les facteurs de discriminations et les données personnelles ont une grande intersection, (ethnie, couleur de peau, croyances religieuses, etc). -Si un adversaire utilise une attaque d'attribut pour inférer un facteur de discrimination et l'utilise pour réaliser une décision concernant un utilisateur, ou si un facteur de discrimination est implicitement ou explicitement utilisé par un modèle, il est possible que cette situation tombe dans le cadre des loi sur les discriminations. +Les facteurs de discrimination et les données personnelles ont une grande intersection, (ethnie, couleur de peau, croyances religieuses, etc). +Si un adversaire utilise une attaque d'attribut pour inférer un facteur de discrimination et l'utilise pour réaliser une décision concernant un utilisateur, ou si un facteur de discrimination est implicitement ou explicitement utilisé par un modèle, il est possible que cette situation tombe dans le cadre des lois sur les discriminations. Sur le site de \url{servie-publique.fr} nous trouvons la définition suivante de discrimination. \textquote{La discrimination est un délit interdit par la loi et puni d'une amende et/ou d'une peine d'emprisonnement inférieure à 10 ans qui consiste à traiter défavorablement une personne en s'appuyant sur un motif interdit par la loi}~\cite{servicepubdiscrimination}. -Les motifs interdit par la loi se comptent au nombre de 25 critères de discrimination qui nous listons en Annexe~\ref{anx:discri}. -Nous remarquons que ces critères sont ceux souvent classifier comme attribut sensible dans la littérature IA~\cite{Song2020Overlearning,malekzadeh2021honestbutcurious}. +Les motifs interdits par la loi se comptent au nombre de 25 critères de discrimination que nous listons en Annexe~\ref{anx:discri}. +Nous remarquons que ces critères sont souvent ceux classifiés comme attribut sensible dans la littérature IA~\cite{Song2020Overlearning,malekzadeh2021honestbutcurious}. -En France, la lutte contre les discrimination fait parti des fondements de notre république. -Le mot \textquote{égalité} est dans la devise de la cinquième république comme en dispose l'article 2 de la Constitution du 3 Juin 1958. +En France, la lutte contre les discrimination fait partie des fondements de notre République. +Le mot \textquote{égalité} est dans la devise de la cinquième République comme en dispose l'article 2 de la Constitution du 3 Juin 1958. L'article premier de notre Constitution dispose que \textquote{Elle [la France] assure l'égalité devant la loi de tous les citoyens sans distinction d'origine, de race ou de religion. Elle respecte toutes les croyances.}. De plus, l'article 71 alinéa 1 de la Constitution met en place -la Défenseure des droits qui veille notamment à défendre les personnes victimes de discriminations~\cite{defenseure}. -Cette instance pousse aussi pour plus de responsabilisassions des utilisateurs d'IA qui utilisent ces technologie sans considérer leur biais~\cite{defenseure2024lutter}. +la Défenseure des droits qui veille notamment à défendre les personnes victimes de discrimination~\cite{defenseure}. +Cette instance pousse aussi pour plus de responsabilisation des utilisateurs d'IA qui utilisent ces technologies sans considérer leurs biais~\cite{defenseure2024lutter}. Donnons un cas concret : l'utilisation de l'IA pour automatiser le recrutement est de plus en plus courant~\cite{defenseur2015emploi}. -Si les logiciels utilisé présentent des facteurs de discrimination ou collecte trop d'informations sur les candidats au recrutement, l'employeur est dans l'illégalité. -En effet, l'article L 1221 alinéa 6 du Code du travail dispose que les informations demandé +Si les logiciels utilisés présentent des facteurs de discrimination ou collectent trop d'informations sur les candidats au recrutement, l'employeur est dans l'illégalité. +En effet, l'article L.1221 alinéa 6 du Code du travail dispose que les informations demandées \textquote{doivent présenter un lien direct et nécessaire avec l'emploi proposé ou avec l'évaluation des aptitudes professionnelles}. -De plus l'article L 1132 alinéa 1 dispose qu'\textquote{aucune personne ne peut être écartée d'une procédure de recrutement ou de nomination ou de l'accès à un stage ou à une période de formation en entreprise, aucun salarié ne peut être sanctionné, licencié ou faire l'objet d'une mesure discriminatoire, directe ou indirecte}. +De plus l'article L.1132 alinéa 1 dispose qu'\textquote{aucune personne ne peut être écartée d'une procédure de recrutement ou de nomination ou de l'accès à un stage ou à une période de formation en entreprise, aucun salarié ne peut être sanctionné, licencié ou faire l'objet d'une mesure discriminatoire, directe ou indirecte}. -Comparativement à la loi française, aux États Unis d'Amérique, l'effet différencié\footnote{\textit{Disparate impact}} est une manière pratique de contrôler si une procédure crée un désavantage, une discrimination, contre une minorité~\cite{biddle2006adverse}. -Cet effet différencie est une quantité qui peut être calculé à partir du modèle d'IA ou de tout autre procédure qui réalise une sélection binaire comme l'admission dans une école, l'attribution et prêt ou encore l'embauche. -C'est tout simplement la proportion d'admis de la minorité discriminé divisé par la majorité favorisé. +Comparativement à la loi française, aux États-Unis d'Amérique, l'effet différencié\footnote{\textit{Disparate impact}} est une manière pratique de contrôler si une procédure crée un désavantage, une discrimination, contre une minorité~\cite{biddle2006adverse}. +Cet effet différencié est une quantité qui peut être calculée à partir du modèle d'IA ou de tout autre procédure qui réalise une sélection binaire comme l'admission dans une école, l'attribution de prêt ou encore l'embauche. +C'est tout simplement la proportion d'admis de la minorité discriminée divisé par la majorité favorisée. Nous en donnerons une définition plus formelle à la Section~\ref{sec:background-eq} -C'est donc une quantité qui varie entre 0 et 1 où 0 indique que personne dans la minorité n'est sélectionné et 1 indique que autant de personne de la majorité que de la minorité sont sélectionné : c'est la parité. -Aux États Unis, si l'effet différencié est inférieur à $0,8$ cela constitue une preuve au regard de la loi qui fait jurisprudence que le système de sélection fait preuve de discrimination. -En France nous n'avons pas de tel précédent ou de métrique précise a utiliser. +C'est donc une quantité qui varie entre 0 et 1 où 0 indique que personne dans la minorité n'est sélectionné et 1 indique qu'autant de personnes de la majorité que de la minorité sont sélectionnées : c'est la parité. +Aux États-Unis, si l'effet différencié est inférieur à $0,8$ cela constitue une preuve, au regard de la loi qui fait jurisprudence, que le système de sélection fait preuve de discrimination. +En France nous n'avons pas de tel précédent ou de métrique précise à utiliser. \subsection{Protection des bases de données} On considère dans cette section que le producteur de la base de données bénéficie d'une protection par le droit sui generis au sens de l'article L.341-1 du Code de la Propriété Intellectuelle qui dispose que \og Le producteur d'une base de données, entendu comme la @@ -93,7 +93,7 @@ Nous sommes alors en droit de penser qu'une attaque de reconstruction représent De plus cette attaque excède les conditions d'utilisation car, dans ce cas, la condition d'utilisation normale est l'entraînement d'un modèle de machine learning. Ici, la personne menant l'attaque porte atteinte aux droits du producteur de la base de données. -Considérons maintenant que c'est le fournisseur de solution d'apprentissage automatique, exploitant la base de données, qui porte atteinte aux droits du producteur. +Considérons maintenant que c'est le fournisseur d'une solution d'apprentissage automatique, exploitant la base de données, qui porte atteinte aux droits du producteur. On se place dans le cas où le producteur interdit \og la réutilisation, par la mise à la disposition du public de la totalité ou d'une partie qualitativement ou quantitativement substantielle du contenu de la base, quelle qu'en soit la forme.\fg, conformément à l'article L.342-1 alinéa 2 du Code de la Propriété Intellectuelle. Dans le cas où le fournisseur de modèle permet à ses clients (le public) de mener à bien des attributs inférence attack, il met à disposition une partie de la base par sa négligence à utiliser une méthode d'apprentissage résistante à ce type d'attaque. @@ -122,19 +122,19 @@ Quoi qu'il en soit, il est dans l'intérêt du producteur de la base de données \subsection{Usage illicite de l'IA} \label{sec:contexte-aiact} -Comme nous l'avons vu à la Section~\ref{sec:contexte-insti} avec l'exemple de la Chine, l'IA peut-être utilisé pour des raisons qui vont à l'encontre des droits les plus fondamentaux. +Comme nous l'avons vu à la Section~\ref{sec:contexte-insti} avec l'exemple de la Chine, l'IA peut-être utilisée pour des raisons qui vont à l'encontre des droits les plus fondamentaux. Face à cette menace, -l'Union Européenne a établie le règlement (UE) 2024/1689 du parlement européen et du conseil +l'Union Européenne a établi le règlement (UE) 2024/1689 du Parlement Européen et du Conseil du 13 juin 2024 établissant des règles harmonisées concernant l’intelligence artificielle~\cite{aiact}. Étant un règlement il est directement applicable en droit français. Ce règlement a trois approches visant à limiter une utilisation de l'IA qui serait contraire aux droit fondamentaux. -La première approche consiste à responsabiliser les fournisseurs et les déployeur de système d'IA quand au potentielles dérives avec l'article 4. -De plus l'article 50 dispose de l'obligation des fournisseurs et des déployeurs de transparence, c'est à dire informer les utilisateurs qu'ils interagissent avec une IA. -Enfin de part leur nature générale et pouvant amener à la création d'IA multiples, les fournisseurs de modèle de fondation\footnote{\textit{Fundation model}} comme ChatGPT ou Llama sont soumis à de plus grande obligations et responsabilités. +La première approche consiste à responsabiliser les fournisseurs et les déployeurs de systèmes d'IA quant aux potentielles dérives avec l'article 4. +De plus l'article 50 dispose de l'obligation des fournisseurs et des déployeurs de transparence, c'est-à -dire informer les utilisateurs qu'ils interagissent avec une IA. +Enfin, de par leur nature générale et pouvant amener à la création d'IA multiples, les fournisseurs de modèle de fondation\footnote{\textit{Fundation model}} comme ChatGPT ou Llama sont soumis à de plus grandes obligations et responsabilités. -La seconde approche très pragmatique consiste à interdire un certain nombre de pratiques qui sont listé à l'article 5. +La seconde approche très pragmatique consiste à interdire un certain nombre de pratiques qui sont listées à l'article 5. Citons certaines qui sont en rapport avec ce manuscrit. Le paragraphe 1 alinéa c point (i) dispose que \textquote{ @@ -145,24 +145,24 @@ conduisant [au] traitement préjudiciable ou défavorable de certaines personnes physiques ou de groupes de personnes dans des contextes sociaux dissociés du contexte dans lequel les données ont été générées ou collectées à l’origine } -Ce qui, en plus de lois françaises sur les discriminations que nous avons cité plus haut, permet de clairement interdire l'utilisation d'IA qui vont utiliser des critère de discriminations dans leur décision. +Ce qui, en plus des lois françaises sur les discriminations que nous avons cité plus haut, permet de clairement interdire l'utilisation d'IA qui vont utiliser des critères de discrimination dans leur décision. Ce point est particulièrement important pour ce manuscrit car nous allons développer aux Chapitres~\ref{sec:fini} et~\ref{sec:aia} une méthode d'audit des systèmes d'IA qui permet de savoir si un système utilise un critère de discrimination pour réaliser une prédiction. -Citons aussi le paragraphe 1 alinéa d qui dispose que sont interdit les systèmes d'IA +Citons aussi le paragraphe 1 alinéa d qui dispose que sont interdits les systèmes d'IA \textquote{visant à évaluer ou à prédire le risque qu’une personne physique commette une infraction pénale}. -C'est un point de divergence important avec la législation de États Unis qui utilise ce genre de système comme nous l'avons vus à la Section~\ref{sec:contexte-insti}. -Dans ce manuscrit nous avons utilisé des bases de donnée États Uniennes pour construire ce genre de système IA pour les étudier. -Bien que nos conclusions sur ces systèmes ne pourront pas s'appliquer en Union Européenne vu qu'ils sont désormais interdits, notre analyse théorique reste valable et applicable à d'autres systèmes. +C'est un point de divergence important avec la législation des États-Unis qui utilise ce genre de système comme nous l'avons vu à la Section~\ref{sec:contexte-insti}. +Dans ce manuscrit nous avons utilisé des bases de données États-Uniennes pour construire ce genre de systèmes IA pour les étudier. +Bien que nos conclusions sur ces systèmes ne puissent pas s'appliquer dans l'Union Européenne étant donné qu'ils sont désormais interdits, notre analyse théorique reste valable et applicable à d'autres systèmes. Nous avons d'ailleurs évalué nos solutions sur d'autres modèles n'impliquant pas la justice prédictive. -La troisième approche consiste à classifier un certain nombre de pratique comme des \textquote{système d'IA à haut risques}. -Comme en dispose l'article 6, paragraphe 2 les système à haut risques sont par exemple des système qui concernent : +La troisième approche consiste à classifier un certain nombre de pratiques comme des \textquote{systèmes d'IA à haut risques}. +Comme en dispose l'article 6, paragraphe 2 les systèmes à haut risques sont par exemple des systèmes qui concernent : \begin{itemize} \item Emploi, gestion de la main-d'œuvre et accès à l'emploi indépendant (Annexe III, paragraphe 4) \item Accès et droit aux services privés essentiels et aux services publics et prestations sociales essentiels (Annexe III, paragraphe 5) \end{itemize} -Ce sont deux points pour lesquelles nous avons construit des système d'IA à titre illustratif dans ce manuscrit à la Section~\ref{sec:aia}. -Cette classification d'IA à haut risque impose des règles plus restrictive pour le déploiement. -Par exemple l'article 9, paragraphe 1 dispose qu'un système de gestion des risques doit être établis. -L'article 13 quand à lui impose un certain niveau d'explicabilité du système. -Enfin nous attirons l'attention du.de la lecteur.rice sur l'article 15 qui met l'accent sur la sécurité de tel système forçant les fournisseurs de contrôler par exemple que leur système ne contiennent pas de porte dérobées. +Ce sont deux points pour lesquels nous avons construit des systèmes d'IA à titre illustratif dans ce manuscrit à la Section~\ref{sec:aia}. +Cette classification d'IA à haut risque impose des règles plus restrictives pour le déploiement. +Par exemple l'article 9, paragraphe 1, dispose qu'un système de gestion des risques doit être établi. +L'article 13, quant à lui, impose un certain niveau d'explicabilité du système. +Enfin nous attirons l'attention du.de la lecteur.rice sur l'article 15 qui met l'accent sur la sécurité de tels systèmes, forçant les fournisseurs à contrôler par exemple que leur système ne contienne pas de porte dérobée. diff --git a/contexte/strat.tex b/contexte/strat.tex index 0ca8f82..020c534 100644 --- a/contexte/strat.tex +++ b/contexte/strat.tex @@ -5,7 +5,7 @@ \begin{subfigure}{0.3\linewidth} \centering \includegraphics[width=\linewidth]{contexte/figure/anr/prc.pdf} - \caption{Proportion attribué à des projets IA} + \caption{Proportion attribuée à des projets IA} \label{subfig:contexte-anr-prop} \end{subfigure} \begin{subfigure}{0.3\linewidth} @@ -24,35 +24,35 @@ \label{fig:contexte-anr} \end{figure} -Nous observons sur la Figure~\ref{fig:contexte-trend} que le recherche des termes \textquote{intelligence artificielle} en France sur le moteur de recherche Google à subit une grande augmentation depuis 2020. -Ainsi, l'IA intéresse de plus en plus le grand publique qui voit ces technologies investir leur téléphones portable, ordinateur, médias, etc. +Nous observons sur la Figure~\ref{fig:contexte-trend} que la recherche des termes \textquote{intelligence artificielle} en France sur le moteur de recherche Google a subi une grande augmentation depuis 2020. +Ainsi, l'IA intéresse de plus en plus le grand public qui voit ces technologies investir leur téléphone portable, ordinateur, médias, etc. Ce phénomène semble suivre en parallèle une très forte augmentation de l'investissement français en matière d'IA. -Pour mieux comprendre ce phénomène nous avons conduit une micro étude des financements accordés par l'Agence Nationale la Recherche (ANR), l'un des principaux bailleur en France. +Pour mieux comprendre ce phénomène nous avons conduit une micro étude des financements accordés par l'Agence Nationale la Recherche (ANR), l'un des principaux bailleurs en France. L'ANR publie une base de donnée des appels à projets financé par la Direction des Opérations Scientifiques (DOS) de l'ANR depuis 2005. -Dans ces données, il y a entra autre, le montant du financement accordé, le titre en anglais et français ainsi que le résumé en anglais et en français. -Le titre et le résumé constituent un court paragraphe de texte donc chaque mots présent est normalement consciencieusement choisit. -Nous avons crée, en utilisant ChatGPT, une liste de mots clefs en anglais et en français qui indique qu'un projet a une forte composante IA. +Dans ces données, il y a entre autre, le montant du financement accordé, le titre en anglais et en français ainsi que le résumé en anglais et en français. +Le titre et le résumé constituent un court paragraphe de texte, donc chaque mot présent est normalement consciencieusement choisi. +Nous avons créé, en utilisant ChatGPT, une liste de mots clefs en anglais et en français qui indique qu'un projet a une forte composante IA. Nous présentons cette liste à l'Annexe~\ref{anx:mots}. -Pour tous les projets financé depuis 2005 nous avons cherché si le titre ou le résumé contiens un ou plusieurs mots de la liste. +Pour tous les projets financés depuis 2005 nous avons cherché si le titre ou le résumé contient un ou plusieurs mots de la liste. Grâce à cela nous construisons la Figure~\ref{fig:contexte-anr} qui montre l'évolution du financement de l'IA au cours du temps. -Nous observons sur la Sous-figure~\ref{subfig:contexte-anr-moy} que en moyenne le financement d'un projet IA n'a pas évolué depuis 2005. +Nous observons sur la Sous-figure~\ref{subfig:contexte-anr-moy} qu'en moyenne le financement d'un projet IA n'a pas évolué depuis 2005. Cependant nous voyons sur la Sous-figure~\ref{subfig:contexte-anr-prop} que le nombre de projets IA a augmenté passant de 2\% du nombre total de projet à 15\%. Nous observons la même augmentation de la proportion d'argent accordé à l'IA. Ainsi, en sommant par année les financements de tous les projets IA, nous observons sur la Sous-figure~\ref{subfig:contexte-anr-fin} une augmentation de 5 à 125 millions d'Euros. -Cette claire augmentation de l'investissement en IA en France n'est pas du au hasard mais à une stratégie dûment établie. +Cette claire augmentation de l'investissement en IA en France n'est pas due au hasard mais à une stratégie dûment établie. \subsection{Rapport Villani : Donner un sens à l'intelligence artificielle} Le 8 septembre 2017 le Premier ministre Edouard Philippe confie au mathématicien et député de l'Essone Cedric Villani une mission parlementaire : faire un état des lieux des stratégies française et européenne autour de l'IA~\cite{villani2018donner}. -Ce rapport a permis la mise en place d'une stratégie d'investissement publique en France qui a pour but d'orienter la recherche vers la construction d'une IA aligné avec les valeurs de la république. +Ce rapport a permis la mise en place d'une stratégie d'investissement publique en France qui a pour but d'orienter la recherche vers la construction d'une IA alignée avec les valeurs de la République. Cette stratégie se découpe en six parties : \paragraph{Une politique économique articulée autour de la donnée.} La donnée est le pilier de l'IA car elle sert à construire les modèles. -Le rapport préconise de recenser les besoins en IA et de construire des politiques de récolte de donnée au niveau européen dans le cadre de la Réglementation Générale de la Protection des Données. -Cela inclut par exemple de limiter la fuite de données vers les grands acteur hors Union Européenne (UE) comme les GAFAM. -Pour éviter de s'éparpiller et de gâcher des ressource, le rapport préconise de se concentrer sur quatre aspect niches où la France à déjà un avantage. -Ces quatre pilier son devenu capitaux dans politique actuelle d'investissement, il s'agit de : +Le rapport préconise de recenser les besoins en IA et de construire des politiques de récolte de données au niveau européen dans le cadre de la Réglementation Générale de la Protection des Données. +Cela inclut par exemple de limiter la fuite de données vers les grands acteurs hors Union Européenne (UE) comme les GAFAM. +Pour éviter de s'éparpiller et de gâcher des ressources, le rapport préconise de se concentrer sur quatre aspects niches où la France a déjà un avantage. +Ces quatre piliers sont devenus capitaux dans la politique actuelle d'investissement, il s'agit de : \begin{enumerate} \item La santé \item L'environnement @@ -61,62 +61,62 @@ Ces quatre pilier son devenu capitaux dans politique actuelle d'investissement, \end{enumerate} \paragraph{Pour une recherche agile et diffusante.} -C'est tout d'abord éviter la fuite des cerveaux en augmentant l'attractive des établissements publiques. +C'est tout d'abord éviter la fuite des cerveaux en augmentant l'attractivité des établissements publics. Par exemple en créant des Instituts Interdisciplinaires d’Intelligence Artificielle (3IA). -Cela passe aussi par un renforcement des liens entres la recherche et l'industrie notamment avec les transferts technologiques et la valorisation. -Ce cadre dynamique ne peut être possible qu'avec des moyens pratiques et pragmatiques comme par exemple de dédier des supercalculateur à la recherche. +Cela passe aussi par un renforcement des liens entre la recherche et l'industrie, notamment avec les transferts technologiques et la valorisation. +Ce cadre dynamique ne peut être possible qu'avec des moyens pratiques et pragmatiques comme par exemple dédier des supercalculateurs à la recherche. Nous reviendrons sur ce sujet à la Section~\ref{sec:contexte-strat-infra}. \paragraph{Anticiper les impacts sur le travail, l’emploi et expérimenter.} -De part son interdisciplinarité, l'IA peut profondément modifier la manière dont nous envisageons le travail, un peu à la manière dont l'informatique ou avant la mécanisation ont profondément transformé notre société. -Le rapport préconise une approche législative visant à redéfinir le cadre du travail en France à l'heure ou beaucoup de tâches peu qualifié peuvent être automatisés. -C'est aussi en formant à tous les niveau à l'IA que ces technologie pourront être utilisé efficacement est sans casse sociale. +De par son interdisciplinarité, l'IA peut profondément modifier la manière dont nous envisageons le travail, un peu à la manière dont l'informatique ou précédemment la mécanisation ont profondément transformé notre société. +Le rapport préconise une approche législative visant à redéfinir le cadre du travail en France à l'heure où beaucoup de tâches peu qualifiées peuvent être automatisées. +C'est aussi en formant à tous les niveaux à l'IA que ces technologies pourront être utilisées efficacement et sans casse sociale. \paragraph{L’intelligence artificielle au service d’une économie plus écologique.} -L'IA nécessite une grande consommation d'énergie, il est donc nécessaire d'investir massivement dans l'IA frugale et embarqué qui permet une utilisation réduite d'électricité. -De plus l'IA doit être mise au service de la transition écologique pour aider notamment à prédire et comprendre le changement climatique. +L'IA nécessite une grande consommation d'énergie, il est donc nécessaire d'investir massivement dans l'IA frugale et embarquée qui permet une utilisation réduite d'électricité. +De plus, l'IA doit être mise au service de la transition écologique pour aider notamment à prédire et comprendre le changement climatique. Pour cela le rapport indique qu'il faut libérer la donnée écologique qui contient les données : \textquote{ météorologiques, agricoles, de transports, d’énergie, de biodiversité, de climat, de déchets, cadastrales, de diagnostic de performance énergétique}. \paragraph{Quelle éthique de l’IA ?} -Les utilisateur doivent avoir la possibilité de comprendre les décisions que prennent les IA. +Les utilisateurs doivent avoir la possibilité de comprendre les décisions que prennent les IA. Pour cela il est nécessaire d'investir plus dans la recherche en explicabilité comme nous le verrons à la Section~\ref{sec:contexte-expl}. De plus le rapport propose une consultation et un dialogue autour des questions de savoir pour quels types de tâches peut-on utiliser l'IA ? -Cette question à déjà été un partie explorée au niveau Européen avec -le règlement (UE) 2024/1689 du parlement européen et du conseil +Cette question a déjà été en partie explorée au niveau Européen avec +le Règlement (UE) 2024/1689 du Parlement Européen et du Conseil du 13 juin 2024 établissant des règles harmonisées concernant l’intelligence artificielle~\cite{aiact}. -Ce règlement à mis en place un liste de tâche dite \textquote{Inacceptables} et \textquote{à haut risque}. +Ce règlement a mis en place une liste de tâches dites \textquote{Inacceptables} et \textquote{à haut risque}. Nous y reviendrons à la Section~\ref{sec:contexte-legal-util}. \paragraph{Pour une IA inclusive et diverse.} Pour que l'IA profite à toutes et tous il est nécessaire déjà de palier l'écart historique de choix d'études scientifiques entre homme et femme. Il s'agit aussi de favoriser la mixité sociale dans la recherche et l'industrie en IA. -Cela passe par la médiation scientifique et par une réflexion quand à l'utilisation de l'IA dans les secteurs sociaux (autre que la santé qui est déjà bien loti). +Cela passe par la médiation scientifique et par une réflexion quant à l'utilisation de l'IA dans les secteurs sociaux (autres que la santé qui est déjà bien lotie). \subsection{Plan France 2030} Le plan France 2030 est un plan d'investissement du gouvernement d'Emannuel Macron de 54 milliards d'Euros~\cite{france2030} ayant pour but de rattraper le retard industriel de la France. -L'IA touchant à plusieurs aspect industriels à une part important dans ce plan. +L'IA touchant à plusieurs aspects industriels a une part importante dans ce plan. Ce plan est divisé en deux phases~\cite{2030phase}. La première phase de 2018 à 2022 a pour but de \textquote{Doter la France de capacités de recherche compétitives}. Avec notamment la mise en place des (3IA) et du supercalculateur Jean Zay~\cite{jeanzay}. -La seconde phase de 2021 à 2025 à pour but de \textquote{Diffuser des technologies d’intelligence artificielle au sein de l’économie}. +La seconde phase de 2021 à 2025 a pour but de \textquote{Diffuser des technologies d’intelligence artificielle au sein de l’économie}. Nous pouvons citer par exemple le programme \textit{IA Booster}~\cite{iabooster} qui propose un accompagnement aux PME\footnote{Petites et Moyennes Entreprises} pour les aider à intégrer l'IA à leur produits et leur solutions. -Concernant l'IA générative il y l'appel \textit{ +Concernant l'IA générative il y a l'appel \textit{ Accélérer l’usage de l’intelligence artificielle générative dans l’économie}~\cite{2030generatif}. -Cet appel à pour but le développement d'outils de A à Z et met l'accent sur les différents enjeux de l'IA avec des exigences environnementales et d'équité par exemple. -De part son aspect interdisciplinaire, l'IA est aussi présent dans d'autres domaine comme dans la santé par exemple avec l'appel \textit{Data Challenges en santé}~\cite{2030sante}. -Les compétitions donnée\footnote{Data challenge} font partis de la culture de la recherche en informatique et notamment en apprentissage automatique comme avec la plate-forme Kaggle~\cite{kaggle}. -Cet appel à projet à pour but d'encourager la création de compétitions sur les donnée médicales. +Cet appel a pour but le développement d'outils de A à Z et met l'accent sur les différents enjeux de l'IA avec des exigences environnementales et d'équité par exemple. +De par son aspect interdisciplinaire, l'IA est aussi présente dans d'autres domaines comme la santé avec l'appel \textit{Data Challenges en santé}~\cite{2030sante}. +Les compétitions données\footnote{Data challenge} font partie de la culture de la recherche en informatique et notamment en apprentissage automatique comme avec la plateforme Kaggle~\cite{kaggle}. +Cet appel à projet a pour but d'encourager la création de compétitions sur les données médicales. Pour généraliser, concernant l'IA, France 2030 a pour but la souveraineté numérique. -C'est à dire de réduire la dépendance des institutions française aux services étrangers et notamment aux GAFAM. -Il s'agit d'un aspect fondamentale de la LOI n° 2016-1321 du 7 octobre 2016 pour une République numérique~\cite{loinumerique}. +C'est-à -dire de réduire la dépendance des institutions françaises aux services étrangers et notamment aux GAFAM. +Il s'agit d'un aspect fondamental de la LOI n° 2016-1321 du 7 octobre 2016 pour une République numérique~\cite{loinumerique}. -Pour coordonner ces investissements en matière d'IA, le directeur général des entreprises du ministère de l’économie et des finances, et en lien avec le secrétariat général pour l’investissement ont nommé un coordinateur national pour l’intelligence artificielle. +Pour coordonner ces investissements en matière d'IA, le Directeur général des entreprises du Ministère de l’Economie et des Finances, et en lien avec le Secrétariat général pour l’investissement ont nommé un coordinateur national pour l’intelligence artificielle. \textquote{Il aura pour mission la coordination interministérielle de la stratégie nationale en intelligence artificielle}~\cite{coordinateur}. Ce coordinateur est un exemple d'une réalisation pratique d'une recommandation du rapport Villani\footnote{Cf. page 63 du rapport Villani}. @@ -134,9 +134,9 @@ Ce coordinateur est un exemple d'une réalisation pratique d'une recommandation \subsection{Infrastructures} \label{sec:contexte-strat-infra} Le développement de l'IA demande des puissances de calcul considérables pour faire fonctionner les algorithmes d'apprentissage automatique. -Par exemple le modèle Llama2 a nécessite 3.311.616 GPUheure d'entraînement~\cite{touvron2023llama} ce qui signifie qu'il faudrait 378 ans a un individu ayant une seul carte graphique\footnote{Graphical Processing Unit} (GPU). -Pour que la France puisse réaliser ses objectif ambitieux en matière d'IA il est donc nécessaire de construire des supercalculateurs en mutualisant les ressources entre les différents acteurs. -Nous avons donné l'exemple du supercalculateur Jean Zay~\cite{jeanzay} qui à été construit en parti dans cette optique. +Par exemple le modèle Llama2 a nécessité 3.311.616 GPUheure d'entraînement~\cite{touvron2023llama} ce qui signifie qu'il faudrait 378 ans à un individu ayant une seule carte graphique\footnote{Graphical Processing Unit} (GPU). +Pour que la France puisse réaliser ses objectifs ambitieux en matière d'IA il est donc nécessaire de construire des supercalculateurs en mutualisant les ressources entre les différents acteurs. +Nous avons donné l'exemple du supercalculateur Jean Zay~\cite{jeanzay} qui a été construit en partie dans cette optique. \begin{figure} \centering \includegraphics[width=0.4\linewidth]{contexte/figure/g5k-backbone.pdf} @@ -144,7 +144,7 @@ Nous avons donné l'exemple du supercalculateur Jean Zay~\cite{jeanzay} qui à à \label{fig:contexte-g5k} \end{figure} -Dans ce manuscrit les calculs ont été réalisé sur une autre infrastructure : Grid5000 (G5K)~\cite{g5k}. -Il s'agit d'une grille de calcul mettant à disposition des centres de recherche français différent type de machine : des GPU, des CPU, des ordinateurs complets\footnote{Bare metal} ce qui permet un très large éventail d'expériences. -Comme nous pouvons le voir sur la Figure~\ref{fig:contexte-g5k} l'aspect distribué de G5K permet de réaliser des expériences implique des système distribué comme par exemple l'apprentissage fédéré\footnote{Federated learning}. +Dans ce manuscrit les calculs ont été réalisés sur une autre infrastructure : Grid5000 (G5K)~\cite{g5k}. +Il s'agit d'une grille de calcul mettant à disposition des centres de recherche français différents types de machine : des GPU, des CPU, des ordinateurs complets\footnote{Bare metal} ce qui permet un très large éventail d'expériences. +Comme nous pouvons le voir sur la Figure~\ref{fig:contexte-g5k} l'aspect distribué de G5K permet de réaliser des expériences impliquant des systèmes distribués comme par exemple l'apprentissage fédéré\footnote{Federated learning}. \FloatBarrier |