diff options
author | Jan Aalmoes <jan.aalmoes@inria.fr> | 2024-10-04 09:42:27 +0200 |
---|---|---|
committer | Jan Aalmoes <jan.aalmoes@inria.fr> | 2024-10-04 09:42:27 +0200 |
commit | d4021e6f8a0bf771b755d39da8515266ef75e667 (patch) | |
tree | 556504e7fd563f57bf3fed3ace649c07347961bd | |
parent | beccac2bc154dc3eae2c9858749dddc01bdeb117 (diff) |
Relecture avec Emeline
-rw-r--r-- | aia/main.tex | 8 | ||||
-rw-r--r-- | avertissement.tex | 2 | ||||
-rw-r--r-- | background/ml.tex | 12 | ||||
-rw-r--r-- | classification_finie/main.tex | 4 | ||||
-rw-r--r-- | contexte/ckoi.tex | 22 | ||||
-rw-r--r-- | contexte/enjeux.tex | 30 | ||||
-rw-r--r-- | contexte/legal.tex | 29 | ||||
-rw-r--r-- | contexte/philo.tex | 8 | ||||
-rw-r--r-- | contexte/philo/anthro.tex | 30 | ||||
-rw-r--r-- | contexte/philo/anthro.tex.bak | 117 | ||||
-rw-r--r-- | contexte/philo/peur.tex | 38 | ||||
-rw-r--r-- | contexte/philo/peur.tex.bak | 158 | ||||
-rw-r--r-- | contexte/strat.tex | 24 | ||||
-rw-r--r-- | introduction.tex | 2 | ||||
-rw-r--r-- | notations.tex | 4 | ||||
-rw-r--r-- | notes.tex | 8 | ||||
-rw-r--r-- | template_these_INSA_cotut.tex | 4 |
17 files changed, 390 insertions, 110 deletions
diff --git a/aia/main.tex b/aia/main.tex index 877052d..d0bc460 100644 --- a/aia/main.tex +++ b/aia/main.tex @@ -18,8 +18,8 @@ \label{sec:aia-resexp} \input{aia/resultats} -\section{Travaux voisins} -\input{aia/related} +%\section{Travaux voisins} +%\input{aia/related} -\section{Conclusion} -\input{aia/conclusion} +%\section{Conclusion} +%\input{aia/conclusion} diff --git a/avertissement.tex b/avertissement.tex index f4a9363..2ee2063 100644 --- a/avertissement.tex +++ b/avertissement.tex @@ -3,5 +3,5 @@ En France, les statistiques ethniques sont interdites~\cite{stateth} ce qui n'es Les résultats de statistiques descriptives, notamment sur les crimes commis en fonction de la couleur de peau, sont à mettre en parallèle avec un grand nombre de facteurs socio-économiques~\cite{howard2000race,williams1996race,green1972race,walsh2007psychopathy}. Ainsi, ils ne doivent pas être interprétés comme indiquant une différence de comportement social entre sous-groupes ethniques. -De plus, la Section~\ref{sec:contexte-phi} invite le.la lecteur.rice à des expériences de pensées qui peuvent être angoissantes pour certaines personnes~\cite{singler2017roko}. +De plus, la Section~\ref{sec:contexte-phi} invite le.la lecteur.rice à des expériences de pensée qui peuvent être angoissantes pour certaines personnes~\cite{singler2017roko}. Nous invitons donc le.la lecteur.rice à ne pas s'attarder sur cette section si il.elle ne se juge pas émotionnellement prêt.e. diff --git a/background/ml.tex b/background/ml.tex index 0f1b426..55fce3c 100644 --- a/background/ml.tex +++ b/background/ml.tex @@ -27,7 +27,8 @@ C'est une fonction qui sert à déterminer à quel point une prédiction est bon C'est-à-dire que plus la fonction de coût renvoie une valeur petite, meilleur est le modèle. Nous définissons le modèle suivant : -\begin{equation*} +\begin{equation} + \label{eq:background-ml-model} f: \left\{ \begin{matrix} @@ -35,7 +36,7 @@ Nous définissons le modèle suivant : x\mapsto f(x,\theta) \end{matrix} \right. -\end{equation*} +\end{equation} Alors une fonction de coût, est une fonction $l$ de $\mathbb{R}^n\times\mathbb{R}^n$ dans $\mathbb{R}^+$. On se donne l'espace probabilisé $(\Omega,\mathcal{T},P)$. Soit $\mathcal{V}$ l'ensemble des variables aléatoires de $\Omega$ dans $\mathbb{R}^+$. @@ -56,7 +57,12 @@ Nous pouvons ainsi définir le coût induit par un choix de paramètres par la f \end{matrix} \right. \end{equation*} -Ainsi nous avons une fonctionnelle $c:\theta\mapsto E(C(\theta))$ en prenant l'espérance de coût. +Ainsi nous avons une fonctionnelle +\begin{equation} + \label{eq:background-ml-cout} + c:\theta\mapsto E(C(\theta)) +\end{equation} +en prenant l'espérance de coût. Nous pouvons donc appliquer une descente de gradient comme vu à la Section~\ref{sec:background-opti-sgd} pour résoudre le problème suivant : \begin{equation*} \text{min}_{\theta\in\Theta}c(\theta) diff --git a/classification_finie/main.tex b/classification_finie/main.tex index b3c9c6f..212477f 100644 --- a/classification_finie/main.tex +++ b/classification_finie/main.tex @@ -1,9 +1,9 @@ \input{classification_finie/introduction} -\section{Exactitude équilibré et Classifieur à Choix Aléatoire} +\section{Exactitude équilibrée et Classifieur à Choix Aléatoire} \input{classification_finie/ba} -\section{Construiction d'un algorithme d'apprentissage ensemblise maximisant l'excatitude équilibré} +\section{Construction d'un algorithme d'apprentissage ensemblise maximisant l'excatitude équilibrée} \input{classification_finie/finit_classif} \section{Résultats expérimentaux} diff --git a/contexte/ckoi.tex b/contexte/ckoi.tex index 4bab1bf..a7973a2 100644 --- a/contexte/ckoi.tex +++ b/contexte/ckoi.tex @@ -1,6 +1,6 @@ L'intelligence artificielle (IA) est un sujet extrêmement médiatisé depuis son ouverture au grand public avec notamment ChatGPT~\cite{chatgpt} ou StableDiffusion~\cite{stabledi}. -Ces technologies sont aussi des enjeux capitaux pour résoudre plusieurs problèmes majeurs de l'humanité, notamment : +Ces technologies sont aussi des enjeux capitaux pour résoudre plusieurs problèmes majeurs de l'humanité, notamment la crise climatique~\cite{barnes2019viewing,slater2023hybrid} et la crise énergétique~\cite{jin2020energy,kumar2020distributed,kumari2020blockchain,ngarambe2020use}. Ainsi l'IA est présente aussi bien à l'échelle de la population qui a accès à des services pour son usage personnel, qu'à l'échelle collective ou institutionnelle. @@ -22,7 +22,7 @@ On trouve des implémentations d'assistants personnels, d'aide à la programmati Des objets connectés portables, comme l'Apple Watch~\cite{applewatch}, permettent de suivre et d'analyser divers indicateurs médicaux. Grâce à cela, les utilisateurs peuvent avoir accès à une médecine personnalisée bien qu'il n'existe pas d'étude clinique à grande échelle qui prouve formellement que de tels appareils puissent améliorer la santé~\cite{dunn2018wearables}. Avec les GAFAM, de nouvelles startups investissent le domaine de l'IA. -Une des plus médiatiques\cite{openaiinter,openaibfm,openaint}, OpenAI a développé ChatGPT : un programme de conversation grandement utilisé~\cite{openaibig}. +Une des plus médiatiques\cite{openaiinter,openaibfm,openaint}, OpenAI, a développé ChatGPT : un programme de conversation grandement utilisé~\cite{openaibig}. Voyons quelques exemples d'utilisation dans la Figure~\ref{fig:contexte-chatgpt}. ChatGPT peut être utilisé comme fondation pour de nombreuses tâches comme l'assistance à la programmation, résumer des textes, la traduction, la reformulation, etc. ChatGPT cherche aussi à rendre accessible l'information en temps réel en s'alliant avec des journaux de référence comme Le Monde en France ou El Paìs en Espagne~\cite{gptjournal}. @@ -67,7 +67,7 @@ Des suites de logiciels permettent d'intégrer RAI, gestion administrative de l' %Hôpitaux L'IA commence aussi à être utilisée pour des applications médicales, avec la promesse de faciliter et d'accélérer la prise en charge des patients. Les techniques de reconnaissance d'images sont utilisées pour aider le diagnostic du cancer de la peau~\cite{dildar2021skin}. -Les dermatologues ont à leur disposition des appareils photos spécialement conçus pour que l'image obtenue des grains de beauté de leur patients soit la plus adaptée possible à la détection de cancer. +Les dermatologues ont à leur disposition des appareils photos spécialement conçus pour que l'image obtenue des grains de beauté de leurs patients soit la plus adaptée possible à la détection de cancer. Cela rend le diagnostic plus fiable que l'utilisation de smartphones avec une application. La rétinopathie diabétique est une maladie qui peut causer la cécité chez les personnes diabétiques. La détection de cette maladie à partir de photographies de la rétine est un autre domaine d'application de l'IA, qui produit des résultats satisfaisants pour une utilisation clinique~\cite{gulshan2016development}. @@ -79,7 +79,7 @@ Nous observons aussi un intérêt grandissant de la part de grandes entreprises, En effet, face à l'affluence de candidatures pour un poste publié sur internet, la charge de travail pour les services de ressources humaines augmente drastiquement. Ainsi, pour automatiser la sélection de candidatures raisonnables et proches de la demande de l'employeur, divers produits proposent l'utilisation d'IA ~\cite{ore2022opportunities}. Le candidat, étant en position de faiblesse face à l'employeur, n'a pas le choix que de se soumettre à cette sélection automatisée pour postuler. -Réduire le facteur humain peut aider à atteindre des objectifs de parité femme homme ou augmenter l'embauche des personnes en situation de handicap en retirant certain biais~\cite{al2021role}. +Réduire le facteur humain peut aider à atteindre des objectifs de parité femme homme ou augmenter l'embauche des personnes en situation de handicap en retirant certains biais~\cite{al2021role}. Cependant cette idée ne fait pas consensus car l'IA a une forte tendance à reproduire les biais historiques~\cite{segal2021fairnesseyesdatacertifying,10.1145/3278721.3278779,Dwork2011fairness,Hardt2016equality}. Ces biais font partie des enjeux majeurs de l'IA que nous traiterons en Sections~\ref{sec:contexte-eq} et~\ref{sec:aia}. @@ -107,7 +107,7 @@ Le dictionnaire de l'Académie française~\cite{dico-int} définit l'intelligenc Faculté de comprendre, de concevoir, de connaître, et notamment faculté de discerner ou d’établir des rapports entre des faits, des idées ou des formes pour parvenir à la connaissance}. Cette définition a deux aspects. Le premier est une liste de tâches techniques qui correspond bien à une liste de logiciels comme nous l'avons vu au début de cette section. -Cependant cette énumération est une définition qui est aussi peu satisfaisante que ne l'est celle de la science faite par Théétète au début de son entretien avec Socrate~\cite{theetete}. +Cependant cette énumération est une définition qui est aussi peu satisfaisante que l'est celle de la science faite par Théétète au début de son entretien avec Socrate~\cite{theetete}. Le second aspect sur la connaissance est plus énigmatique et correspond à un but avec \textquote{pour parvenir}. Nous verrons dans les Sections~\ref{sec:background-opti} et \ref{sec:background-ml} comment un programme informatique peut techniquement chercher à atteindre un objectif voire plusieurs pour les Sections~\ref{sec:background-eq} et~\ref{sec:background-conf}. Cette personnification de la machine traduit bien l'aspect décrit à Dartmouth de simulation de caractéristiques humaines. @@ -126,7 +126,7 @@ Alors, le but de connaissance d'un programme d'IA ne peut pas être uniquement d Toujours selon Platon, c'est la science de la différence qui fait la connaissance. C'est-à-dire de connaître et d'expliquer les caractéristiques qui rendent unique l'objet que le programme d'IA connaît. Nous parlerons d'explications dans la Section~\ref{sec:contexte-expl}. -Il existe différents niveaux d'évaluation de la capacité à trouver les caractéristiques qui différencient les données étudiées, nous les présentons en Section~\ref{sec:background-ml}. +Il existe différents niveaux d'évaluation de la capacité à trouver les caractéristiques qui différencient les données étudiées, nous les présenterons en Section~\ref{sec:background-ml}. A cette science de la différence, Platon ajoute l'opinion droite (ou juste), qui relève de la cité. Cette notion très vaste est étudiée en IA dans les domaines de l'éthique sous la forme d'enjeux que nous présenterons à la Section~\ref{sec:contexte-enjeu}. @@ -138,11 +138,11 @@ L'IA forte, en contrepartie, \textquote{n'est plus qu'un simple outil de l'étud L'objectif à long terme de l'IA forte est d'atteindre l'\textit{Artificial General Inteligence} (AGI)~\cite{baum2017survey}. C'est-à dire-créer une IA qui connaisse, ou qui puisse apprendre, toutes les disciplines. -Maintenant que nous savons précisément ce qui IA signifie, regardons en quoi ce terme est critiquable. +Maintenant que nous savons précisément ce qu'IA signifie, regardons en quoi ce terme est critiquable. Dans un premier temps, les modèles de dialogue comme ChatGPT ne remplissent pas la définition d'intelligence donnée plus haut comme l'explique Richard M. Stallman dans la liste de termes \textquote{à éviter} du projet GNU~\cite{gnuAI} -De plus, certains aspects capitaux en société comme l'intelligence émotionnelle sont absents de toute IA actuelle~\cite{banIA}. -Enfin l'IA ne peut pas avoir une opinion comme le démontre John R. Searle avec l'expérience de la chambre chinoise~\cite{searle1980minds}. -Ainsi, l'expression intelligence artificielle est trompeuse car bien que ces programmes soient en effet artificiels ils ne sont pas intelligents. +De plus, certains aspects capitaux en société, comme l'intelligence émotionnelle, sont absents de toute IA actuelle~\cite{banIA}. +Enfin, l'IA ne peut pas avoir une opinion comme le démontre John R. Searle avec l'expérience de la chambre chinoise~\cite{searle1980minds}. +Ainsi, l'expression intelligence artificielle est trompeuse car bien que ces programmes soient en effet artificiels, ils ne sont pas intelligents. C'est pourquoi la définition légale d'IA est si éloignée de ces considérations. L'Union Européenne a établi le Règlement (UE) 2024/1689 du Parlement Européen et du Conseil @@ -153,7 +153,7 @@ Pour le moment, regardons l'article 3 : il s'agit d'une liste de définitions co Nous y trouvons la définition de (UE 2024/1689 3§1) : \textquote{système IA}. C'est \textquote{un système automatisé qui est conçu pour fonctionner à différents niveaux d’autonomie et peut faire preuve d’une capacité d’adaptation après son déploiement, et qui, pour des objectifs explicites ou implicites, déduit, -à partir des entrées qu’il reçoit, la manière de générer des sorties telles que des prédictions, du contenu, des +à partir des entrées qu’il reçoit, la manière de générer des sorties tels que des prédictions, du contenu, des recommandations ou des décisions qui peuvent influencer les environnements physiques ou virtuels.} Cette définition renvoie simplement l'IA à un algorithme qui prend en entrée les \textquote{entrées} de la définition UE ainsi que des paramètres pour son adaptabilité et renvoie des \textquote{sorties}. Nous représentons cela sur la Figure~\ref{fig:contexte-IAUE}. diff --git a/contexte/enjeux.tex b/contexte/enjeux.tex index 9f5f99d..b00eee2 100644 --- a/contexte/enjeux.tex +++ b/contexte/enjeux.tex @@ -17,7 +17,7 @@ Ces critiques et inquiétudes sont théorisées dans la littérature scientifiqu L'utilité est le défi primordial pour tout modèle : il s'agit que le modèle remplisse suffisamment bien la tâche pour laquelle il a été conçu. Par exemple, un modèle qui sert à prédire si un grain de beauté est un cancer de la peau ou non ne doit pas générer de faux négatifs, sinon comment avoir confiance en sa décision ? L'expression de \textquote{remplir suffisamment bien la tâche} a toute son importance dans la mesure où seuls les modèles ayant une tâche triviale ne se trompent pas. -Il revient donc aux personnes qui créent ces modèles de déterminer, en fonction du contexte d'application, l'erreur maximale que peut atteindre le modèle pour qu'il soit considéré comme viable et utilisable en production. +Il revient donc aux personnes qui créent ces modèles de déterminer, en fonction du contexte d'application, l'erreur maximale que peut atteindre le modèle pour qu'il soit malgré tout considéré comme viable et utilisable en production. \FloatBarrier \subsection{Équité} @@ -27,8 +27,8 @@ C'est-à-dire que le modèle se comporte différemment pour différents sous-ens Cela peut donner lieu à des discriminations, notamment dans les modèles de décision qui influencent directement la vie de personnes. La justice prédictive telle qu'utilisée aux Etats-Unis en est un bon exemple. Dans ce cas, un modèle est utilisé pour prédire si un individu jugé coupable a une forte probabilité d'être récidiviste ou non. -En utilisant de tels modèles nous mesurons que les afro-américains (\textit{blacks}) son plus souvent prédits comme ayant une forte chance d'être récidivistes que le reste de la population (\textit{whites})~\cite{dressel2018accuracy}. -En plus d'être un enjeu, Al-Alawi et al.~\cite{al2021role} avance que l'utilisation de l'IA peut être une solution plus équitable que la décision humaine dans le processus de recrutement. +En utilisant de tels modèles nous mesurons que les afro-américains (\textit{blacks}) sont plus souvent prédits comme ayant une forte chance d'être récidivistes que le reste de la population (\textit{whites})~\cite{dressel2018accuracy}. +En plus d'être un enjeu, Al-Alawi et al.~\cite{al2021role} avancent que l'utilisation de l'IA peut être une solution plus équitable que la décision humaine dans le processus de recrutement. L'équité dans les modèles peut-être imposée lors de l'entraînement. Nous étudierons en détail ce processus dans la Section~\ref{sec:background-eq}. @@ -38,38 +38,38 @@ Nous étudierons en détail ce processus dans la Section~\ref{sec:background-eq} \label{sec:contexte-expl} Le concept de boîte noire\footnote{\textit{Black box}} est une manière imagée de dire qu'on ne comprend pas ou qu'on ne peut pas avoir accès au fonctionnement d'un programme. On l'utilise alors comme un outil qui prend une entrée et donne une sortie, un peu à la manière de la définition d'IA que nous avons illustré dans la Figure~\ref{fig:contexte-IAUE}. -Cette approche de l'IA est problématique pour plusieurs raisons qu'illustrent Quinn et al.~\cite{quinn2022three} dans le domaine médicale : +Cette approche de l'IA est problématique pour plusieurs raisons qu'illustrent Quinn et al.~\cite{quinn2022three} dans le domaine médical : \begin{itemize} - \item Les boîte noires manquent de garanties quant à la qualité de la prédiction et rendent complexe l'étude des biais. + \item Les boîtes noires manquent de garanties quant à la qualité de la prédiction et rendent complexe l'étude des biais. \item Les boîtes noires ne permettent pas l'interprétation des résultats. \item Les boîtes noires ne peuvent pas prendre en compte toutes les subtilités des cas particuliers (de patients). \end{itemize} -Les réseaux de neurones ont une part prépondérante de l'IA. -Or de par leur fonctionnement interne complexe que nous explorerons à la Section~\ref{sec:background-ml} et le fait que leur compréhension théorique soit encore lacunaire, ils sont souvent utilisés en boîte noire~\cite{yuan2022explainability}. -Pour palier cela il existe certaines méthodes qui essaient de produire des explications automatisées compréhensibles des réseaux de neurones~\cite{yuan2022explainability,du2019techniques,rai2020explainable}. +Les réseaux de neurones sont une part prépondérante de l'IA. +Or, de par leur fonctionnement interne complexe, que nous explorerons à la Section~\ref{sec:background-ml} et le fait que leur compréhension théorique soit encore lacunaire, ils sont souvent utilisés en boîte noire~\cite{yuan2022explainability}. +Pour pallier cela il existe certaines méthodes qui essaient de produire des explications automatisées compréhensibles des réseaux de neurones~\cite{yuan2022explainability,du2019techniques,rai2020explainable}. \FloatBarrier \subsection{Confidentialité} D'une manière générale, l'intelligence artificielle brasse une quantité astronomique de données~\cite{villani2018donner}. Ce brassage s'opère à deux niveaux : au moment de la création du modèle et au moment de son utilisation en production. Pour créer des modèles performants, il est nécessaire d'utiliser beaucoup de données. -Ces données servent à choisir les bons paramètres du modèle au travers de diverses méthodes statistiques et d'optimisations, on les appelle des données d'entraînement. +Ces données servent à choisir les bons paramètres du modèle au travers de diverses méthodes statistiques et d'optimisations ; on les appelle des données d'entraînement. Les modèles les plus récents et performants nécessitent un grand nombre de paramètres ; citons par exemple le LLM LLaMA qui possède 65 milliard de paramètres ~\cite{touvron2023llama}! -Ce grand nombre de paramètres a l'effet indésirable de mémoriser des informations potentiellement sensibles sur les données d'entraînements~\cite{shokri2017membership}. +Ce grand nombre de paramètres a l'effet indésirable de mémoriser des informations potentiellement sensibles sur les données d'entraînement~\cite{shokri2017membership}. L'information contenue dans les données d'entraînement est comme résumée, compressée dans la masse - a priori incompréhensible pour un humain - des paramètres du modèle. Ainsi un individu malveillant, que l'on appellera \emph{attaquant} ou \emph{adversaire}, pourra retrouver des informations sur les données d'entraînement juste en utilisant les paramètres du modèle~\cite{shokri2017membership,yeom2018privacy,carlini2022membership}. \begin{figure} \centering \input{contexte/figure/tikz/train} \caption{Les données d'entraînement servent à trouver les paramètres du modèle. - attaquant utilise les paramètres pour retrouver des informations sur les données d'entraînement.} + L'attaquant utilise les paramètres pour retrouver des informations sur les données d'entraînement.} \label{fig:contexte-train} \end{figure} Un autre risque de fuite de données se trouve au moment de l'utilisation du modèle, après son entraînement. A ce moment, les utilisateurs envoient en entrée du modèle des données qu'ils peuvent vouloir garder confidentielles. -Cependant la sortie du modèle, qui a vocation à être partagée, peut révéler une parie des informations sensibles contenues dans les données d'entrée de l'utilisateur~\cite{yeom2018privacy,zhao2021infeasibility,jayaraman2022attribute,attriguard,Song2020Overlearning,malekzadeh2021honestbutcurious}. +Cependant la sortie du modèle, qui a vocation à être partagée, peut révéler une partie des informations sensibles contenues dans les données d'entrée de l'utilisateur~\cite{yeom2018privacy,zhao2021infeasibility,jayaraman2022attribute,attriguard,Song2020Overlearning,malekzadeh2021honestbutcurious}. Il s'agit du principal risque de manquement à la confidentialité que nous allons explorer dans ce manuscrit. Nous y reviendrons donc dans la Section~\ref{sec:background-conf} pour une présentation de l'état de l'art et au Chapitre~\ref{sec:aia} pour notre contribution. @@ -84,7 +84,7 @@ Quand l'adversaire cherche à inférer un attribut sensible c'est une \emph{atta \label{sec:contexte-secu} Le processus d'entraînement des réseaux de neurones est souvent secret et les utilisateurs ont accès uniquement à un modèle entraîné. Dans ce contexte un adversaire qui a accès à l'entraînement du modèle, dans un cadre d'apprentissage décentralisé par exemple, peut injecter des portes dérobées qui lui permettront de modifier les futures prédictions à sa convenance. -Considérons le scénario factice suivant : une entreprise construit un modèle commercial ayant pour but la prédiction du récidivisme. +Considérons le scénario fictif suivant : une entreprise construit un modèle commercial ayant pour but la prédiction du récidivisme. Cette entreprise vend ce modèle à l'état de Floride des Etats-Unis. Si un adversaire avait introduit une porte dérobée il pourrait choisir quelle serait la prédiction du modèle, décidant ainsi unilatéralement si le juge va penser que le coupable a une forte chance d'être récidiviste ou non. @@ -95,8 +95,8 @@ Ainsi, quand le modèle est utilisé en production, l'adversaire peut utiliser l \label{sec:contexte-conso} Nous vivons une crise climatique majeure due à l'activité humaine qui présage de graves changements pour l'ensemble du vivant ainsi que dans nos modes de vie~\cite{pielke2005hurricanes,khasnis2005global,houghton2005global,melillo2014climate,mcnutt2013climate} Bien que l'IA soit prometteuse pour nous aider à anticiper ces changements~\cite{villani2018donner} il ne faut pas que son développement et l'entraînement de modèles accélèrent le changement climatique et le réchauffement climatique. -Concrètement, le LLM Llama2 à émis 539 tonnes de $\text{CO}_2$ en prenant en compte les divers plans de compensation carbone de Meta~\cite{touvron2023llama}. -L'empreinte carbone d'un français étant estimé à 9,2 tonnes de $\text{CO}_2$ par an~\cite{carbonfr} c'est donc à peu près l'équivalent de 59 personnes pendant un an qui a été généré par Llama2. +Concrètement, le LLM Llama2 a émis 539 tonnes de $\text{CO}_2$ en prenant en compte les divers plans de compensation carbone de Meta~\cite{touvron2023llama}. +L'empreinte carbone d'un français étant estimée à 9,2 tonnes de $\text{CO}_2$ par an~\cite{carbonfr} c'est donc à peu près l'équivalent de 59 personnes pendant un an qui a été généré par Llama2. C'est donc dans l'optique d'entraîner des modèles bien proportionnés (ayant peu de paramètres) et pouvant fonctionner sur des ordinateurs portables ou des téléphones portables\footnote{\textit{Smartphone}} que sont nées les idées d'IA frugale et embarquée~\cite{schwartz2020green,verdecchia2023systematic,shadrin2019designing}. Comme nous l'avons vu plus haut, il s'agit aussi d'un positionnement stratégique de la France~\cite{stratfr}. diff --git a/contexte/legal.tex b/contexte/legal.tex index c4206f3..5333a88 100644 --- a/contexte/legal.tex +++ b/contexte/legal.tex @@ -14,12 +14,13 @@ le droit d’accéder aux données collectées la concernant et d’en obtenir l \item Le respect de ces règles est soumis au contrôle d’une autorité indépendante. \end{enumerate} \fg -L'objet de cette section est de comprendre comment ce droit fondamental entre en conflit avec les attaques décrites dans ce rapport à travers de l'étude de textes légaux. + +L'objet de cette section est de comprendre comment ce droit fondamental entre en conflit avec les attaques décrites dans ce rapport à travers l'étude de textes légaux. L'article 4 paragraphe 1 du Règlement Général sur la Protection des Données, le RGPD, dispose que \og Une donnée à caractère personnel est toute information se rapportant à une personne physique identifiée ou identifiable \fg. Cette définition est importante dans le cadre des attaques de modèles car elle permet de rapidement identifier le cadre légal : -si nous pouvons rattacher l'inférence à une personne, il s'agit d'une donnée personnelle, elle doit donc être utilisée conformément au RGPD \cite{RGPD} +si nous pouvons rattacher l'inférence à une personne, il s'agit d'une donnée personnelle, elle doit donc être traitée conformément au RGPD \cite{RGPD} et à la loi n° 78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés\cite{78-17}. On se place dans le cadre où la base de données ayant servi d'entraînement au modèle d'apprentissage automatique @@ -38,8 +39,7 @@ toute opération ou tout ensemble d'opérations effectuées ou non à l'aide de L'article 9 paragraphe 1 du RGPD dispose que \og Le traitement des données à caractère personnel qui révèle l'origine raciale ou ethnique, les opinions politiques, les convictions religieuses ou philosophiques ou l'appartenance syndicale, ainsi que le traitement des données génétiques, des données biométriques aux fins d'identifier une personne physique de manière unique, des données concernant la santé ou des données concernant la vie sexuelle ou l'orientation sexuelle d'une personne physique sont interdits. -\fg -Donc, publier un modèle avec lequel il est possible de retrouver l'ethnie ou le genre est donc illégal, sauf exceptions. +\fg Par conséquent, publier un modèle avec lequel il est possible de retrouver l'ethnie ou le genre est illégal, sauf exceptions. Même si l'attribut sensible ne rentrait pas dans le cadre de l'article 9 paragraphe 1 du RGPD le fait de pouvoir utiliser une attaque d'attribut constitue une violation des données personnelles au sens de l'article 4 paragraphe 12 du RGPD qui dispose qu'une violation des données personnelles est \og @@ -50,7 +50,7 @@ Même si l'attribut sensible ne rentrait pas dans le cadre de l'article 9 paragr \label{sec:contexte-legal-discrimination} Les facteurs de discrimination et les données personnelles ont une grande intersection, (ethnie, couleur de peau, croyances religieuses, etc). Si un adversaire utilise une attaque d'attribut pour inférer un facteur de discrimination et l'utilise pour réaliser une décision concernant un utilisateur, ou si un facteur de discrimination est implicitement ou explicitement utilisé par un modèle, il est possible que cette situation tombe dans le cadre des lois sur les discriminations. -Sur le site de \url{servie-publique.fr} nous trouvons la définition suivante de discrimination. +Sur le site de \url{service-public.fr} nous trouvons la définition suivante de discrimination. \textquote{La discrimination est un délit interdit par la loi et puni d'une amende et/ou d'une peine d'emprisonnement inférieure à 10 ans qui consiste à traiter défavorablement une personne en s'appuyant sur un motif interdit par la loi}~\cite{servicepubdiscrimination}. Les motifs interdits par la loi se comptent au nombre de 25 critères de discrimination que nous listons en Annexe~\ref{anx:discri}. Nous remarquons que ces critères sont souvent ceux classifiés comme attribut sensible dans la littérature IA~\cite{Song2020Overlearning,malekzadeh2021honestbutcurious}. @@ -71,11 +71,11 @@ En effet, l'article L.1221 alinéa 6 du Code du travail dispose que les informat De plus l'article L.1132 alinéa 1 dispose qu'\textquote{aucune personne ne peut être écartée d'une procédure de recrutement ou de nomination ou de l'accès à un stage ou à une période de formation en entreprise, aucun salarié ne peut être sanctionné, licencié ou faire l'objet d'une mesure discriminatoire, directe ou indirecte}. Comparativement à la loi française, aux États-Unis d'Amérique, l'effet différencié\footnote{\textit{Disparate impact}} est une manière pratique de contrôler si une procédure crée un désavantage, une discrimination, contre une minorité~\cite{biddle2006adverse}. -Cet effet différencié est une quantité qui peut être calculée à partir du modèle d'IA ou de tout autre procédure qui réalise une sélection binaire comme l'admission dans une école, l'attribution de prêt ou encore l'embauche. -C'est tout simplement la proportion d'admis de la minorité discriminée divisé par la majorité favorisée. +Cet effet différencié est une quantité qui peut être calculée à partir du modèle d'IA ou de toute autre procédure qui réalise une sélection binaire comme l'admission dans une école, l'attribution de prêt ou encore l'embauche. +C'est tout simplement la proportion d'admis de la minorité discriminée divisée par la majorité favorisée. Nous en donnerons une définition plus formelle à la Section~\ref{sec:background-eq} C'est donc une quantité qui varie entre 0 et 1 où 0 indique que personne dans la minorité n'est sélectionné et 1 indique qu'autant de personnes de la majorité que de la minorité sont sélectionnées : c'est la parité. -Aux États-Unis, si l'effet différencié est inférieur à $0,8$ cela constitue une preuve, au regard de la loi qui fait jurisprudence, que le système de sélection fait preuve de discrimination. +Aux États-Unis, si l'effet différencié est inférieur à $0,8$ cela constitue une preuve, au regard de la loi qui fait jurisprudence (\textit{Common law}), que le système de sélection fait preuve de discrimination. En France nous n'avons pas de tel précédent ou de métrique précise à utiliser. \subsection{Protection des bases de données} @@ -90,12 +90,12 @@ On peut imaginer plusieurs cas où les attaques présentées dans ce manuscrit p Supposons que le producteur décide d'interdire \og l'extraction ou la réutilisation répétée et systématique de parties qualitativement ou quantitativement non substantielles du contenu de la base lorsque ces opérations excèdent manifestement les conditions d'utilisation normales de la base de données.\fg, comme le prévoit l'article L.342-2 du Code de la Propriété Intellectuelle. Nous sommes alors en droit de penser qu'une attaque de reconstruction représente l'extraction d'une partie de la base de données, en l'occurrence une colonne de la base de données. -De plus cette attaque excède les conditions d'utilisation car, dans ce cas, la condition d'utilisation normale est l'entraînement d'un modèle de machine learning. +De plus cette attaque excède les conditions d'utilisation car, dans ce cas, la condition d'utilisation normale est l'entraînement d'un modèle d'apprentissage automatique. Ici, la personne menant l'attaque porte atteinte aux droits du producteur de la base de données. Considérons maintenant que c'est le fournisseur d'une solution d'apprentissage automatique, exploitant la base de données, qui porte atteinte aux droits du producteur. On se place dans le cas où le producteur interdit \og la réutilisation, par la mise à la disposition du public de la totalité ou d'une partie qualitativement ou quantitativement substantielle du contenu de la base, quelle qu'en soit la forme.\fg, conformément à l'article L.342-1 alinéa 2 du Code de la Propriété Intellectuelle. -Dans le cas où le fournisseur de modèle permet à ses clients (le public) de mener à bien des attributs inférence attack, il met à disposition une partie de la base par sa négligence à utiliser une méthode d'apprentissage résistante à ce type d'attaque. +Dans le cas où le fournisseur de modèle permet à ses clients (le public) de mener à bien des attaques d'inférence d'attributs, il met à disposition une partie de la base par sa négligence à utiliser une méthode d'apprentissage résistante à ce type d'attaque. Notons que l'article L.343-4 du Code de la Propriété Intellectuelle dispose qu'\og est puni de trois ans d'emprisonnement et de 300 000 euros d'amende le fait de porter atteinte aux droits du producteur d'une base de données tels que définis à l'article L. 342-1.\fg @@ -114,8 +114,7 @@ De plus l'article L.151-4 alinéa 2 du Code de Commerce dispose que \og L'obtent Ces articles datent de la loi n° 2018-670 du 30 juillet 2018 relative à la protection du secret des affaires. Il n'y a pas de jurisprudence pour confirmer mais on peut raisonnablement penser qu'une attaque sur un modèle d'IA peut être considérée comme déloyale et contraire aux usages en matière commerciale. -Mais d'un autre côté, l'article L.151-3 alinéa 2 du Code de Commerce dispose que \og Constituent des modes d'obtention licite d'un secret des affaires l'observation, l'étude, le démontage ou le test d'un produit ou d'un objet qui a été mis à la disposition du public ou qui est de façon licite en possession de la personne qui obtient l'information, sauf stipulation contractuelle interdisant ou limitant l'obtention du secret. \fg -On pourrait donc dire que l'attaque s'apparente à une observation ou une étude d'un produit qui a été mis à la disposition du public. +Mais d'un autre côté, l'article L.151-3 alinéa 2 du Code de Commerce dispose que \og Constituent des modes d'obtention licite d'un secret des affaires l'observation, l'étude, le démontage ou le test d'un produit ou d'un objet qui a été mis à la disposition du public ou qui est de façon licite en possession de la personne qui obtient l'information, sauf stipulation contractuelle interdisant ou limitant l'obtention du secret. \fg On pourrait donc dire que l'attaque s'apparente à une observation ou une étude d'un produit qui a été mis à la disposition du public. Il faut donc attendre une jurisprudence en la matière pour savoir si cette attaque représente une atteinte au secret des affaires. Quoi qu'il en soit, il est dans l'intérêt du producteur de la base de données de s'assurer que le fournisseur de solution IA sécurise convenablement ses modèles contre ce genre d'attaque. @@ -155,14 +154,14 @@ Dans ce manuscrit nous avons utilisé des bases de données États-Uniennes pour Bien que nos conclusions sur ces systèmes ne puissent pas s'appliquer dans l'Union Européenne étant donné qu'ils sont désormais interdits, notre analyse théorique reste valable et applicable à d'autres systèmes. Nous avons d'ailleurs évalué nos solutions sur d'autres modèles n'impliquant pas la justice prédictive. -La troisième approche consiste à classifier un certain nombre de pratiques comme des \textquote{systèmes d'IA à haut risques}. -Comme en dispose l'article 6, paragraphe 2 les systèmes à haut risques sont par exemple des systèmes qui concernent : +La troisième approche consiste à classifier un certain nombre de pratiques comme des \textquote{systèmes d'IA à hauts risques}. +Comme en dispose l'article 6, paragraphe 2 les systèmes à hauts risques sont par exemple des systèmes qui concernent : \begin{itemize} \item Emploi, gestion de la main-d'œuvre et accès à l'emploi indépendant (Annexe III, paragraphe 4) \item Accès et droit aux services privés essentiels et aux services publics et prestations sociales essentiels (Annexe III, paragraphe 5) \end{itemize} Ce sont deux points pour lesquels nous avons construit des systèmes d'IA à titre illustratif dans ce manuscrit à la Section~\ref{sec:aia}. -Cette classification d'IA à haut risque impose des règles plus restrictives pour le déploiement. +Cette classification d'IA à hauts risque impose des règles plus restrictives pour le déploiement. Par exemple l'article 9, paragraphe 1, dispose qu'un système de gestion des risques doit être établi. L'article 13, quant à lui, impose un certain niveau d'explicabilité du système. Enfin nous attirons l'attention du.de la lecteur.rice sur l'article 15 qui met l'accent sur la sécurité de tels systèmes, forçant les fournisseurs à contrôler par exemple que leur système ne contienne pas de porte dérobée. diff --git a/contexte/philo.tex b/contexte/philo.tex index 48ddf1b..68424ca 100644 --- a/contexte/philo.tex +++ b/contexte/philo.tex @@ -5,13 +5,13 @@ Des auteurs de litérature d'anticipation comme Isaac Asimov proposaient, dès l Dans cette section nous utiliserons des exemples venus du cinéma comme fils conducteurs pour comprendre la vision que le grand public a de l'IA. Cela nous permetra aussi de mettre en avant certains concepts philosophiques et psychanalytiques pour comprendre à quel point l'IA actuelle est différente de l'humain. C'est aussi une manière d'anticiper sur de possibles futurs développements de l'AGI et leurs éventuelles implications. -L'utilisation du cinéma dans ce contexte se justifie car -les films contribuent à forger les opinions que le grand public ainsi que le politiques se font des questions de société~\cite{fearing1947influence, bernays1928manipulating}. +L'utilisation du cinéma dans ce contexte se justifie, car +les films contribuent à forger les opinions que le grand public ainsi que les politiques se font des questions de société~\cite{fearing1947influence, bernays1928manipulating}. De plus, les films présentés dans cette section sont des succès mondiaux qui ont été vus par des millions de personnes. Certains comme \textit{2001: A space odyssey} de Stanley Kubric sont reconnus comme des œuvres majeures~\cite{afi100}. -Un élément supplémentaire qui nous permet de dire que l'IA actuelle cherche à se rapprocher de l'IA fantasmée (au moins en termes de communication) et le fait que +Un élément supplémentaire qui nous permet de dire que l'IA actuelle cherche à se rapprocher de l'IA fantasmée (au moins en termes de communication) est le fait que Scarlett Johansson, qui interprète la voix de l'IA Samantha dans Her~\cite{her}, ait été approchée par Sam Altamn, le PDG de ChatGPT, pour lui proposer de prêter sa voix à l'IA Sky, basée sur GPT4~\cite{johansson}. -Bien que Johansson ait refusé, cela montre à quel point la vision artistique, et surtout cinématographique, par la réalisation a une influence de l'orientation de l'IA actuelle et réelle. +Bien que Johansson ait refusé, cela montre à quel point la vision artistique, et surtout cinématographique, par la réalisation, a une influence de l'orientation de l'IA actuelle et réelle. Outre cet exemple, nous nous efforcerons dans cette section de tracer un parallèle entre les œuvres discutées et les technologies réelles. diff --git a/contexte/philo/anthro.tex b/contexte/philo/anthro.tex index 3ac39d7..340aa71 100644 --- a/contexte/philo/anthro.tex +++ b/contexte/philo/anthro.tex @@ -8,21 +8,21 @@ La reconnaissance de l'humanité par la société passe par la loi. En droit français, être humain est un synonyme de personne physique~\cite{cornu}. C'est-à-dire ayant la personnalité : l'\textquote{Aptitude à être titulaire des droits et assujetti à des obligations qui appartient à toutes les personnes physiques, [...]}~\cite{cornu}. -Cette définition est d'ailleurs la pierre angulaire quant à la reconnaissance de le qualité d'humain d'Andrew, le robot protagoniste de \textit{The bicentennial man}~\cite{bicentenaire}. -C'est en reconnaissant qu'une personne ayant de multiples prothèse d'organes synthétiques, n'en perd pas moins sa personnalité, alors si ce n'est le corps, ne reste plus que le système psychique qui définisse l'humain. +Cette définition est d'ailleurs la pierre angulaire quant à la reconnaissance de la qualité d'humain d'Andrew, le robot protagoniste de \textit{The bicentennial man}~\cite{bicentenaire}. +C'est en reconnaissant qu'une personne ayant de multiples prothèses d'organes synthétiques, n'en perd pas moins sa personnalité, alors si ce n'est le corps, ne reste plus que le système psychique qui définisse l'humain. -La psyché humaine et ce qui la caractérise est un pilier de la recherche philosophique et scientifique. +La psyché humaine et ce qui la caractérise sont un pilier de la recherche philosophique et scientifique. La psychanalyse d'après Freud donne des outils pratiques pour parler de psyché que nous allons utiliser dans cette section. -Nous allons les présenter rapidement mais pour les cerner plus en détails nous renvoyons le lecteur à \textit{Das Ich und das Es}~\cite{Freud2010-qq}, les citations que nous utilisons comme définitions viennent de cet ouvrage. -Dans un premier temps, la psyché subit une subdivision grossière en trois. +Nous allons les présenter rapidement mais pour les cerner plus en détails nous renvoyons le lecteur à \textit{Das Ich und das Es}~\cite{Freud2010-qq} ; les citations que nous utilisons comme définitions viennent de cet ouvrage. +Dans un premier temps, la psyché subit une subdivision grossière en trois parties. \begin{itemize} - \item Cs : La conscience c'est à dire \textquote{la perception la plus immédiate et la plus certaine.} + \item Cs : La conscience c'est-à-dire \textquote{la perception la plus immédiate et la plus certaine.} \item Pcs : le préconscient c'est-à-dire \textquote{latent, tout en étant capable de devenir conscient.} - \item Ics : l'inconscient c'est-à-dire \textquote{le refoulé [...] incapable de devenir conscient.} à cela nous ajoutons une partie du moi qui contrôle le système Cs-Pcs-Ics. + \item Ics : l'inconscient c'est-à-dire \textquote{le refoulé [...] incapable de devenir conscient.} auquel nous ajoutons une partie du moi qui contrôle le système Cs-Pcs-Ics. \end{itemize} Dans un second temps, le cadre qui orchestre ces trois aspects : \begin{itemize} - \item Le moi : \textquote{Organisation cohérente de processus de l'âme dans une personnes.} + \item Le moi : \textquote{Organisation cohérente de processus de l'âme dans une personne.} \item Le ça : \textquote{Part du psychisme dans lequel le moi se continue et qui se comporte comme Ics.} \item Le sur-moi : \textquote{Résidu des premiers choix d'objet du ça}. C'est la morale qui vient, pour simplifier, de certaines de nos interactions avec le reste du monde. \end{itemize} @@ -43,16 +43,16 @@ C'est donc que cet astronaute a identifié HAL dans son moi et a rendu Cs, par l Il est bien sûr aussi possible que ce processus reste Ics comme dans \textit{Her}~\cite{her}. Cela peut être dangereux car là où l'identification a permis à l'astronaute de débrancher HAL quand il est devenu dangereux, l'investissement aurait pu l'en empêcher. -Dans \textit{Her}, l'IA Samantha bien que non-alignée à la fin du film, n'a pas un but dangereux de destruction. +Dans \textit{Her}, l'IA Samantha, bien que non-alignée à la fin du film, n'a pas un but dangereux de destruction. Cela rend le fait que le personnage principal, Théodore, n'ait pas refoulé l'investissement moins grave. -Notons que le processus d'identification avait commencé chez Théodore car il dit à Samantha : '\textquote{Tu n'es qu'une voie artificielle.} +Notons que le processus d'identification avait commencé chez Théodore car il dit à Samantha : \textquote{Tu n'es qu'une voix artificielle.} \footnote{\textit{You are just an artificial voice[..].}} Cependant Samantha a un argument extrêmement fort qui casse cette identification chez Thodore : \textquote{Ce qui fait que je suis qui je suis, c'est ma capacité à évoluer au travers de mes expériences.} \footnote{\textit{What makes me, me, is my ability to grow through my experiences.}}. Elle expose ainsi l'argument principal qui définit la personnalité comme l'explique Freud~\cite{Freud2010-qq} : \textquote{le caractère du moi résulte de la sédimentation des investissements d'objets abandonnés}. -Nous touchons ainsi du doigt une qualité essentielle de l'AGI que nous retrouvons aussi bien chez l'IA Andrew de \textit{The Bicentenial man} que chez l'IA Samantha de \textit{Her} : +Nous touchons ainsi du doigt une qualité essentielle de l'AGI que nous retrouvons aussi bien chez l'IA Andrew de \textit{The Bicentennial Man} que chez l'IA Samantha de \textit{Her} : un système complet Ics,Pcs,Cs, le tout encadré dans un ça inconnu et régi par un moi qui sert d'interface entre le ça et le système Pcs-Cs. C'est d'ailleurs un ça incomplet qui fait que les IA modernes comme ChatGPT sont très loin de l'humain. ChatGPT lui même explique cela clairement lorsqu'on lui pose la question \textquote{Penses-tu ?} comme nous pouvons le voir à la Figure~\ref{fig:contexte-penses}. @@ -69,7 +69,7 @@ Concernant la construction du caractère, le hasard est un élément important d Asimov présente dans \textit{The Bicentennial Man} un robot qui, par le hasard inhérent à son fonctionnement, montre des caractéristiques humaines comme l'empathie ou la créativité. Ce hasard dans la création est aussi décrit au septième point de la proposition de l'école d'été de Dartmouth~\cite{dartmouth}. Cela renforce le lien entre intuition scientifique et imaginaire créatif, artistique. -De manière assez époustouflante ce hasard joue un rôle prédominant dans les programmes génératifs moderne comme les GAN ou les auto-encodeurs ; nous y reviendrons plus en détails dans à la Section~\ref{sec:background-generation}. +De manière assez époustouflante ce hasard joue un rôle prédominant dans les programmes génératifs modernes comme les GAN ou les auto-encodeurs ; nous y reviendrons plus en détails à la Section~\ref{sec:background-generation}. Cependant, le processus de création par le hasard peut-il vraiment s'apparenter au processus de création humain qui fait l'individualité de chacun ? @@ -109,9 +109,9 @@ Cependant, le processus de création par le hasard peut-il vraiment s'apparenter \end{figure} Enfin, l'anthropomorphisme peut présenter un risque dans la mesure où -Marakas et al.~\cite{MARAKAS2000719} explique que cette confusion de l'humain et de la machine entraîne une sur-évaluation de la capacité des ordinateurs et peut mener à utiliser à outrance la décision automatisée. +Marakas et al.~\cite{MARAKAS2000719} expliquent que cette confusion de l'humain et de la machine entraîne une sur-évaluation de la capacité des ordinateurs et peut mener à utiliser à outrance la décision automatisée. C'est le cas avec les décisions juridiques~\cite{zhiyuan2020limits} ou scolaires~\cite{waters2014grade}, où la vie d'êtres humains est décidée par des ordinateurs. -Cela donne lieu à de nombreux problèmes moraux qui forment les fondements de l'IA éthique notamment atout de l'équité, de la confidentialité et de l'explicabilité sur lesquels nos reviendrons à la Section~\ref{sec:contexte-enjeu}. +Cela donne lieu à de nombreux problèmes moraux qui forment les fondements de l'IA éthique notamment autour de l'équité, de la confidentialité et de l'explicabilité sur lesquels nous reviendrons à la Section~\ref{sec:contexte-enjeu}. Attribuer à l'IA ces tâches crée aussi un besoin législatif comme nous le verrons en Section~\ref{sec:contexte-legal}. -En effet, pour considérer l'IA comme un remplacement viable à l'humain pour les tâches les plus sensibles, il faudrait, comme nous l'avons vu, pouvoir prouver que l'IA ait un système complet moi-ça et ait un sur-moi qui soit aligné avec la morale sociale. +En effet, pour considérer l'IA comme un remplacement viable à l'humain pour les tâches les plus sensibles, il faudrait, comme nous l'avons vu, pouvoir prouver que l'IA a un système complet moi-ça et a un sur-moi qui soit aligné avec la morale sociale. Pour cela le test de Turing reste inadéquat comme l'explique John R. Searle~\cite{searle1980minds}. diff --git a/contexte/philo/anthro.tex.bak b/contexte/philo/anthro.tex.bak new file mode 100644 index 0000000..b5a1c7e --- /dev/null +++ b/contexte/philo/anthro.tex.bak @@ -0,0 +1,117 @@ +L'anthropomorphisme consiste à attribuer des caractéristiques humaines à ce qui n'est pas humain. +Dans le contexte de l'IA et plus précisement de l'AGI, ce phénomène peut devenir courant. +L'anthropomorphisme des ordinateurs et d'ailleur déjà encré dans notre société depuis plusieur décénies. +En effet, l'attribution d'un rôle sociale humain à un ordinateur était déjà présent avant l'introduction des logiciels IA~\cite{MARAKAS2000719} : le programme ecrit, copie, attrape un virus, etc. +Une interaction avec quelquechose qui montre un semblant de comportement social nous renvoi a notre propre aliénation sociale au sens décrit par Jean Jaques Rousseau dans son \textit{Du contrat social}~\cite{rousseau1762contrat}. +Cela nous pousse à considérer ce que l'on anthropomorphise comme des personnes, des être huamins. +La reconnaisse de l'humanitée par la société passe par la loi. + +En droit francais, être humain est un synonime de personne physique~\cite{cornu}. +C'est à dire ayant la personnalité : l'\textquote{Aptitude à être titulaire des droits et assujetti à des obligations qui appartient à toutes les personnes physiques, [...]}~\cite{cornu}. +Cette définition est d'ailleur la pierre angulaire quand à la reconaissance de le qualité d'humain d'Andrew, le robot protagoniste de \textit{The bicentennial man}~\cite{bicentenaire}. +C'est en reconaissant qu'une personne ayant de multiples prothése d'organes synthetiques, n'en perdant pas moins sa personalité, alors si ce n'est le corps, ne reste plus que le système psychique qui définisse l'humain. + +La psychée humaine et ce qui la caractérise est un pilier de la recherche philosophique et scientifique. +La psychanalise d'après Freud donne des outils pratiques pour parler de psychée que nous allons utiliser dans cette section. +Nous allons les présenter rapidement mais pour les cerner plus en détail nous renvoyons le lecteur à \textit{Das Ich und das Es}~\cite{Freud2010-qq}, les citations que nous utilisons comme définition viennent de cet ouvrage. +Dans un premier temps, la psychée subit une subdivision grossière en trois. +\begin{itemize} + \item Cs : La conscience c'est à dire \textquote{la perception la plus immédiate et la plus certaine.} + \item Pcs : le préconscient c'est la dire \textquote{latent, tout en étant capable de devenir conscient.} + \item Ics : l'inconscient c'est à dire \textquote{le refoulé [...] incapable de devenir conscient.} à cela nous ajoutons une partie du moi qui controle le système Cs-Pcs-Ics. +\end{itemize} +Dans un second temps, le cadre qui orchestre ces trois aspects : +\begin{itemize} + \item Le moi : \textquote{Organisation cohérente de processus de l'âme dans une personnes.} + \item La ça : \textquote{Part du psychisme dans laquelle le moi se continue et qui se comporte comme Ics.} + \item Le sur-moi : \textquote{Résidu des premier choix d'objet du ça}. C'est la morale qui vient, pour simplifier, de certaines de nos interactions avec le reste du monde. +\end{itemize} +Pour Freud, les mots on une importance capitale : ils permettent le lien entre le ça et le système Pcs-Cs. +Ainsi ils sont résposable d'une grande partie de la conscience. +Freud dit : +\textquote{[...]Comment quelque chose devient-il Pcs ? et la réponse serait : par connexion avec les représentations de mot correspondantes.} +Il faut voir dans cette citation que \textquote{mot} est entendu au sens large pour inclure les restes mnésiques c'est à dire les anciennes pérceptions. +Les mots sont aussi importants pour les pérceptions et peuvent être à l'originie de l'objet de l'invéstissement. +Toujours d'après Freud, les investissment d'objets partent du ça. +Ensuite, soit il y a l'identification d'objets dans le moi, soit il y a l'acceptation de l'investissement si il n'y à pas refoulement. +C'est à dire que les mots créent un sentimient dont on n'a pas forcément conscience (au sens descriptif et non Cs) pour une IA qui vas nous parler. +Cela est mis en lumière dans +\textit{2001 : A space odyssey} quand un des astraunotes dit que \textquote{quand on s'est habité à ce qu'il [HAL] parle, on le voit juste comme une autre persone}. +\footnote{\textit{get adjusted to the idea that he [HAL] talks, you think of him really just as another person}}. +Cependant, il admet ne pas savoir si les sentiment qu'il percoit chez HAL sont réel ou simulé. +C'est donc que cet astraunote a identifié HAL dans son moi et a rendu Cs, par l'analyse, le processus qui lui fait croire que HAL est humain. + +Il est bien sur aussi possible que ce processus reste Ics comme dans \textit{Her}~\cite{her}. +Cela peut-être dangeureux car là où l'identification a permis à l'astraunote de débrancher HAL quand il est devenu dangeureux, l'investissement aurait put l'en empêcher. +Dans \textit{Her}, l'IA Samantha bien que non-aligné à la fin du film, n'a pas un but dangeureux de déstruction. +Cela rend le fais que le personnage principale, Théodore, n'ai pas réfoulé l'investissement moins grave. +Notons que le processus d'identification avait commencé chez Théodore car il dit à Samanthe : '\textquote{Tu n'est qu'une voie artificielle.} +\footnote{\textit{You are just an artificial voice[..].}} +Cepandant Samantha à un argument extrement fort qui casse cette identification chez Thodore : \textquote{Ce qui fait que je suis qui je suis, c'est ma capacité à évoluer au travers de mes experiences.} +\footnote{\textit{What makes me, me, is my ability to grow through my experiences.}}. +Elle expose ainsi l'argument principale qui définit la personalité comme l'explique Freud~\cite{Freud2010-qq} : +\textquote{le caractère du moi résulte de la sédimentation des investissements d'objets abandonnés}. + +Nous touchons ainsi du doigt une qualité essentiel de l'AGI que nous retrouvons aussi bien chez l'IA Andrew de \textit{The Bicentenial man} que chez l'IA Samantha de \textit{Her} : +un système complet Ics,Pcs,Cs le tout encadré dans un ça inconnu et régi par un moi qui sert d'interface entre le ça et le système Pcs-Cs. +C'est d'ailleur un ça incomplet qui fait que les IA moderne comme ChatGPT sont très loins de l'humain. +ChatGPT lui même explique celà clairement quand on lui pose la question \textquote{Penses-tu ?} comme nous pouvons le voir à la Figure~\ref{fig:contexte-penses}. +Mais alors, quand est-t'il du sur-moi pour les IA ? +Pour une AGI avec un système complet ça-moi, le sur-moi existe forcément d'après sa définition, sinon c'est que le ça est pathologique. +On le voit dans le comportement de Samantha dans~\textit{Her} quand elle explore son refoulé : \textquote{Je n'aime pas qui je suis actuellement}. +\footnote{\textit{I don't like who I am right now}}. +Et d'autre moments qui montrent ses névroses. +Une nevrose en particulier est interessante dans le contexte de l'AGI, qui n'existe pas pour les humains normaux, est le fait que de part sa supperiotié intellectuelle les IA peuvent se détacher totalement des humains. +Pourquoi rester à parler avec un humain quand on est infiniement plus rapide et performant que lui ? +Ainsi même si Samantha dit aimer Théodore, elle le quite, achevant la phase de construction primordiale du moi qui consiste a identifier l'amour du père pour constuire son caractère en métant fin à son Eudipe~\cite{Freud2010-qq}. + +Concernant la construction du caractère, le hasard est élement important de l'antrhopomorphisme, que ce soit dans la litérature d'anticipation où dans les téchnologies actuelles de l'IA générative. +Asimov présente dans \textit{The Bicentennial Man} un robot qui, par le hasard inhérent à son fonctionnement, montre des caractéristique humaine comme l'empathie ou la créativitée. +Ce hasard dans la création est aussi décrit au septième point de de la proposition de l'école d'été de Dartmouth~\cite{dartmouth}. +Cela renforce le lien entre intuition scientifique et imaginaire créatif, artistique. +De manière assez époustouflante ce hasard joue un rôle prédominant dans les programmes génératifs moderne comme les GAN ou les auto encodeurs ; nous y reviendrons plus en détails dans à la Section~\ref{sec:background-generation}. +Cependant le processus de création par le hasard peut-il être vraiement s'apparanté au processus de création humain qui fait l'individualité de chacun ? + + +%De plus, ces caractéristique humaines peuvent se retrouver en interagissant avec des logiciels récent comme les LLM ou les générateurs d'images. +%Cela peut amener les utilisateurs humain à anthropomorphiser ces logiciels~\cite{MARAKAS2000719}. + + +%L'IA HAL 9000 \textquote{reproduit, bien que certain experts préfèrent le terme imite, la plus part des activitées du cerveau humain} +%\footnote{\textit{reprdouce, though some expert still prefer the work mimic, most of the activites of the humain brain}}. +%On remarque que l'imitation d'une compréhensio humaine tel que décrite dans l'expérience de la chambre chinoiseé~\cite{searle1980minds} peut amener l'anthropomophisation d'une machine. +%Nous voyons même dans que le Dr David Bowman éprouve de l'empathie pour la machine dans la scène où il débrance HAL, alors même que celui-ci à tenté de le tuer. + +%Elle aimerait avoir un corps + +%\textit{I am becoming much more than they programmed} + +%\textit{proud of having my own feelings about the world} +%\textit{and I had this terrible thoughts: are my feelings even real? Or are they just programming?} +%Descartes + +%\textit{"Are you falling in love with her?""Does that make me a freak?""No, No..."} + +%\textit{"She is not just a computer, she is her own person. She doesn't just do whatever I say""I didn't say that but it does make me very sad that you can't handle real emotions [...].""They are real emotions! How would you know?} + +%\textit{I don't like what I am right now} + +%\textit{Why do I love you? [...] I don't have an intellectuel reason [...] I trust my feelings} + +%\textit{I used to be worried about not having a body. But now I truly love it [...] I am not limited.} + +%Exclusivité de la relation, conversation avec 8516 autres et amoureuse de 641. Cela serait incormpréhensible pour un humain. + +\begin{figure} + \includegraphics[width=\linewidth]{contexte/figure/chatgpt/penses.png} + \caption{Réponsse de ChatGPT à la question \textquote{penses-tu ?}.} + \label{fig:contexte-penses} +\end{figure} + +Enfin, l'antrhopomorphisme peut présenter un risque dans la mesure où +Marakas et al.~\cite{MARAKAS2000719} explique que cette confusion de l'humain et de la machine entraîne une sur évaluation de la capacité des ordinateurs et peut mener à utiliser à outrance la décision automatisé. +C'est le cas avec les décisions juridiques~\cite{zhiyuan2020limits} ou scolaire~\cite{waters2014grade} où la vie d'être humain est décidé par des ordinateur. +Cela donne lieu à de nombreux problèmes moraux qui forment les fondements de l'IA éthique nottamant autout de l'équité, de la confidentialité et de l'explicabilité sur lesquels nos reviendrons à la Section~\ref{sec:contexte-enjeu}. +Attribuer à l'IA ces tâches crée aussi un besoin législatif comme nous le veron en Section~\ref{sec:contexte-legal}. +En effet, pour considéré l'IA comme un remplacement viable à l'humain pour les tâches les plus sensibles il faudrait, comme nous l'avons vue, pouvoir prouver que l'IA ai un système complet moi-ça et ai un sur-moi qui soit aligné avec la morale sociale. +Pour cela le test de Turing reste inadequoit comme l'explique John R. Searle~\cite{searle1980minds}. diff --git a/contexte/philo/peur.tex b/contexte/philo/peur.tex index aa18375..7cd5126 100644 --- a/contexte/philo/peur.tex +++ b/contexte/philo/peur.tex @@ -8,11 +8,11 @@ Dans l'\textit{Home bicentenaire}, Isaac Asimov écrit le dialogue suivant : 'It is a disease of mankind, one of which it is not yet cured.' } Et en effet, nous observons une certaine méfiance de la part du grand public envers l'IA et ses développements possibles~\cite{johnson2017ai}. -Dans la culture populaire et notamment dans le cinéma, cette peur est très présente, nous voyons à la Figure~\ref{fig:contexte-badai} un collage qui montre que l'IA est un antagoniste iconique du septième art. +Dans la culture populaire et notamment dans le cinéma, cette peur est très présente ; nous voyons à la Figure~\ref{fig:contexte-badai} un collage qui montre que l'IA est un antagoniste iconique du septième art. Explorons certaines de ces inquiétudes. Nous parlerons ici uniquement des risque liés à l'IA forte, et plus précisément à une potentielle AGI future. -Nous présentons à la Section~\ref{sec:contexte-enjeu} une introduction sur les risques à court terme pour des technologies bien présentes et utilisées aujourd'hui en production. -Nous séparons les risques en deux : ceux liés à une IA alignée, c'est-à-dire une IA qui fait ce pour quoi elle a été créée, et le risques lié à une IA non-alignée. +Nous présenterons à la Section~\ref{sec:contexte-enjeu} une introduction sur les risques à court terme pour des technologies bien présentes et utilisées aujourd'hui en production. +Nous séparerons les risques en deux : ceux liés à une IA alignée, c'est-à-dire une IA qui fait ce pour quoi elle a été créée, et les risques liés à une IA non-alignée. \begin{figure} \centering \includegraphics[width=\linewidth]{contexte/figure/bad_ai.png} @@ -30,21 +30,21 @@ C'est la même inquiétude qui est présente dans \textit{The Matrix}~\cite{matr Ce film présente ce qui pourrait se passer après une guerre contre les machines, perdue par l'humanité. Les machines, ayant besoin d'énergie, créent un monde virtuel : une simulation, dans laquelle est enfermé l'esprit de tous les hommes. Ainsi, elles peuvent récupérer la bio-électricité générée par le corps humain. -La simulation est ainsi un environnement où l'IA peut évoluer avec un contrôle humain assez limité ce qui facilite le non-alignement~\cite{johnson2017ai}. -En effet, quand des aspects capitaux de la vie des personnes ne sont plus gérés physiquement, l'IA n'a plus besoin de robots (capteurs, activateur, ...) pour interagir avec la réalité. +La simulation est ainsi un environnement où l'IA peut évoluer avec un contrôle humain assez limité, ce qui facilite le non-alignement~\cite{johnson2017ai}. +En effet, quand des aspects capitaux de la vie des personnes ne sont plus gérés physiquement, l'IA n'a plus besoin de robots (capteurs, activateurs, etc.) pour interagir avec la réalité. Nous parlons ici de la réalité au sens platonicien de l'allégorie de la caverne : la simulation est la réalité~\cite{caverne}. Cette simulation est un futur possible quant à la manière dont nous vivons, par exemple, depuis le COVID-19, le télétravail s'est grandement démocratisé~\cite{bergeaud2023teletravail}. Il existe de multiples moyens numériques pour simuler la vie physique dans ce contexte et la réalité virtuelle est une voie fortement appuyée par les GAFAM. Apple et Meta proposent des casques de réalité virtuelle dans cette optique~\cite{metaverse,applevision}. Dans \textit{The Terminator}, une seule IA est responsable du non-alignement. La tâche pour laquelle cette IA a été construite était la défense du territoire américain. -C'est un problème imprévu par les développeurs, lié à une trop grande confiance dans les capacités de la machine qui amène à la guerre entre homme et machine. +C'est un problème imprévu par les développeurs, lié à une trop grande confiance dans les capacités de la machine, qui amène à la guerre entre homme et machine. En effet le protagoniste Kyle Reese explique l'IA \textquote{Skynet} comme étant \textquote{[un] réseau informatique de défense, habilité à tout connaître. Il le disait intelligent.} \footnote{\textit{Defense network computer, trusted to know it all. They said it was smart.}} L'IA est donc passée de alignée à non-alignée ; cela est particulièrement inquiétant pour les systèmes autonomes armés comme le décrit Cedric Villani à la cinquième partie de son rapport sur l'IA commandé par le gouvernement Macron~\cite{villani2018donner}. -Pour palier cela, les IA, comme les LLM +Pour pallier cela, les IA, comme les LLM \footnote{LLM signifie \textit{Large Language Model} comme ChatGPT par exemple} (Grand Model linguistique) peuvent être programmés pour respecter certaines contraintes morales~\cite{wang2023not}. C'est notamment ce type de contraintes qui est utilisé pour imposer des restrictions morales aux IA actuelles. @@ -75,17 +75,17 @@ Heureusement ce genre de risque est très faible, car la robotique n'est pas ass Nous pouvons nous demander, pourquoi créer une telle IA ? Dans l'optique de répondre à cette question, il existe un argument similaire à celui du Pari Pascalien qui cherche à savoir si nous devons collaborer à l'élaboration d'une IA non-alignée, potentiellement mauvaise. Le Pari Pascalien est un argument probabiliste avancé par Blaise Pascal disant qu'il est plus avantageux de croire en Dieu que de ne pas croire. -Nous présentons dans la Table~\ref{tbl:contexte-paris} comment se fait le calcul moyen du gain. +Nous présenterons dans la Table~\ref{tbl:contexte-paris} comment se fait le calcul moyen du gain. Il existe une version modifiée du Pari, appelée Basilic de Roko, qui explore le problème de Newcombe suivant : doit-on coopérer à la création d'une IA sans alignement~\cite{Singler_2018,roko}? Il s'agit d'un problème de théorie de la décision à deux agents : -L'un est l'IA, l'autre le décideur. +l'un est l'IA, l'autre le décideur. Le décideur est antérieur à l'IA et choisit de coopérer ou non. L'IA est au courant des pensées du décideur, comme dans le cadre d'agents coopérants dans le dilemme du prisonnier~\cite{Poundstone1993-jr}. L'IA fait du chantage au décideur : si le décideur ne coopère pas il sera torturé. Cela crée pour le décideur le tableau de gain présenté à la Table~\ref{tbl:contexte-roko}. Ainsi, toute personne étant au courant du Basilic (ligne Sait) aurait avantage à coopérer. -Cette démonstration a été très médiatisée et a généré beaucoup d'anxiété dû à sa nature de danger informationnel~\cite{rokowiki,slate}. -Cependant cet argument est critiquable, notamment sur le fait que si l'agent IA existe, il n'a pas d'intérêt à torturer l'agent qui savait et na pas contribué rétrospectivement~\cite{rokomisc}. +Cette démonstration a été très médiatisée et a généré beaucoup d'anxiété due à sa nature de danger informationnel~\cite{rokowiki,slate}. +Cependant cet argument est critiquable, notamment sur le fait que si l'agent IA existe, il n'a pas d'intérêt à torturer l'agent qui savait et n'a pas contribué rétrospectivement~\cite{rokomisc}. \begin{table} \centering @@ -122,7 +122,7 @@ Cependant cet argument est critiquable, notamment sur le fait que si l'agent IA \end{table} \FloatBarrier -\subsubsection{IA aligné} +\subsubsection{IA alignée} Le non-alignement n'est pas le seul risque envisageable. Par exemple dans \textit{2001: A Space odyssey}~\cite{2001odyssey} HAL est une IA alignée qui, pour préserver sa mission, choisit de tuer les humains qui veulent le débrancher. @@ -130,23 +130,23 @@ On remarque donc bien la nécessité, de manière générale, d'avoir des gardes Ainsi, un risque est celui d'une IA cherchant si bien à atteindre son objectif qu'elle en oublierait toute considération morale. Pour pallier cela, tout comme dans le cas des IA non-alignées, des contraintes peuvent être imposées lors de l'entraînement des modèles. -Un autre type de risque est celui qui consiste à attribuer une tâche capitale à une IA qui, potentiellemen,t aurait des failles de sécurité. -C'est ce scénario qu'explore \title{War game}~\cite{wargames}. -Dans ce film, qui se passe pendant la Guerre Froide, la gestion et la décision de l'utilisation d'armes nucléaires est délégué à une IA. +Un autre type de risque est celui qui consiste à attribuer une tâche capitale à une IA qui, potentiellement, aurait des failles de sécurité. +C'est ce scénario qu'explore \textit{War game}~\cite{wargames}. +Dans ce film, qui se passe pendant la Guerre Froide, la gestion et la décision de l'utilisation d'armes nucléaires sont déléguées à une IA. Le raisonnement est que le programme peut optimiser le succès d'une riposte atomique infiniment plus rapidement qu'un humain. Cependant, il y avait une faille dans l'IA : une porte dérobée\footnote{\textit{Backdoor}} avait été introduite par un développeur. A cause de cela, un jeune hacker a failli réussir, par inadvertance, à déclencher une guerre nucléaire avec l'URSS\footnote{Union des Républiques Socialistes Soviétiques}. Comme nous l'avons vu en Section~\ref{sec:contexte-ckoi}, l'IA est de plus en plus utilisée, et même pour des systèmes critiques. Il est de plus possible de mettre des portes dérobées dans les IA comme nous le verrons en Section~\ref{sec:contexte-secu}. -Pour finir cette section nous parlerons du risque de confidentialité. +Pour finir cette section, nous parlerons du risque de perte de confidentialité. C'est-à-dire du risque que des informations que l'on souhaite garder confidentielles soient utilisées par autrui. Nous verrons des définitions de la confidentialité plus poussées dans la Section~\ref{sec:contexte-legal}. -Dans le film \textit{Her}~\cite{her}, l'assistant personnel IA Samantha accède sans l'autorisation de l'utilisateur, Théodore, à ses \textit{emails}. -Elle ne l'informe qu'après avoir lu l'intégralité de ses conversations : \textquote{J'ai vu dans tes \textit{emails} que tu à récemment rompu}\footnote{ +Dans le film \textit{Her}~\cite{her}, l'assistant personnel IA, Samantha, accède sans l'autorisation de l'utilisateur, Théodore, à ses \textit{emails}. +Elle ne l'informe qu'après avoir lu l'intégralité de ses conversations : \textquote{J'ai vu dans tes \textit{emails} que tu as récemment rompu}\footnote{ \textit{I saw through your emails that you went through a break up recently}}. En faisant cela elle apprend des informations sensibles sur Théodore : le fait qu'il ait rompu. -Dans ce film nous n'avons que très peu d'informations sur le fonctionnement des IA (qu'il appellent OS), ce qui ne nous permet pas de dire que cette information précise quitte l'appareil local de Théodore pour être envoyé vers un tiers. +Dans ce film nous n'avons que très peu d'informations sur le fonctionnement des IA (qu'il appellent OS), ce qui ne nous permet pas de dire que cette information précise quitte l'appareil local de Théodore pour être envoyée vers un tiers. Cependant, dans la suite du film, Samantha avoue avoir parlé de Théodore avec d'autres personnes alors que celui-ci n'était pas au courant. Samantha est donc en réseau, avec la possibilité de communiquer n'importe quelle information qu'elle juge nécessaire. Cela implique une grande chance qu'elle ait communiqué des informations que Théodore aurait souhaité garder confidentielles. diff --git a/contexte/philo/peur.tex.bak b/contexte/philo/peur.tex.bak new file mode 100644 index 0000000..0fef0e1 --- /dev/null +++ b/contexte/philo/peur.tex.bak @@ -0,0 +1,158 @@ +Dans l'\textit{Home bicentenaire}, Isaac Asimov ecrit le dialogue suivant : +\textquote{ +'Comment peuvent-ils avoir peur des robots ?' +'C'est un mal de l'humanitée, l'un de ceux dont elle n'est pas encore guerrie.' +} +\footnote{ +'How can they fear robots?' +'It is a disease of mankind, one of which it is not yet cured.' +} +Et en effet, nous observons une certaine méfiance de la part du grand publique envers l'IA et ses dévelopement possibles~\cite{johnson2017ai}. +Dans la culture populaire et notament dans le cinema, cette peur est très présente, nous voyons à la Figure~\ref{fig:contexte-badai} un collage qui montre que l'IA est un antagoniste iconique du septième art. +Explorons certaines de ces inquétudes. +Nous parlerons ici uniquement des risque liée à l'IA forte, et plus précisement à une potentielle AGI future. +Nous présentons à la Section~\ref{sec:contexte-enjeu} une introduction sur les risques à court termes pour des technologie bien présentes et utilisé aujourd'hui en production. +Nous séparons les risques en deux : ceux liée à un IA aligné, c'est à dire une IA qui fait ce pour quoi elle à été crée, et le risques lié à un IA non-alignée. +\begin{figure} + \centering + \includegraphics[width=\linewidth]{contexte/figure/bad_ai.png} + \caption{L'IA : un grand méchant. WarGames~\cite{wargames}. Avengers: Age of Ultron~\cite{avenger}. The Matrix~\cite{matrix}. The Terminator~\cite{terminator}. Futurama~\cite{futurama}. 2001: A space Odyssey~\cite{2001odyssey}} + \label{fig:contexte-badai} +\end{figure} + +\FloatBarrier +\subsubsection{AI non-alginée} +La scène d'ouverture de \textit{The Terminator}~\cite{terminator} montre parfaitement ce qu'est une machine aligné. +Nous y voyons des machines autonomes se battre avec une force ecrasant contre des humains. +Cette scène contraste avec celle qui l'on voit jute après l'écran titre où la machine, toute aussi gigantesque que les robots tueurs, est un camion poubelle donc totalement au service et l'homme qui la contrôle. +Une IA non-alginé est donc un programme qui cherche à atteindre un objectif qui n'est pas celui pour lequel il a été concut, dans ce cas, un guerre totale contre l'humanitée. +C'est la même inquiétude qui est présente dans \textit{The Matrix}~\cite{matrix}. +Ce film présente ce qui pourrait se passer après un guerre contre les machines pérdu par l'humanité. +Les machines, ayant besoin d'énergie, créent un monde virtuel : une simulation, dans laquelle est enfermé l'esprit de tous les hommes. +Ainsi elle peuvent recuperer la bioéléctricité générée par le corps humain. +La simulation est ainsi un environement ou l'IA peut évoluer avec un controle humain assez limité ce qui facilite le non-alignement~\cite{johnson2017ai}. +En effet, quand des aspects capitaux de la vie des personnes n'est plus géré physiquement, l'IA n'a plus besoins de robot (captuers, activateur, ...) pour intéragir avec la réalité. +Nous parlons ici de la réalité au sens plationitien de l'alégorie de la caverne : la simulation est la réalité~\cite{caverne}. +Cette simulation est un future possible quand à la manière dont nous vivons, par exemple depuis le COVID-19 le télétravail c'est grandement démocratisé~\cite{bergeaud2023teletravail}. +Il existe de multiples moyens numériques pour simuler la vie physique dans ce contexte et la réalité virtuelle est une voie fortemnt appuyé par les GAFAM. +Apple et Meta proposent des casques de réalitée virtuelle dans cette optique~\cite{metaverse,applevision}. + +Dans \textit{The Terminator}, une seul IA est responssable du non-alignement. La tâche pour laquelle cette IA à été construite était la défense du territoire américain. +C'est un problème imprévu par les dévelopeurs lié à une trop grande confiance dans les capacité de la machine qui amène à la guerre entre homme et machine. +En effet le protagoniste Kyle Reese explique l'IA \textquote{Skynet} comme étant +\textquote{[un] réseau informatique de défence, habilité à tout connaître. Il le disait intelligent.} +\footnote{\textit{Defense network computer, trusted to know it all. They said it was smart.}} +L'IA est donc passé de aligné à non-aligné, cela est particulièrement inquiétant pour les systèmes autonomes armés comme le décrit Cedric Villani à la cinquième partie de son rapport sur l'IA commandé par le gouvernment Macron~\cite{villani2018donner}. + +Pour palier cela, les IA, comme les LLM +\footnote{LLM signifie \textit{Large Language Model} comme ChatGPT par exemple} +(Grand Model Languisitque) peuvent être programmé pour respecter certaines contraintes morales~\cite{wang2023not}. +C'est notammant ce types de contraintes qui est utilisé pour imposer des restriction morale aux IA actuelle. +Nous aborderons en détail ce sujet à la Section~\ref{sec:background-eq}. +C'est aussi ce type de contrôle que préconise +Asimov dans ca serie de nouvelles sur les robots \textit{I, Robot}. +Il y introduit les fameuses trois lois de la robotique qui sont programmés dans toutes les IA de son oeuvre~\cite{assimovIrobot}: +\textquote{ +\begin{enumerate} + \item La Première loi : Un robot ne peut porter atteinte à un être humain ni, restant passif, laisser cet être humain exposé au danger ; + \item La Seconde loi : Un robot doit obéir aux ordres donnés par les êtres humains, sauf si de tels ordres entrent en contradiction avec la première loi ; + \item La Troisème loi : Un robot doit protéger son existence dans la mesure où cette protection n'entre pas en contradiction avec la première ou la deuxième loi. +\end{enumerate} +} +\footnote{\textit{The First Law: A robot may not injure a human being or, through inaction, allow a human being to come to harm. The Second Law: A robot must obey the orders given it by human beings except where such orders would conflict with the First Law. The Third Law: A robot must protect its own existence as long as such protection does not conflict with the First or Second Law.}} +Ces trois lois mettent en avant la necessité d'avoir un contrôle sur l'IA et peuvent être vue comme les prémisses de l'IA éthique. +C'est en parti dans cet objectif que l'Union Européenne +a établie le règlement (UE) 2024/1689 du parlement européen et du conseil +du 13 juin 2024 +établissant des règles harmonisées concernant l’intelligence artificielle~\cite{aiact}. +Ce réglèment établi de plusieurs niveaux de risque qui impose chacun des restrictions sur le déploiement et la création d'IA. Nous entrerons plus en détails dans ce réglement à la Section~\ref{sec:contexte-aiact}. + +Outre le cas d'une IA qui bascule d'aligné à non-aligné, et bien que ce cas ne ce soit pas (encore) présenté, \textit{Avengers: age of Ultron}~\cite{avenger} présente une IA qui dès sa création est non-aligné. +Lors d'une expérience, Tony Stark, le createur de l'IA Ultron, n'avait pas de but précis pour sa création. +Ultron, après avoir s'être renseigné sur ce que sont les humains en ayant accès à internet, à pris la décision de les exterminer. +Heureusement ce genre de risque est très faible, car la robotique n'est pas assez avancé et comme le montre Johnson et al~\cite{johnson2017ai}, les IA acutels ne sont pas capable de prendre des décisions arbitraires. + +Nous pouvons nous demander, pourquoi créer un telle IA ? +Dans l'optique de répondre à cette question, il existe un argument similaire à celui du Paris Pascalien qui cherche à savoir si nous devons colaborer à l'ellaboration d'une IA non-aligné, potentielement mauvaise. +Le Paris Pascalien est un argument probabiliste avancé par Blaise Pascale disant qu'il est plus avantageux de croire en dieu que de ne pas croire. +Nous présentons dans la Table~\ref{tbl:contexte-paris} comment se fait le calcul moyen du gain. +Il existe une version modifié du paris, appélé Basilic de Roko, qui explore le problème de Newcombe suivant : doit-on coopéréer à la création d'une IA sans alignement~\cite{Singler_2018,roko}? +Il s'agit d'un problème de théorie de la décision à deux agents : +L'un est l'IA, l'autre le decideur. +Le décideur est antiérieur à l'IA et choisit de coopérer ou non. +L'IA est au courant des pensée du décideur comme dans le cadre d'agent coopérants dans le dilemn du prisonier~\cite{Poundstone1993-jr}. +L'IA fait du chantage au décideur : si le décideur ne coopère pas il sera torturé. +Cela crée pour le décideur le tableau de gain presanté à la Table~\ref{tbl:contexte-roko}. +Ainsi, toutes personne étant au courant du Basilic (ligne Sait) aurait avantage à coopérer. +Cette démonstration a été très médiatisée et à généré beaucoup d'anxiété du à sa nature de danger informationel~\cite{rokowiki,slate}. +Cependant cet argument est criticable, notament sur le fait que si l'agent IA existe, il n'a pas d'intéret à torturer l'agant qui savait et na pas contribué retrospéctivement~\cite{rokomisc}. + +\begin{table} + \centering + \begin{tabular}{c|cc} + &Existe&N'éxiste pas\\ + \hline + Croire&$+\infty$&$-c$\\ + Ne pas croire&$-\infty$&$+c$\\ + \end{tabular} + + \begin{tabular}{c} + $E(\text{Croire}) = +\infty P(\text{Existe}) - c P(\text{N'éxiste pas}) = +\infty$\\ + $E(\text{Ne pas croire}) = -\infty P(\text{Existe}) + c P(\text{N'éxiste pas}) = -\infty$ + \end{tabular} + \caption{Tableau des gains de croire ou ne pas croire en Dieu. $E$ représente le gain moyen (voir la Section~\ref{sec:background-proba} pour une définition formelle de l'espérence).} + \label{tbl:contexte-paris} +\end{table} + +\begin{table} + \centering + \begin{tabular}{cc|cc} + &&IA construit&IA pas construit\\ + \hline + \multirow{2}{*}{Sait}& + Donner&$-c$&$-c$\\ + &Ne pas donner&$-\infty$&$0$\\ + \hline + \multirow{2}{*}{Ne sait pas}& + Donner&/&/\\ + &Ne pas donner&$0$&$0$\\ + \end{tabular} + \caption{Basilic de Roko} + \label{tbl:contexte-roko} +\end{table} + +\FloatBarrier +\subsubsection{IA aligné} +Le non-alignement n'est pas le seul risque envisageable. +Par exemple dans \textit{2001: A Space odyssey}~\cite{2001odyssey} +HAL est une IA aligné qui pour préserver sa mission choisit de tuer les humains qui veulent le débrancher. +On remarque donc bien la necessité, de manière générale, d'avoir de garders fous qui assurent non seulement l'utilité du programme (sa mission) mais aussi un certain niveau morale. +Ainsi, un risque est celui d'une IA cherchant si bien à atteindre son objectif qu'elle en oublierai toute considération morale. +Pour palier cela, tout comme dans le cas des IA non-alginé, des contraites peuvent être imposé lors de l'entrainement des modèles. + +Un autre type de risque est celui qui consiste à attribuer une tâche capitale à une IA qui potentielement aurait des failles de sécurité. +C'est ce scénario qu'explore \title{War game}~\cite{wargames}. +Dans ce film qui se passe pendant la guerre froide, la gestion et la décision de l'utilisation d'arme nucléaires et délégué à une IA. +Le raisonement est que le programme peut optimiser le succès d'une riposte atomique infiniement plus rapidement qu'un humain. +Cependant, il y avait une faille dans l'IA : une porte dérobée\footnote{\textit{Backdoor}} avait été introduite par un développeur. +A cause de cela, un jeune hacker à faille réussir par inadvertance, à déclancher une guerre nucléaire avec l'URSS\footnote{Union des Républiques Socialistes Soviétiques}. +Comme nous l'avons vu en Section~\ref{sec:contexte-ckoi}, l'IA est de plus en plus utilisée et même pour des système critiques. +Il est de plus possible de mettre des porte dérobée dans les IAcomme nous le verons en Section~\ref{sec:contexte-secu}. + +Pour finir cette section nous parlerons du risque de confidentialité. +C'est à dire du risque que des informations que l'on souhaite garder confidentielle soient utilisés pas autrui. +Nous verons des définitions de la confidentialité plus poussée dans la Section~\ref{sec:contexte-legal}. +Dans le film \textit{Her}~\cite{her}, l'assistant personel IA Samantha accède sans l'autorisation de l'utilisateur, Théodore, à ses \textit{emails}. +Elle ne l'informe qu'après avoir lu l'integralité de ses conversations : \textquote{J'ai vu dans tes \textit{emails} que tu à récament rompu}\footnote{ + \textit{I saw through your emails that you went through a break up recently}}. +En faisant cela elle apprend des informations sensibles sur Théodore : le fait qu'il ai rompu. +Dans ce film nous n'avons que très peu d'information sur le fonctionnement des IA (qu'il appellent OS) ce qui ne nous permet pas de dire que cette information précise quitte l'appareil locale de Théodore pour être envoyé vers un tiers. +Cependant, dans la suite du film Samantha avoue avoir parlé de Théodore avec d'autre personnes alors que celui-ci n'était pas au courant. +Samantha est donc en réseau avec la possibilité de communiquer n'importe quelle information qu'elle juge nécessaire. +Cela implique une grande chance qu'elle ai comuniqué des information que Théodore aurai souhaité garder confidentielles. +Les assistants personels sont de plus en plus présents, notament sur téléphone avec par exemple Siri sur iPhone~\cite{siri} ou Google assistant sur les Pixel~\cite{googleai}. +Ces assistants pour être utiles doivent avoir accès aux donnés personelles des utilisateurs et les limitations actuels de la puissance de calcul sur smartphone fait que ces données doivent être envoyer à des tiers pour être traité. +Par exemple, Siri envoi ses requettas les plus complexes à ChaGPT par exemple~\cite{aaigpt} mais l'utilisateur doit donner son accord pour chaque requette. +Ou encroe, sur la messagerie Discord~\cite{discord}, il est possible d'activer le résumé des converssations. +Alors le seveur Discord envoi toutes les conversations aux serveur de OpenAI pour que ChatGPT les analyses~\cite{discordgpt}. + diff --git a/contexte/strat.tex b/contexte/strat.tex index 020c534..94054e5 100644 --- a/contexte/strat.tex +++ b/contexte/strat.tex @@ -25,18 +25,18 @@ \end{figure} Nous observons sur la Figure~\ref{fig:contexte-trend} que la recherche des termes \textquote{intelligence artificielle} en France sur le moteur de recherche Google a subi une grande augmentation depuis 2020. -Ainsi, l'IA intéresse de plus en plus le grand public qui voit ces technologies investir leur téléphone portable, ordinateur, médias, etc. +Ainsi, l'IA intéresse de plus en plus le grand public qui voit ces technologies investir les téléphones portables, ordinateurs, médias, etc. Ce phénomène semble suivre en parallèle une très forte augmentation de l'investissement français en matière d'IA. -Pour mieux comprendre ce phénomène nous avons conduit une micro étude des financements accordés par l'Agence Nationale la Recherche (ANR), l'un des principaux bailleurs en France. -L'ANR publie une base de donnée des appels à projets financé par la Direction des Opérations Scientifiques (DOS) de l'ANR depuis 2005. -Dans ces données, il y a entre autre, le montant du financement accordé, le titre en anglais et en français ainsi que le résumé en anglais et en français. +Pour mieux comprendre ce phénomène nous avons conduit une micro-étude des financements accordés par l'Agence Nationale la Recherche (ANR), l'un des principaux bailleurs en France. +L'ANR publie une base de données des appels à projets financés par la Direction des Opérations Scientifiques (DOS) de l'ANR depuis 2005. +Dans ces données, il y a entre-autre le montant du financement accordé, le titre en anglais et en français ainsi que le résumé en anglais et en français. Le titre et le résumé constituent un court paragraphe de texte, donc chaque mot présent est normalement consciencieusement choisi. Nous avons créé, en utilisant ChatGPT, une liste de mots clefs en anglais et en français qui indique qu'un projet a une forte composante IA. Nous présentons cette liste à l'Annexe~\ref{anx:mots}. Pour tous les projets financés depuis 2005 nous avons cherché si le titre ou le résumé contient un ou plusieurs mots de la liste. Grâce à cela nous construisons la Figure~\ref{fig:contexte-anr} qui montre l'évolution du financement de l'IA au cours du temps. Nous observons sur la Sous-figure~\ref{subfig:contexte-anr-moy} qu'en moyenne le financement d'un projet IA n'a pas évolué depuis 2005. -Cependant nous voyons sur la Sous-figure~\ref{subfig:contexte-anr-prop} que le nombre de projets IA a augmenté passant de 2\% du nombre total de projet à 15\%. +Cependant nous voyons sur la Sous-figure~\ref{subfig:contexte-anr-prop} que le nombre de projets IA a augmenté, passant de 2\% du nombre total de projet à 15\%. Nous observons la même augmentation de la proportion d'argent accordé à l'IA. Ainsi, en sommant par année les financements de tous les projets IA, nous observons sur la Sous-figure~\ref{subfig:contexte-anr-fin} une augmentation de 5 à 125 millions d'Euros. Cette claire augmentation de l'investissement en IA en France n'est pas due au hasard mais à une stratégie dûment établie. @@ -64,7 +64,7 @@ Ces quatre piliers sont devenus capitaux dans la politique actuelle d'investisse C'est tout d'abord éviter la fuite des cerveaux en augmentant l'attractivité des établissements publics. Par exemple en créant des Instituts Interdisciplinaires d’Intelligence Artificielle (3IA). Cela passe aussi par un renforcement des liens entre la recherche et l'industrie, notamment avec les transferts technologiques et la valorisation. -Ce cadre dynamique ne peut être possible qu'avec des moyens pratiques et pragmatiques comme par exemple dédier des supercalculateurs à la recherche. +Ce cadre dynamique ne peut être possible qu'avec des moyens pratiques et pragmatiques, comme par exemple dédier des supercalculateurs à la recherche. Nous reviendrons sur ce sujet à la Section~\ref{sec:contexte-strat-infra}. \paragraph{Anticiper les impacts sur le travail, l’emploi et expérimenter.} @@ -92,19 +92,19 @@ Ce règlement a mis en place une liste de tâches dites \textquote{Inacceptables Nous y reviendrons à la Section~\ref{sec:contexte-legal-util}. \paragraph{Pour une IA inclusive et diverse.} -Pour que l'IA profite à toutes et tous il est nécessaire déjà de palier l'écart historique de choix d'études scientifiques entre homme et femme. +Pour que l'IA profite à toutes et tous il est nécessaire déjà de pallier l'écart historique de choix d'études scientifiques entre hommes et femmes. Il s'agit aussi de favoriser la mixité sociale dans la recherche et l'industrie en IA. Cela passe par la médiation scientifique et par une réflexion quant à l'utilisation de l'IA dans les secteurs sociaux (autres que la santé qui est déjà bien lotie). \subsection{Plan France 2030} -Le plan France 2030 est un plan d'investissement du gouvernement d'Emannuel Macron de 54 milliards d'Euros~\cite{france2030} ayant pour but de rattraper le retard industriel de la France. +Le plan France 2030 est un plan d'investissement du gouvernement d'Emmanuel Macron de 54 milliards d'Euros~\cite{france2030} ayant pour but de rattraper le retard industriel de la France. L'IA touchant à plusieurs aspects industriels a une part importante dans ce plan. Ce plan est divisé en deux phases~\cite{2030phase}. La première phase de 2018 à 2022 a pour but de \textquote{Doter la France de capacités de recherche compétitives}. Avec notamment la mise en place des (3IA) et du supercalculateur Jean Zay~\cite{jeanzay}. La seconde phase de 2021 à 2025 a pour but de \textquote{Diffuser des technologies d’intelligence artificielle au sein de l’économie}. -Nous pouvons citer par exemple le programme \textit{IA Booster}~\cite{iabooster} qui propose un accompagnement aux PME\footnote{Petites et Moyennes Entreprises} pour les aider à intégrer l'IA à leur produits et leur solutions. +Nous pouvons citer par exemple le programme \textit{IA Booster}~\cite{iabooster} qui propose un accompagnement aux PME\footnote{Petites et Moyennes Entreprises} pour les aider à intégrer l'IA à leurs produits et leurs solutions. Concernant l'IA générative il y a l'appel \textit{ Accélérer l’usage de l’intelligence artificielle générative dans l’économie}~\cite{2030generatif}. Cet appel a pour but le développement d'outils de A à Z et met l'accent sur les différents enjeux de l'IA avec des exigences environnementales et d'équité par exemple. @@ -113,10 +113,10 @@ Les compétitions données\footnote{Data challenge} font partie de la culture de Cet appel à projet a pour but d'encourager la création de compétitions sur les données médicales. Pour généraliser, concernant l'IA, France 2030 a pour but la souveraineté numérique. -C'est-à-dire de réduire la dépendance des institutions françaises aux services étrangers et notamment aux GAFAM. +C'est-à-dire réduire la dépendance des institutions françaises aux services étrangers et notamment aux GAFAM. Il s'agit d'un aspect fondamental de la LOI n° 2016-1321 du 7 octobre 2016 pour une République numérique~\cite{loinumerique}. -Pour coordonner ces investissements en matière d'IA, le Directeur général des entreprises du Ministère de l’Economie et des Finances, et en lien avec le Secrétariat général pour l’investissement ont nommé un coordinateur national pour l’intelligence artificielle. +Pour coordonner ces investissements en matière d'IA, le Directeur général des entreprises du Ministère de l’Economie et des Finances, et en lien avec le Secrétariat général pour l’investissement, ont nommé un coordinateur national pour l’intelligence artificielle. \textquote{Il aura pour mission la coordination interministérielle de la stratégie nationale en intelligence artificielle}~\cite{coordinateur}. Ce coordinateur est un exemple d'une réalisation pratique d'une recommandation du rapport Villani\footnote{Cf. page 63 du rapport Villani}. @@ -134,7 +134,7 @@ Ce coordinateur est un exemple d'une réalisation pratique d'une recommandation \subsection{Infrastructures} \label{sec:contexte-strat-infra} Le développement de l'IA demande des puissances de calcul considérables pour faire fonctionner les algorithmes d'apprentissage automatique. -Par exemple le modèle Llama2 a nécessité 3.311.616 GPUheure d'entraînement~\cite{touvron2023llama} ce qui signifie qu'il faudrait 378 ans à un individu ayant une seule carte graphique\footnote{Graphical Processing Unit} (GPU). +Par exemple le modèle Llama2 a nécessité 3.311.616 GPUheure d'entraînement~\cite{touvron2023llama} ce qui signifie qu'il faudrait 378 ans à un individu ayant une seule carte graphique\footnote{Graphical Processing Unit} (GPU) pour faire de même. Pour que la France puisse réaliser ses objectifs ambitieux en matière d'IA il est donc nécessaire de construire des supercalculateurs en mutualisant les ressources entre les différents acteurs. Nous avons donné l'exemple du supercalculateur Jean Zay~\cite{jeanzay} qui a été construit en partie dans cette optique. \begin{figure} diff --git a/introduction.tex b/introduction.tex index d4bdc0a..73d04d8 100644 --- a/introduction.tex +++ b/introduction.tex @@ -1,6 +1,6 @@ L'intelligence artificielle (IA) est de plus en plus présente dans de nombreux domaines comme la santé~\cite{dildar2021skin,gulshan2016development,quinn2022three}, les médias~\cite{gptjournal} ou les ressources humaines~\cite{ore2022opportunities}. Ces technologies induisent des risques pour la confidentialité des données personnelles des utilisateurs~\cite{MehnazAttInf,yeom,shokri2017membership,Song2020Overlearning} et peuvent introduire des biais discriminatoires rendant les décisions automatiques non équitables~\cite{fairmetric,fairmetric2,debiase,reductions}. -Mes travaux s'inscrivent dans une lignée florissante de recherches visant à mieux comprendre ces enjeux capitaux et à trouver des solutions pour rentre l'intelligence artificielle morale. +Mes travaux s'inscrivent dans une lignée de recherches visant à mieux comprendre ces enjeux capitaux et à trouver des solutions pour rentre l'intelligence artificielle morale. Ma principale contribution a été publiée à la conférence Wise 2024 et vise à comprendre le lien entre l'équité et la confidentialité. Notre approche théorique nous a amené à démontrer que, sous un certain aspect, la confidentialité et l'équité pouvaient travailler de concert pour créer des IA plus fiables. diff --git a/notations.tex b/notations.tex index 6ad09be..abfabee 100644 --- a/notations.tex +++ b/notations.tex @@ -36,7 +36,7 @@ Pour faciliter la lecture je fournis ici une liste des notations avec la référ \hline $\text{Tr}(M)$&Trace d'une matrice $M$&Définition~\ref{def:background-alg-tr}\\ \hline - $\mathcal{L}(E,F)$&Ensemble des applications linéaire de $E$ dans $F$&Section~\ref{sec:background-alg-L}\\ + $\mathcal{L}(E,F)$&Ensemble des applications linéaires de $E$ dans $F$&Section~\ref{sec:background-alg-L}\\ \hline $\otimes$&Produit de mesure&Section~\ref{sec:background-proba}\\ \hline @@ -46,7 +46,7 @@ Pour faciliter la lecture je fournis ici une liste des notations avec la référ \hline $\langle x,y\rangle$&Produit scalaire euclidien&Définition~\ref{def:background-dif-scal}\\ \hline - $\mathbb{R}_{n,m}$&Matrice à $n$ lignes et $m$ colones&Section~\ref{sec:background-alg-L}\\ + $\mathbb{R}_{n,m}$&Matrices à $n$ lignes et $m$ colonnes&Section~\ref{sec:background-alg-L}\\ \hline $||x||$&Norme euclidienne&Définition~\ref{def:background-dif-eucl}\\ \hline @@ -4,11 +4,11 @@ Le sujet premier de ce manuscrit, l'intelligence artificielle est un sujet majeu Cette souveraineté est intimement liée à la francophonie car, comme l'explique Rachida Dati, Ministre de la Culture, \textquote{la langue doit vivre au même rythme pour restituer la création, l'invention, l'innovation, pour nous permettre de penser et d'exprimer toutes les réalités du monde contemporain. Et pour rester une grande langue internationale, il faut pouvoir tout dire, tout nommer, tout traduire}~\cite{dati2024declaration}. Ainsi je me suis efforcé de traduire les termes techniques de l'apprentissage automatique qui viennent tous de l'anglais. -Pour éviter que ma traduction soit trop confuse pour les lecteur.rice.s habitué.e.s aux termes anglais, pour chaque terme traduit j'indique son origine anglaise en note de bas de page à se première occurrence. +Pour éviter que ma traduction soit trop confuse pour les lecteur.rice.s habitué.e.s aux termes anglais, pour chaque terme traduit, j'indique son origine anglaise en note de bas de page à sa première occurrence. -De plus ce manuscrit traite d'équité et de discrimination, ces sujets ont une place particulière dans l'histoire de France, ce qui a forgé le rapport des français face à ces questions. -La vision traitée sur ces questions dans la littérature scientifique des conférences et journaux internationaux est celle du monde anglo-saxon notamment États-Uniens. -Ainsi en rédigeant ce manuscrit en français je mets en avant que c'est la vision française, de la loi française et des institution françaises que nous étudions. +De plus, ce manuscrit traite d'équité et de discrimination ; ces sujets ont une place particulière dans l'histoire de France, ce qui a forgé le rapport des français face à ces questions. +La vision traitée sur ces questions dans la littérature scientifique des conférences et journaux internationaux est celle du monde anglo-saxon, notamment États-Uniens. +Ainsi en rédigeant ce manuscrit en français je mets en avant que c'est la vision française, de la loi française et des institutions françaises que nous étudions. Bien que pour des raisons pratiques j'ai dû utiliser certains jeux de données standards États-Uniens, ils ne sont là qu'à titre d'exemple et d'illustration pour les résultats théoriques. Ces résultats sont suffisamment généraux pour s'appliquer à tout type de jeux de données qui respecte les hypothèses de chaque théorème. diff --git a/template_these_INSA_cotut.tex b/template_these_INSA_cotut.tex index b74a316..88fb09f 100644 --- a/template_these_INSA_cotut.tex +++ b/template_these_INSA_cotut.tex @@ -100,7 +100,7 @@ pdfsubject={Th\`ese} %sous Acrobat. \section{Enjeux}
\label{sec:contexte-enjeu}
\input{contexte/enjeux}
- \section{Bases legales}
+ \section{Bases légales}
\input{contexte/legal}
\label{sec:contexte-legal}
@@ -132,7 +132,7 @@ pdfsubject={Th\`ese} %sous Acrobat. \bibliography{biblio}
\appendix
-\chapter{Mot clé pour la recherche projets IA}
+\chapter{Mots-clefs pour la recherche de projets IA}
\label{anx:mots}
\input{annexe/ai_words}
|