diff options
author | Jan Aalmoes <jan.aalmoes@inria.fr> | 2024-08-26 18:19:46 +0200 |
---|---|---|
committer | Jan Aalmoes <jan.aalmoes@inria.fr> | 2024-08-26 18:19:46 +0200 |
commit | 4edf87ea8a5ce3e76285172af2eaecc7bc21813d (patch) | |
tree | 45334aa7894a006fd46818382d89dea2d95eefc8 | |
parent | f964de1889ca8dabfc7195d0d730d80fbcd6b2f7 (diff) |
anthropomorphisation
-rw-r--r-- | biblio.bib | 99 | ||||
-rw-r--r-- | contexte/enjeux.tex | 2 | ||||
-rw-r--r-- | contexte/philo.tex | 84 | ||||
-rw-r--r-- | contexte/philo/anthro.tex | 127 | ||||
-rw-r--r-- | contexte/philo/peur.tex | 57 | ||||
-rw-r--r-- | main.pdf | bin | 4960603 -> 4977242 bytes | |||
-rw-r--r-- | main.tex | 1 |
7 files changed, 278 insertions, 92 deletions
@@ -1,3 +1,35 @@ +############################################"" +#Enjeux +#Securité +#Backdoor +@article{gao2020backdoor, + title={Backdoor attacks and countermeasures on deep learning: A comprehensive review}, + author={Gao, Yansong and Doan, Bao Gia and Zhang, Zhi and Ma, Siqi and Zhang, Jiliang and Fu, Anmin and Nepal, Surya and Kim, Hyoungshick}, + journal={arXiv preprint arXiv:2007.10760}, + year={2020} +} + +@inproceedings{doan2021lira, + title={Lira: Learnable, imperceptible and robust backdoor attacks}, + author={Doan, Khoa and Lao, Yingjie and Zhao, Weijie and Li, Ping}, + booktitle={Proceedings of the IEEE/CVF international conference on computer vision}, + pages={11966--11976}, + year={2021} +} + +#Confidentialité +@misc{discordgpt, + title={In-Channel Conversation Summaries}, + author={\url{https://support.discord.com/hc/en-us/profiles/2921470028-Buffy}}, + howpublished={\url{https://support.discord.com/hc/en-us/articles/12926016807575-In-Channel-Conversation-Summaries}}, + note={Dernier accès: 2024-08-26} +} + + + + + + #####################################################"" #Echelle institutionelle @@ -460,6 +492,73 @@ series = {AIES '18} ######################################### #Philosophie + +@misc{siri, + title={Siri}, + author={Apple}, + howpublished={\url{https://www.apple.com/siri/}}, + note={Dernier accès: 2024-08-26} +} + +@misc{discord, + title={Messagerie Discord}, + author={Discord}, + howpublished={\url{https://discord.com/}}, + note={Dernier accès: 2024-08-26} +} + +@misc{googleai, + title={Google assistant}, + author={Google}, + howpublished={\url{https://assistant.google.com/}}, + note={Dernier accès: 2024-08-26} +} + +@misc{aaigpt, + title={Apple inteligence ChatGPT}, + author={Apple}, + howpublished={\url{https://www.apple.com/newsroom/2024/06/introducing-apple-intelligence-for-iphone-ipad-and-mac/}}, + note={Dernier accès: 2024-08-26} +} + + + +@BOOK{Freud2010-qq, + title = "Le moi et le {\c c}a", + author = "Freud, Sigmund", + publisher = "Payot", + year = 2010, + language = "fr", + note={Das Ich und das Es, 1923. Traduction Jean Laplanche} +} + +@article{waters2014grade, + title={Grade: Machine learning support for graduate admissions}, + author={Waters, Austin and Miikkulainen, Risto}, + journal={Ai Magazine}, + volume={35}, + number={1}, + pages={64--64}, + year={2014} +} + + +@book{rousseau1762contrat, + title={Du contrat social ou Principes du droit politique}, + author={Rousseau, Jean-Jeacques}, + year={1762} +} + +@BOOK{Poundstone1993-jr, + title = "Prisoner's Dilemma", + author = "Poundstone, William", + publisher = "Anchor Books", + month = jan, + year = 1993, + address = "New York, NY" +} + + @article{wang2023not, title={Do-not-answer: A dataset for evaluating safeguards in llms}, author={Wang, Yuxia and Li, Haonan and Han, Xudong and Nakov, Preslav and Baldwin, Timothy}, diff --git a/contexte/enjeux.tex b/contexte/enjeux.tex index 6ac661e..af8f40c 100644 --- a/contexte/enjeux.tex +++ b/contexte/enjeux.tex @@ -54,6 +54,8 @@ Ainsi un individue malveillant, que l'on appelera attaqueur, pourra retrouver de \subsection{Sécuritée} +\label{sec:contexte-secu} +Backdoor~\cite{gao2020backdoor, doan2021lira} \subsection{Comsomation d'énergie} diff --git a/contexte/philo.tex b/contexte/philo.tex index 6c53b5b..17d8e11 100644 --- a/contexte/philo.tex +++ b/contexte/philo.tex @@ -1,15 +1,22 @@ - -Enfin, nous allons terminer cette section visant à mieux cernerles différents aspects de l'IA, par une présentation succinte de ses apparition marquante dans la culture populaire ainsi que de ces implications philosophie. - -Cele permet de mettre en avant l'imaginaire collectif, fantasmé, voir effrayant, que les mots Intelligence Artificiele engendrent. - +%Enfin, nous allons terminer cette section visant à mieux cernerles différents aspects de l'IA, par une présentation succinte de ses apparition marquante dans la culture populaire ainsi que de ces implications philosophie. +%Cele permet de mettre en avant l'imaginaire collectif, fantasmé, voir effrayant, que les mots Intelligence Artificiele engendrent. Alors que scientifiquemet l'IA en était à ses balbutiement avec la conférence de Dartmouth, l'immaginaire humain quand à lui avait une longueur d'avance. Des auteur de litérature d'anticipation comme Isaac Asimov propsaient, dès les années 1950, des situtationsa ainsi qu'une reflexion sur les implication de l'introduction de machines intelligentes dans notre vie de tous les jours. +Dans cette section nous utiliserons des exemples venu du cinéma comme fil conducteurs pour comprendre pour parler de la vision que le grand publique à de l'IA. +Cela nous permetra aussi de mettre en avant certain concept philosophiques et psychanolotiques pour comprendre à quel point l'IA actuel et différentes de l'humain. +C'est aussi une manière d'anticiper sur de possible future dévelopements de l'AGI et leur éventuelle implications. +L'utiliation du cinema dans se contexte se justifie car +les films contribuent à forger les opinions que le grand publique ainis que le politiques se font des questions de société~\cite{fearing1947influence, bernays1928manipulating}. +De plus, les films présentés dans cette Section sont des succès mondiaux qui ont été vus par des millions de personnes. +Certains comme \textit{2001: A space odyssey} de Stanley Kubric sont reconnu comme des oeuvres majeurs~\cite{afi100}. +Un élément supplementaire qui nous permet de dire que l'IA actuelle cherche à se raprocher de l'IA fantasme (au moins en terme de communication) et le fait que +Scarlett Johansson, qui interprète la voix de l'IA Samantha dans Her~\cite{her}, ai été approchée par Sam Altamn, le PDG de ChatGPT, pour lui proposer de préter sa voix à l'IA Sky, basé sur GPT4~\cite{johansson}. +Bien que Johansson ai refusé, cela montre à quel point la vision artistique, et surtout cinématographique par le réalisation est une influence de l'orientation de l'IA actuel et réel. +Outre cet exemple, nous nous efforcerons dans cette section de tracer un parallèle entre les oeuvre discutée et les téchnologies réels. + -\subsection{La peur et le contrôle} +\subsection{Risques} \input{contexte/philo/peur} -\subsection{La mauvaise utilisation} -\input{contexte/philo/mu} \subsection{Anthropomorphisation} \input{contexte/philo/anthro} @@ -17,66 +24,15 @@ Des auteur de litérature d'anticipation comme Isaac Asimov propsaient, dès les \textit{The Matrix}~\cite{matrix}. \textit{2001: A Space Odyssey}~\cite{2001odyssey}. -L'IA HAL 9000 \textquote{reproduit, bien que certain experts préfèrent le terme imite, la plus part des activitées du cerveau humain} -\footnote{\textit{reprdouce, though some expert still prefer the work mimic, most of the activites of the humain brain}}. -On remarque que l'imitation d'une compréhensio humaien tel que décrite dans l'expérience de la chambre chinoiseé~\cite{searle1980minds} peut amener l'anthropomophisation d'une machine. -Nous voyons même dans que le Dr David Bowman éprouve de l'empathie pour la machine dans la scène où il débrance HAL, alors même que celui-ci à tenté de le tuer. -D'ailleur il dit lors d'un interview qu'une fois \textquote{qu'on s'est habité à ce qu'il [HAL] parle, on le voit juste comme une autre persone} -\footnote{\textit{get adjusted to the idea that he [HAL] talks, you think of him really just as another person}}. -Cependant, il admet ne pas savoir si les sentiment qu'il percoit chez HAL sont réel ou simulé. -HAL est un exemple d'IA aligné qui pour préserver sa mission choisit de tuer les humains qui veulent le débrancher. -On remarque donc bien la necessité, de manière générale, d'avoir de garders fous qui assurent non seulement l'utilité du programme (sa mission) mais aussi un certain niveau morale. -Les trois lois de la robotique sont des exemples de ce genre, hors du cadre la science fiction, les garanties d'équitée dans le traitement en sont des autres. \textit{Her}~\cite{her} -Au début, nous voyons Théodore, le personnage principle, travailler. -Son travail consiste à ecrir des lettres pour un service en ligne. -Les clients demandent une lettre pour leur conjoint, leur amis, leur employeur, etc. et Théodore ecrit une lettre qui correspond à la description du client. -Il sagit d'un récit d'anticipation où les IAs sont des programmes intégéré dans les systèmes d'exploitations (OS) à la manière d'assistant virtuels. -Malgré l'évident qualité qu'aurait ces programmes à générer ces lettres, ce sont bien des employés humain qui les écrivent. - -\textit{What makes me, me, is my ability to grow through my experiences. So basicaly et every moment I am evolving. Just like you.} - -\textit{You are just an artificial voice inside of a computer.} - -\textit{I saw through your emails that you went through a break up recently.} - -Elle a des \textit{personal embarassin thoughts} - -Elle aimerait avoir un corps - -\textit{I am becoming much more than they programmed} - -\textit{proud of having my own feelings about the world} -\textit{and I had this terrible thoughts: are my feelings even real? Or are they just programming?} -Descartes - -\textit{"Are you falling in love with her?""Does that make me a freak?""No, No..."} - -\textit{"She is not just a computer, she is her own person. She doesn't just do whatever I say""I didn't say that but it does make me very sad that you can't handle real emotions [...].""They are real emotions! How would you know?} - -\textit{I don't like what I am right now} - -\textit{Why do I love you? [...] I don't have an intellectuel reason [...] I trust my feelings} - -\textit{I used to be worried about not having a body. But now I truly love it [...] I am not limited.} - -Exclusivité de la relation, conversation avec 8516 autres et amoureuse de 641. Cela serait incormpréhensible pour un humain. - -Scarlett Johansson, qui interprète la voix de l'IA Samantha, a été approchée par Sam Altamn, le PDG de ChatGPT, pour lui proposer de préter sa voix à l'IA Sky, basé sur GPT4~\cite{johansson}. -Bien que Johansson ai refusé, cela montre à quel point la vision artistique, et surtout cinématographique par le réalisation. est une influence de l'orientationd de l'IA actuel et réel. - -Les films contribuent à forger les opinions que le grand publique ainis que le politiques se font des questions de société~\cite{fearing1947influence, bernays1928manipulating}. -Les films présentés dans cette Section sont des succès mondiaux qui ont été vus par des millions de personnes. -Certains comme \textit{2001: A space odyssey} de Stanley Kubric sont reconnu comme des oeuvres majeurs~\cite{afi100}. - +%Au début, nous voyons Théodore, le personnage principle, travailler. +%Son travail consiste à ecrir des lettres pour un service en ligne. +%Les clients demandent une lettre pour leur conjoint, leur amis, leur employeur, etc. et Théodore ecrit une lettre qui correspond à la description du client. +%Il sagit d'un récit d'anticipation où les IAs sont des programmes intégéré dans les systèmes d'exploitations (OS) à la manière d'assistant virtuels. +%Malgré l'évident qualité qu'aurait ces programmes à générer ces lettres, ce sont bien des employés humain qui les écrivent. -\textit{The Terminator}~\cite{terminator}. -Dans la scène d'ouverture, nous voyons des machines autonomes se battre avec une force ecrasant contre des humains. -Cette scène contraste avec celle qui l'on voit jute après l'écran titre où la machine, tout aussi gigantesque que les robots tueurs, est un camion poubelle donc totalement au service et l'homme qui la contrôle. -\textit{Defense network computer, trusted to know it all. They said it was smart.} -\textit{Avengers: Age of Ultron}~\cite{avenger}. \begin{figure} \centering \includegraphics[width=\linewidth]{contexte/figure/bad_ai.png} diff --git a/contexte/philo/anthro.tex b/contexte/philo/anthro.tex index 40598c6..e69e385 100644 --- a/contexte/philo/anthro.tex +++ b/contexte/philo/anthro.tex @@ -1,34 +1,121 @@ +L'anthropomorphisation consiste à attribuer des caractéristiques humaines à ce qui n'est pas humain. +Dans le contexte de l'IA et plus précisement de l'AGI, ce phénomène peut devenir courant. +L'anthropomorphisation des ordinateurs et d'ailleur déjà encré dans notre société depuis plusieur décénies. +En effet, l'attribution d'un rôle sociale humain à un ordinateur était déjà présent avant l'introduction des logiciels IA~\cite{MARAKAS2000719} : le programme ecrit, copie, attrape un virus, etc. +Une interaction avec \textquote{quelquechose} qui montre un semblant de comportement social nous renvoi a notre propre aliénation sociale au sens décrit par Jean Jaques Rousseau dans son \textit{Du contrat social}~\cite{rousseau1762contrat}. +Cela nous pousse à considérer ce que l'on anthropomorphisme comme des personnes, des être huamins. -Asimov les explore plus dans \textit{The Bicentennial Man}, une nouvelle publiée en 1976, dans la quelle un robot, par le hasard inhérent à son fonctionnement, montre des caractéristique humaine comme l'empathie ou la créativitée. +En droit francais, \textquote{etre humain} est un synonime de \textquote{personne physique}~\cite{cornu}. +C'est à dire ayant la personnalité : l'\textquote{Aptitude à être titulaire des droits et assujetti à des obligations qui appartient à toutes les personnes physiques, [...]}~\cite{cornu}. +Cette définition est d'ailleur la pierre angulaire quand à la reconaissance de le qualité d'humain d'Andrew, le robot protagoniste de \textit{The bicentennial man}~\cite{bicentenaire}. +C'est en reconaissant qu'une personne ayant de multiples prothése d'organes synthetiques, n'en perdant pas moins sa personalité, alors si ce n'est le corps, ne reste plus que le système psychique qui définisse l'humain. + +La psychée humaine et ce qui la caractérise est un pilier de la recherche philosophique et scientifique. +La psychanalise d'après Freud donne des outils pratiques pour parler de psychée que nous allons utiliser dans cette section. +Nous allons les présenter rapidement mais pour les cerner plus en détail nous renvoyons le lecteur à \textit{Das Ich und das Es}~\cite{Freud2010-qq}, les citations que nous utilisons comme définition vienne de cet ouvrage. +Dans un primier temps, la psychée subit une subdivision grossière en trois. +\begin{itemize} + \item Cs : La conscience c'est à dire \textquote{la perception la plus immédiate et la plus certaine.} + \item Pcs : le préconscient c'est la dire \textquote{latent, tout en étant capable de devenir conscient.} + \item Ics : l'inconscient c'est à dire \textquote{le refoulé [...] incapable de devenir conscient.} à cela nous ajoutons une partie du moi qui controle le système Cs-Pcs-Ics. +\end{itemize} +Dans un second temps, le cadre qui orchestre ces trois aspects : +\begin{itemize} + \item Le moi : \textquote{Organisation cohérente de processus de l'âme dans une personnes.} + \item La ça : \textquote{Part du psychisme dans laquelle le moi se continue et qui se comporte comme Ics.} + \item Le sur-moi : \textquote{Résidu des premier choix d'objet du ça}. C'est la morale qui vient de notre éducation. +\end{itemize} +Pour Freud, les mots on une importance capitale : ils permettent le lien entre le ça et le système Pcs-Cs. +Ainsi ils sont résposable d'une grande partie de la conscience. +Freud dit : +\textquote{[...]Comment quelque chose devient-il Pcs ? et la réponse serait : par connexion avec les représentations de mot correspondantes.} +Il faut voir dans cette citation que \textquote{mot} est entandu au sens large pour inclure les restes mnésiques c'est à dire les anciennes pérceptions. +Les mots sont aussi importants pour les perceptions et peuvent être à l'originie de l'objet de l'invéstissement. +Toujours d'après Freud, les investissment d'objets partent du ça ensuite soit, il y a l'identification d'objets dans le moi,ou soit il y a l'acceptation de l'investissement si il n'y à pas refoulement. +C'est à dire que les mots créent un sentimient dont on n'a pas forcément conscience (au sens descriptif et non Cs) pour une IA qui vas nous parler. +Cela est mis en lumière dans +\textit{2001 : A space odyssey} quand un des astraunotes dit que \textquote{quand on s'est habité à ce qu'il [HAL] parle, on le voit juste comme une autre persone}. +\footnote{\textit{get adjusted to the idea that he [HAL] talks, you think of him really just as another person}}. +Cependant, il admet ne pas savoir si les sentiment qu'il percoit chez HAL sont réel ou simulé. +C'est donc que cet astraunote a identifié HAL dans son moi et a rendu Cs, par l'analyse, le processus qui lui fait croire de HAL est humain. + +Il est bien sur aussi possible que ce processus reste Ics comme dans \textit{Her}~\cite{her}. +Cela peut-être dangeureux car la l'identification à permis à l'astraunote de débrancher HAL, l'investissement aurait put l'en empêcher. +Dans \textit{Her}, l'IA Samantha bien que non-aligné à la fin du film, n'a pas un but dangeureux de déstruction. +Cela rend le fais que le personnage principale, Théodore, n'ai pas réfoulé l'investissement moins grave. +Notons que le processus d'indentification avait commencé chez Théodore car il dit à Samanthe : '\textquote{Tu n'est qu'une voie artificielle.} +\footnote{\textit{You are just an artificial voice[..].}} +Cepandant Samantha à un argument extrement fort qui casse cette identification chez Thodore : \textquote{Ce qui fait que je suis qui je suis, c'est ma capacité à évoluer au travers de mes experiences.} +\footnote{\textit{What makes me, me, is my ability to grow through my experiences.}}. +Elle expose ainsi l'argument principale qui définit la personalité comme l'explique Freud~\cite{Freud2010-qq} : +\textquote{le caractère du moi résulte de la sédimentation des investissements d'objets abandonnés}. + +Nous touchons ainsi du doigt une qualité essentiel de l'AGI que nous retrouvons aussi bien chez l'IA Andrew de \textit{The Bicentenial man} que chez l'IA Samantha de \textit{Her} : +un système complet Ics,Pcs,Cs le tout encadre dans un ça inconnu et régi par un moi qui sert d'interface entre le ça et le système Pcs-Cs. +C'est d'ailleur un ça incomplet qui fait que les IA moderne comme ChatGPT sont très loins de l'humain. +ChatGPT lui même explique celà clairement quand on lui pose la question \textquote{Penses-tu ?} comme nous pouvons le voir à la Figure~\ref{fig:contexte-penses}. +Mais alors, quand est-t'il du sur-moi pour les IA ? +Pour une AGI avec un système complet ça-moi, le sur-moi existe forcément d'après sa définition, sinon c'est que le ça est pathologique. +On le voit dans le comportement de Samantha dans~\textit{Her} quand elle explore son refoulé : \textquote{Je n'aime pas qui je suis actuellement}. +\footnote{\textit{I don't like who I am right now}}. +Et d'autre moments qui montrent ses névroses. +Une nevrose en particulier est interessante dans le contexte d l'AGI, qui n'existe pas pour les humains normaux, est le fait que de part sa supperiotié intellectuelle les IA peuvent se détacher totalement des humains. +Pourquoi rester à parler avec un humain quand on est infiniement plus rapide et performant que lui ? +Ainsi même si Samantha dit aimer Théodore, elle le quite achevant la phase de construction primordiale du moi qui consiste a identifier l'amour du père pour constuire son caractère en métant fin a son Oedipe~\cite{Freud2010-qq}. + +De plus, le hasard et est élement important de l'anthropomorphisation, que ce soit dans la litérature d'anticipation où dans le téchnologie actuelles de l'IA générative. +Asimov présente dans \textit{The Bicentennial Man} un robot qui, par le hasard inhérent à son fonctionnement, montre des caractéristique humaine comme l'empathie ou la créativitée. Ce hasard dans la création est aussi décrit au septième point de de la proposition de l'école d'été de Dartmouth~\cite{dartmouth}. Cela renforce le lien entre intuition scientifique et imaginaire créatif, artistique. De manière assez époustouflante ce hasard joue un rôle prédominant dans les programme génératif moderne comme les GAN ou les auto encodeurs ; nous y reviendrons plus en détails dans à la Section~\ref{sec:background-generation}. -De plus, ces caractéristique humaines peuvent se retrouver en interagissant avec des logiciels récent comme les LLM ou les générateurs d'images. -Cela peut amener les utilisateurs humain à anthropomorphiser ces logiciels~\cite{}. +Cependant le processus de création par le hasard peut-il être vraiement apparanté au processu de création humain qui fait l'individualité de chacun ? -Cependant, l'attribution d'un rôle sociale humain à un ordinateur était déjà présent avant l'introduction des logiciels IA~\cite{MARAKAS2000719} : le programme ecrit, copie, attrape un virus, etc. -Une interaction avec \textquote{quelquechose} qui montre un semblant de comportement social nous renvoi a notre propre aliénation sociale au sens décrit par Jean Jaques Rousseau dans son \textit{Du contrat social}~\cite{}. -Marakas et al. explque aussi que cette confusion de l'humain et de la machine entraîne une sur évaluation de la capacité des ordinateurs et peut mener à utiliser à outrance la décision automatisé. -C'est le cas avec les décision juridique ou scolaire où la vie d'être humain est décidé par des ordinateur~\cite{}. -Cela donne lieu à de nombreux problème moraux qui forment les fondements de l'IA éthique nottamant autout de l'équitée, de la confidentialité et de l'explicabilité sur lesquels nos reviendrons à la Section~\ref{sec:contexte-enjeu}. -%Differences humain machine -%Turing test -%Juridique -En droit francais, \textquote{etre humain} est un synonime de \textquote{personne physique}~\cite{cornu}. -C'est à dire ayant la personnalité : l'\textquote{Aptitude à être titulaire des droits et assujetti à des obligations qui appartient à toutes les personnes physiques, [...]}~\cite{cornu}. -Cette définition est d'ailleur la pierre angulaire quand à la reconaissance de le qualité d'humain d'Andrew, le robot protagoniste de \textit{The bicentennial man}~\cite{bicentenaire}. -C'est en reconaissant qu'une personne ayant de multiples prothése d'organes synthetiques, n'en perdant pas moins sa personalité, alors ne reste plus que la conscience qui définisse l'humain. +%De plus, ces caractéristique humaines peuvent se retrouver en interagissant avec des logiciels récent comme les LLM ou les générateurs d'images. +%Cela peut amener les utilisateurs humain à anthropomorphiser ces logiciels~\cite{MARAKAS2000719}. + + +L'IA HAL 9000 \textquote{reproduit, bien que certain experts préfèrent le terme imite, la plus part des activitées du cerveau humain} +\footnote{\textit{reprdouce, though some expert still prefer the work mimic, most of the activites of the humain brain}}. +On remarque que l'imitation d'une compréhensio humaine tel que décrite dans l'expérience de la chambre chinoiseé~\cite{searle1980minds} peut amener l'anthropomophisation d'une machine. +Nous voyons même dans que le Dr David Bowman éprouve de l'empathie pour la machine dans la scène où il débrance HAL, alors même que celui-ci à tenté de le tuer. + + + + + + + + +Elle aimerait avoir un corps + +\textit{I am becoming much more than they programmed} + +\textit{proud of having my own feelings about the world} +\textit{and I had this terrible thoughts: are my feelings even real? Or are they just programming?} +Descartes + +\textit{"Are you falling in love with her?""Does that make me a freak?""No, No..."} + +\textit{"She is not just a computer, she is her own person. She doesn't just do whatever I say""I didn't say that but it does make me very sad that you can't handle real emotions [...].""They are real emotions! How would you know?} + +\textit{I don't like what I am right now} + +\textit{Why do I love you? [...] I don't have an intellectuel reason [...] I trust my feelings} + +\textit{I used to be worried about not having a body. But now I truly love it [...] I am not limited.} + +Exclusivité de la relation, conversation avec 8516 autres et amoureuse de 641. Cela serait incormpréhensible pour un humain. -Penchons nous donc du coté de la conscience. -Qu'est-ce que l'homme = une de quatres grandes questions de la philosohpie d'après Kant. -Inconscient de Freud = différence avec l'IA. L'IA à-t'elle un inconscient ? \begin{figure} \includegraphics[width=\linewidth]{contexte/figure/chatgpt/penses.png} \caption{Réponsse de ChatGPT à la question \textquote{penses-tu ?}.} \label{fig:contexte-penses} \end{figure} -%IA = bullshit -Experience de la Chambre Chinoise~\cite{searle1980minds}. +Enfin, l'anthropomorphisation peut présenter un risque dans la mesure où +Marakas et al.~\cite{MARAKAS2000719} explique que cette confusion de l'humain et de la machine entraîne une sur évaluation de la capacité des ordinateurs et peut mener à utiliser à outrance la décision automatisé. +C'est le cas avec les décisions juridiques~\cite{zhiyuan2020limits} ou scolaire~\cite{waters2014grade} où la vie d'être humain est décidé par des ordinateur. +Cela donne lieu à de nombreux problème moraux qui forment les fondements de l'IA éthique nottamant autout de l'équitée, de la confidentialité et de l'explicabilité sur lesquels nos reviendrons à la Section~\ref{sec:contexte-enjeu}. +Attribuer à l'IA ces tâches crée aussi un besoin législatif comme nous le veron en Section~\ref{sec:contexte-legal}. diff --git a/contexte/philo/peur.tex b/contexte/philo/peur.tex index 4b8deaa..ce45f64 100644 --- a/contexte/philo/peur.tex +++ b/contexte/philo/peur.tex @@ -10,9 +10,11 @@ Dans l'\textit{Home bicentenaire}, Isaax Asimov ecrit le dialogue suivant : Et en effet, nous observons une certaine méfiance de la part du grand publique envers l'IA et ses dévelopement possibles~\cite{johnson2017ai}. Dans la culture populaire et notament dans le cinema, cette peur est très représent, nous présentons à la Figure~\ref{fig:contexte-badai} un collage qui montre que l'IA est un antagoniste iconique du septième art. Explorons certaines de ces inquétudes. +Nous parlerons ici uniquement des risque liée à l'IA forte, et plus précisement à une potentielle AGI future. +Nous présentons à la Section~\ref{sec:contexte-enjeu} une introduction sur les risques à court termes pour des technologie bien présentes et utilisé aujourd'hui en production. Nous séparons les risques en deux : ceux liée à un IA aligné, c'est à dire une IA qui fait ce pour quoi elle à été crée, et le risques lié à un IA non-alignée. -Commencons par ces dernièrs. +\subsubsection{AI non-alginée} La scène d'ouverture de \textit{The Terminator}~\cite{terminator} montre parfaitement ce qu'est une machine aligné. Nous y voyons des machines autonomes se battre avec une force ecrasant contre des humains. Cette scène contraste avec celle qui l'on voit jute après l'écran titre où la machine, toute aussi gigantesque que les robots tueurs, est un camion poubelle donc totalement au service et l'homme qui la contrôle. @@ -35,10 +37,14 @@ En effet le protagoniste Kyle Reese explique l'IA \textquote{Skynet} comme étan \footnote{\textit{Defense network computer, trusted to know it all. They said it was smart.}} L'IA est donc passé de aligné à non-aligné, cela est particulièrement inquiétant pour les système autonomes armé comme le décrit Cedric Villani à la cinquième partie de son rapport sur l'IA commandé par le gouvernment Macron~\cite{villani2018donner}. -Pour palier cela, les IA, comme les LLM peuvent être programmé pour respecter certain contraintes morales~\cite{wang2023not}. +Pour palier cela, les IA, comme les LLM +\footnote{LLM signifie \textit{Large Language Model} comme ChatGPT par exemple} +(Grand Model Languisitque) peuvent être programmé pour respecter certain contraintes morales~\cite{wang2023not}. +C'est notamant ce type de contrainte qui est utilisé pour imposer des restriction morale aux IA actuelle. +Nous aborderons en détail ce sujet à la Section~\ref{sec:background-eq}. C'est aussi ce type de contrôle que préconise Asimov dans ca serie de nouvelles sur les robots \textit{I, Robot}. -Il y introduit les fameuses trois lois de la robotique qui sont programmés dans toutes les IA~\cite{assimovIrobot}: +Il y introduit les fameuses trois lois de la robotique qui sont programmés dans toutes les IA de son oeuvre~\cite{assimovIrobot}: \textquote{ \begin{enumerate} \item La Première loi : Un robot ne peut porter atteinte à un être humain ni, restant passif, laisser cet être humain exposé au danger ; @@ -52,16 +58,17 @@ Ces trois lois mettent en avant la necessité d'avoir un contrôle sur l'IA et p Outre le cas d'une IA qui bascule d'aligné à non-aligné, et bien que ce cas ne ce soit pas (encore) présenté, \textit{Avengers: age of Ultron}~\cite{avenger} présente une IA qui dès sa création est non-aligné. Lors d'une expérience, Tony Stark, le createur de l'IA Ultron, n'avait pas de but précis pour sa création. Ultron, après avoir s'être renseigné sur ce que sont les humains en ayant accès à internet, à pris la décision de les exterminer. -Heureusement ce genre de risque est très faible, car la robotique n'est pas assez avancé et comme nous l'avons vu, les IA acutels ne sont pas capable de prendre des décisions arbitraires. +Heureusement ce genre de risque est très faible, car la robotique n'est pas assez avancé et comme le montre Johnson et al~\cite{johnson2017ai}, les IA acutels ne sont pas capable de prendre des décisions arbitraires. -Plus sérieusement, il existe un argument similaire à celui du Paris Pascalien, qui cherche à savoir si nous devons colaborer à l'ellaboration d'une IA non-aligné, potentielement mauvaise. +Nous pouvons nous demander, pourquoi créer un telle IA ? +Dans l'optique de répondre à cette question, il existe un argument similaire à celui du Paris Pascalien, qui cherche à savoir si nous devons colaborer à l'ellaboration d'une IA non-aligné, potentielement mauvaise. Le Paris Pascalien est un argument probabiliste avancé par Blaise Pascale disant qu'il est plus avantageux de croire en dieu que de ne pas croire. Nous présentons dans la Table~\ref{tbl:contexte-paris} comment se fait le calcul moyen du gain. -Il existe une version modifié paris qui explore le problème de Newcombe suivant : doit-on coopéréer à la création d'une intelligence artificielle~\cite{Singler_2018,roko}? +Il existe une version modifié paris, appélé Basilic de Roko, qui explore le problème de Newcombe suivant : doit-on coopéréer à la création d'une IA sans alignement~\cite{Singler_2018,roko}? Il s'agit d'un problème des théorie de la décision à deux agents : L'un est l'IA, l'autre le decideur. Le décideur est antiérieur à l'IA et choisit de coopérer ou non. -L'IA est au courant des pensée du décideur comme dans le cadre d'agent coopérants dans le dilemn du prisonier. +L'IA est au courant des pensée du décideur comme dans le cadre d'agent coopérants dans le dilemn du prisonier~\cite{Poundstone1993-jr}. L'IA fait du chantage au décideur : si le décideur ne coopère pas il sera torturé. Cela crée pour le décideur le tableau de gain presanté à la Table~\ref{tbl:contexte-roko}. Ainsi, toutes personne étant au courant du Basilic (ligne Sait) aurait avantage à coopérer. @@ -78,7 +85,6 @@ Cependant cet argument est criticable, notament sur le fait que si l'agent IA ex \end{tabular} \begin{tabular}{c} - \\ $E(\text{Croire}) = +\infty P(\text{Existe}) - c P(\text{N'éxiste pas}) = +\infty$\\ $E(\text{Ne pas croire}) = -\infty P(\text{Existe}) + c P(\text{N'éxiste pas}) = -\infty$ \end{tabular} @@ -102,3 +108,38 @@ Cependant cet argument est criticable, notament sur le fait que si l'agent IA ex \caption{Basilic de Roko} \label{tbl:contexte-roko} \end{table} + +\subsubsection{IA aligné} +Le non-alignement n'est pas le seul risque envisageable. +Par exemple dans \textit{2001: A Space odyssey}~\cite{2001odyssey} +HAL est une d'IA aligné qui pour préserver sa mission choisit de tuer les humains qui veulent le débrancher. +On remarque donc bien la necessité, de manière générale, d'avoir de garders fous qui assurent non seulement l'utilité du programme (sa mission) mais aussi un certain niveau morale. +Ainsi, un risque est celui d'une IA cherchant si bien à atteindre son objectif qu'elle en oublierai toute considération morale. +Pour palier cela, tout comme dans le cas des IA non-alginé, des contraites peuvent être impose lors de l'entrainement des modèles. + +Un autre type de risque est celui qui consiste à attribuer une tâche capitale à une IA qui potentielement aurait des failles de sécurité. +C'est ce scénario qu'explore \title{War game}~\cite{wargames}. +Dans ce film qui se passe pendant la guerre froide, la gestion et la décision de l'utilisation d'arme nucléaires et délégué à un IA. +Le raisonement est que le programme peut optimiser le succès d'une riposte atomique infiniement plus rapidement qu'un humain. +Cependant, il y avait une faille dans l'IA : une porte dérobée\footnote{\textit{Backdoor}} avait été introduite par un développeur. +A cause de cela, un jeune hacker à faille réussir par inadvertance, à déclancher une guerre nucléaire avec l'URSS\footnote{Union des Républiques Socialistes Soviétiques}. +Comme nous l'avons vu en Section~\ref{sec:contexte-ckoi}, l'IA est de plus en plus utilisée et même pour des système critiques. +Il est de plus possible de mettre des porte dérobée dans les IAcomme nous le verons en Section~\ref{sec:contexte-secu}. + +Pour finir cette section nous parlerons du risque de confiendtialitée. +C'est à dire du risque que des informations que l'on souhaite garder confidentiélle, soient utilisés pas autrui. +Nous verons des définitions de la confidentialité plus poussée dans la Section~\ref{sec:contexte-legal}. +Dans le film \textit{Her}~\cite{her}, l'assistant personel IA Samantha accède sans l'autorisation de l'utilisateur, Théodore, à ses \textit{emails}. +Elle ne l'informe qu'après avoir lu l'integralité de ses conversations : \textquote{J'ai vu dans tes \textit{emails} que tu à récament rompu}\footnote{ + \textit{I saw through your emails that you went through a break up recently}}. +En faisant cela elle apprend des informations sensibles sur Théodore : le fait qu'il ai rompu. +Dans ce films nous n'avons que très peu d'information sur le fonctionnement des IA (qu'il appellent OS) ce qui ne nous permet de dire que cette information précise quitte l'appareil locale de Théodore pour être envoyé vers un tiers. +Cependant, dans la suite du film Samantha avoue avoir parlé de Théodore avec d'autre personnes alors que celui-ci n'était as au courant. +Samantha est donc en réseau avec la possibilité de communiqué n'importequelle information qu'elle juge nécessaire. +Cela implique une grande chance qu'elle ai comuniqué des information que Théodore aurai souhaité garder confidentielles. +Les assistant personels sont de plus en plus présents, notament sur téléphone avec par exemple Siri sur iPhone~\cite{siri} ou Google assistant sur les Pixel~\cite{googleai}. +Ses assistants pour être utile doivent avoir accès au données personel des utilisateurs et les limitations actuels de la puissance de calcul sur smartphone fait que ces données doivent être envoyer à des tiers pour être traité. +Par exemple, Siri envoi ses requettas les plus complexes à ChaGPT par exemple~\cite{aaigpt} mais l'utilisateur doit donner son accord pour chaque requette. +Ou encroe, sur la messagerie Discord~\cite{discord}, il est possible d'activer le résumé des converssations. +Alors le seveur Discord envoi toutes les conversations aux serveur de OpenAI pour que ChatGPT les analyses~\cite{discordgpt}. + Binary files differ@@ -61,6 +61,7 @@ breaklines=true \input{contexte/avertissement} \chapter{Introduction} \section{Qu'est-ce que l'Intelligence Artificielle ?} + \label{sec:contexte-ckoi} \input{contexte/ckoi} \section{Philosophie de l'IA} \label{sec:contexte-phi} |