diff options
Diffstat (limited to 'contexte/enjeux.tex')
-rw-r--r-- | contexte/enjeux.tex | 11 |
1 files changed, 8 insertions, 3 deletions
diff --git a/contexte/enjeux.tex b/contexte/enjeux.tex index af8f40c..c69573f 100644 --- a/contexte/enjeux.tex +++ b/contexte/enjeux.tex @@ -27,8 +27,10 @@ Cela peut donner lieu à des discriminations notament dans le modèle de décisi La justice prédictive tel qu'utilisé aux Etats Unis en est un bon exemple. Dans ce cas, un modèle est utilisé pour prédire si un individu jugé coupable à un forte probabilité d'être récidiviste au non. En utilisant de tel modèle nous mesurons que les afro-américains (\textit{blacks}) son plus souvent predit comme ayant un forte chance d'être récidiviste que le reste de la population (\textit{whites})~\cite{}. +En plus d'être un enjeu, Al-Alawi et al.~\cite{al2021role} avance que l'utilisation de l'IA peut être une solution plus equitable que la décision humaine dans le processus de recrutement. -Recrutement : l'IA peut rentirer les bias humains~\cite{al2021role}. +L'équitée dans le modèle peut-être imposé lors de l'entraînement. +Nous étudierons en détail ce processu dans la Section~\ref{sec:background-eq}. \subsection{Explicabilitée} \label{sec:contexte-expl} @@ -39,7 +41,7 @@ D'une manière génèrale, l'inteligence artificielle brasse une quantité astro Ce brassage s'opère à deux niveaux : au moment de la creation du modèle et au moment de son utilisation en production. Pour créer des modèles performants, il est necessaire d'utiliser beaucoup de données. Ces données servent à choisirs les bon parametres du modèle au travers de divers methods statistiques et d'optimisations, on les appeles données d'entrainement. -Les modèles les plus récent et performant necessite un grand nombre de paramètres, citons par exemple le modèle LLaMA qui posède 65 milliard de pramètres ~\cite{}! +Les modèles les plus récent et performant necessite un grand nombre de paramètres, citons par exemple le LLM LLaMA qui posède 65 milliard de pramètres ~\cite{}! Ce grand nombre de paramètre a l'effet indesirable de mémoriserdes informations potentielement sensible sur les données d'entrainement~\cite{}. L'information contenue dans les données d'entrainement est comme résumé, compressée dans la masses, a prior incompréhensible pour un humain, des paramètres du modèle. Ainsi un individue malveillant, que l'on appelera attaqueur, pourra retrouver des informations sur les données d'entrainement juste en utilisant les paramètres du modèle~\cite{}. @@ -51,7 +53,10 @@ Ainsi un individue malveillant, que l'on appelera attaqueur, pourra retrouver de \label{fig:contexte-train} \end{figure} - +Un autre risque de fuite de donnée se trouve au moment du l'utilisation du modèle, après son entraînement, lors de son utilisation. +A ce moment, les utilisateurs envoient en entrée du modèle des données qu'ils peuvent vouloir gardé confidentielles. +Cependant la sortie du modèle, qui a vocation à être partagée, peut reveler une parite des informations sensibles contenues dans les donnée d'entrée de l'utilisateurs. +Mettre en avant risque est le travail originial que nous avons réalisé : nous le présentons dans la Section~\ref{sec:aia}. \subsection{Sécuritée} \label{sec:contexte-secu} |