Article : Des IA conviviales ?

Co-auteurs : Clément BIDA, Dimitri CHALINE, Clément VERGIER, Anaïs WATHELET

1. Problématique

Les intelligences artificielles (IA) sont de plus en plus présentes dans nos vies. Elles nous accompagnent dans nos activités sur internet de façon courante. Des plus en plus de moteurs de recherche, dont Google, incorporent des IA à leur systèmes pour améliorer leurs résultats. Les réseaux sociaux l'utilisent aussi pour pouvoir nous montrer du contenu qui nous plaît, de la même façon qu'un ami nous recommanderait une nouvelle œuvre en connaissant nos goûts. C'est ce qu'on appelle l'algorithme des plateformes. On la retrouve aussi pour retoucher nos photos comme sur Photoshop avec l'outil "generative fill" ou les IA nommées Midjourney ou Craiyon. Cette présence est grandissante, mais est-elle pour autant bénéfique à l'utilisateur ou à la société ? Nous allons nous intéresser à ce sujet, en nous penchant plus particulièrement sur la question suivante : Les IA peuvent elles être conviviales au sens d'Ivan Illich ?

Pour cela, nous nous pencherons d'abord sur la définition d'une IA conviviale. Nous effectuerons ensuite un état des lieux en expliquant pourquoi les IA actuelles ne peuvent pas être conviviales. Enfin, nous proposerons une réflexion pour permettre de créer, dans le futur, des IA conviviales.

2. Cadre conceptuel

La convivialité est un principe introduit par Ivan Illich (1973) qui prône une société qui donne à l'homme la possibilité d'exercer l'action la plus autonome et la plus créative, à l'aide d'outils moins contrôlables par autrui . Cette conception de la société requiert donc de repenser l'outil, non plus en remplaçant de l'Homme, mais en support à l'expression de sa créativité. Un outil est alors convivial dans la mesure où chacun peut l'utiliser, sans difficulté, aussi souvent ou aussi rarement qu'il le désire, à des fins qu'il détermine lui-même (Illich, 1973).

Après cette première définition, la convivialité a vu son concept évoluer et changer en fonction des principes des interlocuteurs. Par exemple, l'Internationale convivialiste la définit comme l'art de coopérer en s'opposant sans s'entretuer en prenant soin des humains et de la Nature (L'internationale convivialiste, 2020). Dans cet article, nous utiliserons la définition de la convivialité donnée par Ivan Illich.

Selon l'encyclopédie Larousse, le terme d'intelligence artificielle désigne l'ensemble de théories et de techniques mises en œuvre en vue de réaliser des machines capables de simuler l'intelligence humaine (Larousse, 2023). Pour développer notre raisonnement, une partie de notre article prendra l'exemple précis des IA de Language model (LM). C'est un type de logiciel informatique utilisant l'intelligence artificielle pour comprendre et générer du langage naturel de manière sophistiquée (Weidinger et al., 2021) comme ChatGPT ou Google Bard.

Capture d'écran d'une question posée à ChatGPT
Exemple de question posée à ChatGPT par Dimitri Chaline

D'après ces définitions, nous définissons une IA conviviale comme étant un procédé informatique capable de simuler l'intelligence humaine que chacun peut comprendre et utiliser sans difficulté et qui permet l'expression de sa créativité.

Si on se réfère à l'article Wikipédia (2023) à ce sujet, un logiciel libre est un logiciel dont l'utilisation, l'étude, la modification, la duplication et la diffusion sont universellement autorisées sans contrepartie financière. D'après Stéphane Bortzmeyer (2023) cette définition est étymologiquement identique à celle d'open-source avec toutefois quelques différences d'ordre politique. Les défenseurs de l'utilisation de la notion de logiciel libre prônent une société justement plus libre et émancipée tandis que la notion d'open-source fait plutôt écho au libéralisme.

Le libre-washing est une tactique visant à donner l'impression qu'une entreprise soutient activement le logiciel libre, mais qui ne le fait pas de manière sincère. Cela peut être perçu par l'utilisateur comme une tromperie. (Stéphane Bortzmeyer, 2023)

Dans le cadre général, la prolétarisation décrit une situation où un sujet qui peut être aussi bien un producteur, un concepteur ou encore consommateur se retrouve privé de ses savoirs (savoir-faire, savoir-vivre, savoir théoriser). (Stiegler, 2012)

3. État des lieux

Nous pouvons nous demander, en quoi les IA actuelles ne sont pas conviviales ? On peut pour cela avancer plusieurs constatations.

a) Un entraînement algorithmique discriminant

Les algorithmes sur lesquels sont basés ces IA favorisent la diffusion de stéréotypes lors de leur fonctionnement. En effet, lors de la phase d'entraînement, ces derniers vont s'alimenter des données reprenant les tendances majoritaires dans la société, par exemple le fait qu'une famille soit basée autour d'un homme et d'une femme qui ont des enfants (Bender, 2011; Haraway, 2004). Il s'agit ici d'un problème conjoncturel, lié à la façon dont les données sont utilisées. En effet, l'Homme cherche des outils lui permettant d'améliorer les méthodes d'entraînement pour le limiter, voire même le supprimer (Drag et Mackereth ,2022) notamment en menant des recherches approfondies sur la loi et l'éthique. (Kolher-Hausmann, 2019)

Ainsi, les procédés informatiques vont contribuer à faire perpétuer ces idées. Cela n'est pas sans impact sur l'avenir de la population. En effet, des minorités vont se retrouver mises d'autant plus à l'écart suite à ce processus, et se sentir moins libres dans leurs aspirations.
Ce sont ainsi des normes sociales discriminantes qui deviennent des règles pour ces IA. Ces règles ne permettent pas de représenter la diversité présente dans notre société actuelle. Ainsi, elles ne font que reproduire les inégalités présentent actuellement et empêchent ainsi l'expression des libertés de tous de façon égalitaire. En effet, les règles ne permettant pas aux minorités mis à l'écart d'être justement représentées dans la société, elles se retrouvent donc privées de leur liberté qui leur accordent ce statut de minorité.

b) Une menace pour les activités humaines

Les IA nous amènent également à repenser les activités créatives humaines. En effet, ces intelligences sont capables comme l'Homme de rédiger des poésies ou de produire des textes tout en respectant des règles de rédaction. Par exemple, l'outil Google VersebyVerse AI peut aider à composer une poésie inspirée par des poètes célèbres (Holt, 2020). GPT-2 a aussi été utilisé pour générer de courtes histoires avec le style de Neil Gaiman et Terry Pratchett (summerstay sur Reddit, 2020), et des poèmes dans le style de Robert Frost et Maya Angelou (Hsieh, 2019).

Cependant ces pratiques représentent une menace pour les activités créatives littéraires . En effet, bien qu'elles puissent permettre d'aider les humains dans cette voie, par exemple pour la correction des fautes d'orthographes ou encore pour faciliter la mise en forme des idées. Ces derniers voient leur façon de créer conditionnée par ces intelligences, qui ne servent plus seulement à aider les humains mais peuvent même les remplacer comme on a pu le citer précédemment avec GPT. Pour qualifier cette menace, on peut ainsi se ramener au concept de prolétarisation (Stiegler, 2012). En effet, les humains se retrouvent ici privés de leur savoir-faire créatif par les IA, qui peut le mettre en œuvre dorénavant de manière automatisé et réglementé. En mettant en relation ce constat avec la notion de convivialité, cela permet de mettre en perspective que la capacité humaine de création est en péril face à ces intelligences.

c) Notion d'open source pour les LM

Nous allons voir dans cette partie que les LM ont un fonctionnement particulier. Ce fonctionnement est l'une des raisons de la non-convivialité des LM. En effet, beaucoup se définissent comme open source pour profiter du flou autour de cette notion qui n'existe que depuis 1998 et qui a la même définition qu'un logiciel libre. Son unique but serait de rendre cette notion plus abordable et plus "sympathique" pour in fine permettre de l'utiliser, quitte à faire du libre-washing. En réalité la plupart des LM ne sont pas open source car certaines données restent obscures pour l'utilisateur. En effet, on peut par exemple télécharger certains LM sur nos ordinateurs comme Chat-GPT (c'est souvent l'argument avancé pour justifier qu'ils sont open source) mais nous n'avons pas pour autant accès aux données fondamentales nécessaires pour comprendre leur fonctionnement. C’est notamment le cas des bases de données utilisées pour entraîner les LM, qui sont pour la plupart tenues secrètes. De plus, l'utilisation des LM via des clouds fait émerger de nombreuses questions sur la gestion de nos données : comment sont elles conservées, sécurisées ? Sont-elles utilisées a des fins commerciales ? (Stéphane Bortzmeyer, 2023)

Il existe en pratique des modèles de langage complètement libres qui pourraient donc devenir conviviaux comme le modèle Falcon ( Le modèle LM open source le plus puissant à ce jour : https://huggingface.co/tiiuae/falcon-7b ), mais il sera difficile de créer des LM libres capables de rivaliser avec les géants de l'IA au vu des problématiques imposées par leur fonctionnement. En effet, pour rendre un modèle performant, il est nécessaire de l'entraîner avec des quantités astronomiques de données. Or, ceux qui maîtrisent le mieux ces données et qui ont surtout les moyens d'y accéder sont les géants de tech (Meta, OpenAI, Google...). Il faudra donc se contenter de modèles avec une base de données plus petite qui seront donc moins performants si l'on souhaite des modèles de langage conviviaux.

Pour résumer, nous nous rendons aisément compte que les IA actuelles ne sont pas conviviales car elles ne favorisent pas la transparence et le dialogue. Les entreprises qui mettent au point les LM trompent parfois sciemment l'utilisateur en faisant du libre-washing.

Il semble que les IA sont forcément destinées à ne pas être conviviales au vu de l'examen des ces arguments. Existe-t-il des solutions pour agir contre ces principes et reprendre en partie la main sur ces machines afin de les rendre conviviales ?

4. Prospective

Depuis les années 2040, la société OpenAI développe des IA permettant de simuler des conversations comme si vous échangiez avec d'autres humains voir même vos amis proches. L'IA arrive même à comprendre les références de votre groupe d'amis. Cette prouesse technique les a menés à avoir un monopole sur le marché des LM.

Une dizaine d'année plus tard, un message apparaît sur un blog internet. Ce message contient un lien vers des données extraites de la base de données ayant servie à entraîner les IA de OpenAI. On y découvre que les performances des 10 dernières années de leurs LM sont dûes à l'utilisation des échanges privés de millions d'utilisateurs de différents réseaux sociaux. Ces échanges d'ordre privé n'auraient jamais dû être accessibles à une entreprise privée, d'autant plus que chacun de ces échanges sont aussi protégés par le droit d'auteur depuis l'évolution de la loi en 2030.

L'association "European Digital Rights Initiative" s'est directement emparée du sujet. En effet, d'après les déclarations de leurs avocats, peu importe la manière dont ils ont eu accès à ces données, que ce soit par achat via un data broker ou en piratant les serveurs des réseaux sociaux, ils sont responsables de l'utilisation illégale de tels échanges. Une action en justice est donc menée par cette association.

Après ce procès, OpenAI a été contraint de rendre public l'ensemble de ses données, ce qui correspond à plus d'une dizaine de LM, leurs algorithmes et les données pré-traitées utilisées pour l'entraînement de ces LM. Dès lors, leurs LM sont devenus réellement libres et de nombreuses nouvelles IA de langage sont apparues. Ces dernières sont aussi toutes libres. En France, le gouvernement a décidé d'accompagner cette émergence des IA de LM libres en mettant en place un espace dans chaque mairie avec une permanence informatique pour que les individus souhaitant utiliser une IA puissent le faire en étant accompagnés. Cette mesure a pour objectif d'améliorer la convivialité de ces IA en permettant à tous de les utiliser.

5. Conclusion

L'intelligence artificielle prend petit à petit de plus en plus d'importance dans notre société. Cette constatation nous a amené à nous questionner sur le rôle de celle-ci au sein de la société, et sur son impact sur l'Homme.

Après avoir admis la définition de la convivialité donnée par Ivan Illich, nous avons remarqué, en prenant comme exemple les IA de modèle de langage, que les intelligences artificielles que nous utilisons aujourd'hui ne peuvent pas être conviviales. En effet, elles peuvent être discriminantes voire une vraie menace pour les activités humaines. De plus, leur fonctionnement reste très obscure. Nous avons donc cherché une façon de rendre les intelligences artificielles conviviales, afin qu'elles profitent au mieux à la société toute entière.

Nous en sommes donc parvenu à cette conclusion : pour être conviviales, les technologies derrières les IA doivent être divulguées au plus grand nombre. Ainsi, chacun, à son niveau, sera capable de se servir de ces technologies afin de produire et/ou d'utiliser des IA qui correspondent à ses besoins, sans avoir à dépendre de grandes entreprises ou institutions. Enfin, l'éducation devra aussi être adaptée afin d'intégrer cet outil à notre ensemble de connaissances et ne pas laisser d'individu sur le côté.

6. Bibliographie