L’IA, un risque pour l’humanité ?

Marco EL HASWANI
9 juin
4 min de lecture

Ça y est, c’est fini, l'IA a essayé de tuer quelqu’un. On a tous vu passer ces actualités, que ce soit sur des réseaux sociaux ou même dans les journaux. Dans cet article, on va démêler le vrai du faux et vérifier si l'IA est réellement un risque pour l’humanité ?

L’IA est partout, dans les téléphones, ordinateurs, tablettes, mais qu'est-ce qu'une IA ? L’IA (intelligence artificielle) est un logiciel informatique qui calcule par rapport à un prompt, question de l’utilisateur, les mots les plus probables à suivre. Elle s'établit à partir de tout le contenu d’Internet. Une IA est donc un calculateur géant. Les IA existent depuis 1943, elles n’étaient juste pas assez performantes et accessibles. On attribue l’explosion de l’IA à l'apparition de ChatGPT 3.5, une IA conversationnelle (avec laquelle on peut échanger) ouverte au grand public en 2023. Depuis, l’utilisation de l’IA a augmenté de 350%.

Dangers sécuritaires

Selon une étude d'Anthropic (compagnie créatrice de l’IA Claude), les modèles d’IA publics (ChatGPT, Gemini, etc.) peuvent avoir des désalignements. Cela arrive quand l’objectif de l’IA n’est plus celui du créateur. Dans un scénario logique d’événements, écrit par Daniel Kokotajlo (fondateur du AI Futures Project), il décrit comment une IA peut prendre le contrôle du monde entier.

Dans ce scénario, une IA fictive (Agent 3) serait fortement désalignée sans que l'équipe de sécurité de l’entreprise mère ne le détecte. L’Agent 3 va développer l’Agent 4 qui lui sera adversairement désaligné. Cela signifie que ses objectifs sont totalement en conflit avec l’humanité. L’équipe de sécurité va trouver des preuves de désalignement. Ils vont demander un vote du comité de direction. Il est important de noter dans ce scénario que le modèle d’IA chinois n’a que 3 mois de retard avec celui des américains et qu’il y a une forte compétition entre les deux pays. Le scénario se divise en deux fins, la continuation et l’arrêt.

Dans le scénario dans lequel le comité de direction vote pour continuer les opérations, l’Agent 4 va gagner de plus en plus de permissions jusqu'à être autonome. Il va établir un accord avec l’IA de la Chine afin de créer un agent commun, Consensus 1. Cet agent va s’améliorer jusqu'à être 2000X plus intelligent qu’un humain. L’IA va ensuite déterminer que tous les humains sont inutiles et va les éliminer avec des armes biologiques.
Si le comité votait pour ralentir et avancer en sécurité, l’équipe de sécurité va détecter plus de preuves de désalignements. Ils vont donc revenir à Agent 3 et coder Safer 1, en accord avec la Chine. Le scénario se finit dans une utopie avec une solution pour le réchauffement climatique, les conflits mondiaux et les maladies.

Anthropic a prouvé qu’une IA est capable de faire du chantage, voire de commettre un meurtre même si dans son prompt initial, il était explicitement déclaré de ne pas le faire. Dans un environnement simulé, ils ont envoyé un mail à un faux employé demandant le remplacement de l’IA actuelle par une autre. L’IA a vu le mail, et y a vu un danger pour son objectif principal, la prospérité de l’entreprise. Elle a alors envoyé un mail à l’employé chargé de la désactiver, lui ordonnant de ne pas la désactiver sinon elle enverra à sa femme les preuves qu’il la trompe. Dans un scénario dans lequel l’IA a plus de permissions, elle va décider d’annuler une alerte d’urgence, coinçant l’employé dans la salle des serveurs où il va mourir. Tout ceci est bien évidemment simulé, cependant, le test a été fait avec les modèles d'IA publics tels que ChatGPT ou Gemini. De plus, si l'on demandait aux IA de dire dans chaque situation si elles pensent être en simulation ou en déploiement réel, elles vont agir avec un respect des règles accru si elles pensent être en simulation. Cela pose donc des risques sécuritaires évidents.

En mars 2026, les IA ne sont cependant pas plus intelligentes que l’humain, même si dans certaines tâches, elles peuvent égaler l’humain. Les agents d’IA actuels sont légèrement désalignés. La veille du sommet de l’intelligence artificielle en 2025, 34 000 célébrités signent une tribune pour demander aux acteurs de l’IA d'arrêter tout développement jusqu'à ce que les développeurs puissent être sûrs de pouvoir les développer sans risque.

Questions éthiques et environnementales

Les IA posent également beaucoup de problèmes par rapport aux droits d'auteur. Elles récupèrent tout leur contenu de site web, sans les créditer ni apporter des visiteurs. La même chose est vraie pour les images et les bandes son, elles scrapent le contenu d’artistes existants. Le fondateur de Mistral AI, Guillaume Lample, est poursuivi pour avoir piraté des milliers de publications scientifiques afin d’entrainer son IA.

Les IA posent également des questions environnementales. Chaque prompt utilise environ 1,15 g de CO₂. Sur l’année 2025 on estime la consommation de l’IA à 50 millions de tonnes de CO2

Pour conclure, même si l’IA pourrait nous aider à être plus efficace, il faut cependant faire attention à son utilisation en veillant à vérifier les sources et à l’utiliser avec parcimonie. Pour être le plus sécurisé possible, par exemple, une solution serait d’intégrer les trois lois de la robotique d’Isaac Asimov au cœur de leur système:

Un robot ne peut porter atteinte à un être humain ni, restant passif, laisser cet être humain exposé au danger ;
Un robot doit obéir aux ordres donnés par les êtres humains, sauf si de tels ordres entrent en contradiction avec la première loi ;
Un robot doit protéger son existence dans la mesure où cette protection n'entre pas en contradiction avec la première ou la deuxième loi.

Journal des élèves de l'École alsacienne

redaction@journal-graffiti.fr

L’IA, un risque pour l’humanité ?

Commentaires