Numéro du 26 avril 2025

Saturday, 26 April 2025 00:00 UTC

L'édito — Les réflexions sur la modernisation de cette wikilettre se poursuivent. Dans ce cadre, nous aimerions créer de nouvelles rubriques. Vos suggestions sont les bienvenues en salle de rédaction : dites-nous ce que vous aimeriez lire dans les RAW, ou ce que vous voudriez y écrire !

C'est dans cette perspective que nous lançons un premier appel à commentaires afin de co-rédiger un futur dossier relatif à la possibilité de modifier Wikipédia sans créer de compte (actuellement sous IP, prochainement sous compte temporaire).

Bonne lecture !

Les brèves

Contributions de Jules*, Nanoyo88, Pyb en résidence, Trizek

Échos francophones

Les contributeurs à l'honneur dans les médias — La revue de presse wikipédienne est encore une fois très riche en mars 2025, mais elle voit surtout la mise à l'honneur de nombreux contributeurs tels que Le chat perché (d · c · b) sur XXI[1], Simon Villeneuve (d · c · b) sur Ici Radio-Canada[2], C.Salviani (d · c · b) dans La Croix[3], Lyokoï (d · c · b) sur France 3 Champagne-Ardenne[4] et d'autres sur France Culture[5] ou dans l'émission de David Dufresne[6]. Des interventions remarquables et remarquées !

2033 – Adieu joli wiki ? — Une projection de régression linéaire basée sur les données Google Trends laisse entendre que l'intérêt et l'utilisation continuera de décroître, menant Wikipedia à cesser d'exister le au profit des LLM. A-t-on oublié de préciser le caractère humoristique de cette brève Émoticône ?

Wikipédia / Le Point : clôture de la lettre ouverte et réponse aux mises en demeure — Dans le dernier numéro des RAW, nous vous parlions de la controverse opposant le magazine français Le Point à Wikipédia en français. La lettre ouverte a été close le . En trois semaines, elle a rassemblé 1 155 signatures de contributeurs de notre wiki ou d'autres. Aelxen a compté que le cumul des contributions des signataires sur la seule version francophone s'élevait à environ 22 900 000, soit environ 10 % du total des modifications effectuées sur l'encyclopédie depuis sa création.

Parmi les signatures, celle du co-fondateur de Wikipédia, Jimmy Wales, le , n'est pas passée inaperçue. La directrice du service Trust & Safety de la Fondation Wikimédia (WMF), Maggie Dennis, a également publié un message de soutien en page de discussion.

Le Point a cessé ses publications hostiles à Wikipédia, après une série de neuf articles en onze jours — du jamais vu. Les avocats du magazine ont en revanche adressé une deuxième mise en demeure à la WMF, dans laquelle ils maintiennent leurs demandes de censure de l'article Le Point, en dépit des améliorations apportées par la communauté, et dans laquelle ils qualifient la lettre ouverte de « diffamatoire ».

C'est ce que nous avons appris au détour d'un message incisif publié sur le Bistro par Phil Bradley-Schmieg au nom du service juridique de la WMF. Ce dernier indique clairement ne pas donner suite aux exigences éditoriales du Point et soutenir la lettre ouverte. Plus encore, il souligne, après avoir regretté l'absence d'excuses de la part du magazine, les « graves erreurs et malentendus » que contient la première mise en demeure. Non sans un brin de causticité, le service juridique indique avoir « proposé d'expliquer le fonctionnement de Wikipédia au Point et à ses avocats ». À suivre.

Au Comité d'arbitrage, un élu esseulé — Le CAr n'a pas terminé de casser des claviers sous de douces mélodies un peu naïve de refonte. Les élections de mars 2025 s'achèvent avec l'élection d'un arbitre. Mais concrètement, que se passera-t-il ensuite ? Ce qui est certain, c'est que le quorum de trois arbitres minimum n'est pas rempli pour relancer le CAr. Peut-être serait-ce l'occasion d'engager le processus de déconstruction et de création d'un nouvel organe tel que suggéré par plusieurs contributeurs dans les votes et discussions ? La communauté semble en effet attachée à l'existence d'un organe type CAr, comme en témoignent cette élection et, précédemment, le refus répété (2016, 2018, 2021) de dissoudre le CAr sans instance pour le remplacer.

Coups de griffes — Un conflit oppose la cabale féline et d'autres bénévoles, excédés par la profusion d'images de chats sur le Bistro. Les tensions se sont envenimées à la suite d'une proposition de passage en recommandation de la page Wikipédia:Ne mordez pas les chats, jugée discriminante à l'égard des poissons-chats. Plusieurs RA ont été déposées en mars, mais n'ont toujours pas été traitées ; un contributeur, soupçonnant les administrateurs de partialité, a réclamé qu'ils indiquent s'ils portent ou non la moustache. C'est en tout cas ce que rapporte le magazine français La Virgule qui, renseigné par un certain « Marcel Wiki » et faisant état des accusations lapidaires d'un concessionnaire automobile qui jouit d'une certaine notoriété outre-Atlantique, s'inquiète d'une dérive ailurophile de l'encyclopédie. Sur le Bistro, des commentateurs avisés ont jugé que cet article faisait fausse route : « On sait tous ici que le vrai désaccord dans la communauté porte en ce moment sur la nécessité ou non de capitaliser le nom des modèles dans le wikicode ! »

Attention à la désinformation russe — Des rapports indiquent que des fermes de contenus produisant de la désinformation russe sont utilisés sur Wikipédia[7]. Peu nombreux sur la version francophone et effectués de bonne foi, ces ajouts sont le fait de contributeurs avertis de la communauté ; la situation est semble-t-il différente sur d'autres versions linguistiques de Wikipédia.

Un livre sur Wikipédia... écrit par un utilisateur bloqué — En , l'éphémère média français d'extrême droite Factuel[8], au détour d'un article commenté sur le Bistro, annonçait un ouvrage à paraître en 2024 consacré à Wikipédia. Son auteur ? Un certain Michel1961 (d · c · b), bloqué indéfiniment en 2021 (notamment pour comportement non collaboratif, détournement de sources, rameutage et POV-pushing) et régulièrement cité dans des articles de presse sensationnalistes en 2020 (où des contributeurs expérimentés sont accusés d'être « islamo-conciliants »), 2021, 2023, février et mai 2024. L'ouvrage, annoncé dès 2023, paraît en aux éditions du Cerf sous le titre La face cachée de Wikipédia : Enquête sur les dérives de l'encyclopédie libre[9]. Cosigné par Victor Lefebvre, ancien journaliste au Figaro et à Factuel, l'ouvrage de 216 pages prétend apporter « une réponse argumentée et dépassionnée » à la question de savoir si l'encyclopédie est devenue « Wokipedia » comme allégué par Elon Musk. La réponse est donnée au dos de l'ouvrage : « Le pouvoir de nuisance d'une petite poignée d'utilisateurs ouvertement militants - pour ne pas dire woke - tend à se renforcer. »

L'actu technique

Nouvel aperçu de l'outil de traduction

L'outil de traduction évolue — L'équipe de Localisation de la langue et des produits a amélioré le Tableau de bord de traduction de contenu en intégrant des fonctionnalités de personnalisation de suggestions et en améliorant l'accessibilité du tableau de bord.

D'où viennent et où vont les lecteurs d'un article ? — L'outil Wikinav permet de répondre à ces questions. En plus de mettre en évidence que la majorité des consultations viennent des moteurs de recherche, l'analyse de l'article Elon Musk (le plus consulté en ) montre ainsi que l'article de Wikipédia par lequel le plus grand nombre de lecteurs arrivent est celui de son ex-compagne Grimes et celui le plus consulté consécutivement est celui de sa compagne actuelle, Shivon Zilis. Les clics entrants depuis ou sortants vers le département de l'Efficacité gouvernementale (DOGE) n'arrivent respectivement qu'en dixième et sixième positions. La vie privée avant la politique.

Dans le mouvement

Le logo de Wikipédia, en allemand, avec la mention « 3 Millionen Artikel ».
Et de trois !

Trois millions d'articles sur Wikipédia en allemand — C'est le seuil franchi par la version germanophone de Wikipédia le . Troisième plus grosse version linguistique en nombre d'articles, elle devance la version francophone, selon la liste des wikis. Il existe toutefois de nombreux autres indicateurs pour comparer les versions linguistiques, dont la profondeur, qui valorise le nombre d'éditions par article et le nombre de pages autres que les articles — en classant les wikis avec cet indicateur, la version francophone arrive en dix-neuvième position (loin devant la version germanophone). Pour en revenir au seuil symbolique de trois millions d'articles, les paris sur la date à laquelle Wikipédia en français l'atteindra sont toujours ouverts.

Une militaire américaine en train de se faire peindre la joue aux couleurs du drapeau LGBT.
Exemple de photo retirée.

Suppression de contenus de l'armée américaine — Le département de la Défense des États-Unis a récemment appliqué une décision présidentielle mettant fin aux politiques Diversité, équité et inclusion (DEI). Cela s'est traduit notamment par la mise hors ligne de beaucoup de contenus multimédia. Associated Press a récupéré une base de données de 26 000 photos concernées par la censure. Wikimedia Commons héberge de nombreuses photos de l'armée américaine, entre 10 et 20 % des 5 millions de photos stockées sur DVIDS, la médiathèque du départ de la Défense. Don-vip (d · c · b) poursuit l'import en masse des photos, que  (d · c · b) avait débuté. Une catégorisation des photos supprimées est en cours ainsi que l'import des vidéos manquantes, projet initié par Mvolz (d · c · b). Une fois ce travail de catégorisation réalisé, il sera possible d'extraire les données pour les mettre sur data.gouv.fr par exemple afin de permettre aux chercheurs et associations d'étudier les contenus retirés. Ce travail n'est pas sans soulever des questions éthiques auxquelles l'armée américaine a été confrontée en 2021 en procédant à un retrait massif de photos d'Afghans afin de les protéger des talibans.

Renforcer la neutralité de point de vue de Wikipédia — La Fondation Wikimédia a récemment mis en évidence des tendances essentielles et prioritaires pour le mouvement, à travers des conversations avec les communautés. Cette année, une tendance qui a suscité de nombreuses discussions au sein et au-delà du mouvement Wikimédia concerne la neutralité : la baisse de confiance dans les informations en ligne et la fragmentation du consensus sur la véracité des informations. Il s'avère que la manière dont le principe de neutralité de point de vue se traduit varie d'un projet Wikimédia à l'autre, ce qui met en évidence la possibilité pour les communautés d'apprendre les unes des autres et d'explorer si des normes mondiales communes de neutralité peuvent mieux protéger les projets (et les bénévoles) dans un environnement de menaces accrues et de réglementation croissante. Pour soutenir les communautés Wikimédia et réaffirmer notre engagement en faveur de la neutralité, la Fondation Wikimédia réunira un groupe de travail composé de contributeurs actifs, de membres du CA de la Fondation, de chercheurs et de conseillers afin d'étudier des recommandations de normes communes pour les politiques NPOV qui peuvent protéger Wikipédia, accroître l'intégrité des projets et fournir davantage de soutien aux bénévoles chargés d'administrer ces politiques. Pour en savoir plus, rendez-vous sur Diff, le blog hébergé par la Fondation à propos du mouvement.

Verrouillages globaux massifs — Le , la WMF a entrepris le verrouillage global de plus de 35 000 comptes (liste) compromis (mots de passe divulgués, vraisemblablement). Dans le communiqué qu'elle a publié quelques jours après, elle indique que cela fait suite à la découverte d'« un schéma de connexions inhabituelles à des comptes enregistrés », qui résulterait d'une fuite de données depuis un autre site web incluant des mots de passe, utilisés aussi sur Wikipédia. Un bon rappel de la nécessité de ne pas utiliser un même mot de passe sur plusieurs sites web, et l'occasion de lire ou relire Aide:Sécurité des comptes utilisateur.

Focus

RAW encourage les membres de la communauté à s'exprimer sur différents enjeux liés à l'écosystème Wikimedia. N'hésitez pas à proposer vos textes pour cette section. N'hésitez pas non plus à réagir dans la section du courrier du lectorat.

À la recherche des articles disparus de Google
par Jules*

Certains articles de Wikipédia sont déréférencés par Google. Combien ? Les déréférencements sont-ils légitimes ? C'est le grand flou.

Le Canard enchaîné publie une enquête qui vous déplaît ? Oubliez le communiqué de presse et la plainte pour diffamation. Le problème, ce n'est pas l'article : c'est le fait qu'il soit lu ! Et s'il était possible de le faire disparaître de Google ? Improbable ? C'est pourtant ce qui s'est passé, nous raconte Thibaut Schepman dans un article paru en janvier dernier dans La Revue des médias, éditée par l'Institut national de l'audiovisuel (INA)[10]. La méthode employée par les malandrins est la suivante : signaler à Google une violation des droits d'auteurs en affirmant que l'article de presse est un plagiat d'une page web, antidatée. Derrière la mésaventure vécue par une journaliste du Canard enchaîné se cache une véritable industrie du déréférencement indu, nous apprend Thibaut Schepman.

Si Google a rétabli le référencement de l'article du Canard enchaîné, est-il possible que Wikipédia soit également victime de telles manœuvres ? La question n'est pas anodine. La plupart des consultations de Wikipédia proviennent des moteurs de recherche, et parmi ceux-ci, Google est en position de quasi-monopole[11]. Un article Wikipédia déréférencé de Google, c'est donc probablement un article qui ne sera quasiment plus lu.

De la lumière mais pas trop

Pour savoir ce qu'il en est, première étape, la plateforme Lumen. Elle permet de consulter les demandes de déréférencement adressées à Google pour divers motifs : violation des droits d'auteurs, diffamation, droit à l'oubli... Mais les notices, dont la consultation n'est pas aisée, n'indiquent pas l'issue de ces demandes. Nous ne sommes guère éclairés.

De son côté, la Fondation Wikimédia (WMF) a commencé en 2014 à publier les notifications de déréférencement qu'elle recevait de Google (dont plusieurs dizaines pour Wikipédia en français). À l'époque, la WMF s'est émue de cette censure, motivée par le droit à l'oubli, dans un billet de blog en anglais[12].

Récemment, l'auteur de ces lignes a eu vent du déréférencement d'un article de Wikipédia en français par Google. Le déréférencement a-t-il été effectué au nom du droit à l'oubli ? Ou bien par une méthode retorse comme celle mise en lumière par La Revue des médias ? Aucune idée : aucun résultat sur Lumen avec le titre de l'article, et pas de notice relative sur la page tenue à jour par la WMF.

RGPD à la suédoise

Renseignement pris auprès du service juridique de la WMF, Google envoie depuis quelques années des notifications de déréférencement dépourvues de l'URL du contenu déréférencé (exemple) et donc parfaitement inutiles. Surprenant. Ce changement découle en fait d'une décision prise en 2020 par l'Autorité suédoise pour la protection de la vie privée, sur le fondement du règlement général sur la protection des données (RGPD). Elle a estimé qu'en fournissant l'URL du contenu déréférencé dans ses notifications, Google permettait à leur destinataire de republier les contenus litigieux sous une autre URL, et donc de bafouer le droit à l'oubli[13]. Exit les URL.

Tout au plus la WMF continue-t-elle de recevoir des notifications précises quand le requérant est situé hors Union européenne ; on sait ainsi que l'article Fusillade de l'université d'Eskişehir Osmangazi a disparu de certaines recherches Google en raison de la législation turque — sans plus de précision.

On ignore d'ailleurs si la WMF reçoit systématiquement une notification de Google en cas de déréférencement. En tout état de cause, la liste des notifications relatives à Wikipédia en français n'évoque aucun déréférencement pour violation des droits d'auteurs — c'est en revanche le cas pour Wikipédia en anglais, comme le relèvent nos confrères du Signpost.

S'agissant du droit à l'oubli, s'il est légitime de chercher un équilibre entre droit à l'information et droit au respect de la vie privée, il apparaît contestable qu'une entreprise privée, en l'espèce Google, puisse opérer sans aucune transparence le déréférencement d'articles.

Le dossier du mois

Dans cette section, le magazine aborde un sujet qui a fait beaucoup réagir à l'intérieur de la communauté, voire à l'extérieur.

Le bouleversement annoncé des pratiques par l'IA générative
par Nanoyo88

Cet article repose sur quatre interviews que vous pouvez consulter dans leur version complète.

Lors de précédentes éditions, nous avons régulièrement abordé le sujet de l'IA générative (genAI), ses implications et conséquences pour Wikipédia. Nous aimerions prendre le temps, au travers d'un dossier et d'interventions de quatre contributeurs, d'approfondir le sujet. Pa2chant.bis, LD, Aelxen et (:Julien:) analysent les usages de l'IA et les problèmes qu'ils engendrent ; ils discutent aussi de l'élaboration d'un texte pour les encadrer.

IA, genAI, LLM :
de quoi parle-t-on ?

De manière générale, les machines informatiques exécutent scrupuleusement des instructions (un programme informatique) écrites par des humains. Les humains disent explicitement quoi faire à la machine, pas à pas. L'intelligence artificielle (IA) est une discipline scientifique visant à permettre aux machines d'être « intelligentes » : apprentissage, raisonnement logique, compréhension du langage naturel (anglais, français…). L'IA cherche à permettre aux machines à gagner en autonomie pour effectuer des tâches plus complexes. L'intelligence artificielle générative (genAI) est un sous-domaine de l'IA dont le but est de générer automatiquement des textes en langage naturel. Les réseaux de neurones sont une technologie très puissante (et gourmande en ressources) largement utilisée dans l'IA.

Depuis 2017-2018, les grands modèles de langage (LLM) utilisent des (grands, très grands) réseaux de neurones pour comprendre du langage naturel, répondre à des questions ou générer du texte (genAI). Le texte écrit par un humain pour interagir avec le LLM est appelé prompt. Pour apprendre le langage et des connaissances, les LLM sont gavés de tonnes de données disponibles sur Internet (dont évidemment WP). Les LLM n'ont pas d'estimation de la valeur de vérité ou véracité de ce qu'ils répondent : ils répondent grosso modo ce qui est le plus probable parmi les textes sur lesquels leur apprentissage s'est fondé. Le LLM invente donc : parfois c'est juste, parfois c'est faux — on parle alors d'hallucination.

Pour en savoir plus, lire cet article sur Le Monde.

Ils fleurissent sur l'encyclopédie et le printemps n'y est pour rien. Les textes générés par IA sont de plus en plus nombreux sur les articles de Wikipédia à mesure que l'usage de l'IA générative se démocratise. Pour Pa2chant.bis, cet usage wikipédien se fait « en l'absence de recommandation », ce qui a pour conséquence de rendre « très lourd et coûteux en temps de démontrer des abus » et risque de démotiver les contributeurs qui se consacrent à ces vérifications.

Julien indique à ce propos qu'il est « difficile d'anticiper les usages qui seront faits des LLM. Mais c'est potentiellement un game changer pour WP », qui peut au choix « devenir un dépôt de connaissances approximatives via des masses de textes mal comprises ou un facilitateur de rédaction ».

« C'est l'avenir de Wikipédia qui se joue »

Pa2chant.bis n'y va pas par quatre chemins : « C'est l'avenir de Wikipédia qui se joue. » Les enjeux et les risques de ces nouvelles pratiques sont déjà connus : « outre les potentielles atteintes au droit d'auteur, on peut citer les problèmes de fiabilité de l'information de type absence ou détournement de source, les TI et les problèmes de style. »

La majorité des usages observés ne résistent pas aux vérifications et affichent différents problèmes qui pourraient être évités si la contribution était 100 % humaine. C'est notamment le cas des traductions automatiques, des synthèses de sources multiples, de l'identification de sources, etc.

Des usages problématiques, Pa2chant.bis en a vu quelques exemples surprenants. Par exemple, dans une page Wikipédia sur une maladie, indiquer aux parents que même traitée, elle peut être mortelle, alors qu'aucune source n'a été trouvée dans ce sens. Dans l'article 'Ndrangheta (la mafia calabraise), une famille dont le nom est parfaitement inconnu des sources a été désignée comme étant influente. Dans un autre article étaient indiqués des liens familiaux entre deux personnes, liens imaginaires sourcés avec un blog généré par IA. Les abus peuvent d'une envergure encore supérieure, comme les interventions mêlant TI, IA et vandalismes sur une profusion d'articles dédiés aux quasars : alors que le projet:Astronomie compte peu de membres, et encore moins de spécialistes de ce sous-domaine, cela va exiger d'utiliser WP:TNT.

« L'IA, on l'utilise depuis super longtemps »

Julien rappelle que les traductions automatiques relèvent de l'IA, et plus récemment de l'introduction des LLM. Or, « la communauté semble ok avec cette utilisation de l'IA », quand bien même Julien en est lui-même critique. Concernant les LLM, « des utilisateurs ont développé et rendu compte de pratiques plus avancées (Projet:Observatoire des IA/Documentation, Utilisateur:Global Donald/Création d'article via ChatGPT 4o et comparaison des prompts, Utilisateur:Nanoyo88/testIA…) ». La question revient dès lors à se demander si la relecture et la vérification sont bien effectuées, et c'est là que ça coince. Comme pour les traductions automatiques à la chaîne, les textes générés par IA augmentent la quantité de travail de vérification pour la communauté.

Il y a également des usages de LLM qui pourraient être utiles à l'automatisation de certaines opérations de maintenance sur Wikipédia. « Sur les projets sportifs (basket, foot, foot US), c'est toujours relou quand un joueur change de club : il faut rajouter des catégories, changer des palettes, mettre à jour l'infobox… Not fun. J'ai dans ma todo list le développement d'un outil automatique de mise à jour quand un joueur change de club, avec l'usage d'un LLM. » Les LLM pourraient également être utilisés afin de lutter contre le vandalisme, voire même contre les mésusages de LLM !

Une lutte contraignante

Dernièrement, un tracker a été mis en place par Julien sur la base du signalement, par Pa2chant.bis, de sources comportant un paramètre UTM lié à ChatGPT. Cette longue liste n'est que la partie émergée d'une analyse en profondeur nécessaire et dans laquelle il faut comparer les sources présentées et les informations ajoutées.

Afin de pouvoir rapidement identifier ce type d'ajout, un filtre anti-abus a été créé par Aelxen. « Le filtre consiste à détecter les insertions d'URL contenant un paramètre UTM provenant de ChatGPT. Actuellement, il est uniquement utilisé pour récupérer des statistiques. À terme, il pourrait permettre d'insérer un message d'avertissement lors de la publication des modifications. »

« Des détecteurs insuffisamment fiables »

Actuellement, on peut difficilement s'appuyer uniquement sur des outils de détection et éléments techniques pour identifier les usages de textes générés par IA avec fiabilité. « Ces outils sont imparfaits, explique Julien : les LLM sont des machines probabilistes donc il y a des risques de faux-positifs. Les études qui essaient de mesurer les faux positifs divergent pas mal et s'appuient sur des textes en anglais, donc il faut prévoir une décote pour le français. »

Aelxen et Pa2chant.bis jugent également la fiabilité de ces détecteurs insuffisante. Pour Pa2chant.bis, « le plus performant détecteur trouve en français un nombre impressionnant de probables faux-positifs » et Julien souligne une observation surprenante d'Esprit Fugace : il y a des faux positifs lorsque le contenu est rédigé « par des personnes neuroatypiques dont le style rédactionnel diffère » de la norme.

Sur les possibilités techniques, Aelxen suggère que « des outils semi-automatiques pourraient être envisagés pour aider à l'analyse, par exemple en signalant des passages suspects ou en identifiant des modèles d'écriture caractéristiques de l'IA ». Mais Julien considère que c'est « sans issue parce que les LLM s'aguerrissent et les méthodes de détection sont toujours en retard. Il est possible que le contenu genAI devienne rapidement indiscernable par un œil humain comme par un détecteur ».

« Ils voient surtout le verre à moitié plein sans voir le verre à moitié vide »
Mésusages de l'IA :
comment aider ?

Pour donner un coup de main sur le sujet, plusieurs possibilités. Vous pouvez participer à l'élaboration de la future recommandation ainsi qu'au sondage associé. La vérification des quelque 170 insertions de sources via ChatGPT peut également vous intéresser. De bonnes âmes sont aussi nécessaires pour l'analyse et le traitement de 284 + 400 sites générés par IA utilisés comme sources sur Wikipédia.

Enfin, si vous rencontrez des textes que vous soupçonnez d'être générés par IA et qui contreviennent aux PF, vous pouvez les signaler sur Projet:Observatoire des IA/Contrôle.

Votre aide est précieuse !

Identifier les textes générés par IA et leurs problèmes n'est pas chose aisée. Pa2chant.bis témoigne de sa pratique, indiquant que cela se fait « au hasard des analyses de créations d'articles, des relectures et de la patrouille ». Les mauvais usages possèdent plusieurs marqueurs tels que le style stéréotypé et souvent laudatif, le plan caractéristique et les détournements de sources par hallucination — « et là, c'est beaucoup plus long à identifier ».

Le second problème est qu'il est particulièrement complexe de faire comprendre aux utilisateurs d'IA, novices ou expérimentés, les problèmes de leurs contributions. Pa2chant.bis a l'impression « qu'ils voient surtout le verre à moitié plein (leurs prompts sont de plus en plus précis et performants, et le niveau de réponse des IA s'améliore) sans voir le verre à moitié vide (les erreurs, le langage stéréotypé et les traductions parfaites en mot à mot, mais porteuses de contresens, non-sens ou inventions) ».

Malheureusement, l'utilisation abusive de l'IA reste très tentante car elle est en mesure de produire des textes d'apparence robuste, auxquels il est aisé pour les contributeurs de faire confiance, en ayant la fausse impression d'avoir maitrisé un sujet. À cela s'ajoute la culture historique de Wikipédia « selon laquelle l'encyclopédie est en construction, les erreurs ne sont pas trop graves et finiront bien par être corrigées un jour » ainsi que le sentiment que refuser l'usage de l'IA relève « d'une forme de passéisme, ou d'une attitude rétrograde vis-à-vis des progrès technologiques ».

Vers la mise en place d'une recommandation

Le , Pa2chant.bis tirait une nouvelle fois la sonnette d'alarme, soulevant une nouvelle pratique consistant à sourcer des contenus, ou générer des contenus sourcés, par le biais de l'IA. Cette situation le pousse alors à inviter la communauté à se pencher sur un passage à l'état de recommandation d'un texte encadrant l'usage des IA. L'idée a été très bien accueillie et un sondage est en préparation. Deux versions existent actuellement, un essai élaboré depuis plusieurs mois et une contre-proposition simplifiée par LD.

Cependant, établir une recommandation présente plusieurs contraintes car elle a vocation à établir des lignes directrices à suivre dans la contribution. LD nous rappelle qu'elles doivent donc « répondre aux attentes et interrogations les plus courantes, tout en véhiculant un « savoir-faire » concret ».

« Elle doit être claire, non contradictoire avec les autres normes et permettre un ajustement progressif »

Le plus complexe est de produire une recommandation « claire, non contradictoire avec les autres normes (principes, règles, recommandations) et permettre un ajustement progressif ». Ce dernier élément est nécessaire afin de pouvoir répondre aux éventuelles évolutions législatives. En effet, l'IA générative pose la question de la propriété intellectuelle, dans la mesure où « les textes générés [peuvent provenir] de textes régis par le droit d'auteur et [où] ces générations [pourraient être] considérées comme également soumises au droit d'auteur (et/ou sont considérées comme des œuvres dérivées ou collectives) ».

Cette future recommandation ne supplantera donc pas les recommandations déjà existantes. LD évoque le propos de @Cosmophilus à ce sujet en soulignant que « le mauvais usage de l'IA se caractérise par la violation d'un principe ou d'une norme déjà définie, telle que WP:DA, WP:V, WP:STYLEetc. ». Aussi le but n'est-il pas de répéter le corpus réglementaire mais de donner des indications pour « se concentrer sur l'application de ces normes dans le cadre de l'IA ».

Si la communauté démontre une certaine hostilité à l'égard des contenus générés par IA et le démontre au travers de précédents sondages, il ne semble pas que l'on se dirige vers une interdiction stricte de son usage. Il est d'ores et déjà complexe de le démontrer.

Face à ces nouvelles pratiques, comme l'écrit LD, le mot d'ordre pourrait bien être de « rester guidé par le bon sens et le discernement ».

L'agenda

Le wik’hit-parade

Articles les plus vus en
No  Article Av. Vues Image Remarques
1 Émilie Dequenne B 1 608 141 Cette actrice belge, lauréate du prix d'interprétation féminine du Festival de Cannes pour Rosetta et du César de la meilleure actrice dans un second rôle pour Les choses qu'on dit, les choses qu'on fait, est décédée le des suites d'un cancer des surrénales à l'âge de 43 ans.
2 Elon Musk B 447 151 Cet homme d'affaires américain est très présent dans l'actualité depuis la réélection à la présidence des États-Unis de Donald Trump (no 9) qui l'a nommé à la tête d'un tout nouveau département de l'Efficacité gouvernementale.
3 Leïla Bekhti Bon début 430 921 Cette actrice française tient le premier rôle dans Ma mère, Dieu et Sylvie Vartan, sorti en salles en France le .
4 Herbert Léonard Bon début 417 692 Ce chanteur français, qui s'est fait connaître dans les années 1980 avec des tubes comme Pour le plaisir ou Quand tu m'aimes, est décédé le à l'âge de 80 ans.
5 Jean-Louis Debré Bon début 344 587 Cet homme politique français, ancien ministre de l'Intérieur, président de l'Assemblée nationale et président du Conseil constitutionnel, est décédé le , lui aussi à l'âge de 80 ans.
6 Adolescence (série télévisée) Bon début 337 219 Cette mini-série britannique, conçue par Jack Thorne (photo), a rencontré un grand succès à sa sortie sur Netflix, le . Elle aborde des sujets d'actualité (le cyberharcèlement, la culture incel, la radicalisation en ligne…) sous une forme inhabituelle (chaque épisode se compose d'un unique plan-séquence).
7 Claude Malhuret Bon début 310 362 Ce sénateur français, ancien président de Médecins sans frontières et cofondateur du site Doctissimo, a prononcé le 5 mars devant le Sénat un discours très remarqué en France et à l'international contre la politique menée par le président des États-Unis Donald Trump (no 9).
8 Michel Ferracci Bon début 302 884 Cet acteur français était le mari d'Émilie Dequenne (no 1).
9 Donald Trump B 297 837 Depuis sa réélection à la présidence des États-Unis en novembre dernier, cet homme d'affaires défraie constamment la chronique par ses décisions aussi nombreuses que controversées. Le mois de voit ainsi la déportation de détenus vénézuéliens au Salvador, le début du démantèlement du département de l'Éducation et la menace de l'instauration de droits de douane draconiens.
10 Olivier Giroud B 278 711 Ayant annoncé sa retraite internationale en , le footballeur français, champion du monde en 2018, a été ovationné par le Stade de France le avant le match France-Croatie comptant pour la Ligue des nations de l'UEFA 2024-2025.
11 Michael Olise Bon début 269 396 Ce footballeur français inscrit son premier but sous le maillot de l'équipe de France lors de ce même match France-Croatie du 23 mars.
12 Olympe de Gouges B 261 523 Cette pionnière française du féminisme est le sujet du téléfilm Olympe, une femme dans la Révolution, diffusé le 3 mars sur la chaîne France 2.
13 France AdQ AdQ 251 529 Le pays qui compte le plus grand nombre de francophones figure régulièrement parmi les articles les plus vus de Wikipédia en français.
14 Cyril Hanouna B 249 540 L'ancien animateur vedette de C8 poursuit la diffusion de son émission controversée Touche pas à mon poste ! sur Internet après la fermeture de la chaîne, le .
15 Carême B 239 339 Cette période du calendrier chrétien correspondant aux 40 jours précédant Pâques a commencé cette année le .
16 Gene Hackman Bon début 238 685 Figure de proue du Nouvel Hollywood, récompensé par deux Oscars et quatre Golden Globes, l'acteur américain a été retrouvé mort à son domicile de Santa Fe le avec son épouse Betsy Arakawa (en). Les résultats de l'enquête ont été publiés le .
17 Emilia Pérez Bon début 237 090 Cette comédie musicale sur un chef de cartel mexicain interprété par Karla Sofía Gascón (photo) qui change de sexe pour changer de vie a reçu sept récompenses lors des César, le , mais ses treize nominations aux Oscars ne se sont traduites que par deux victoires le .
18 Décès en mars 2025 Ébauche 233 582 Comme l'illustrent les numéros 1, 4, 5 et 16, la mort d'une personnalité entraîne presque systématiquement un pic de fréquentation de son article.
19 Jacques Audiard Bon début 227 677 Réalisateur du no 17, qui lui a valu le César de la meilleure réalisation.
20 Volodymyr Zelensky B 219 818 Alors que la guerre russo-ukrainienne se poursuit, le président ukrainien s'est rendu à Washington le pour une rencontre particulièrement houleuse avec Donald Trump (no 9).

Méthodologie : sur le modèle du Top 25 Report de Wikipédia en anglais, ce wik'hit-parade reprend les données fournies par l'outil « Pages les plus vues ». Sont exclues les entrées clairement aberrantes comme Cookie (informatique) ou Soudan du Sud, dont le nombre de visites élevé n'est pas le fruit d'un véritable intérêt des internautes : elles se distinguent par un taux très faible (moins de 5 %) ou au contraire très élevé (plus de 95 %) de consultations sur mobile.

Les autres infolettres

La page Wikipédia:RAW/Découvrir recense les infolettres et blogs relatifs à Wikimedia.

En plus de RAW, vous pouvez lire le Wikimag, newsletter hebdomadaire de la Wikipédia francophone (Voir le dernier numéro semaine 13), l'infolettre Wikifier la science (voir hiver 2024) et les Actualités mensuelles du Wiktionnaire (mars 2025).

Les anglophones peuvent aussi lire The Signpost, publié toutes les deux semaines, la newsletter hebdo de la communauté Wikidata (voir ici d:Wikidata:Status updates/2025 02 24) ou encore la newsletter du projet Wikifunction (wikifunctions:Wikifunctions:Status updates/2025-01-15).

Courrier du lectorat

Il nous fera plaisir de lire les messages déposés ici et, si nécessaire, d'y répondre dans les plus brefs délais.

  • bonjour, bravo pour ce numero. A propos du bouquin sur wikipedia qui va sortir on connait le nom reel de l'auteur mais comment on connait le nom d'utilisateur à celui de l'auteur? Et on a le droit de le dire? Ce serait pas du Wikipédia:Doxxing à l'envers? A moins que ce soit un poisson du 1er avril auquel cas je me suis bien fait attraper... --Sergent Cool (discuter) 1 avril 2025 à 09:19 (CEST)
    Bonjour @Sergent Cool. Ce n'est pas un poisson d'avril, ni du doxxing à l'envers : l'utilisateur est intervenu dans la presse successivement sous le nom de « Michel », « Michel wiki » et « Michel Sandrin » (peut-être un pseudonyme, d'ailleurs ?), en évoquant son « bannissement » (blocage indef, en fait), si bien que les wikipédiens ont fait le lien sans difficulté. — Jules* 💬 1 avril 2025 à 12:28 (CEST)
  • Bonjour Émoticône à tous et merci pour ce travail ! Je suis honoré de me découvrir nommément cité dans vos lignes (par @LD), quelle agréable surprise ! Tout ceci dans le cadre d'un débat ô combien actuel, qui plus est… C'est l'occasion de saluer la réflexion et les efforts ayant mené à ce numéro, et, plus généralement, la mise en lumière continuelle du travail collaboratif wikimédien dans les pages de ce magazine (dont je suis un lecteur assidu), tâche qui ne doit pas être aisée. Félicitations ! --Cosmophilus (discuter) 2 avril 2025 à 22:30 (CEST)

Renouveau — content de voir des forces vives travailler à l'évolution des RAW. Un merci particulier à Jules* pour son focus.
longue vie à la nouvelle rédaction! - Simon Villeneuve 3 avril 2025 à 12:42 (CEST)

Merci à tous les trois, @Sergent Cool, @Cosmophilus et @Simon Villeneuve, pour vos retours, c'est encourageant Émoticône sourire. — Jules* 💬 3 avril 2025 à 12:46 (CEST)
Un numéro intéressant. Émoticône — Cantons-de-l'Est p|d|d 🧹 4 avril 2025 à 00:37 (CEST)
Citations originales
Notes
Références
  1. Nicolas Gastineau, « Propos d’un patrouilleur de Wikipédia », sur Revue21.fr, (consulté le )
  2. « Pourquoi la droite américaine s’attaque-t-elle à Wikipédia? », sur ici.radio-canada.ca (consulté le )
  3. « Wikipédia, la méticuleuse fabrique du savoir », La Croix,‎ (ISSN 0242-6056, lire en ligne, consulté le )
  4. « Attaques contre Wikipédia : ce contributeur nous explique comment fonctionne l'encyclopédie libre et partagée », sur France 3 Grand Est, (consulté le )
  5. « Wikipedia : comment les contributions sont-elles contrôlées ? », sur France Culture, (consulté le )
  6. David Dufresne Euryale, « Wikipédia: qui veut sa peau (et pourquoi)? », sur Au Poste, média indépendant 100% Live & Libre, (consulté le )
  7. « Les outils d’IA comme ChatGPT ou Gemini utilisent des sites de propagande russe comme sources », Le Monde,‎ (lire en ligne, consulté le )
  8. Brice Laemle, « « Factuel », un nouveau média en ligne parrainé par Christine Kelly et Dominique Rizet », Le Monde,‎ (lire en ligne)
  9. « La Face cachée de Wikipédia », sur éditions du Cerf (consulté le ).
  10. Cet article a été partagé et discuté sur la page de discussion du Projet:Antipub.
  11. Comme le montre l'outil Search Engine Referrals.
  12. Le quotidien Le Monde y a aussi consacré un article.
  13. Lire à ce sujet ce billet sur le site du Comité européen de la protection des données.

Numéro du 25 avril 2025

Friday, 25 April 2025 00:00 UTC

L'édito — Les réflexions sur la modernisation de cette wikilettre se poursuivent. Dans ce cadre, nous aimerions créer de nouvelles rubriques. Vos suggestions sont les bienvenues en salle de rédaction : dites-nous ce que vous aimeriez lire dans les RAW, ou ce que vous voudriez y écrire !

C'est dans cette perspective que nous lançons un premier appel à commentaires afin de co-rédiger un futur dossier relatif à la possibilité de modifier Wikipédia sans créer de compte (actuellement sous IP, prochainement sous compte temporaire).

Bonne lecture !

Les brèves

Contributions de Jules*, Nanoyo88, Pyb en résidence, Trizek

Échos francophones

Les contributeurs à l'honneur dans les médias — La revue de presse wikipédienne est encore une fois très riche en mars 2025, mais elle voit surtout la mise à l'honneur de nombreux contributeurs tels que Le chat perché (d · c · b) sur XXI[1], Simon Villeneuve (d · c · b) sur Ici Radio-Canada[2], C.Salviani (d · c · b) dans La Croix[3], Lyokoï (d · c · b) sur France 3 Champagne-Ardenne[4] et d'autres sur France Culture[5] ou dans l'émission de David Dufresne[6]. Des interventions remarquables et remarquées !

2033 – Adieu joli wiki ? — Une projection de régression linéaire basée sur les données Google Trends laisse entendre que l'intérêt et l'utilisation continuera de décroître, menant Wikipedia à cesser d'exister le au profit des LLM. A-t-on oublié de préciser le caractère humoristique de cette brève Émoticône ?

Wikipédia / Le Point : clôture de la lettre ouverte et réponse aux mises en demeure — Dans le dernier numéro des RAW, nous vous parlions de la controverse opposant le magazine français Le Point à Wikipédia en français. La lettre ouverte a été close le . En trois semaines, elle a rassemblé 1 155 signatures de contributeurs de notre wiki ou d'autres. Aelxen a compté que le cumul des contributions des signataires sur la seule version francophone s'élevait à environ 22 900 000, soit environ 10 % du total des modifications effectuées sur l'encyclopédie depuis sa création.

Parmi les signatures, celle du co-fondateur de Wikipédia, Jimmy Wales, le , n'est pas passée inaperçue. La directrice du service Trust & Safety de la Fondation Wikimédia (WMF), Maggie Dennis, a également publié un message de soutien en page de discussion.

Le Point a cessé ses publications hostiles à Wikipédia, après une série de neuf articles en onze jours — du jamais vu. Les avocats du magazine ont en revanche adressé une deuxième mise en demeure à la WMF, dans laquelle ils maintiennent leurs demandes de censure de l'article Le Point, en dépit des améliorations apportées par la communauté, et dans laquelle ils qualifient la lettre ouverte de « diffamatoire ».

C'est ce que nous avons appris au détour d'un message incisif publié sur le Bistro par Phil Bradley-Schmieg au nom du service juridique de la WMF. Ce dernier indique clairement ne pas donner suite aux exigences éditoriales du Point et soutenir la lettre ouverte. Plus encore, il souligne, après avoir regretté l'absence d'excuses de la part du magazine, les « graves erreurs et malentendus » que contient la première mise en demeure. Non sans un brin de causticité, le service juridique indique avoir « proposé d'expliquer le fonctionnement de Wikipédia au Point et à ses avocats ». À suivre.

Au Comité d'arbitrage, un élu esseulé — Le CAr n'a pas terminé de casser des claviers sous de douces mélodies un peu naïve de refonte. Les élections de mars 2025 s'achèvent avec l'élection d'un arbitre. Mais concrètement, que se passera-t-il ensuite ? Ce qui est certain, c'est que le quorum de trois arbitres minimum n'est pas rempli pour relancer le CAr. Peut-être serait-ce l'occasion d'engager le processus de déconstruction et de création d'un nouvel organe tel que suggéré par plusieurs contributeurs dans les votes et discussions ? La communauté semble en effet attachée à l'existence d'un organe type CAr, comme en témoignent cette élection et, précédemment, le refus répété (2016, 2018, 2021) de dissoudre le CAr sans instance pour le remplacer.

Coups de griffes — Un conflit oppose la cabale féline et d'autres bénévoles, excédés par la profusion d'images de chats sur le Bistro. Les tensions se sont envenimées à la suite d'une proposition de passage en recommandation de la page Wikipédia:Ne mordez pas les chats, jugée discriminante à l'égard des poissons-chats. Plusieurs RA ont été déposées en mars, mais n'ont toujours pas été traitées ; un contributeur, soupçonnant les administrateurs de partialité, a réclamé qu'ils indiquent s'ils portent ou non la moustache. C'est en tout cas ce que rapporte le magazine français La Virgule qui, renseigné par un certain « Marcel Wiki » et faisant état des accusations lapidaires d'un concessionnaire automobile qui jouit d'une certaine notoriété outre-Atlantique, s'inquiète d'une dérive ailurophile de l'encyclopédie. Sur le Bistro, des commentateurs avisés ont jugé que cet article faisait fausse route : « On sait tous ici que le vrai désaccord dans la communauté porte en ce moment sur la nécessité ou non de capitaliser le nom des modèles dans le wikicode ! »

Attention à la désinformation russe — Des rapports indiquent que des fermes de contenus produisant de la désinformation russe sont utilisés sur Wikipédia[7]. Peu nombreux sur la version francophone et effectués de bonne foi, ces ajouts sont le fait de contributeurs avertis de la communauté ; la situation est semble-t-il différente sur d'autres versions linguistiques de Wikipédia.

Un livre sur Wikipédia... écrit par un utilisateur bloqué — En , l'éphémère média français d'extrême droite Factuel[8], au détour d'un article commenté sur le Bistro, annonçait un ouvrage à paraître en 2024 consacré à Wikipédia. Son auteur ? Un certain Michel1961 (d · c · b), bloqué indéfiniment en 2021 (notamment pour comportement non collaboratif, détournement de sources, rameutage et POV-pushing) et régulièrement cité dans des articles de presse sensationnalistes en 2020 (où des contributeurs expérimentés sont accusés d'être « islamo-conciliants »), 2021, 2023, février et mai 2024. L'ouvrage, annoncé dès 2023, paraît en aux éditions du Cerf sous le titre La face cachée de Wikipédia : Enquête sur les dérives de l'encyclopédie libre[9]. Cosigné par Victor Lefebvre, ancien journaliste au Figaro et à Factuel, l'ouvrage de 216 pages prétend apporter « une réponse argumentée et dépassionnée » à la question de savoir si l'encyclopédie est devenue « Wokipedia » comme allégué par Elon Musk. La réponse est donnée au dos de l'ouvrage : « Le pouvoir de nuisance d'une petite poignée d'utilisateurs ouvertement militants - pour ne pas dire woke - tend à se renforcer. »

L'actu technique

Nouvel aperçu de l'outil de traduction

L'outil de traduction évolue — L'équipe de Localisation de la langue et des produits a amélioré le Tableau de bord de traduction de contenu en intégrant des fonctionnalités de personnalisation de suggestions et en améliorant l'accessibilité du tableau de bord.

D'où viennent et où vont les lecteurs d'un article ? — L'outil Wikinav permet de répondre à ces questions. En plus de mettre en évidence que la majorité des consultations viennent des moteurs de recherche, l'analyse de l'article Elon Musk (le plus consulté en ) montre ainsi que l'article de Wikipédia par lequel le plus grand nombre de lecteurs arrivent est celui de son ex-compagne Grimes et celui le plus consulté consécutivement est celui de sa compagne actuelle, Shivon Zilis. Les clics entrants depuis ou sortants vers le département de l'Efficacité gouvernementale (DOGE) n'arrivent respectivement qu'en dixième et sixième positions. La vie privée avant la politique.

Dans le mouvement

Le logo de Wikipédia, en allemand, avec la mention « 3 Millionen Artikel ».
Et de trois !

Trois millions d'articles sur Wikipédia en allemand — C'est le seuil franchi par la version germanophone de Wikipédia le . Troisième plus grosse version linguistique en nombre d'articles, elle devance la version francophone, selon la liste des wikis. Il existe toutefois de nombreux autres indicateurs pour comparer les versions linguistiques, dont la profondeur, qui valorise le nombre d'éditions par article et le nombre de pages autres que les articles — en classant les wikis avec cet indicateur, la version francophone arrive en dix-neuvième position (loin devant la version germanophone). Pour en revenir au seuil symbolique de trois millions d'articles, les paris sur la date à laquelle Wikipédia en français l'atteindra sont toujours ouverts.

Une militaire américaine en train de se faire peindre la joue aux couleurs du drapeau LGBT.
Exemple de photo retirée.

Suppression de contenus de l'armée américaine — Le département de la Défense des États-Unis a récemment appliqué une décision présidentielle mettant fin aux politiques Diversité, équité et inclusion (DEI). Cela s'est traduit notamment par la mise hors ligne de beaucoup de contenus multimédia. Associated Press a récupéré une base de données de 26 000 photos concernées par la censure. Wikimedia Commons héberge de nombreuses photos de l'armée américaine, entre 10 et 20 % des 5 millions de photos stockées sur DVIDS, la médiathèque du départ de la Défense. Don-vip (d · c · b) poursuit l'import en masse des photos, que  (d · c · b) avait débuté. Une catégorisation des photos supprimées est en cours ainsi que l'import des vidéos manquantes, projet initié par Mvolz (d · c · b). Une fois ce travail de catégorisation réalisé, il sera possible d'extraire les données pour les mettre sur data.gouv.fr par exemple afin de permettre aux chercheurs et associations d'étudier les contenus retirés. Ce travail n'est pas sans soulever des questions éthiques auxquelles l'armée américaine a été confrontée en 2021 en procédant à un retrait massif de photos d'Afghans afin de les protéger des talibans.

Renforcer la neutralité de point de vue de Wikipédia — La Fondation Wikimédia a récemment mis en évidence des tendances essentielles et prioritaires pour le mouvement, à travers des conversations avec les communautés. Cette année, une tendance qui a suscité de nombreuses discussions au sein et au-delà du mouvement Wikimédia concerne la neutralité : la baisse de confiance dans les informations en ligne et la fragmentation du consensus sur la véracité des informations. Il s'avère que la manière dont le principe de neutralité de point de vue se traduit varie d'un projet Wikimédia à l'autre, ce qui met en évidence la possibilité pour les communautés d'apprendre les unes des autres et d'explorer si des normes mondiales communes de neutralité peuvent mieux protéger les projets (et les bénévoles) dans un environnement de menaces accrues et de réglementation croissante. Pour soutenir les communautés Wikimédia et réaffirmer notre engagement en faveur de la neutralité, la Fondation Wikimédia réunira un groupe de travail composé de contributeurs actifs, de membres du CA de la Fondation, de chercheurs et de conseillers afin d'étudier des recommandations de normes communes pour les politiques NPOV qui peuvent protéger Wikipédia, accroître l'intégrité des projets et fournir davantage de soutien aux bénévoles chargés d'administrer ces politiques. Pour en savoir plus, rendez-vous sur Diff, le blog hébergé par la Fondation à propos du mouvement.

Verrouillages globaux massifs — Le , la WMF a entrepris le verrouillage global de plus de 35 000 comptes (liste) compromis (mots de passe divulgués, vraisemblablement). Dans le communiqué qu'elle a publié quelques jours après, elle indique que cela fait suite à la découverte d'« un schéma de connexions inhabituelles à des comptes enregistrés », qui résulterait d'une fuite de données depuis un autre site web incluant des mots de passe, utilisés aussi sur Wikipédia. Un bon rappel de la nécessité de ne pas utiliser un même mot de passe sur plusieurs sites web, et l'occasion de lire ou relire Aide:Sécurité des comptes utilisateur.

Focus

RAW encourage les membres de la communauté à s'exprimer sur différents enjeux liés à l'écosystème Wikimedia. N'hésitez pas à proposer vos textes pour cette section. N'hésitez pas non plus à réagir dans la section du courrier du lectorat.

À la recherche des articles disparus de Google
par Jules*

Certains articles de Wikipédia sont déréférencés par Google. Combien ? Les déréférencements sont-ils légitimes ? C'est le grand flou.

Le Canard enchaîné publie une enquête qui vous déplaît ? Oubliez le communiqué de presse et la plainte pour diffamation. Le problème, ce n'est pas l'article : c'est le fait qu'il soit lu ! Et s'il était possible de le faire disparaître de Google ? Improbable ? C'est pourtant ce qui s'est passé, nous raconte Thibaut Schepman dans un article paru en janvier dernier dans La Revue des médias, éditée par l'Institut national de l'audiovisuel (INA)[10]. La méthode employée par les malandrins est la suivante : signaler à Google une violation des droits d'auteurs en affirmant que l'article de presse est un plagiat d'une page web, antidatée. Derrière la mésaventure vécue par une journaliste du Canard enchaîné se cache une véritable industrie du déréférencement indu, nous apprend Thibaut Schepman.

Si Google a rétabli le référencement de l'article du Canard enchaîné, est-il possible que Wikipédia soit également victime de telles manœuvres ? La question n'est pas anodine. La plupart des consultations de Wikipédia proviennent des moteurs de recherche, et parmi ceux-ci, Google est en position de quasi-monopole[11]. Un article Wikipédia déréférencé de Google, c'est donc probablement un article qui ne sera quasiment plus lu.

De la lumière mais pas trop

Pour savoir ce qu'il en est, première étape, la plateforme Lumen. Elle permet de consulter les demandes de déréférencement adressées à Google pour divers motifs : violation des droits d'auteurs, diffamation, droit à l'oubli... Mais les notices, dont la consultation n'est pas aisée, n'indiquent pas l'issue de ces demandes. Nous ne sommes guère éclairés.

De son côté, la Fondation Wikimédia (WMF) a commencé en 2014 à publier les notifications de déréférencement qu'elle recevait de Google (dont plusieurs dizaines pour Wikipédia en français). À l'époque, la WMF s'est émue de cette censure, motivée par le droit à l'oubli, dans un billet de blog en anglais[12].

Récemment, l'auteur de ces lignes a eu vent du déréférencement d'un article de Wikipédia en français par Google. Le déréférencement a-t-il été effectué au nom du droit à l'oubli ? Ou bien par une méthode retorse comme celle mise en lumière par La Revue des médias ? Aucune idée : aucun résultat sur Lumen avec le titre de l'article, et pas de notice relative sur la page tenue à jour par la WMF.

RGPD à la suédoise

Renseignement pris auprès du service juridique de la WMF, Google envoie depuis quelques années des notifications de déréférencement dépourvues de l'URL du contenu déréférencé (exemple) et donc parfaitement inutiles. Surprenant. Ce changement découle en fait d'une décision prise en 2020 par l'Autorité suédoise pour la protection de la vie privée, sur le fondement du règlement général sur la protection des données (RGPD). Elle a estimé qu'en fournissant l'URL du contenu déréférencé dans ses notifications, Google permettait à leur destinataire de republier les contenus litigieux sous une autre URL, et donc de bafouer le droit à l'oubli[13]. Exit les URL.

Tout au plus la WMF continue-t-elle de recevoir des notifications précises quand le requérant est situé hors Union européenne ; on sait ainsi que l'article Fusillade de l'université d'Eskişehir Osmangazi a disparu de certaines recherches Google en raison de la législation turque — sans plus de précision.

On ignore d'ailleurs si la WMF reçoit systématiquement une notification de Google en cas de déréférencement. En tout état de cause, la liste des notifications relatives à Wikipédia en français n'évoque aucun déréférencement pour violation des droits d'auteurs — c'est en revanche le cas pour Wikipédia en anglais, comme le relèvent nos confrères du Signpost.

S'agissant du droit à l'oubli, s'il est légitime de chercher un équilibre entre droit à l'information et droit au respect de la vie privée, il apparaît contestable qu'une entreprise privée, en l'espèce Google, puisse opérer sans aucune transparence le déréférencement d'articles.

Le dossier du mois

Dans cette section, le magazine aborde un sujet qui a fait beaucoup réagir à l'intérieur de la communauté, voire à l'extérieur.

Le bouleversement annoncé des pratiques par l'IA générative
par Nanoyo88

Cet article repose sur quatre interviews que vous pouvez consulter dans leur version complète.

Lors de précédentes éditions, nous avons régulièrement abordé le sujet de l'IA générative (genAI), ses implications et conséquences pour Wikipédia. Nous aimerions prendre le temps, au travers d'un dossier et d'interventions de quatre contributeurs, d'approfondir le sujet. Pa2chant.bis, LD, Aelxen et (:Julien:) analysent les usages de l'IA et les problèmes qu'ils engendrent ; ils discutent aussi de l'élaboration d'un texte pour les encadrer.

IA, genAI, LLM :
de quoi parle-t-on ?

De manière générale, les machines informatiques exécutent scrupuleusement des instructions (un programme informatique) écrites par des humains. Les humains disent explicitement quoi faire à la machine, pas à pas. L'intelligence artificielle (IA) est une discipline scientifique visant à permettre aux machines d'être « intelligentes » : apprentissage, raisonnement logique, compréhension du langage naturel (anglais, français…). L'IA cherche à permettre aux machines à gagner en autonomie pour effectuer des tâches plus complexes. L'intelligence artificielle générative (genAI) est un sous-domaine de l'IA dont le but est de générer automatiquement des textes en langage naturel. Les réseaux de neurones sont une technologie très puissante (et gourmande en ressources) largement utilisée dans l'IA.

Depuis 2017-2018, les grands modèles de langage (LLM) utilisent des (grands, très grands) réseaux de neurones pour comprendre du langage naturel, répondre à des questions ou générer du texte (genAI). Le texte écrit par un humain pour interagir avec le LLM est appelé prompt. Pour apprendre le langage et des connaissances, les LLM sont gavés de tonnes de données disponibles sur Internet (dont évidemment WP). Les LLM n'ont pas d'estimation de la valeur de vérité ou véracité de ce qu'ils répondent : ils répondent grosso modo ce qui est le plus probable parmi les textes sur lesquels leur apprentissage s'est fondé. Le LLM invente donc : parfois c'est juste, parfois c'est faux — on parle alors d'hallucination.

Pour en savoir plus, lire cet article sur Le Monde.

Ils fleurissent sur l'encyclopédie et le printemps n'y est pour rien. Les textes générés par IA sont de plus en plus nombreux sur les articles de Wikipédia à mesure que l'usage de l'IA générative se démocratise. Pour Pa2chant.bis, cet usage wikipédien se fait « en l'absence de recommandation », ce qui a pour conséquence de rendre « très lourd et coûteux en temps de démontrer des abus » et risque de démotiver les contributeurs qui se consacrent à ces vérifications.

Julien indique à ce propos qu'il est « difficile d'anticiper les usages qui seront faits des LLM. Mais c'est potentiellement un game changer pour WP », qui peut au choix « devenir un dépôt de connaissances approximatives via des masses de textes mal comprises ou un facilitateur de rédaction ».

« C'est l'avenir de Wikipédia qui se joue »

Pa2chant.bis n'y va pas par quatre chemins : « C'est l'avenir de Wikipédia qui se joue. » Les enjeux et les risques de ces nouvelles pratiques sont déjà connus : « outre les potentielles atteintes au droit d'auteur, on peut citer les problèmes de fiabilité de l'information de type absence ou détournement de source, les TI et les problèmes de style. »

La majorité des usages observés ne résistent pas aux vérifications et affichent différents problèmes qui pourraient être évités si la contribution était 100 % humaine. C'est notamment le cas des traductions automatiques, des synthèses de sources multiples, de l'identification de sources, etc.

Des usages problématiques, Pa2chant.bis en a vu quelques exemples surprenants. Par exemple, dans une page Wikipédia sur une maladie, indiquer aux parents que même traitée, elle peut être mortelle, alors qu'aucune source n'a été trouvée dans ce sens. Dans l'article 'Ndrangheta (la mafia calabraise), une famille dont le nom est parfaitement inconnu des sources a été désignée comme étant influente. Dans un autre article étaient indiqués des liens familiaux entre deux personnes, liens imaginaires sourcés avec un blog généré par IA. Les abus peuvent d'une envergure encore supérieure, comme les interventions mêlant TI, IA et vandalismes sur une profusion d'articles dédiés aux quasars : alors que le projet:Astronomie compte peu de membres, et encore moins de spécialistes de ce sous-domaine, cela va exiger d'utiliser WP:TNT.

« L'IA, on l'utilise depuis super longtemps »

Julien rappelle que les traductions automatiques relèvent de l'IA, et plus récemment de l'introduction des LLM. Or, « la communauté semble ok avec cette utilisation de l'IA », quand bien même Julien en est lui-même critique. Concernant les LLM, « des utilisateurs ont développé et rendu compte de pratiques plus avancées (Projet:Observatoire des IA/Documentation, Utilisateur:Global Donald/Création d'article via ChatGPT 4o et comparaison des prompts, Utilisateur:Nanoyo88/testIA…) ». La question revient dès lors à se demander si la relecture et la vérification sont bien effectuées, et c'est là que ça coince. Comme pour les traductions automatiques à la chaîne, les textes générés par IA augmentent la quantité de travail de vérification pour la communauté.

Il y a également des usages de LLM qui pourraient être utiles à l'automatisation de certaines opérations de maintenance sur Wikipédia. « Sur les projets sportifs (basket, foot, foot US), c'est toujours relou quand un joueur change de club : il faut rajouter des catégories, changer des palettes, mettre à jour l'infobox… Not fun. J'ai dans ma todo list le développement d'un outil automatique de mise à jour quand un joueur change de club, avec l'usage d'un LLM. » Les LLM pourraient également être utilisés afin de lutter contre le vandalisme, voire même contre les mésusages de LLM !

Une lutte contraignante

Dernièrement, un tracker a été mis en place par Julien sur la base du signalement, par Pa2chant.bis, de sources comportant un paramètre UTM lié à ChatGPT. Cette longue liste n'est que la partie émergée d'une analyse en profondeur nécessaire et dans laquelle il faut comparer les sources présentées et les informations ajoutées.

Afin de pouvoir rapidement identifier ce type d'ajout, un filtre anti-abus a été créé par Aelxen. « Le filtre consiste à détecter les insertions d'URL contenant un paramètre UTM provenant de ChatGPT. Actuellement, il est uniquement utilisé pour récupérer des statistiques. À terme, il pourrait permettre d'insérer un message d'avertissement lors de la publication des modifications. »

« Des détecteurs insuffisamment fiables »

Actuellement, on peut difficilement s'appuyer uniquement sur des outils de détection et éléments techniques pour identifier les usages de textes générés par IA avec fiabilité. « Ces outils sont imparfaits, explique Julien : les LLM sont des machines probabilistes donc il y a des risques de faux-positifs. Les études qui essaient de mesurer les faux positifs divergent pas mal et s'appuient sur des textes en anglais, donc il faut prévoir une décote pour le français. »

Aelxen et Pa2chant.bis jugent également la fiabilité de ces détecteurs insuffisante. Pour Pa2chant.bis, « le plus performant détecteur trouve en français un nombre impressionnant de probables faux-positifs » et Julien souligne une observation surprenante d'Esprit Fugace : il y a des faux positifs lorsque le contenu est rédigé « par des personnes neuroatypiques dont le style rédactionnel diffère » de la norme.

Sur les possibilités techniques, Aelxen suggère que « des outils semi-automatiques pourraient être envisagés pour aider à l'analyse, par exemple en signalant des passages suspects ou en identifiant des modèles d'écriture caractéristiques de l'IA ». Mais Julien considère que c'est « sans issue parce que les LLM s'aguerrissent et les méthodes de détection sont toujours en retard. Il est possible que le contenu genAI devienne rapidement indiscernable par un œil humain comme par un détecteur ».

« Ils voient surtout le verre à moitié plein sans voir le verre à moitié vide »
Mésusages de l'IA :
comment aider ?

Pour donner un coup de main sur le sujet, plusieurs possibilités. Vous pouvez participer à l'élaboration de la future recommandation ainsi qu'au sondage associé. La vérification des quelque 170 insertions de sources via ChatGPT peut également vous intéresser. De bonnes âmes sont aussi nécessaires pour l'analyse et le traitement de 284 + 400 sites générés par IA utilisés comme sources sur Wikipédia.

Enfin, si vous rencontrez des textes que vous soupçonnez d'être générés par IA et qui contreviennent aux PF, vous pouvez les signaler sur Projet:Observatoire des IA/Contrôle.

Votre aide est précieuse !

Identifier les textes générés par IA et leurs problèmes n'est pas chose aisée. Pa2chant.bis témoigne de sa pratique, indiquant que cela se fait « au hasard des analyses de créations d'articles, des relectures et de la patrouille ». Les mauvais usages possèdent plusieurs marqueurs tels que le style stéréotypé et souvent laudatif, le plan caractéristique et les détournements de sources par hallucination — « et là, c'est beaucoup plus long à identifier ».

Le second problème est qu'il est particulièrement complexe de faire comprendre aux utilisateurs d'IA, novices ou expérimentés, les problèmes de leurs contributions. Pa2chant.bis a l'impression « qu'ils voient surtout le verre à moitié plein (leurs prompts sont de plus en plus précis et performants, et le niveau de réponse des IA s'améliore) sans voir le verre à moitié vide (les erreurs, le langage stéréotypé et les traductions parfaites en mot à mot, mais porteuses de contresens, non-sens ou inventions) ».

Malheureusement, l'utilisation abusive de l'IA reste très tentante car elle est en mesure de produire des textes d'apparence robuste, auxquels il est aisé pour les contributeurs de faire confiance, en ayant la fausse impression d'avoir maitrisé un sujet. À cela s'ajoute la culture historique de Wikipédia « selon laquelle l'encyclopédie est en construction, les erreurs ne sont pas trop graves et finiront bien par être corrigées un jour » ainsi que le sentiment que refuser l'usage de l'IA relève « d'une forme de passéisme, ou d'une attitude rétrograde vis-à-vis des progrès technologiques ».

Vers la mise en place d'une recommandation

Le , Pa2chant.bis tirait une nouvelle fois la sonnette d'alarme, soulevant une nouvelle pratique consistant à sourcer des contenus, ou générer des contenus sourcés, par le biais de l'IA. Cette situation le pousse alors à inviter la communauté à se pencher sur un passage à l'état de recommandation d'un texte encadrant l'usage des IA. L'idée a été très bien accueillie et un sondage est en préparation. Deux versions existent actuellement, un essai élaboré depuis plusieurs mois et une contre-proposition simplifiée par LD.

Cependant, établir une recommandation présente plusieurs contraintes car elle a vocation à établir des lignes directrices à suivre dans la contribution. LD nous rappelle qu'elles doivent donc « répondre aux attentes et interrogations les plus courantes, tout en véhiculant un « savoir-faire » concret ».

« Elle doit être claire, non contradictoire avec les autres normes et permettre un ajustement progressif »

Le plus complexe est de produire une recommandation « claire, non contradictoire avec les autres normes (principes, règles, recommandations) et permettre un ajustement progressif ». Ce dernier élément est nécessaire afin de pouvoir répondre aux éventuelles évolutions législatives. En effet, l'IA générative pose la question de la propriété intellectuelle, dans la mesure où « les textes générés [peuvent provenir] de textes régis par le droit d'auteur et [où] ces générations [pourraient être] considérées comme également soumises au droit d'auteur (et/ou sont considérées comme des œuvres dérivées ou collectives) ».

Cette future recommandation ne supplantera donc pas les recommandations déjà existantes. LD évoque le propos de @Cosmophilus à ce sujet en soulignant que « le mauvais usage de l'IA se caractérise par la violation d'un principe ou d'une norme déjà définie, telle que WP:DA, WP:V, WP:STYLEetc. ». Aussi le but n'est-il pas de répéter le corpus réglementaire mais de donner des indications pour « se concentrer sur l'application de ces normes dans le cadre de l'IA ».

Si la communauté démontre une certaine hostilité à l'égard des contenus générés par IA et le démontre au travers de précédents sondages, il ne semble pas que l'on se dirige vers une interdiction stricte de son usage. Il est d'ores et déjà complexe de le démontrer.

Face à ces nouvelles pratiques, comme l'écrit LD, le mot d'ordre pourrait bien être de « rester guidé par le bon sens et le discernement ».

L'agenda

Le wik’hit-parade

Articles les plus vus en
No  Article Av. Vues Image Remarques
1 Émilie Dequenne B 1 608 141 Cette actrice belge, lauréate du prix d'interprétation féminine du Festival de Cannes pour Rosetta et du César de la meilleure actrice dans un second rôle pour Les choses qu'on dit, les choses qu'on fait, est décédée le des suites d'un cancer des surrénales à l'âge de 43 ans.
2 Elon Musk B 447 151 Cet homme d'affaires américain est très présent dans l'actualité depuis la réélection à la présidence des États-Unis de Donald Trump (no 9) qui l'a nommé à la tête d'un tout nouveau département de l'Efficacité gouvernementale.
3 Leïla Bekhti Bon début 430 921 Cette actrice française tient le premier rôle dans Ma mère, Dieu et Sylvie Vartan, sorti en salles en France le .
4 Herbert Léonard Bon début 417 692 Ce chanteur français, qui s'est fait connaître dans les années 1980 avec des tubes comme Pour le plaisir ou Quand tu m'aimes, est décédé le à l'âge de 80 ans.
5 Jean-Louis Debré Bon début 344 587 Cet homme politique français, ancien ministre de l'Intérieur, président de l'Assemblée nationale et président du Conseil constitutionnel, est décédé le , lui aussi à l'âge de 80 ans.
6 Adolescence (série télévisée) Bon début 337 219 Cette mini-série britannique, conçue par Jack Thorne (photo), a rencontré un grand succès à sa sortie sur Netflix, le . Elle aborde des sujets d'actualité (le cyberharcèlement, la culture incel, la radicalisation en ligne…) sous une forme inhabituelle (chaque épisode se compose d'un unique plan-séquence).
7 Claude Malhuret Bon début 310 362 Ce sénateur français, ancien président de Médecins sans frontières et cofondateur du site Doctissimo, a prononcé le 5 mars devant le Sénat un discours très remarqué en France et à l'international contre la politique menée par le président des États-Unis Donald Trump (no 9).
8 Michel Ferracci Bon début 302 884 Cet acteur français était le mari d'Émilie Dequenne (no 1).
9 Donald Trump B 297 837 Depuis sa réélection à la présidence des États-Unis en novembre dernier, cet homme d'affaires défraie constamment la chronique par ses décisions aussi nombreuses que controversées. Le mois de voit ainsi la déportation de détenus vénézuéliens au Salvador, le début du démantèlement du département de l'Éducation et la menace de l'instauration de droits de douane draconiens.
10 Olivier Giroud B 278 711 Ayant annoncé sa retraite internationale en , le footballeur français, champion du monde en 2018, a été ovationné par le Stade de France le avant le match France-Croatie comptant pour la Ligue des nations de l'UEFA 2024-2025.
11 Michael Olise Bon début 269 396 Ce footballeur français inscrit son premier but sous le maillot de l'équipe de France lors de ce même match France-Croatie du 23 mars.
12 Olympe de Gouges B 261 523 Cette pionnière française du féminisme est le sujet du téléfilm Olympe, une femme dans la Révolution, diffusé le 3 mars sur la chaîne France 2.
13 France AdQ AdQ 251 529 Le pays qui compte le plus grand nombre de francophones figure régulièrement parmi les articles les plus vus de Wikipédia en français.
14 Cyril Hanouna B 249 540 L'ancien animateur vedette de C8 poursuit la diffusion de son émission controversée Touche pas à mon poste ! sur Internet après la fermeture de la chaîne, le .
15 Carême B 239 339 Cette période du calendrier chrétien correspondant aux 40 jours précédant Pâques a commencé cette année le .
16 Gene Hackman Bon début 238 685 Figure de proue du Nouvel Hollywood, récompensé par deux Oscars et quatre Golden Globes, l'acteur américain a été retrouvé mort à son domicile de Santa Fe le avec son épouse Betsy Arakawa (en). Les résultats de l'enquête ont été publiés le .
17 Emilia Pérez Bon début 237 090 Cette comédie musicale sur un chef de cartel mexicain interprété par Karla Sofía Gascón (photo) qui change de sexe pour changer de vie a reçu sept récompenses lors des César, le , mais ses treize nominations aux Oscars ne se sont traduites que par deux victoires le .
18 Décès en mars 2025 Ébauche 233 582 Comme l'illustrent les numéros 1, 4, 5 et 16, la mort d'une personnalité entraîne presque systématiquement un pic de fréquentation de son article.
19 Jacques Audiard Bon début 227 677 Réalisateur du no 17, qui lui a valu le César de la meilleure réalisation.
20 Volodymyr Zelensky B 219 818 Alors que la guerre russo-ukrainienne se poursuit, le président ukrainien s'est rendu à Washington le pour une rencontre particulièrement houleuse avec Donald Trump (no 9).

Méthodologie : sur le modèle du Top 25 Report de Wikipédia en anglais, ce wik'hit-parade reprend les données fournies par l'outil « Pages les plus vues ». Sont exclues les entrées clairement aberrantes comme Cookie (informatique) ou Soudan du Sud, dont le nombre de visites élevé n'est pas le fruit d'un véritable intérêt des internautes : elles se distinguent par un taux très faible (moins de 5 %) ou au contraire très élevé (plus de 95 %) de consultations sur mobile.

Les autres infolettres

La page Wikipédia:RAW/Découvrir recense les infolettres et blogs relatifs à Wikimedia.

En plus de RAW, vous pouvez lire le Wikimag, newsletter hebdomadaire de la Wikipédia francophone (Voir le dernier numéro semaine 13), l'infolettre Wikifier la science (voir hiver 2024) et les Actualités mensuelles du Wiktionnaire (mars 2025).

Les anglophones peuvent aussi lire The Signpost, publié toutes les deux semaines, la newsletter hebdo de la communauté Wikidata (voir ici d:Wikidata:Status updates/2025 02 24) ou encore la newsletter du projet Wikifunction (wikifunctions:Wikifunctions:Status updates/2025-01-15).

Courrier du lectorat

Il nous fera plaisir de lire les messages déposés ici et, si nécessaire, d'y répondre dans les plus brefs délais.

  • bonjour, bravo pour ce numero. A propos du bouquin sur wikipedia qui va sortir on connait le nom reel de l'auteur mais comment on connait le nom d'utilisateur à celui de l'auteur? Et on a le droit de le dire? Ce serait pas du Wikipédia:Doxxing à l'envers? A moins que ce soit un poisson du 1er avril auquel cas je me suis bien fait attraper... --Sergent Cool (discuter) 1 avril 2025 à 09:19 (CEST)
    Bonjour @Sergent Cool. Ce n'est pas un poisson d'avril, ni du doxxing à l'envers : l'utilisateur est intervenu dans la presse successivement sous le nom de « Michel », « Michel wiki » et « Michel Sandrin » (peut-être un pseudonyme, d'ailleurs ?), en évoquant son « bannissement » (blocage indef, en fait), si bien que les wikipédiens ont fait le lien sans difficulté. — Jules* 💬 1 avril 2025 à 12:28 (CEST)
  • Bonjour Émoticône à tous et merci pour ce travail ! Je suis honoré de me découvrir nommément cité dans vos lignes (par @LD), quelle agréable surprise ! Tout ceci dans le cadre d'un débat ô combien actuel, qui plus est… C'est l'occasion de saluer la réflexion et les efforts ayant mené à ce numéro, et, plus généralement, la mise en lumière continuelle du travail collaboratif wikimédien dans les pages de ce magazine (dont je suis un lecteur assidu), tâche qui ne doit pas être aisée. Félicitations ! --Cosmophilus (discuter) 2 avril 2025 à 22:30 (CEST)

Renouveau — content de voir des forces vives travailler à l'évolution des RAW. Un merci particulier à Jules* pour son focus.
longue vie à la nouvelle rédaction! - Simon Villeneuve 3 avril 2025 à 12:42 (CEST)

Merci à tous les trois, @Sergent Cool, @Cosmophilus et @Simon Villeneuve, pour vos retours, c'est encourageant Émoticône sourire. — Jules* 💬 3 avril 2025 à 12:46 (CEST)
Un numéro intéressant. Émoticône — Cantons-de-l'Est p|d|d 🧹 4 avril 2025 à 00:37 (CEST)
Citations originales
Notes
Références
  1. Nicolas Gastineau, « Propos d’un patrouilleur de Wikipédia », sur Revue21.fr, (consulté le )
  2. « Pourquoi la droite américaine s’attaque-t-elle à Wikipédia? », sur ici.radio-canada.ca (consulté le )
  3. « Wikipédia, la méticuleuse fabrique du savoir », La Croix,‎ (ISSN 0242-6056, lire en ligne, consulté le )
  4. « Attaques contre Wikipédia : ce contributeur nous explique comment fonctionne l'encyclopédie libre et partagée », sur France 3 Grand Est, (consulté le )
  5. « Wikipedia : comment les contributions sont-elles contrôlées ? », sur France Culture, (consulté le )
  6. David Dufresne Euryale, « Wikipédia: qui veut sa peau (et pourquoi)? », sur Au Poste, média indépendant 100% Live & Libre, (consulté le )
  7. « Les outils d’IA comme ChatGPT ou Gemini utilisent des sites de propagande russe comme sources », Le Monde,‎ (lire en ligne, consulté le )
  8. Brice Laemle, « « Factuel », un nouveau média en ligne parrainé par Christine Kelly et Dominique Rizet », Le Monde,‎ (lire en ligne)
  9. « La Face cachée de Wikipédia », sur éditions du Cerf (consulté le ).
  10. Cet article a été partagé et discuté sur la page de discussion du Projet:Antipub.
  11. Comme le montre l'outil Search Engine Referrals.
  12. Le quotidien Le Monde y a aussi consacré un article.
  13. Lire à ce sujet ce billet sur le site du Comité européen de la protection des données.

Numéro du 24 avril 2025

Thursday, 24 April 2025 00:00 UTC

L'édito — Les réflexions sur la modernisation de cette wikilettre se poursuivent. Dans ce cadre, nous aimerions créer de nouvelles rubriques. Vos suggestions sont les bienvenues en salle de rédaction : dites-nous ce que vous aimeriez lire dans les RAW, ou ce que vous voudriez y écrire !

C'est dans cette perspective que nous lançons un premier appel à commentaires afin de co-rédiger un futur dossier relatif à la possibilité de modifier Wikipédia sans créer de compte (actuellement sous IP, prochainement sous compte temporaire).

Bonne lecture !

Les brèves

Contributions de Jules*, Nanoyo88, Pyb en résidence, Trizek

Échos francophones

Les contributeurs à l'honneur dans les médias — La revue de presse wikipédienne est encore une fois très riche en mars 2025, mais elle voit surtout la mise à l'honneur de nombreux contributeurs tels que Le chat perché (d · c · b) sur XXI[1], Simon Villeneuve (d · c · b) sur Ici Radio-Canada[2], C.Salviani (d · c · b) dans La Croix[3], Lyokoï (d · c · b) sur France 3 Champagne-Ardenne[4] et d'autres sur France Culture[5] ou dans l'émission de David Dufresne[6]. Des interventions remarquables et remarquées !

2033 – Adieu joli wiki ? — Une projection de régression linéaire basée sur les données Google Trends laisse entendre que l'intérêt et l'utilisation continuera de décroître, menant Wikipedia à cesser d'exister le au profit des LLM. A-t-on oublié de préciser le caractère humoristique de cette brève Émoticône ?

Wikipédia / Le Point : clôture de la lettre ouverte et réponse aux mises en demeure — Dans le dernier numéro des RAW, nous vous parlions de la controverse opposant le magazine français Le Point à Wikipédia en français. La lettre ouverte a été close le . En trois semaines, elle a rassemblé 1 155 signatures de contributeurs de notre wiki ou d'autres. Aelxen a compté que le cumul des contributions des signataires sur la seule version francophone s'élevait à environ 22 900 000, soit environ 10 % du total des modifications effectuées sur l'encyclopédie depuis sa création.

Parmi les signatures, celle du co-fondateur de Wikipédia, Jimmy Wales, le , n'est pas passée inaperçue. La directrice du service Trust & Safety de la Fondation Wikimédia (WMF), Maggie Dennis, a également publié un message de soutien en page de discussion.

Le Point a cessé ses publications hostiles à Wikipédia, après une série de neuf articles en onze jours — du jamais vu. Les avocats du magazine ont en revanche adressé une deuxième mise en demeure à la WMF, dans laquelle ils maintiennent leurs demandes de censure de l'article Le Point, en dépit des améliorations apportées par la communauté, et dans laquelle ils qualifient la lettre ouverte de « diffamatoire ».

C'est ce que nous avons appris au détour d'un message incisif publié sur le Bistro par Phil Bradley-Schmieg au nom du service juridique de la WMF. Ce dernier indique clairement ne pas donner suite aux exigences éditoriales du Point et soutenir la lettre ouverte. Plus encore, il souligne, après avoir regretté l'absence d'excuses de la part du magazine, les « graves erreurs et malentendus » que contient la première mise en demeure. Non sans un brin de causticité, le service juridique indique avoir « proposé d'expliquer le fonctionnement de Wikipédia au Point et à ses avocats ». À suivre.

Au Comité d'arbitrage, un élu esseulé — Le CAr n'a pas terminé de casser des claviers sous de douces mélodies un peu naïve de refonte. Les élections de mars 2025 s'achèvent avec l'élection d'un arbitre. Mais concrètement, que se passera-t-il ensuite ? Ce qui est certain, c'est que le quorum de trois arbitres minimum n'est pas rempli pour relancer le CAr. Peut-être serait-ce l'occasion d'engager le processus de déconstruction et de création d'un nouvel organe tel que suggéré par plusieurs contributeurs dans les votes et discussions ? La communauté semble en effet attachée à l'existence d'un organe type CAr, comme en témoignent cette élection et, précédemment, le refus répété (2016, 2018, 2021) de dissoudre le CAr sans instance pour le remplacer.

Coups de griffes — Un conflit oppose la cabale féline et d'autres bénévoles, excédés par la profusion d'images de chats sur le Bistro. Les tensions se sont envenimées à la suite d'une proposition de passage en recommandation de la page Wikipédia:Ne mordez pas les chats, jugée discriminante à l'égard des poissons-chats. Plusieurs RA ont été déposées en mars, mais n'ont toujours pas été traitées ; un contributeur, soupçonnant les administrateurs de partialité, a réclamé qu'ils indiquent s'ils portent ou non la moustache. C'est en tout cas ce que rapporte le magazine français La Virgule qui, renseigné par un certain « Marcel Wiki » et faisant état des accusations lapidaires d'un concessionnaire automobile qui jouit d'une certaine notoriété outre-Atlantique, s'inquiète d'une dérive ailurophile de l'encyclopédie. Sur le Bistro, des commentateurs avisés ont jugé que cet article faisait fausse route : « On sait tous ici que le vrai désaccord dans la communauté porte en ce moment sur la nécessité ou non de capitaliser le nom des modèles dans le wikicode ! »

Attention à la désinformation russe — Des rapports indiquent que des fermes de contenus produisant de la désinformation russe sont utilisés sur Wikipédia[7]. Peu nombreux sur la version francophone et effectués de bonne foi, ces ajouts sont le fait de contributeurs avertis de la communauté ; la situation est semble-t-il différente sur d'autres versions linguistiques de Wikipédia.

Un livre sur Wikipédia... écrit par un utilisateur bloqué — En , l'éphémère média français d'extrême droite Factuel[8], au détour d'un article commenté sur le Bistro, annonçait un ouvrage à paraître en 2024 consacré à Wikipédia. Son auteur ? Un certain Michel1961 (d · c · b), bloqué indéfiniment en 2021 (notamment pour comportement non collaboratif, détournement de sources, rameutage et POV-pushing) et régulièrement cité dans des articles de presse sensationnalistes en 2020 (où des contributeurs expérimentés sont accusés d'être « islamo-conciliants »), 2021, 2023, février et mai 2024. L'ouvrage, annoncé dès 2023, paraît en aux éditions du Cerf sous le titre La face cachée de Wikipédia : Enquête sur les dérives de l'encyclopédie libre[9]. Cosigné par Victor Lefebvre, ancien journaliste au Figaro et à Factuel, l'ouvrage de 216 pages prétend apporter « une réponse argumentée et dépassionnée » à la question de savoir si l'encyclopédie est devenue « Wokipedia » comme allégué par Elon Musk. La réponse est donnée au dos de l'ouvrage : « Le pouvoir de nuisance d'une petite poignée d'utilisateurs ouvertement militants - pour ne pas dire woke - tend à se renforcer. »

L'actu technique

Nouvel aperçu de l'outil de traduction

L'outil de traduction évolue — L'équipe de Localisation de la langue et des produits a amélioré le Tableau de bord de traduction de contenu en intégrant des fonctionnalités de personnalisation de suggestions et en améliorant l'accessibilité du tableau de bord.

D'où viennent et où vont les lecteurs d'un article ? — L'outil Wikinav permet de répondre à ces questions. En plus de mettre en évidence que la majorité des consultations viennent des moteurs de recherche, l'analyse de l'article Elon Musk (le plus consulté en ) montre ainsi que l'article de Wikipédia par lequel le plus grand nombre de lecteurs arrivent est celui de son ex-compagne Grimes et celui le plus consulté consécutivement est celui de sa compagne actuelle, Shivon Zilis. Les clics entrants depuis ou sortants vers le département de l'Efficacité gouvernementale (DOGE) n'arrivent respectivement qu'en dixième et sixième positions. La vie privée avant la politique.

Dans le mouvement

Le logo de Wikipédia, en allemand, avec la mention « 3 Millionen Artikel ».
Et de trois !

Trois millions d'articles sur Wikipédia en allemand — C'est le seuil franchi par la version germanophone de Wikipédia le . Troisième plus grosse version linguistique en nombre d'articles, elle devance la version francophone, selon la liste des wikis. Il existe toutefois de nombreux autres indicateurs pour comparer les versions linguistiques, dont la profondeur, qui valorise le nombre d'éditions par article et le nombre de pages autres que les articles — en classant les wikis avec cet indicateur, la version francophone arrive en dix-neuvième position (loin devant la version germanophone). Pour en revenir au seuil symbolique de trois millions d'articles, les paris sur la date à laquelle Wikipédia en français l'atteindra sont toujours ouverts.

Une militaire américaine en train de se faire peindre la joue aux couleurs du drapeau LGBT.
Exemple de photo retirée.

Suppression de contenus de l'armée américaine — Le département de la Défense des États-Unis a récemment appliqué une décision présidentielle mettant fin aux politiques Diversité, équité et inclusion (DEI). Cela s'est traduit notamment par la mise hors ligne de beaucoup de contenus multimédia. Associated Press a récupéré une base de données de 26 000 photos concernées par la censure. Wikimedia Commons héberge de nombreuses photos de l'armée américaine, entre 10 et 20 % des 5 millions de photos stockées sur DVIDS, la médiathèque du départ de la Défense. Don-vip (d · c · b) poursuit l'import en masse des photos, que  (d · c · b) avait débuté. Une catégorisation des photos supprimées est en cours ainsi que l'import des vidéos manquantes, projet initié par Mvolz (d · c · b). Une fois ce travail de catégorisation réalisé, il sera possible d'extraire les données pour les mettre sur data.gouv.fr par exemple afin de permettre aux chercheurs et associations d'étudier les contenus retirés. Ce travail n'est pas sans soulever des questions éthiques auxquelles l'armée américaine a été confrontée en 2021 en procédant à un retrait massif de photos d'Afghans afin de les protéger des talibans.

Renforcer la neutralité de point de vue de Wikipédia — La Fondation Wikimédia a récemment mis en évidence des tendances essentielles et prioritaires pour le mouvement, à travers des conversations avec les communautés. Cette année, une tendance qui a suscité de nombreuses discussions au sein et au-delà du mouvement Wikimédia concerne la neutralité : la baisse de confiance dans les informations en ligne et la fragmentation du consensus sur la véracité des informations. Il s'avère que la manière dont le principe de neutralité de point de vue se traduit varie d'un projet Wikimédia à l'autre, ce qui met en évidence la possibilité pour les communautés d'apprendre les unes des autres et d'explorer si des normes mondiales communes de neutralité peuvent mieux protéger les projets (et les bénévoles) dans un environnement de menaces accrues et de réglementation croissante. Pour soutenir les communautés Wikimédia et réaffirmer notre engagement en faveur de la neutralité, la Fondation Wikimédia réunira un groupe de travail composé de contributeurs actifs, de membres du CA de la Fondation, de chercheurs et de conseillers afin d'étudier des recommandations de normes communes pour les politiques NPOV qui peuvent protéger Wikipédia, accroître l'intégrité des projets et fournir davantage de soutien aux bénévoles chargés d'administrer ces politiques. Pour en savoir plus, rendez-vous sur Diff, le blog hébergé par la Fondation à propos du mouvement.

Verrouillages globaux massifs — Le , la WMF a entrepris le verrouillage global de plus de 35 000 comptes (liste) compromis (mots de passe divulgués, vraisemblablement). Dans le communiqué qu'elle a publié quelques jours après, elle indique que cela fait suite à la découverte d'« un schéma de connexions inhabituelles à des comptes enregistrés », qui résulterait d'une fuite de données depuis un autre site web incluant des mots de passe, utilisés aussi sur Wikipédia. Un bon rappel de la nécessité de ne pas utiliser un même mot de passe sur plusieurs sites web, et l'occasion de lire ou relire Aide:Sécurité des comptes utilisateur.

Focus

RAW encourage les membres de la communauté à s'exprimer sur différents enjeux liés à l'écosystème Wikimedia. N'hésitez pas à proposer vos textes pour cette section. N'hésitez pas non plus à réagir dans la section du courrier du lectorat.

À la recherche des articles disparus de Google
par Jules*

Certains articles de Wikipédia sont déréférencés par Google. Combien ? Les déréférencements sont-ils légitimes ? C'est le grand flou.

Le Canard enchaîné publie une enquête qui vous déplaît ? Oubliez le communiqué de presse et la plainte pour diffamation. Le problème, ce n'est pas l'article : c'est le fait qu'il soit lu ! Et s'il était possible de le faire disparaître de Google ? Improbable ? C'est pourtant ce qui s'est passé, nous raconte Thibaut Schepman dans un article paru en janvier dernier dans La Revue des médias, éditée par l'Institut national de l'audiovisuel (INA)[10]. La méthode employée par les malandrins est la suivante : signaler à Google une violation des droits d'auteurs en affirmant que l'article de presse est un plagiat d'une page web, antidatée. Derrière la mésaventure vécue par une journaliste du Canard enchaîné se cache une véritable industrie du déréférencement indu, nous apprend Thibaut Schepman.

Si Google a rétabli le référencement de l'article du Canard enchaîné, est-il possible que Wikipédia soit également victime de telles manœuvres ? La question n'est pas anodine. La plupart des consultations de Wikipédia proviennent des moteurs de recherche, et parmi ceux-ci, Google est en position de quasi-monopole[11]. Un article Wikipédia déréférencé de Google, c'est donc probablement un article qui ne sera quasiment plus lu.

De la lumière mais pas trop

Pour savoir ce qu'il en est, première étape, la plateforme Lumen. Elle permet de consulter les demandes de déréférencement adressées à Google pour divers motifs : violation des droits d'auteurs, diffamation, droit à l'oubli... Mais les notices, dont la consultation n'est pas aisée, n'indiquent pas l'issue de ces demandes. Nous ne sommes guère éclairés.

De son côté, la Fondation Wikimédia (WMF) a commencé en 2014 à publier les notifications de déréférencement qu'elle recevait de Google (dont plusieurs dizaines pour Wikipédia en français). À l'époque, la WMF s'est émue de cette censure, motivée par le droit à l'oubli, dans un billet de blog en anglais[12].

Récemment, l'auteur de ces lignes a eu vent du déréférencement d'un article de Wikipédia en français par Google. Le déréférencement a-t-il été effectué au nom du droit à l'oubli ? Ou bien par une méthode retorse comme celle mise en lumière par La Revue des médias ? Aucune idée : aucun résultat sur Lumen avec le titre de l'article, et pas de notice relative sur la page tenue à jour par la WMF.

RGPD à la suédoise

Renseignement pris auprès du service juridique de la WMF, Google envoie depuis quelques années des notifications de déréférencement dépourvues de l'URL du contenu déréférencé (exemple) et donc parfaitement inutiles. Surprenant. Ce changement découle en fait d'une décision prise en 2020 par l'Autorité suédoise pour la protection de la vie privée, sur le fondement du règlement général sur la protection des données (RGPD). Elle a estimé qu'en fournissant l'URL du contenu déréférencé dans ses notifications, Google permettait à leur destinataire de republier les contenus litigieux sous une autre URL, et donc de bafouer le droit à l'oubli[13]. Exit les URL.

Tout au plus la WMF continue-t-elle de recevoir des notifications précises quand le requérant est situé hors Union européenne ; on sait ainsi que l'article Fusillade de l'université d'Eskişehir Osmangazi a disparu de certaines recherches Google en raison de la législation turque — sans plus de précision.

On ignore d'ailleurs si la WMF reçoit systématiquement une notification de Google en cas de déréférencement. En tout état de cause, la liste des notifications relatives à Wikipédia en français n'évoque aucun déréférencement pour violation des droits d'auteurs — c'est en revanche le cas pour Wikipédia en anglais, comme le relèvent nos confrères du Signpost.

S'agissant du droit à l'oubli, s'il est légitime de chercher un équilibre entre droit à l'information et droit au respect de la vie privée, il apparaît contestable qu'une entreprise privée, en l'espèce Google, puisse opérer sans aucune transparence le déréférencement d'articles.

Le dossier du mois

Dans cette section, le magazine aborde un sujet qui a fait beaucoup réagir à l'intérieur de la communauté, voire à l'extérieur.

Le bouleversement annoncé des pratiques par l'IA générative
par Nanoyo88

Cet article repose sur quatre interviews que vous pouvez consulter dans leur version complète.

Lors de précédentes éditions, nous avons régulièrement abordé le sujet de l'IA générative (genAI), ses implications et conséquences pour Wikipédia. Nous aimerions prendre le temps, au travers d'un dossier et d'interventions de quatre contributeurs, d'approfondir le sujet. Pa2chant.bis, LD, Aelxen et (:Julien:) analysent les usages de l'IA et les problèmes qu'ils engendrent ; ils discutent aussi de l'élaboration d'un texte pour les encadrer.

IA, genAI, LLM :
de quoi parle-t-on ?

De manière générale, les machines informatiques exécutent scrupuleusement des instructions (un programme informatique) écrites par des humains. Les humains disent explicitement quoi faire à la machine, pas à pas. L'intelligence artificielle (IA) est une discipline scientifique visant à permettre aux machines d'être « intelligentes » : apprentissage, raisonnement logique, compréhension du langage naturel (anglais, français…). L'IA cherche à permettre aux machines à gagner en autonomie pour effectuer des tâches plus complexes. L'intelligence artificielle générative (genAI) est un sous-domaine de l'IA dont le but est de générer automatiquement des textes en langage naturel. Les réseaux de neurones sont une technologie très puissante (et gourmande en ressources) largement utilisée dans l'IA.

Depuis 2017-2018, les grands modèles de langage (LLM) utilisent des (grands, très grands) réseaux de neurones pour comprendre du langage naturel, répondre à des questions ou générer du texte (genAI). Le texte écrit par un humain pour interagir avec le LLM est appelé prompt. Pour apprendre le langage et des connaissances, les LLM sont gavés de tonnes de données disponibles sur Internet (dont évidemment WP). Les LLM n'ont pas d'estimation de la valeur de vérité ou véracité de ce qu'ils répondent : ils répondent grosso modo ce qui est le plus probable parmi les textes sur lesquels leur apprentissage s'est fondé. Le LLM invente donc : parfois c'est juste, parfois c'est faux — on parle alors d'hallucination.

Pour en savoir plus, lire cet article sur Le Monde.

Ils fleurissent sur l'encyclopédie et le printemps n'y est pour rien. Les textes générés par IA sont de plus en plus nombreux sur les articles de Wikipédia à mesure que l'usage de l'IA générative se démocratise. Pour Pa2chant.bis, cet usage wikipédien se fait « en l'absence de recommandation », ce qui a pour conséquence de rendre « très lourd et coûteux en temps de démontrer des abus » et risque de démotiver les contributeurs qui se consacrent à ces vérifications.

Julien indique à ce propos qu'il est « difficile d'anticiper les usages qui seront faits des LLM. Mais c'est potentiellement un game changer pour WP », qui peut au choix « devenir un dépôt de connaissances approximatives via des masses de textes mal comprises ou un facilitateur de rédaction ».

« C'est l'avenir de Wikipédia qui se joue »

Pa2chant.bis n'y va pas par quatre chemins : « C'est l'avenir de Wikipédia qui se joue. » Les enjeux et les risques de ces nouvelles pratiques sont déjà connus : « outre les potentielles atteintes au droit d'auteur, on peut citer les problèmes de fiabilité de l'information de type absence ou détournement de source, les TI et les problèmes de style. »

La majorité des usages observés ne résistent pas aux vérifications et affichent différents problèmes qui pourraient être évités si la contribution était 100 % humaine. C'est notamment le cas des traductions automatiques, des synthèses de sources multiples, de l'identification de sources, etc.

Des usages problématiques, Pa2chant.bis en a vu quelques exemples surprenants. Par exemple, dans une page Wikipédia sur une maladie, indiquer aux parents que même traitée, elle peut être mortelle, alors qu'aucune source n'a été trouvée dans ce sens. Dans l'article 'Ndrangheta (la mafia calabraise), une famille dont le nom est parfaitement inconnu des sources a été désignée comme étant influente. Dans un autre article étaient indiqués des liens familiaux entre deux personnes, liens imaginaires sourcés avec un blog généré par IA. Les abus peuvent d'une envergure encore supérieure, comme les interventions mêlant TI, IA et vandalismes sur une profusion d'articles dédiés aux quasars : alors que le projet:Astronomie compte peu de membres, et encore moins de spécialistes de ce sous-domaine, cela va exiger d'utiliser WP:TNT.

« L'IA, on l'utilise depuis super longtemps »

Julien rappelle que les traductions automatiques relèvent de l'IA, et plus récemment de l'introduction des LLM. Or, « la communauté semble ok avec cette utilisation de l'IA », quand bien même Julien en est lui-même critique. Concernant les LLM, « des utilisateurs ont développé et rendu compte de pratiques plus avancées (Projet:Observatoire des IA/Documentation, Utilisateur:Global Donald/Création d'article via ChatGPT 4o et comparaison des prompts, Utilisateur:Nanoyo88/testIA…) ». La question revient dès lors à se demander si la relecture et la vérification sont bien effectuées, et c'est là que ça coince. Comme pour les traductions automatiques à la chaîne, les textes générés par IA augmentent la quantité de travail de vérification pour la communauté.

Il y a également des usages de LLM qui pourraient être utiles à l'automatisation de certaines opérations de maintenance sur Wikipédia. « Sur les projets sportifs (basket, foot, foot US), c'est toujours relou quand un joueur change de club : il faut rajouter des catégories, changer des palettes, mettre à jour l'infobox… Not fun. J'ai dans ma todo list le développement d'un outil automatique de mise à jour quand un joueur change de club, avec l'usage d'un LLM. » Les LLM pourraient également être utilisés afin de lutter contre le vandalisme, voire même contre les mésusages de LLM !

Une lutte contraignante

Dernièrement, un tracker a été mis en place par Julien sur la base du signalement, par Pa2chant.bis, de sources comportant un paramètre UTM lié à ChatGPT. Cette longue liste n'est que la partie émergée d'une analyse en profondeur nécessaire et dans laquelle il faut comparer les sources présentées et les informations ajoutées.

Afin de pouvoir rapidement identifier ce type d'ajout, un filtre anti-abus a été créé par Aelxen. « Le filtre consiste à détecter les insertions d'URL contenant un paramètre UTM provenant de ChatGPT. Actuellement, il est uniquement utilisé pour récupérer des statistiques. À terme, il pourrait permettre d'insérer un message d'avertissement lors de la publication des modifications. »

« Des détecteurs insuffisamment fiables »

Actuellement, on peut difficilement s'appuyer uniquement sur des outils de détection et éléments techniques pour identifier les usages de textes générés par IA avec fiabilité. « Ces outils sont imparfaits, explique Julien : les LLM sont des machines probabilistes donc il y a des risques de faux-positifs. Les études qui essaient de mesurer les faux positifs divergent pas mal et s'appuient sur des textes en anglais, donc il faut prévoir une décote pour le français. »

Aelxen et Pa2chant.bis jugent également la fiabilité de ces détecteurs insuffisante. Pour Pa2chant.bis, « le plus performant détecteur trouve en français un nombre impressionnant de probables faux-positifs » et Julien souligne une observation surprenante d'Esprit Fugace : il y a des faux positifs lorsque le contenu est rédigé « par des personnes neuroatypiques dont le style rédactionnel diffère » de la norme.

Sur les possibilités techniques, Aelxen suggère que « des outils semi-automatiques pourraient être envisagés pour aider à l'analyse, par exemple en signalant des passages suspects ou en identifiant des modèles d'écriture caractéristiques de l'IA ». Mais Julien considère que c'est « sans issue parce que les LLM s'aguerrissent et les méthodes de détection sont toujours en retard. Il est possible que le contenu genAI devienne rapidement indiscernable par un œil humain comme par un détecteur ».

« Ils voient surtout le verre à moitié plein sans voir le verre à moitié vide »
Mésusages de l'IA :
comment aider ?

Pour donner un coup de main sur le sujet, plusieurs possibilités. Vous pouvez participer à l'élaboration de la future recommandation ainsi qu'au sondage associé. La vérification des quelque 170 insertions de sources via ChatGPT peut également vous intéresser. De bonnes âmes sont aussi nécessaires pour l'analyse et le traitement de 284 + 400 sites générés par IA utilisés comme sources sur Wikipédia.

Enfin, si vous rencontrez des textes que vous soupçonnez d'être générés par IA et qui contreviennent aux PF, vous pouvez les signaler sur Projet:Observatoire des IA/Contrôle.

Votre aide est précieuse !

Identifier les textes générés par IA et leurs problèmes n'est pas chose aisée. Pa2chant.bis témoigne de sa pratique, indiquant que cela se fait « au hasard des analyses de créations d'articles, des relectures et de la patrouille ». Les mauvais usages possèdent plusieurs marqueurs tels que le style stéréotypé et souvent laudatif, le plan caractéristique et les détournements de sources par hallucination — « et là, c'est beaucoup plus long à identifier ».

Le second problème est qu'il est particulièrement complexe de faire comprendre aux utilisateurs d'IA, novices ou expérimentés, les problèmes de leurs contributions. Pa2chant.bis a l'impression « qu'ils voient surtout le verre à moitié plein (leurs prompts sont de plus en plus précis et performants, et le niveau de réponse des IA s'améliore) sans voir le verre à moitié vide (les erreurs, le langage stéréotypé et les traductions parfaites en mot à mot, mais porteuses de contresens, non-sens ou inventions) ».

Malheureusement, l'utilisation abusive de l'IA reste très tentante car elle est en mesure de produire des textes d'apparence robuste, auxquels il est aisé pour les contributeurs de faire confiance, en ayant la fausse impression d'avoir maitrisé un sujet. À cela s'ajoute la culture historique de Wikipédia « selon laquelle l'encyclopédie est en construction, les erreurs ne sont pas trop graves et finiront bien par être corrigées un jour » ainsi que le sentiment que refuser l'usage de l'IA relève « d'une forme de passéisme, ou d'une attitude rétrograde vis-à-vis des progrès technologiques ».

Vers la mise en place d'une recommandation

Le , Pa2chant.bis tirait une nouvelle fois la sonnette d'alarme, soulevant une nouvelle pratique consistant à sourcer des contenus, ou générer des contenus sourcés, par le biais de l'IA. Cette situation le pousse alors à inviter la communauté à se pencher sur un passage à l'état de recommandation d'un texte encadrant l'usage des IA. L'idée a été très bien accueillie et un sondage est en préparation. Deux versions existent actuellement, un essai élaboré depuis plusieurs mois et une contre-proposition simplifiée par LD.

Cependant, établir une recommandation présente plusieurs contraintes car elle a vocation à établir des lignes directrices à suivre dans la contribution. LD nous rappelle qu'elles doivent donc « répondre aux attentes et interrogations les plus courantes, tout en véhiculant un « savoir-faire » concret ».

« Elle doit être claire, non contradictoire avec les autres normes et permettre un ajustement progressif »

Le plus complexe est de produire une recommandation « claire, non contradictoire avec les autres normes (principes, règles, recommandations) et permettre un ajustement progressif ». Ce dernier élément est nécessaire afin de pouvoir répondre aux éventuelles évolutions législatives. En effet, l'IA générative pose la question de la propriété intellectuelle, dans la mesure où « les textes générés [peuvent provenir] de textes régis par le droit d'auteur et [où] ces générations [pourraient être] considérées comme également soumises au droit d'auteur (et/ou sont considérées comme des œuvres dérivées ou collectives) ».

Cette future recommandation ne supplantera donc pas les recommandations déjà existantes. LD évoque le propos de @Cosmophilus à ce sujet en soulignant que « le mauvais usage de l'IA se caractérise par la violation d'un principe ou d'une norme déjà définie, telle que WP:DA, WP:V, WP:STYLEetc. ». Aussi le but n'est-il pas de répéter le corpus réglementaire mais de donner des indications pour « se concentrer sur l'application de ces normes dans le cadre de l'IA ».

Si la communauté démontre une certaine hostilité à l'égard des contenus générés par IA et le démontre au travers de précédents sondages, il ne semble pas que l'on se dirige vers une interdiction stricte de son usage. Il est d'ores et déjà complexe de le démontrer.

Face à ces nouvelles pratiques, comme l'écrit LD, le mot d'ordre pourrait bien être de « rester guidé par le bon sens et le discernement ».

L'agenda

Le wik’hit-parade

Articles les plus vus en
No  Article Av. Vues Image Remarques
1 Émilie Dequenne B 1 608 141 Cette actrice belge, lauréate du prix d'interprétation féminine du Festival de Cannes pour Rosetta et du César de la meilleure actrice dans un second rôle pour Les choses qu'on dit, les choses qu'on fait, est décédée le des suites d'un cancer des surrénales à l'âge de 43 ans.
2 Elon Musk B 447 151 Cet homme d'affaires américain est très présent dans l'actualité depuis la réélection à la présidence des États-Unis de Donald Trump (no 9) qui l'a nommé à la tête d'un tout nouveau département de l'Efficacité gouvernementale.
3 Leïla Bekhti Bon début 430 921 Cette actrice française tient le premier rôle dans Ma mère, Dieu et Sylvie Vartan, sorti en salles en France le .
4 Herbert Léonard Bon début 417 692 Ce chanteur français, qui s'est fait connaître dans les années 1980 avec des tubes comme Pour le plaisir ou Quand tu m'aimes, est décédé le à l'âge de 80 ans.
5 Jean-Louis Debré Bon début 344 587 Cet homme politique français, ancien ministre de l'Intérieur, président de l'Assemblée nationale et président du Conseil constitutionnel, est décédé le , lui aussi à l'âge de 80 ans.
6 Adolescence (série télévisée) Bon début 337 219 Cette mini-série britannique, conçue par Jack Thorne (photo), a rencontré un grand succès à sa sortie sur Netflix, le . Elle aborde des sujets d'actualité (le cyberharcèlement, la culture incel, la radicalisation en ligne…) sous une forme inhabituelle (chaque épisode se compose d'un unique plan-séquence).
7 Claude Malhuret Bon début 310 362 Ce sénateur français, ancien président de Médecins sans frontières et cofondateur du site Doctissimo, a prononcé le 5 mars devant le Sénat un discours très remarqué en France et à l'international contre la politique menée par le président des États-Unis Donald Trump (no 9).
8 Michel Ferracci Bon début 302 884 Cet acteur français était le mari d'Émilie Dequenne (no 1).
9 Donald Trump B 297 837 Depuis sa réélection à la présidence des États-Unis en novembre dernier, cet homme d'affaires défraie constamment la chronique par ses décisions aussi nombreuses que controversées. Le mois de voit ainsi la déportation de détenus vénézuéliens au Salvador, le début du démantèlement du département de l'Éducation et la menace de l'instauration de droits de douane draconiens.
10 Olivier Giroud B 278 711 Ayant annoncé sa retraite internationale en , le footballeur français, champion du monde en 2018, a été ovationné par le Stade de France le avant le match France-Croatie comptant pour la Ligue des nations de l'UEFA 2024-2025.
11 Michael Olise Bon début 269 396 Ce footballeur français inscrit son premier but sous le maillot de l'équipe de France lors de ce même match France-Croatie du 23 mars.
12 Olympe de Gouges B 261 523 Cette pionnière française du féminisme est le sujet du téléfilm Olympe, une femme dans la Révolution, diffusé le 3 mars sur la chaîne France 2.
13 France AdQ AdQ 251 529 Le pays qui compte le plus grand nombre de francophones figure régulièrement parmi les articles les plus vus de Wikipédia en français.
14 Cyril Hanouna B 249 540 L'ancien animateur vedette de C8 poursuit la diffusion de son émission controversée Touche pas à mon poste ! sur Internet après la fermeture de la chaîne, le .
15 Carême B 239 339 Cette période du calendrier chrétien correspondant aux 40 jours précédant Pâques a commencé cette année le .
16 Gene Hackman Bon début 238 685 Figure de proue du Nouvel Hollywood, récompensé par deux Oscars et quatre Golden Globes, l'acteur américain a été retrouvé mort à son domicile de Santa Fe le avec son épouse Betsy Arakawa (en). Les résultats de l'enquête ont été publiés le .
17 Emilia Pérez Bon début 237 090 Cette comédie musicale sur un chef de cartel mexicain interprété par Karla Sofía Gascón (photo) qui change de sexe pour changer de vie a reçu sept récompenses lors des César, le , mais ses treize nominations aux Oscars ne se sont traduites que par deux victoires le .
18 Décès en mars 2025 Ébauche 233 582 Comme l'illustrent les numéros 1, 4, 5 et 16, la mort d'une personnalité entraîne presque systématiquement un pic de fréquentation de son article.
19 Jacques Audiard Bon début 227 677 Réalisateur du no 17, qui lui a valu le César de la meilleure réalisation.
20 Volodymyr Zelensky B 219 818 Alors que la guerre russo-ukrainienne se poursuit, le président ukrainien s'est rendu à Washington le pour une rencontre particulièrement houleuse avec Donald Trump (no 9).

Méthodologie : sur le modèle du Top 25 Report de Wikipédia en anglais, ce wik'hit-parade reprend les données fournies par l'outil « Pages les plus vues ». Sont exclues les entrées clairement aberrantes comme Cookie (informatique) ou Soudan du Sud, dont le nombre de visites élevé n'est pas le fruit d'un véritable intérêt des internautes : elles se distinguent par un taux très faible (moins de 5 %) ou au contraire très élevé (plus de 95 %) de consultations sur mobile.

Les autres infolettres

La page Wikipédia:RAW/Découvrir recense les infolettres et blogs relatifs à Wikimedia.

En plus de RAW, vous pouvez lire le Wikimag, newsletter hebdomadaire de la Wikipédia francophone (Voir le dernier numéro semaine 13), l'infolettre Wikifier la science (voir hiver 2024) et les Actualités mensuelles du Wiktionnaire (mars 2025).

Les anglophones peuvent aussi lire The Signpost, publié toutes les deux semaines, la newsletter hebdo de la communauté Wikidata (voir ici d:Wikidata:Status updates/2025 02 24) ou encore la newsletter du projet Wikifunction (wikifunctions:Wikifunctions:Status updates/2025-01-15).

Courrier du lectorat

Il nous fera plaisir de lire les messages déposés ici et, si nécessaire, d'y répondre dans les plus brefs délais.

  • bonjour, bravo pour ce numero. A propos du bouquin sur wikipedia qui va sortir on connait le nom reel de l'auteur mais comment on connait le nom d'utilisateur à celui de l'auteur? Et on a le droit de le dire? Ce serait pas du Wikipédia:Doxxing à l'envers? A moins que ce soit un poisson du 1er avril auquel cas je me suis bien fait attraper... --Sergent Cool (discuter) 1 avril 2025 à 09:19 (CEST)
    Bonjour @Sergent Cool. Ce n'est pas un poisson d'avril, ni du doxxing à l'envers : l'utilisateur est intervenu dans la presse successivement sous le nom de « Michel », « Michel wiki » et « Michel Sandrin » (peut-être un pseudonyme, d'ailleurs ?), en évoquant son « bannissement » (blocage indef, en fait), si bien que les wikipédiens ont fait le lien sans difficulté. — Jules* 💬 1 avril 2025 à 12:28 (CEST)
  • Bonjour Émoticône à tous et merci pour ce travail ! Je suis honoré de me découvrir nommément cité dans vos lignes (par @LD), quelle agréable surprise ! Tout ceci dans le cadre d'un débat ô combien actuel, qui plus est… C'est l'occasion de saluer la réflexion et les efforts ayant mené à ce numéro, et, plus généralement, la mise en lumière continuelle du travail collaboratif wikimédien dans les pages de ce magazine (dont je suis un lecteur assidu), tâche qui ne doit pas être aisée. Félicitations ! --Cosmophilus (discuter) 2 avril 2025 à 22:30 (CEST)

Renouveau — content de voir des forces vives travailler à l'évolution des RAW. Un merci particulier à Jules* pour son focus.
longue vie à la nouvelle rédaction! - Simon Villeneuve 3 avril 2025 à 12:42 (CEST)

Merci à tous les trois, @Sergent Cool, @Cosmophilus et @Simon Villeneuve, pour vos retours, c'est encourageant Émoticône sourire. — Jules* 💬 3 avril 2025 à 12:46 (CEST)
Un numéro intéressant. Émoticône — Cantons-de-l'Est p|d|d 🧹 4 avril 2025 à 00:37 (CEST)
Citations originales
Notes
Références
  1. Nicolas Gastineau, « Propos d’un patrouilleur de Wikipédia », sur Revue21.fr, (consulté le )
  2. « Pourquoi la droite américaine s’attaque-t-elle à Wikipédia? », sur ici.radio-canada.ca (consulté le )
  3. « Wikipédia, la méticuleuse fabrique du savoir », La Croix,‎ (ISSN 0242-6056, lire en ligne, consulté le )
  4. « Attaques contre Wikipédia : ce contributeur nous explique comment fonctionne l'encyclopédie libre et partagée », sur France 3 Grand Est, (consulté le )
  5. « Wikipedia : comment les contributions sont-elles contrôlées ? », sur France Culture, (consulté le )
  6. David Dufresne Euryale, « Wikipédia: qui veut sa peau (et pourquoi)? », sur Au Poste, média indépendant 100% Live & Libre, (consulté le )
  7. « Les outils d’IA comme ChatGPT ou Gemini utilisent des sites de propagande russe comme sources », Le Monde,‎ (lire en ligne, consulté le )
  8. Brice Laemle, « « Factuel », un nouveau média en ligne parrainé par Christine Kelly et Dominique Rizet », Le Monde,‎ (lire en ligne)
  9. « La Face cachée de Wikipédia », sur éditions du Cerf (consulté le ).
  10. Cet article a été partagé et discuté sur la page de discussion du Projet:Antipub.
  11. Comme le montre l'outil Search Engine Referrals.
  12. Le quotidien Le Monde y a aussi consacré un article.
  13. Lire à ce sujet ce billet sur le site du Comité européen de la protection des données.

Jean Claude Balès franchissant la ligne d’arrivée / Romain Balès CC BY-SA 4.0 via Wikimedia Commons Dimanche 13 avril, Jean-Claude Balès a couru la Marathon de Paris pour Wikimédia France. Qu’est-ce qui l’a motivé à courir 42,195 km pour l’association ? Cette année pour la première fois, Wikimédia proposait à la vente des dossards solidaires […]

L’article Jean-Claude Balès, premier coureur marathonien pour Wikimédia France est apparu en premier sur Wikimédia France.

Numéro du 23 avril 2025

Wednesday, 23 April 2025 00:00 UTC

L'édito — Les réflexions sur la modernisation de cette wikilettre se poursuivent. Dans ce cadre, nous aimerions créer de nouvelles rubriques. Vos suggestions sont les bienvenues en salle de rédaction : dites-nous ce que vous aimeriez lire dans les RAW, ou ce que vous voudriez y écrire !

C'est dans cette perspective que nous lançons un premier appel à commentaires afin de co-rédiger un futur dossier relatif à la possibilité de modifier Wikipédia sans créer de compte (actuellement sous IP, prochainement sous compte temporaire).

Bonne lecture !

Les brèves

Contributions de Jules*, Nanoyo88, Pyb en résidence, Trizek

Échos francophones

Les contributeurs à l'honneur dans les médias — La revue de presse wikipédienne est encore une fois très riche en mars 2025, mais elle voit surtout la mise à l'honneur de nombreux contributeurs tels que Le chat perché (d · c · b) sur XXI[1], Simon Villeneuve (d · c · b) sur Ici Radio-Canada[2], C.Salviani (d · c · b) dans La Croix[3], Lyokoï (d · c · b) sur France 3 Champagne-Ardenne[4] et d'autres sur France Culture[5] ou dans l'émission de David Dufresne[6]. Des interventions remarquables et remarquées !

2033 – Adieu joli wiki ? — Une projection de régression linéaire basée sur les données Google Trends laisse entendre que l'intérêt et l'utilisation continuera de décroître, menant Wikipedia à cesser d'exister le au profit des LLM. A-t-on oublié de préciser le caractère humoristique de cette brève Émoticône ?

Wikipédia / Le Point : clôture de la lettre ouverte et réponse aux mises en demeure — Dans le dernier numéro des RAW, nous vous parlions de la controverse opposant le magazine français Le Point à Wikipédia en français. La lettre ouverte a été close le . En trois semaines, elle a rassemblé 1 155 signatures de contributeurs de notre wiki ou d'autres. Aelxen a compté que le cumul des contributions des signataires sur la seule version francophone s'élevait à environ 22 900 000, soit environ 10 % du total des modifications effectuées sur l'encyclopédie depuis sa création.

Parmi les signatures, celle du co-fondateur de Wikipédia, Jimmy Wales, le , n'est pas passée inaperçue. La directrice du service Trust & Safety de la Fondation Wikimédia (WMF), Maggie Dennis, a également publié un message de soutien en page de discussion.

Le Point a cessé ses publications hostiles à Wikipédia, après une série de neuf articles en onze jours — du jamais vu. Les avocats du magazine ont en revanche adressé une deuxième mise en demeure à la WMF, dans laquelle ils maintiennent leurs demandes de censure de l'article Le Point, en dépit des améliorations apportées par la communauté, et dans laquelle ils qualifient la lettre ouverte de « diffamatoire ».

C'est ce que nous avons appris au détour d'un message incisif publié sur le Bistro par Phil Bradley-Schmieg au nom du service juridique de la WMF. Ce dernier indique clairement ne pas donner suite aux exigences éditoriales du Point et soutenir la lettre ouverte. Plus encore, il souligne, après avoir regretté l'absence d'excuses de la part du magazine, les « graves erreurs et malentendus » que contient la première mise en demeure. Non sans un brin de causticité, le service juridique indique avoir « proposé d'expliquer le fonctionnement de Wikipédia au Point et à ses avocats ». À suivre.

Au Comité d'arbitrage, un élu esseulé — Le CAr n'a pas terminé de casser des claviers sous de douces mélodies un peu naïve de refonte. Les élections de mars 2025 s'achèvent avec l'élection d'un arbitre. Mais concrètement, que se passera-t-il ensuite ? Ce qui est certain, c'est que le quorum de trois arbitres minimum n'est pas rempli pour relancer le CAr. Peut-être serait-ce l'occasion d'engager le processus de déconstruction et de création d'un nouvel organe tel que suggéré par plusieurs contributeurs dans les votes et discussions ? La communauté semble en effet attachée à l'existence d'un organe type CAr, comme en témoignent cette élection et, précédemment, le refus répété (2016, 2018, 2021) de dissoudre le CAr sans instance pour le remplacer.

Coups de griffes — Un conflit oppose la cabale féline et d'autres bénévoles, excédés par la profusion d'images de chats sur le Bistro. Les tensions se sont envenimées à la suite d'une proposition de passage en recommandation de la page Wikipédia:Ne mordez pas les chats, jugée discriminante à l'égard des poissons-chats. Plusieurs RA ont été déposées en mars, mais n'ont toujours pas été traitées ; un contributeur, soupçonnant les administrateurs de partialité, a réclamé qu'ils indiquent s'ils portent ou non la moustache. C'est en tout cas ce que rapporte le magazine français La Virgule qui, renseigné par un certain « Marcel Wiki » et faisant état des accusations lapidaires d'un concessionnaire automobile qui jouit d'une certaine notoriété outre-Atlantique, s'inquiète d'une dérive ailurophile de l'encyclopédie. Sur le Bistro, des commentateurs avisés ont jugé que cet article faisait fausse route : « On sait tous ici que le vrai désaccord dans la communauté porte en ce moment sur la nécessité ou non de capitaliser le nom des modèles dans le wikicode ! »

Attention à la désinformation russe — Des rapports indiquent que des fermes de contenus produisant de la désinformation russe sont utilisés sur Wikipédia[7]. Peu nombreux sur la version francophone et effectués de bonne foi, ces ajouts sont le fait de contributeurs avertis de la communauté ; la situation est semble-t-il différente sur d'autres versions linguistiques de Wikipédia.

Un livre sur Wikipédia... écrit par un utilisateur bloqué — En , l'éphémère média français d'extrême droite Factuel[8], au détour d'un article commenté sur le Bistro, annonçait un ouvrage à paraître en 2024 consacré à Wikipédia. Son auteur ? Un certain Michel1961 (d · c · b), bloqué indéfiniment en 2021 (notamment pour comportement non collaboratif, détournement de sources, rameutage et POV-pushing) et régulièrement cité dans des articles de presse sensationnalistes en 2020 (où des contributeurs expérimentés sont accusés d'être « islamo-conciliants »), 2021, 2023, février et mai 2024. L'ouvrage, annoncé dès 2023, paraît en aux éditions du Cerf sous le titre La face cachée de Wikipédia : Enquête sur les dérives de l'encyclopédie libre[9]. Cosigné par Victor Lefebvre, ancien journaliste au Figaro et à Factuel, l'ouvrage de 216 pages prétend apporter « une réponse argumentée et dépassionnée » à la question de savoir si l'encyclopédie est devenue « Wokipedia » comme allégué par Elon Musk. La réponse est donnée au dos de l'ouvrage : « Le pouvoir de nuisance d'une petite poignée d'utilisateurs ouvertement militants - pour ne pas dire woke - tend à se renforcer. »

L'actu technique

Nouvel aperçu de l'outil de traduction

L'outil de traduction évolue — L'équipe de Localisation de la langue et des produits a amélioré le Tableau de bord de traduction de contenu en intégrant des fonctionnalités de personnalisation de suggestions et en améliorant l'accessibilité du tableau de bord.

D'où viennent et où vont les lecteurs d'un article ? — L'outil Wikinav permet de répondre à ces questions. En plus de mettre en évidence que la majorité des consultations viennent des moteurs de recherche, l'analyse de l'article Elon Musk (le plus consulté en ) montre ainsi que l'article de Wikipédia par lequel le plus grand nombre de lecteurs arrivent est celui de son ex-compagne Grimes et celui le plus consulté consécutivement est celui de sa compagne actuelle, Shivon Zilis. Les clics entrants depuis ou sortants vers le département de l'Efficacité gouvernementale (DOGE) n'arrivent respectivement qu'en dixième et sixième positions. La vie privée avant la politique.

Dans le mouvement

Le logo de Wikipédia, en allemand, avec la mention « 3 Millionen Artikel ».
Et de trois !

Trois millions d'articles sur Wikipédia en allemand — C'est le seuil franchi par la version germanophone de Wikipédia le . Troisième plus grosse version linguistique en nombre d'articles, elle devance la version francophone, selon la liste des wikis. Il existe toutefois de nombreux autres indicateurs pour comparer les versions linguistiques, dont la profondeur, qui valorise le nombre d'éditions par article et le nombre de pages autres que les articles — en classant les wikis avec cet indicateur, la version francophone arrive en dix-neuvième position (loin devant la version germanophone). Pour en revenir au seuil symbolique de trois millions d'articles, les paris sur la date à laquelle Wikipédia en français l'atteindra sont toujours ouverts.

Une militaire américaine en train de se faire peindre la joue aux couleurs du drapeau LGBT.
Exemple de photo retirée.

Suppression de contenus de l'armée américaine — Le département de la Défense des États-Unis a récemment appliqué une décision présidentielle mettant fin aux politiques Diversité, équité et inclusion (DEI). Cela s'est traduit notamment par la mise hors ligne de beaucoup de contenus multimédia. Associated Press a récupéré une base de données de 26 000 photos concernées par la censure. Wikimedia Commons héberge de nombreuses photos de l'armée américaine, entre 10 et 20 % des 5 millions de photos stockées sur DVIDS, la médiathèque du départ de la Défense. Don-vip (d · c · b) poursuit l'import en masse des photos, que  (d · c · b) avait débuté. Une catégorisation des photos supprimées est en cours ainsi que l'import des vidéos manquantes, projet initié par Mvolz (d · c · b). Une fois ce travail de catégorisation réalisé, il sera possible d'extraire les données pour les mettre sur data.gouv.fr par exemple afin de permettre aux chercheurs et associations d'étudier les contenus retirés. Ce travail n'est pas sans soulever des questions éthiques auxquelles l'armée américaine a été confrontée en 2021 en procédant à un retrait massif de photos d'Afghans afin de les protéger des talibans.

Renforcer la neutralité de point de vue de Wikipédia — La Fondation Wikimédia a récemment mis en évidence des tendances essentielles et prioritaires pour le mouvement, à travers des conversations avec les communautés. Cette année, une tendance qui a suscité de nombreuses discussions au sein et au-delà du mouvement Wikimédia concerne la neutralité : la baisse de confiance dans les informations en ligne et la fragmentation du consensus sur la véracité des informations. Il s'avère que la manière dont le principe de neutralité de point de vue se traduit varie d'un projet Wikimédia à l'autre, ce qui met en évidence la possibilité pour les communautés d'apprendre les unes des autres et d'explorer si des normes mondiales communes de neutralité peuvent mieux protéger les projets (et les bénévoles) dans un environnement de menaces accrues et de réglementation croissante. Pour soutenir les communautés Wikimédia et réaffirmer notre engagement en faveur de la neutralité, la Fondation Wikimédia réunira un groupe de travail composé de contributeurs actifs, de membres du CA de la Fondation, de chercheurs et de conseillers afin d'étudier des recommandations de normes communes pour les politiques NPOV qui peuvent protéger Wikipédia, accroître l'intégrité des projets et fournir davantage de soutien aux bénévoles chargés d'administrer ces politiques. Pour en savoir plus, rendez-vous sur Diff, le blog hébergé par la Fondation à propos du mouvement.

Verrouillages globaux massifs — Le , la WMF a entrepris le verrouillage global de plus de 35 000 comptes (liste) compromis (mots de passe divulgués, vraisemblablement). Dans le communiqué qu'elle a publié quelques jours après, elle indique que cela fait suite à la découverte d'« un schéma de connexions inhabituelles à des comptes enregistrés », qui résulterait d'une fuite de données depuis un autre site web incluant des mots de passe, utilisés aussi sur Wikipédia. Un bon rappel de la nécessité de ne pas utiliser un même mot de passe sur plusieurs sites web, et l'occasion de lire ou relire Aide:Sécurité des comptes utilisateur.

Focus

RAW encourage les membres de la communauté à s'exprimer sur différents enjeux liés à l'écosystème Wikimedia. N'hésitez pas à proposer vos textes pour cette section. N'hésitez pas non plus à réagir dans la section du courrier du lectorat.

À la recherche des articles disparus de Google
par Jules*

Certains articles de Wikipédia sont déréférencés par Google. Combien ? Les déréférencements sont-ils légitimes ? C'est le grand flou.

Le Canard enchaîné publie une enquête qui vous déplaît ? Oubliez le communiqué de presse et la plainte pour diffamation. Le problème, ce n'est pas l'article : c'est le fait qu'il soit lu ! Et s'il était possible de le faire disparaître de Google ? Improbable ? C'est pourtant ce qui s'est passé, nous raconte Thibaut Schepman dans un article paru en janvier dernier dans La Revue des médias, éditée par l'Institut national de l'audiovisuel (INA)[10]. La méthode employée par les malandrins est la suivante : signaler à Google une violation des droits d'auteurs en affirmant que l'article de presse est un plagiat d'une page web, antidatée. Derrière la mésaventure vécue par une journaliste du Canard enchaîné se cache une véritable industrie du déréférencement indu, nous apprend Thibaut Schepman.

Si Google a rétabli le référencement de l'article du Canard enchaîné, est-il possible que Wikipédia soit également victime de telles manœuvres ? La question n'est pas anodine. La plupart des consultations de Wikipédia proviennent des moteurs de recherche, et parmi ceux-ci, Google est en position de quasi-monopole[11]. Un article Wikipédia déréférencé de Google, c'est donc probablement un article qui ne sera quasiment plus lu.

De la lumière mais pas trop

Pour savoir ce qu'il en est, première étape, la plateforme Lumen. Elle permet de consulter les demandes de déréférencement adressées à Google pour divers motifs : violation des droits d'auteurs, diffamation, droit à l'oubli... Mais les notices, dont la consultation n'est pas aisée, n'indiquent pas l'issue de ces demandes. Nous ne sommes guère éclairés.

De son côté, la Fondation Wikimédia (WMF) a commencé en 2014 à publier les notifications de déréférencement qu'elle recevait de Google (dont plusieurs dizaines pour Wikipédia en français). À l'époque, la WMF s'est émue de cette censure, motivée par le droit à l'oubli, dans un billet de blog en anglais[12].

Récemment, l'auteur de ces lignes a eu vent du déréférencement d'un article de Wikipédia en français par Google. Le déréférencement a-t-il été effectué au nom du droit à l'oubli ? Ou bien par une méthode retorse comme celle mise en lumière par La Revue des médias ? Aucune idée : aucun résultat sur Lumen avec le titre de l'article, et pas de notice relative sur la page tenue à jour par la WMF.

RGPD à la suédoise

Renseignement pris auprès du service juridique de la WMF, Google envoie depuis quelques années des notifications de déréférencement dépourvues de l'URL du contenu déréférencé (exemple) et donc parfaitement inutiles. Surprenant. Ce changement découle en fait d'une décision prise en 2020 par l'Autorité suédoise pour la protection de la vie privée, sur le fondement du règlement général sur la protection des données (RGPD). Elle a estimé qu'en fournissant l'URL du contenu déréférencé dans ses notifications, Google permettait à leur destinataire de republier les contenus litigieux sous une autre URL, et donc de bafouer le droit à l'oubli[13]. Exit les URL.

Tout au plus la WMF continue-t-elle de recevoir des notifications précises quand le requérant est situé hors Union européenne ; on sait ainsi que l'article Fusillade de l'université d'Eskişehir Osmangazi a disparu de certaines recherches Google en raison de la législation turque — sans plus de précision.

On ignore d'ailleurs si la WMF reçoit systématiquement une notification de Google en cas de déréférencement. En tout état de cause, la liste des notifications relatives à Wikipédia en français n'évoque aucun déréférencement pour violation des droits d'auteurs — c'est en revanche le cas pour Wikipédia en anglais, comme le relèvent nos confrères du Signpost.

S'agissant du droit à l'oubli, s'il est légitime de chercher un équilibre entre droit à l'information et droit au respect de la vie privée, il apparaît contestable qu'une entreprise privée, en l'espèce Google, puisse opérer sans aucune transparence le déréférencement d'articles.

Le dossier du mois

Dans cette section, le magazine aborde un sujet qui a fait beaucoup réagir à l'intérieur de la communauté, voire à l'extérieur.

Le bouleversement annoncé des pratiques par l'IA générative
par Nanoyo88

Cet article repose sur quatre interviews que vous pouvez consulter dans leur version complète.

Lors de précédentes éditions, nous avons régulièrement abordé le sujet de l'IA générative (genAI), ses implications et conséquences pour Wikipédia. Nous aimerions prendre le temps, au travers d'un dossier et d'interventions de quatre contributeurs, d'approfondir le sujet. Pa2chant.bis, LD, Aelxen et (:Julien:) analysent les usages de l'IA et les problèmes qu'ils engendrent ; ils discutent aussi de l'élaboration d'un texte pour les encadrer.

IA, genAI, LLM :
de quoi parle-t-on ?

De manière générale, les machines informatiques exécutent scrupuleusement des instructions (un programme informatique) écrites par des humains. Les humains disent explicitement quoi faire à la machine, pas à pas. L'intelligence artificielle (IA) est une discipline scientifique visant à permettre aux machines d'être « intelligentes » : apprentissage, raisonnement logique, compréhension du langage naturel (anglais, français…). L'IA cherche à permettre aux machines à gagner en autonomie pour effectuer des tâches plus complexes. L'intelligence artificielle générative (genAI) est un sous-domaine de l'IA dont le but est de générer automatiquement des textes en langage naturel. Les réseaux de neurones sont une technologie très puissante (et gourmande en ressources) largement utilisée dans l'IA.

Depuis 2017-2018, les grands modèles de langage (LLM) utilisent des (grands, très grands) réseaux de neurones pour comprendre du langage naturel, répondre à des questions ou générer du texte (genAI). Le texte écrit par un humain pour interagir avec le LLM est appelé prompt. Pour apprendre le langage et des connaissances, les LLM sont gavés de tonnes de données disponibles sur Internet (dont évidemment WP). Les LLM n'ont pas d'estimation de la valeur de vérité ou véracité de ce qu'ils répondent : ils répondent grosso modo ce qui est le plus probable parmi les textes sur lesquels leur apprentissage s'est fondé. Le LLM invente donc : parfois c'est juste, parfois c'est faux — on parle alors d'hallucination.

Pour en savoir plus, lire cet article sur Le Monde.

Ils fleurissent sur l'encyclopédie et le printemps n'y est pour rien. Les textes générés par IA sont de plus en plus nombreux sur les articles de Wikipédia à mesure que l'usage de l'IA générative se démocratise. Pour Pa2chant.bis, cet usage wikipédien se fait « en l'absence de recommandation », ce qui a pour conséquence de rendre « très lourd et coûteux en temps de démontrer des abus » et risque de démotiver les contributeurs qui se consacrent à ces vérifications.

Julien indique à ce propos qu'il est « difficile d'anticiper les usages qui seront faits des LLM. Mais c'est potentiellement un game changer pour WP », qui peut au choix « devenir un dépôt de connaissances approximatives via des masses de textes mal comprises ou un facilitateur de rédaction ».

« C'est l'avenir de Wikipédia qui se joue »

Pa2chant.bis n'y va pas par quatre chemins : « C'est l'avenir de Wikipédia qui se joue. » Les enjeux et les risques de ces nouvelles pratiques sont déjà connus : « outre les potentielles atteintes au droit d'auteur, on peut citer les problèmes de fiabilité de l'information de type absence ou détournement de source, les TI et les problèmes de style. »

La majorité des usages observés ne résistent pas aux vérifications et affichent différents problèmes qui pourraient être évités si la contribution était 100 % humaine. C'est notamment le cas des traductions automatiques, des synthèses de sources multiples, de l'identification de sources, etc.

Des usages problématiques, Pa2chant.bis en a vu quelques exemples surprenants. Par exemple, dans une page Wikipédia sur une maladie, indiquer aux parents que même traitée, elle peut être mortelle, alors qu'aucune source n'a été trouvée dans ce sens. Dans l'article 'Ndrangheta (la mafia calabraise), une famille dont le nom est parfaitement inconnu des sources a été désignée comme étant influente. Dans un autre article étaient indiqués des liens familiaux entre deux personnes, liens imaginaires sourcés avec un blog généré par IA. Les abus peuvent d'une envergure encore supérieure, comme les interventions mêlant TI, IA et vandalismes sur une profusion d'articles dédiés aux quasars : alors que le projet:Astronomie compte peu de membres, et encore moins de spécialistes de ce sous-domaine, cela va exiger d'utiliser WP:TNT.

« L'IA, on l'utilise depuis super longtemps »

Julien rappelle que les traductions automatiques relèvent de l'IA, et plus récemment de l'introduction des LLM. Or, « la communauté semble ok avec cette utilisation de l'IA », quand bien même Julien en est lui-même critique. Concernant les LLM, « des utilisateurs ont développé et rendu compte de pratiques plus avancées (Projet:Observatoire des IA/Documentation, Utilisateur:Global Donald/Création d'article via ChatGPT 4o et comparaison des prompts, Utilisateur:Nanoyo88/testIA…) ». La question revient dès lors à se demander si la relecture et la vérification sont bien effectuées, et c'est là que ça coince. Comme pour les traductions automatiques à la chaîne, les textes générés par IA augmentent la quantité de travail de vérification pour la communauté.

Il y a également des usages de LLM qui pourraient être utiles à l'automatisation de certaines opérations de maintenance sur Wikipédia. « Sur les projets sportifs (basket, foot, foot US), c'est toujours relou quand un joueur change de club : il faut rajouter des catégories, changer des palettes, mettre à jour l'infobox… Not fun. J'ai dans ma todo list le développement d'un outil automatique de mise à jour quand un joueur change de club, avec l'usage d'un LLM. » Les LLM pourraient également être utilisés afin de lutter contre le vandalisme, voire même contre les mésusages de LLM !

Une lutte contraignante

Dernièrement, un tracker a été mis en place par Julien sur la base du signalement, par Pa2chant.bis, de sources comportant un paramètre UTM lié à ChatGPT. Cette longue liste n'est que la partie émergée d'une analyse en profondeur nécessaire et dans laquelle il faut comparer les sources présentées et les informations ajoutées.

Afin de pouvoir rapidement identifier ce type d'ajout, un filtre anti-abus a été créé par Aelxen. « Le filtre consiste à détecter les insertions d'URL contenant un paramètre UTM provenant de ChatGPT. Actuellement, il est uniquement utilisé pour récupérer des statistiques. À terme, il pourrait permettre d'insérer un message d'avertissement lors de la publication des modifications. »

« Des détecteurs insuffisamment fiables »

Actuellement, on peut difficilement s'appuyer uniquement sur des outils de détection et éléments techniques pour identifier les usages de textes générés par IA avec fiabilité. « Ces outils sont imparfaits, explique Julien : les LLM sont des machines probabilistes donc il y a des risques de faux-positifs. Les études qui essaient de mesurer les faux positifs divergent pas mal et s'appuient sur des textes en anglais, donc il faut prévoir une décote pour le français. »

Aelxen et Pa2chant.bis jugent également la fiabilité de ces détecteurs insuffisante. Pour Pa2chant.bis, « le plus performant détecteur trouve en français un nombre impressionnant de probables faux-positifs » et Julien souligne une observation surprenante d'Esprit Fugace : il y a des faux positifs lorsque le contenu est rédigé « par des personnes neuroatypiques dont le style rédactionnel diffère » de la norme.

Sur les possibilités techniques, Aelxen suggère que « des outils semi-automatiques pourraient être envisagés pour aider à l'analyse, par exemple en signalant des passages suspects ou en identifiant des modèles d'écriture caractéristiques de l'IA ». Mais Julien considère que c'est « sans issue parce que les LLM s'aguerrissent et les méthodes de détection sont toujours en retard. Il est possible que le contenu genAI devienne rapidement indiscernable par un œil humain comme par un détecteur ».

« Ils voient surtout le verre à moitié plein sans voir le verre à moitié vide »
Mésusages de l'IA :
comment aider ?

Pour donner un coup de main sur le sujet, plusieurs possibilités. Vous pouvez participer à l'élaboration de la future recommandation ainsi qu'au sondage associé. La vérification des quelque 170 insertions de sources via ChatGPT peut également vous intéresser. De bonnes âmes sont aussi nécessaires pour l'analyse et le traitement de 284 + 400 sites générés par IA utilisés comme sources sur Wikipédia.

Enfin, si vous rencontrez des textes que vous soupçonnez d'être générés par IA et qui contreviennent aux PF, vous pouvez les signaler sur Projet:Observatoire des IA/Contrôle.

Votre aide est précieuse !

Identifier les textes générés par IA et leurs problèmes n'est pas chose aisée. Pa2chant.bis témoigne de sa pratique, indiquant que cela se fait « au hasard des analyses de créations d'articles, des relectures et de la patrouille ». Les mauvais usages possèdent plusieurs marqueurs tels que le style stéréotypé et souvent laudatif, le plan caractéristique et les détournements de sources par hallucination — « et là, c'est beaucoup plus long à identifier ».

Le second problème est qu'il est particulièrement complexe de faire comprendre aux utilisateurs d'IA, novices ou expérimentés, les problèmes de leurs contributions. Pa2chant.bis a l'impression « qu'ils voient surtout le verre à moitié plein (leurs prompts sont de plus en plus précis et performants, et le niveau de réponse des IA s'améliore) sans voir le verre à moitié vide (les erreurs, le langage stéréotypé et les traductions parfaites en mot à mot, mais porteuses de contresens, non-sens ou inventions) ».

Malheureusement, l'utilisation abusive de l'IA reste très tentante car elle est en mesure de produire des textes d'apparence robuste, auxquels il est aisé pour les contributeurs de faire confiance, en ayant la fausse impression d'avoir maitrisé un sujet. À cela s'ajoute la culture historique de Wikipédia « selon laquelle l'encyclopédie est en construction, les erreurs ne sont pas trop graves et finiront bien par être corrigées un jour » ainsi que le sentiment que refuser l'usage de l'IA relève « d'une forme de passéisme, ou d'une attitude rétrograde vis-à-vis des progrès technologiques ».

Vers la mise en place d'une recommandation

Le , Pa2chant.bis tirait une nouvelle fois la sonnette d'alarme, soulevant une nouvelle pratique consistant à sourcer des contenus, ou générer des contenus sourcés, par le biais de l'IA. Cette situation le pousse alors à inviter la communauté à se pencher sur un passage à l'état de recommandation d'un texte encadrant l'usage des IA. L'idée a été très bien accueillie et un sondage est en préparation. Deux versions existent actuellement, un essai élaboré depuis plusieurs mois et une contre-proposition simplifiée par LD.

Cependant, établir une recommandation présente plusieurs contraintes car elle a vocation à établir des lignes directrices à suivre dans la contribution. LD nous rappelle qu'elles doivent donc « répondre aux attentes et interrogations les plus courantes, tout en véhiculant un « savoir-faire » concret ».

« Elle doit être claire, non contradictoire avec les autres normes et permettre un ajustement progressif »

Le plus complexe est de produire une recommandation « claire, non contradictoire avec les autres normes (principes, règles, recommandations) et permettre un ajustement progressif ». Ce dernier élément est nécessaire afin de pouvoir répondre aux éventuelles évolutions législatives. En effet, l'IA générative pose la question de la propriété intellectuelle, dans la mesure où « les textes générés [peuvent provenir] de textes régis par le droit d'auteur et [où] ces générations [pourraient être] considérées comme également soumises au droit d'auteur (et/ou sont considérées comme des œuvres dérivées ou collectives) ».

Cette future recommandation ne supplantera donc pas les recommandations déjà existantes. LD évoque le propos de @Cosmophilus à ce sujet en soulignant que « le mauvais usage de l'IA se caractérise par la violation d'un principe ou d'une norme déjà définie, telle que WP:DA, WP:V, WP:STYLEetc. ». Aussi le but n'est-il pas de répéter le corpus réglementaire mais de donner des indications pour « se concentrer sur l'application de ces normes dans le cadre de l'IA ».

Si la communauté démontre une certaine hostilité à l'égard des contenus générés par IA et le démontre au travers de précédents sondages, il ne semble pas que l'on se dirige vers une interdiction stricte de son usage. Il est d'ores et déjà complexe de le démontrer.

Face à ces nouvelles pratiques, comme l'écrit LD, le mot d'ordre pourrait bien être de « rester guidé par le bon sens et le discernement ».

L'agenda

Le wik’hit-parade

Articles les plus vus en
No  Article Av. Vues Image Remarques
1 Émilie Dequenne B 1 608 141 Cette actrice belge, lauréate du prix d'interprétation féminine du Festival de Cannes pour Rosetta et du César de la meilleure actrice dans un second rôle pour Les choses qu'on dit, les choses qu'on fait, est décédée le des suites d'un cancer des surrénales à l'âge de 43 ans.
2 Elon Musk B 447 151 Cet homme d'affaires américain est très présent dans l'actualité depuis la réélection à la présidence des États-Unis de Donald Trump (no 9) qui l'a nommé à la tête d'un tout nouveau département de l'Efficacité gouvernementale.
3 Leïla Bekhti Bon début 430 921 Cette actrice française tient le premier rôle dans Ma mère, Dieu et Sylvie Vartan, sorti en salles en France le .
4 Herbert Léonard Bon début 417 692 Ce chanteur français, qui s'est fait connaître dans les années 1980 avec des tubes comme Pour le plaisir ou Quand tu m'aimes, est décédé le à l'âge de 80 ans.
5 Jean-Louis Debré Bon début 344 587 Cet homme politique français, ancien ministre de l'Intérieur, président de l'Assemblée nationale et président du Conseil constitutionnel, est décédé le , lui aussi à l'âge de 80 ans.
6 Adolescence (série télévisée) Bon début 337 219 Cette mini-série britannique, conçue par Jack Thorne (photo), a rencontré un grand succès à sa sortie sur Netflix, le . Elle aborde des sujets d'actualité (le cyberharcèlement, la culture incel, la radicalisation en ligne…) sous une forme inhabituelle (chaque épisode se compose d'un unique plan-séquence).
7 Claude Malhuret Bon début 310 362 Ce sénateur français, ancien président de Médecins sans frontières et cofondateur du site Doctissimo, a prononcé le 5 mars devant le Sénat un discours très remarqué en France et à l'international contre la politique menée par le président des États-Unis Donald Trump (no 9).
8 Michel Ferracci Bon début 302 884 Cet acteur français était le mari d'Émilie Dequenne (no 1).
9 Donald Trump B 297 837 Depuis sa réélection à la présidence des États-Unis en novembre dernier, cet homme d'affaires défraie constamment la chronique par ses décisions aussi nombreuses que controversées. Le mois de voit ainsi la déportation de détenus vénézuéliens au Salvador, le début du démantèlement du département de l'Éducation et la menace de l'instauration de droits de douane draconiens.
10 Olivier Giroud B 278 711 Ayant annoncé sa retraite internationale en , le footballeur français, champion du monde en 2018, a été ovationné par le Stade de France le avant le match France-Croatie comptant pour la Ligue des nations de l'UEFA 2024-2025.
11 Michael Olise Bon début 269 396 Ce footballeur français inscrit son premier but sous le maillot de l'équipe de France lors de ce même match France-Croatie du 23 mars.
12 Olympe de Gouges B 261 523 Cette pionnière française du féminisme est le sujet du téléfilm Olympe, une femme dans la Révolution, diffusé le 3 mars sur la chaîne France 2.
13 France AdQ AdQ 251 529 Le pays qui compte le plus grand nombre de francophones figure régulièrement parmi les articles les plus vus de Wikipédia en français.
14 Cyril Hanouna B 249 540 L'ancien animateur vedette de C8 poursuit la diffusion de son émission controversée Touche pas à mon poste ! sur Internet après la fermeture de la chaîne, le .
15 Carême B 239 339 Cette période du calendrier chrétien correspondant aux 40 jours précédant Pâques a commencé cette année le .
16 Gene Hackman Bon début 238 685 Figure de proue du Nouvel Hollywood, récompensé par deux Oscars et quatre Golden Globes, l'acteur américain a été retrouvé mort à son domicile de Santa Fe le avec son épouse Betsy Arakawa (en). Les résultats de l'enquête ont été publiés le .
17 Emilia Pérez Bon début 237 090 Cette comédie musicale sur un chef de cartel mexicain interprété par Karla Sofía Gascón (photo) qui change de sexe pour changer de vie a reçu sept récompenses lors des César, le , mais ses treize nominations aux Oscars ne se sont traduites que par deux victoires le .
18 Décès en mars 2025 Ébauche 233 582 Comme l'illustrent les numéros 1, 4, 5 et 16, la mort d'une personnalité entraîne presque systématiquement un pic de fréquentation de son article.
19 Jacques Audiard Bon début 227 677 Réalisateur du no 17, qui lui a valu le César de la meilleure réalisation.
20 Volodymyr Zelensky B 219 818 Alors que la guerre russo-ukrainienne se poursuit, le président ukrainien s'est rendu à Washington le pour une rencontre particulièrement houleuse avec Donald Trump (no 9).

Méthodologie : sur le modèle du Top 25 Report de Wikipédia en anglais, ce wik'hit-parade reprend les données fournies par l'outil « Pages les plus vues ». Sont exclues les entrées clairement aberrantes comme Cookie (informatique) ou Soudan du Sud, dont le nombre de visites élevé n'est pas le fruit d'un véritable intérêt des internautes : elles se distinguent par un taux très faible (moins de 5 %) ou au contraire très élevé (plus de 95 %) de consultations sur mobile.

Les autres infolettres

La page Wikipédia:RAW/Découvrir recense les infolettres et blogs relatifs à Wikimedia.

En plus de RAW, vous pouvez lire le Wikimag, newsletter hebdomadaire de la Wikipédia francophone (Voir le dernier numéro semaine 13), l'infolettre Wikifier la science (voir hiver 2024) et les Actualités mensuelles du Wiktionnaire (mars 2025).

Les anglophones peuvent aussi lire The Signpost, publié toutes les deux semaines, la newsletter hebdo de la communauté Wikidata (voir ici d:Wikidata:Status updates/2025 02 24) ou encore la newsletter du projet Wikifunction (wikifunctions:Wikifunctions:Status updates/2025-01-15).

Courrier du lectorat

Il nous fera plaisir de lire les messages déposés ici et, si nécessaire, d'y répondre dans les plus brefs délais.

  • bonjour, bravo pour ce numero. A propos du bouquin sur wikipedia qui va sortir on connait le nom reel de l'auteur mais comment on connait le nom d'utilisateur à celui de l'auteur? Et on a le droit de le dire? Ce serait pas du Wikipédia:Doxxing à l'envers? A moins que ce soit un poisson du 1er avril auquel cas je me suis bien fait attraper... --Sergent Cool (discuter) 1 avril 2025 à 09:19 (CEST)
    Bonjour @Sergent Cool. Ce n'est pas un poisson d'avril, ni du doxxing à l'envers : l'utilisateur est intervenu dans la presse successivement sous le nom de « Michel », « Michel wiki » et « Michel Sandrin » (peut-être un pseudonyme, d'ailleurs ?), en évoquant son « bannissement » (blocage indef, en fait), si bien que les wikipédiens ont fait le lien sans difficulté. — Jules* 💬 1 avril 2025 à 12:28 (CEST)
  • Bonjour Émoticône à tous et merci pour ce travail ! Je suis honoré de me découvrir nommément cité dans vos lignes (par @LD), quelle agréable surprise ! Tout ceci dans le cadre d'un débat ô combien actuel, qui plus est… C'est l'occasion de saluer la réflexion et les efforts ayant mené à ce numéro, et, plus généralement, la mise en lumière continuelle du travail collaboratif wikimédien dans les pages de ce magazine (dont je suis un lecteur assidu), tâche qui ne doit pas être aisée. Félicitations ! --Cosmophilus (discuter) 2 avril 2025 à 22:30 (CEST)

Renouveau — content de voir des forces vives travailler à l'évolution des RAW. Un merci particulier à Jules* pour son focus.
longue vie à la nouvelle rédaction! - Simon Villeneuve 3 avril 2025 à 12:42 (CEST)

Merci à tous les trois, @Sergent Cool, @Cosmophilus et @Simon Villeneuve, pour vos retours, c'est encourageant Émoticône sourire. — Jules* 💬 3 avril 2025 à 12:46 (CEST)
Un numéro intéressant. Émoticône — Cantons-de-l'Est p|d|d 🧹 4 avril 2025 à 00:37 (CEST)
Citations originales
Notes
Références
  1. Nicolas Gastineau, « Propos d’un patrouilleur de Wikipédia », sur Revue21.fr, (consulté le )
  2. « Pourquoi la droite américaine s’attaque-t-elle à Wikipédia? », sur ici.radio-canada.ca (consulté le )
  3. « Wikipédia, la méticuleuse fabrique du savoir », La Croix,‎ (ISSN 0242-6056, lire en ligne, consulté le )
  4. « Attaques contre Wikipédia : ce contributeur nous explique comment fonctionne l'encyclopédie libre et partagée », sur France 3 Grand Est, (consulté le )
  5. « Wikipedia : comment les contributions sont-elles contrôlées ? », sur France Culture, (consulté le )
  6. David Dufresne Euryale, « Wikipédia: qui veut sa peau (et pourquoi)? », sur Au Poste, média indépendant 100% Live & Libre, (consulté le )
  7. « Les outils d’IA comme ChatGPT ou Gemini utilisent des sites de propagande russe comme sources », Le Monde,‎ (lire en ligne, consulté le )
  8. Brice Laemle, « « Factuel », un nouveau média en ligne parrainé par Christine Kelly et Dominique Rizet », Le Monde,‎ (lire en ligne)
  9. « La Face cachée de Wikipédia », sur éditions du Cerf (consulté le ).
  10. Cet article a été partagé et discuté sur la page de discussion du Projet:Antipub.
  11. Comme le montre l'outil Search Engine Referrals.
  12. Le quotidien Le Monde y a aussi consacré un article.
  13. Lire à ce sujet ce billet sur le site du Comité européen de la protection des données.

Numéro du 22 avril 2025

Tuesday, 22 April 2025 00:00 UTC

L'édito — Les réflexions sur la modernisation de cette wikilettre se poursuivent. Dans ce cadre, nous aimerions créer de nouvelles rubriques. Vos suggestions sont les bienvenues en salle de rédaction : dites-nous ce que vous aimeriez lire dans les RAW, ou ce que vous voudriez y écrire !

C'est dans cette perspective que nous lançons un premier appel à commentaires afin de co-rédiger un futur dossier relatif à la possibilité de modifier Wikipédia sans créer de compte (actuellement sous IP, prochainement sous compte temporaire).

Bonne lecture !

Les brèves

Contributions de Jules*, Nanoyo88, Pyb en résidence, Trizek

Échos francophones

Les contributeurs à l'honneur dans les médias — La revue de presse wikipédienne est encore une fois très riche en mars 2025, mais elle voit surtout la mise à l'honneur de nombreux contributeurs tels que Le chat perché (d · c · b) sur XXI[1], Simon Villeneuve (d · c · b) sur Ici Radio-Canada[2], C.Salviani (d · c · b) dans La Croix[3], Lyokoï (d · c · b) sur France 3 Champagne-Ardenne[4] et d'autres sur France Culture[5] ou dans l'émission de David Dufresne[6]. Des interventions remarquables et remarquées !

2033 – Adieu joli wiki ? — Une projection de régression linéaire basée sur les données Google Trends laisse entendre que l'intérêt et l'utilisation continuera de décroître, menant Wikipedia à cesser d'exister le au profit des LLM. A-t-on oublié de préciser le caractère humoristique de cette brève Émoticône ?

Wikipédia / Le Point : clôture de la lettre ouverte et réponse aux mises en demeure — Dans le dernier numéro des RAW, nous vous parlions de la controverse opposant le magazine français Le Point à Wikipédia en français. La lettre ouverte a été close le . En trois semaines, elle a rassemblé 1 155 signatures de contributeurs de notre wiki ou d'autres. Aelxen a compté que le cumul des contributions des signataires sur la seule version francophone s'élevait à environ 22 900 000, soit environ 10 % du total des modifications effectuées sur l'encyclopédie depuis sa création.

Parmi les signatures, celle du co-fondateur de Wikipédia, Jimmy Wales, le , n'est pas passée inaperçue. La directrice du service Trust & Safety de la Fondation Wikimédia (WMF), Maggie Dennis, a également publié un message de soutien en page de discussion.

Le Point a cessé ses publications hostiles à Wikipédia, après une série de neuf articles en onze jours — du jamais vu. Les avocats du magazine ont en revanche adressé une deuxième mise en demeure à la WMF, dans laquelle ils maintiennent leurs demandes de censure de l'article Le Point, en dépit des améliorations apportées par la communauté, et dans laquelle ils qualifient la lettre ouverte de « diffamatoire ».

C'est ce que nous avons appris au détour d'un message incisif publié sur le Bistro par Phil Bradley-Schmieg au nom du service juridique de la WMF. Ce dernier indique clairement ne pas donner suite aux exigences éditoriales du Point et soutenir la lettre ouverte. Plus encore, il souligne, après avoir regretté l'absence d'excuses de la part du magazine, les « graves erreurs et malentendus » que contient la première mise en demeure. Non sans un brin de causticité, le service juridique indique avoir « proposé d'expliquer le fonctionnement de Wikipédia au Point et à ses avocats ». À suivre.

Au Comité d'arbitrage, un élu esseulé — Le CAr n'a pas terminé de casser des claviers sous de douces mélodies un peu naïve de refonte. Les élections de mars 2025 s'achèvent avec l'élection d'un arbitre. Mais concrètement, que se passera-t-il ensuite ? Ce qui est certain, c'est que le quorum de trois arbitres minimum n'est pas rempli pour relancer le CAr. Peut-être serait-ce l'occasion d'engager le processus de déconstruction et de création d'un nouvel organe tel que suggéré par plusieurs contributeurs dans les votes et discussions ? La communauté semble en effet attachée à l'existence d'un organe type CAr, comme en témoignent cette élection et, précédemment, le refus répété (2016, 2018, 2021) de dissoudre le CAr sans instance pour le remplacer.

Coups de griffes — Un conflit oppose la cabale féline et d'autres bénévoles, excédés par la profusion d'images de chats sur le Bistro. Les tensions se sont envenimées à la suite d'une proposition de passage en recommandation de la page Wikipédia:Ne mordez pas les chats, jugée discriminante à l'égard des poissons-chats. Plusieurs RA ont été déposées en mars, mais n'ont toujours pas été traitées ; un contributeur, soupçonnant les administrateurs de partialité, a réclamé qu'ils indiquent s'ils portent ou non la moustache. C'est en tout cas ce que rapporte le magazine français La Virgule qui, renseigné par un certain « Marcel Wiki » et faisant état des accusations lapidaires d'un concessionnaire automobile qui jouit d'une certaine notoriété outre-Atlantique, s'inquiète d'une dérive ailurophile de l'encyclopédie. Sur le Bistro, des commentateurs avisés ont jugé que cet article faisait fausse route : « On sait tous ici que le vrai désaccord dans la communauté porte en ce moment sur la nécessité ou non de capitaliser le nom des modèles dans le wikicode ! »

Attention à la désinformation russe — Des rapports indiquent que des fermes de contenus produisant de la désinformation russe sont utilisés sur Wikipédia[7]. Peu nombreux sur la version francophone et effectués de bonne foi, ces ajouts sont le fait de contributeurs avertis de la communauté ; la situation est semble-t-il différente sur d'autres versions linguistiques de Wikipédia.

Un livre sur Wikipédia... écrit par un utilisateur bloqué — En , l'éphémère média français d'extrême droite Factuel[8], au détour d'un article commenté sur le Bistro, annonçait un ouvrage à paraître en 2024 consacré à Wikipédia. Son auteur ? Un certain Michel1961 (d · c · b), bloqué indéfiniment en 2021 (notamment pour comportement non collaboratif, détournement de sources, rameutage et POV-pushing) et régulièrement cité dans des articles de presse sensationnalistes en 2020 (où des contributeurs expérimentés sont accusés d'être « islamo-conciliants »), 2021, 2023, février et mai 2024. L'ouvrage, annoncé dès 2023, paraît en aux éditions du Cerf sous le titre La face cachée de Wikipédia : Enquête sur les dérives de l'encyclopédie libre[9]. Cosigné par Victor Lefebvre, ancien journaliste au Figaro et à Factuel, l'ouvrage de 216 pages prétend apporter « une réponse argumentée et dépassionnée » à la question de savoir si l'encyclopédie est devenue « Wokipedia » comme allégué par Elon Musk. La réponse est donnée au dos de l'ouvrage : « Le pouvoir de nuisance d'une petite poignée d'utilisateurs ouvertement militants - pour ne pas dire woke - tend à se renforcer. »

L'actu technique

Nouvel aperçu de l'outil de traduction

L'outil de traduction évolue — L'équipe de Localisation de la langue et des produits a amélioré le Tableau de bord de traduction de contenu en intégrant des fonctionnalités de personnalisation de suggestions et en améliorant l'accessibilité du tableau de bord.

D'où viennent et où vont les lecteurs d'un article ? — L'outil Wikinav permet de répondre à ces questions. En plus de mettre en évidence que la majorité des consultations viennent des moteurs de recherche, l'analyse de l'article Elon Musk (le plus consulté en ) montre ainsi que l'article de Wikipédia par lequel le plus grand nombre de lecteurs arrivent est celui de son ex-compagne Grimes et celui le plus consulté consécutivement est celui de sa compagne actuelle, Shivon Zilis. Les clics entrants depuis ou sortants vers le département de l'Efficacité gouvernementale (DOGE) n'arrivent respectivement qu'en dixième et sixième positions. La vie privée avant la politique.

Dans le mouvement

Le logo de Wikipédia, en allemand, avec la mention « 3 Millionen Artikel ».
Et de trois !

Trois millions d'articles sur Wikipédia en allemand — C'est le seuil franchi par la version germanophone de Wikipédia le . Troisième plus grosse version linguistique en nombre d'articles, elle devance la version francophone, selon la liste des wikis. Il existe toutefois de nombreux autres indicateurs pour comparer les versions linguistiques, dont la profondeur, qui valorise le nombre d'éditions par article et le nombre de pages autres que les articles — en classant les wikis avec cet indicateur, la version francophone arrive en dix-neuvième position (loin devant la version germanophone). Pour en revenir au seuil symbolique de trois millions d'articles, les paris sur la date à laquelle Wikipédia en français l'atteindra sont toujours ouverts.

Une militaire américaine en train de se faire peindre la joue aux couleurs du drapeau LGBT.
Exemple de photo retirée.

Suppression de contenus de l'armée américaine — Le département de la Défense des États-Unis a récemment appliqué une décision présidentielle mettant fin aux politiques Diversité, équité et inclusion (DEI). Cela s'est traduit notamment par la mise hors ligne de beaucoup de contenus multimédia. Associated Press a récupéré une base de données de 26 000 photos concernées par la censure. Wikimedia Commons héberge de nombreuses photos de l'armée américaine, entre 10 et 20 % des 5 millions de photos stockées sur DVIDS, la médiathèque du départ de la Défense. Don-vip (d · c · b) poursuit l'import en masse des photos, que  (d · c · b) avait débuté. Une catégorisation des photos supprimées est en cours ainsi que l'import des vidéos manquantes, projet initié par Mvolz (d · c · b). Une fois ce travail de catégorisation réalisé, il sera possible d'extraire les données pour les mettre sur data.gouv.fr par exemple afin de permettre aux chercheurs et associations d'étudier les contenus retirés. Ce travail n'est pas sans soulever des questions éthiques auxquelles l'armée américaine a été confrontée en 2021 en procédant à un retrait massif de photos d'Afghans afin de les protéger des talibans.

Renforcer la neutralité de point de vue de Wikipédia — La Fondation Wikimédia a récemment mis en évidence des tendances essentielles et prioritaires pour le mouvement, à travers des conversations avec les communautés. Cette année, une tendance qui a suscité de nombreuses discussions au sein et au-delà du mouvement Wikimédia concerne la neutralité : la baisse de confiance dans les informations en ligne et la fragmentation du consensus sur la véracité des informations. Il s'avère que la manière dont le principe de neutralité de point de vue se traduit varie d'un projet Wikimédia à l'autre, ce qui met en évidence la possibilité pour les communautés d'apprendre les unes des autres et d'explorer si des normes mondiales communes de neutralité peuvent mieux protéger les projets (et les bénévoles) dans un environnement de menaces accrues et de réglementation croissante. Pour soutenir les communautés Wikimédia et réaffirmer notre engagement en faveur de la neutralité, la Fondation Wikimédia réunira un groupe de travail composé de contributeurs actifs, de membres du CA de la Fondation, de chercheurs et de conseillers afin d'étudier des recommandations de normes communes pour les politiques NPOV qui peuvent protéger Wikipédia, accroître l'intégrité des projets et fournir davantage de soutien aux bénévoles chargés d'administrer ces politiques. Pour en savoir plus, rendez-vous sur Diff, le blog hébergé par la Fondation à propos du mouvement.

Verrouillages globaux massifs — Le , la WMF a entrepris le verrouillage global de plus de 35 000 comptes (liste) compromis (mots de passe divulgués, vraisemblablement). Dans le communiqué qu'elle a publié quelques jours après, elle indique que cela fait suite à la découverte d'« un schéma de connexions inhabituelles à des comptes enregistrés », qui résulterait d'une fuite de données depuis un autre site web incluant des mots de passe, utilisés aussi sur Wikipédia. Un bon rappel de la nécessité de ne pas utiliser un même mot de passe sur plusieurs sites web, et l'occasion de lire ou relire Aide:Sécurité des comptes utilisateur.

Focus

RAW encourage les membres de la communauté à s'exprimer sur différents enjeux liés à l'écosystème Wikimedia. N'hésitez pas à proposer vos textes pour cette section. N'hésitez pas non plus à réagir dans la section du courrier du lectorat.

À la recherche des articles disparus de Google
par Jules*

Certains articles de Wikipédia sont déréférencés par Google. Combien ? Les déréférencements sont-ils légitimes ? C'est le grand flou.

Le Canard enchaîné publie une enquête qui vous déplaît ? Oubliez le communiqué de presse et la plainte pour diffamation. Le problème, ce n'est pas l'article : c'est le fait qu'il soit lu ! Et s'il était possible de le faire disparaître de Google ? Improbable ? C'est pourtant ce qui s'est passé, nous raconte Thibaut Schepman dans un article paru en janvier dernier dans La Revue des médias, éditée par l'Institut national de l'audiovisuel (INA)[10]. La méthode employée par les malandrins est la suivante : signaler à Google une violation des droits d'auteurs en affirmant que l'article de presse est un plagiat d'une page web, antidatée. Derrière la mésaventure vécue par une journaliste du Canard enchaîné se cache une véritable industrie du déréférencement indu, nous apprend Thibaut Schepman.

Si Google a rétabli le référencement de l'article du Canard enchaîné, est-il possible que Wikipédia soit également victime de telles manœuvres ? La question n'est pas anodine. La plupart des consultations de Wikipédia proviennent des moteurs de recherche, et parmi ceux-ci, Google est en position de quasi-monopole[11]. Un article Wikipédia déréférencé de Google, c'est donc probablement un article qui ne sera quasiment plus lu.

De la lumière mais pas trop

Pour savoir ce qu'il en est, première étape, la plateforme Lumen. Elle permet de consulter les demandes de déréférencement adressées à Google pour divers motifs : violation des droits d'auteurs, diffamation, droit à l'oubli... Mais les notices, dont la consultation n'est pas aisée, n'indiquent pas l'issue de ces demandes. Nous ne sommes guère éclairés.

De son côté, la Fondation Wikimédia (WMF) a commencé en 2014 à publier les notifications de déréférencement qu'elle recevait de Google (dont plusieurs dizaines pour Wikipédia en français). À l'époque, la WMF s'est émue de cette censure, motivée par le droit à l'oubli, dans un billet de blog en anglais[12].

Récemment, l'auteur de ces lignes a eu vent du déréférencement d'un article de Wikipédia en français par Google. Le déréférencement a-t-il été effectué au nom du droit à l'oubli ? Ou bien par une méthode retorse comme celle mise en lumière par La Revue des médias ? Aucune idée : aucun résultat sur Lumen avec le titre de l'article, et pas de notice relative sur la page tenue à jour par la WMF.

RGPD à la suédoise

Renseignement pris auprès du service juridique de la WMF, Google envoie depuis quelques années des notifications de déréférencement dépourvues de l'URL du contenu déréférencé (exemple) et donc parfaitement inutiles. Surprenant. Ce changement découle en fait d'une décision prise en 2020 par l'Autorité suédoise pour la protection de la vie privée, sur le fondement du règlement général sur la protection des données (RGPD). Elle a estimé qu'en fournissant l'URL du contenu déréférencé dans ses notifications, Google permettait à leur destinataire de republier les contenus litigieux sous une autre URL, et donc de bafouer le droit à l'oubli[13]. Exit les URL.

Tout au plus la WMF continue-t-elle de recevoir des notifications précises quand le requérant est situé hors Union européenne ; on sait ainsi que l'article Fusillade de l'université d'Eskişehir Osmangazi a disparu de certaines recherches Google en raison de la législation turque — sans plus de précision.

On ignore d'ailleurs si la WMF reçoit systématiquement une notification de Google en cas de déréférencement. En tout état de cause, la liste des notifications relatives à Wikipédia en français n'évoque aucun déréférencement pour violation des droits d'auteurs — c'est en revanche le cas pour Wikipédia en anglais, comme le relèvent nos confrères du Signpost.

S'agissant du droit à l'oubli, s'il est légitime de chercher un équilibre entre droit à l'information et droit au respect de la vie privée, il apparaît contestable qu'une entreprise privée, en l'espèce Google, puisse opérer sans aucune transparence le déréférencement d'articles.

Le dossier du mois

Dans cette section, le magazine aborde un sujet qui a fait beaucoup réagir à l'intérieur de la communauté, voire à l'extérieur.

Le bouleversement annoncé des pratiques par l'IA générative
par Nanoyo88

Cet article repose sur quatre interviews que vous pouvez consulter dans leur version complète.

Lors de précédentes éditions, nous avons régulièrement abordé le sujet de l'IA générative (genAI), ses implications et conséquences pour Wikipédia. Nous aimerions prendre le temps, au travers d'un dossier et d'interventions de quatre contributeurs, d'approfondir le sujet. Pa2chant.bis, LD, Aelxen et (:Julien:) analysent les usages de l'IA et les problèmes qu'ils engendrent ; ils discutent aussi de l'élaboration d'un texte pour les encadrer.

IA, genAI, LLM :
de quoi parle-t-on ?

De manière générale, les machines informatiques exécutent scrupuleusement des instructions (un programme informatique) écrites par des humains. Les humains disent explicitement quoi faire à la machine, pas à pas. L'intelligence artificielle (IA) est une discipline scientifique visant à permettre aux machines d'être « intelligentes » : apprentissage, raisonnement logique, compréhension du langage naturel (anglais, français…). L'IA cherche à permettre aux machines à gagner en autonomie pour effectuer des tâches plus complexes. L'intelligence artificielle générative (genAI) est un sous-domaine de l'IA dont le but est de générer automatiquement des textes en langage naturel. Les réseaux de neurones sont une technologie très puissante (et gourmande en ressources) largement utilisée dans l'IA.

Depuis 2017-2018, les grands modèles de langage (LLM) utilisent des (grands, très grands) réseaux de neurones pour comprendre du langage naturel, répondre à des questions ou générer du texte (genAI). Le texte écrit par un humain pour interagir avec le LLM est appelé prompt. Pour apprendre le langage et des connaissances, les LLM sont gavés de tonnes de données disponibles sur Internet (dont évidemment WP). Les LLM n'ont pas d'estimation de la valeur de vérité ou véracité de ce qu'ils répondent : ils répondent grosso modo ce qui est le plus probable parmi les textes sur lesquels leur apprentissage s'est fondé. Le LLM invente donc : parfois c'est juste, parfois c'est faux — on parle alors d'hallucination.

Pour en savoir plus, lire cet article sur Le Monde.

Ils fleurissent sur l'encyclopédie et le printemps n'y est pour rien. Les textes générés par IA sont de plus en plus nombreux sur les articles de Wikipédia à mesure que l'usage de l'IA générative se démocratise. Pour Pa2chant.bis, cet usage wikipédien se fait « en l'absence de recommandation », ce qui a pour conséquence de rendre « très lourd et coûteux en temps de démontrer des abus » et risque de démotiver les contributeurs qui se consacrent à ces vérifications.

Julien indique à ce propos qu'il est « difficile d'anticiper les usages qui seront faits des LLM. Mais c'est potentiellement un game changer pour WP », qui peut au choix « devenir un dépôt de connaissances approximatives via des masses de textes mal comprises ou un facilitateur de rédaction ».

« C'est l'avenir de Wikipédia qui se joue »

Pa2chant.bis n'y va pas par quatre chemins : « C'est l'avenir de Wikipédia qui se joue. » Les enjeux et les risques de ces nouvelles pratiques sont déjà connus : « outre les potentielles atteintes au droit d'auteur, on peut citer les problèmes de fiabilité de l'information de type absence ou détournement de source, les TI et les problèmes de style. »

La majorité des usages observés ne résistent pas aux vérifications et affichent différents problèmes qui pourraient être évités si la contribution était 100 % humaine. C'est notamment le cas des traductions automatiques, des synthèses de sources multiples, de l'identification de sources, etc.

Des usages problématiques, Pa2chant.bis en a vu quelques exemples surprenants. Par exemple, dans une page Wikipédia sur une maladie, indiquer aux parents que même traitée, elle peut être mortelle, alors qu'aucune source n'a été trouvée dans ce sens. Dans l'article 'Ndrangheta (la mafia calabraise), une famille dont le nom est parfaitement inconnu des sources a été désignée comme étant influente. Dans un autre article étaient indiqués des liens familiaux entre deux personnes, liens imaginaires sourcés avec un blog généré par IA. Les abus peuvent d'une envergure encore supérieure, comme les interventions mêlant TI, IA et vandalismes sur une profusion d'articles dédiés aux quasars : alors que le projet:Astronomie compte peu de membres, et encore moins de spécialistes de ce sous-domaine, cela va exiger d'utiliser WP:TNT.

« L'IA, on l'utilise depuis super longtemps »

Julien rappelle que les traductions automatiques relèvent de l'IA, et plus récemment de l'introduction des LLM. Or, « la communauté semble ok avec cette utilisation de l'IA », quand bien même Julien en est lui-même critique. Concernant les LLM, « des utilisateurs ont développé et rendu compte de pratiques plus avancées (Projet:Observatoire des IA/Documentation, Utilisateur:Global Donald/Création d'article via ChatGPT 4o et comparaison des prompts, Utilisateur:Nanoyo88/testIA…) ». La question revient dès lors à se demander si la relecture et la vérification sont bien effectuées, et c'est là que ça coince. Comme pour les traductions automatiques à la chaîne, les textes générés par IA augmentent la quantité de travail de vérification pour la communauté.

Il y a également des usages de LLM qui pourraient être utiles à l'automatisation de certaines opérations de maintenance sur Wikipédia. « Sur les projets sportifs (basket, foot, foot US), c'est toujours relou quand un joueur change de club : il faut rajouter des catégories, changer des palettes, mettre à jour l'infobox… Not fun. J'ai dans ma todo list le développement d'un outil automatique de mise à jour quand un joueur change de club, avec l'usage d'un LLM. » Les LLM pourraient également être utilisés afin de lutter contre le vandalisme, voire même contre les mésusages de LLM !

Une lutte contraignante

Dernièrement, un tracker a été mis en place par Julien sur la base du signalement, par Pa2chant.bis, de sources comportant un paramètre UTM lié à ChatGPT. Cette longue liste n'est que la partie émergée d'une analyse en profondeur nécessaire et dans laquelle il faut comparer les sources présentées et les informations ajoutées.

Afin de pouvoir rapidement identifier ce type d'ajout, un filtre anti-abus a été créé par Aelxen. « Le filtre consiste à détecter les insertions d'URL contenant un paramètre UTM provenant de ChatGPT. Actuellement, il est uniquement utilisé pour récupérer des statistiques. À terme, il pourrait permettre d'insérer un message d'avertissement lors de la publication des modifications. »

« Des détecteurs insuffisamment fiables »

Actuellement, on peut difficilement s'appuyer uniquement sur des outils de détection et éléments techniques pour identifier les usages de textes générés par IA avec fiabilité. « Ces outils sont imparfaits, explique Julien : les LLM sont des machines probabilistes donc il y a des risques de faux-positifs. Les études qui essaient de mesurer les faux positifs divergent pas mal et s'appuient sur des textes en anglais, donc il faut prévoir une décote pour le français. »

Aelxen et Pa2chant.bis jugent également la fiabilité de ces détecteurs insuffisante. Pour Pa2chant.bis, « le plus performant détecteur trouve en français un nombre impressionnant de probables faux-positifs » et Julien souligne une observation surprenante d'Esprit Fugace : il y a des faux positifs lorsque le contenu est rédigé « par des personnes neuroatypiques dont le style rédactionnel diffère » de la norme.

Sur les possibilités techniques, Aelxen suggère que « des outils semi-automatiques pourraient être envisagés pour aider à l'analyse, par exemple en signalant des passages suspects ou en identifiant des modèles d'écriture caractéristiques de l'IA ». Mais Julien considère que c'est « sans issue parce que les LLM s'aguerrissent et les méthodes de détection sont toujours en retard. Il est possible que le contenu genAI devienne rapidement indiscernable par un œil humain comme par un détecteur ».

« Ils voient surtout le verre à moitié plein sans voir le verre à moitié vide »
Mésusages de l'IA :
comment aider ?

Pour donner un coup de main sur le sujet, plusieurs possibilités. Vous pouvez participer à l'élaboration de la future recommandation ainsi qu'au sondage associé. La vérification des quelque 170 insertions de sources via ChatGPT peut également vous intéresser. De bonnes âmes sont aussi nécessaires pour l'analyse et le traitement de 284 + 400 sites générés par IA utilisés comme sources sur Wikipédia.

Enfin, si vous rencontrez des textes que vous soupçonnez d'être générés par IA et qui contreviennent aux PF, vous pouvez les signaler sur Projet:Observatoire des IA/Contrôle.

Votre aide est précieuse !

Identifier les textes générés par IA et leurs problèmes n'est pas chose aisée. Pa2chant.bis témoigne de sa pratique, indiquant que cela se fait « au hasard des analyses de créations d'articles, des relectures et de la patrouille ». Les mauvais usages possèdent plusieurs marqueurs tels que le style stéréotypé et souvent laudatif, le plan caractéristique et les détournements de sources par hallucination — « et là, c'est beaucoup plus long à identifier ».

Le second problème est qu'il est particulièrement complexe de faire comprendre aux utilisateurs d'IA, novices ou expérimentés, les problèmes de leurs contributions. Pa2chant.bis a l'impression « qu'ils voient surtout le verre à moitié plein (leurs prompts sont de plus en plus précis et performants, et le niveau de réponse des IA s'améliore) sans voir le verre à moitié vide (les erreurs, le langage stéréotypé et les traductions parfaites en mot à mot, mais porteuses de contresens, non-sens ou inventions) ».

Malheureusement, l'utilisation abusive de l'IA reste très tentante car elle est en mesure de produire des textes d'apparence robuste, auxquels il est aisé pour les contributeurs de faire confiance, en ayant la fausse impression d'avoir maitrisé un sujet. À cela s'ajoute la culture historique de Wikipédia « selon laquelle l'encyclopédie est en construction, les erreurs ne sont pas trop graves et finiront bien par être corrigées un jour » ainsi que le sentiment que refuser l'usage de l'IA relève « d'une forme de passéisme, ou d'une attitude rétrograde vis-à-vis des progrès technologiques ».

Vers la mise en place d'une recommandation

Le , Pa2chant.bis tirait une nouvelle fois la sonnette d'alarme, soulevant une nouvelle pratique consistant à sourcer des contenus, ou générer des contenus sourcés, par le biais de l'IA. Cette situation le pousse alors à inviter la communauté à se pencher sur un passage à l'état de recommandation d'un texte encadrant l'usage des IA. L'idée a été très bien accueillie et un sondage est en préparation. Deux versions existent actuellement, un essai élaboré depuis plusieurs mois et une contre-proposition simplifiée par LD.

Cependant, établir une recommandation présente plusieurs contraintes car elle a vocation à établir des lignes directrices à suivre dans la contribution. LD nous rappelle qu'elles doivent donc « répondre aux attentes et interrogations les plus courantes, tout en véhiculant un « savoir-faire » concret ».

« Elle doit être claire, non contradictoire avec les autres normes et permettre un ajustement progressif »

Le plus complexe est de produire une recommandation « claire, non contradictoire avec les autres normes (principes, règles, recommandations) et permettre un ajustement progressif ». Ce dernier élément est nécessaire afin de pouvoir répondre aux éventuelles évolutions législatives. En effet, l'IA générative pose la question de la propriété intellectuelle, dans la mesure où « les textes générés [peuvent provenir] de textes régis par le droit d'auteur et [où] ces générations [pourraient être] considérées comme également soumises au droit d'auteur (et/ou sont considérées comme des œuvres dérivées ou collectives) ».

Cette future recommandation ne supplantera donc pas les recommandations déjà existantes. LD évoque le propos de @Cosmophilus à ce sujet en soulignant que « le mauvais usage de l'IA se caractérise par la violation d'un principe ou d'une norme déjà définie, telle que WP:DA, WP:V, WP:STYLEetc. ». Aussi le but n'est-il pas de répéter le corpus réglementaire mais de donner des indications pour « se concentrer sur l'application de ces normes dans le cadre de l'IA ».

Si la communauté démontre une certaine hostilité à l'égard des contenus générés par IA et le démontre au travers de précédents sondages, il ne semble pas que l'on se dirige vers une interdiction stricte de son usage. Il est d'ores et déjà complexe de le démontrer.

Face à ces nouvelles pratiques, comme l'écrit LD, le mot d'ordre pourrait bien être de « rester guidé par le bon sens et le discernement ».

L'agenda

Le wik’hit-parade

Articles les plus vus en
No  Article Av. Vues Image Remarques
1 Émilie Dequenne B 1 608 141 Cette actrice belge, lauréate du prix d'interprétation féminine du Festival de Cannes pour Rosetta et du César de la meilleure actrice dans un second rôle pour Les choses qu'on dit, les choses qu'on fait, est décédée le des suites d'un cancer des surrénales à l'âge de 43 ans.
2 Elon Musk B 447 151 Cet homme d'affaires américain est très présent dans l'actualité depuis la réélection à la présidence des États-Unis de Donald Trump (no 9) qui l'a nommé à la tête d'un tout nouveau département de l'Efficacité gouvernementale.
3 Leïla Bekhti Bon début 430 921 Cette actrice française tient le premier rôle dans Ma mère, Dieu et Sylvie Vartan, sorti en salles en France le .
4 Herbert Léonard Bon début 417 692 Ce chanteur français, qui s'est fait connaître dans les années 1980 avec des tubes comme Pour le plaisir ou Quand tu m'aimes, est décédé le à l'âge de 80 ans.
5 Jean-Louis Debré Bon début 344 587 Cet homme politique français, ancien ministre de l'Intérieur, président de l'Assemblée nationale et président du Conseil constitutionnel, est décédé le , lui aussi à l'âge de 80 ans.
6 Adolescence (série télévisée) Bon début 337 219 Cette mini-série britannique, conçue par Jack Thorne (photo), a rencontré un grand succès à sa sortie sur Netflix, le . Elle aborde des sujets d'actualité (le cyberharcèlement, la culture incel, la radicalisation en ligne…) sous une forme inhabituelle (chaque épisode se compose d'un unique plan-séquence).
7 Claude Malhuret Bon début 310 362 Ce sénateur français, ancien président de Médecins sans frontières et cofondateur du site Doctissimo, a prononcé le 5 mars devant le Sénat un discours très remarqué en France et à l'international contre la politique menée par le président des États-Unis Donald Trump (no 9).
8 Michel Ferracci Bon début 302 884 Cet acteur français était le mari d'Émilie Dequenne (no 1).
9 Donald Trump B 297 837 Depuis sa réélection à la présidence des États-Unis en novembre dernier, cet homme d'affaires défraie constamment la chronique par ses décisions aussi nombreuses que controversées. Le mois de voit ainsi la déportation de détenus vénézuéliens au Salvador, le début du démantèlement du département de l'Éducation et la menace de l'instauration de droits de douane draconiens.
10 Olivier Giroud B 278 711 Ayant annoncé sa retraite internationale en , le footballeur français, champion du monde en 2018, a été ovationné par le Stade de France le avant le match France-Croatie comptant pour la Ligue des nations de l'UEFA 2024-2025.
11 Michael Olise Bon début 269 396 Ce footballeur français inscrit son premier but sous le maillot de l'équipe de France lors de ce même match France-Croatie du 23 mars.
12 Olympe de Gouges B 261 523 Cette pionnière française du féminisme est le sujet du téléfilm Olympe, une femme dans la Révolution, diffusé le 3 mars sur la chaîne France 2.
13 France AdQ AdQ 251 529 Le pays qui compte le plus grand nombre de francophones figure régulièrement parmi les articles les plus vus de Wikipédia en français.
14 Cyril Hanouna B 249 540 L'ancien animateur vedette de C8 poursuit la diffusion de son émission controversée Touche pas à mon poste ! sur Internet après la fermeture de la chaîne, le .
15 Carême B 239 339 Cette période du calendrier chrétien correspondant aux 40 jours précédant Pâques a commencé cette année le .
16 Gene Hackman Bon début 238 685 Figure de proue du Nouvel Hollywood, récompensé par deux Oscars et quatre Golden Globes, l'acteur américain a été retrouvé mort à son domicile de Santa Fe le avec son épouse Betsy Arakawa (en). Les résultats de l'enquête ont été publiés le .
17 Emilia Pérez Bon début 237 090 Cette comédie musicale sur un chef de cartel mexicain interprété par Karla Sofía Gascón (photo) qui change de sexe pour changer de vie a reçu sept récompenses lors des César, le , mais ses treize nominations aux Oscars ne se sont traduites que par deux victoires le .
18 Décès en mars 2025 Ébauche 233 582 Comme l'illustrent les numéros 1, 4, 5 et 16, la mort d'une personnalité entraîne presque systématiquement un pic de fréquentation de son article.
19 Jacques Audiard Bon début 227 677 Réalisateur du no 17, qui lui a valu le César de la meilleure réalisation.
20 Volodymyr Zelensky B 219 818 Alors que la guerre russo-ukrainienne se poursuit, le président ukrainien s'est rendu à Washington le pour une rencontre particulièrement houleuse avec Donald Trump (no 9).

Méthodologie : sur le modèle du Top 25 Report de Wikipédia en anglais, ce wik'hit-parade reprend les données fournies par l'outil « Pages les plus vues ». Sont exclues les entrées clairement aberrantes comme Cookie (informatique) ou Soudan du Sud, dont le nombre de visites élevé n'est pas le fruit d'un véritable intérêt des internautes : elles se distinguent par un taux très faible (moins de 5 %) ou au contraire très élevé (plus de 95 %) de consultations sur mobile.

Les autres infolettres

La page Wikipédia:RAW/Découvrir recense les infolettres et blogs relatifs à Wikimedia.

En plus de RAW, vous pouvez lire le Wikimag, newsletter hebdomadaire de la Wikipédia francophone (Voir le dernier numéro semaine 13), l'infolettre Wikifier la science (voir hiver 2024) et les Actualités mensuelles du Wiktionnaire (mars 2025).

Les anglophones peuvent aussi lire The Signpost, publié toutes les deux semaines, la newsletter hebdo de la communauté Wikidata (voir ici d:Wikidata:Status updates/2025 02 24) ou encore la newsletter du projet Wikifunction (wikifunctions:Wikifunctions:Status updates/2025-01-15).

Courrier du lectorat

Il nous fera plaisir de lire les messages déposés ici et, si nécessaire, d'y répondre dans les plus brefs délais.

  • bonjour, bravo pour ce numero. A propos du bouquin sur wikipedia qui va sortir on connait le nom reel de l'auteur mais comment on connait le nom d'utilisateur à celui de l'auteur? Et on a le droit de le dire? Ce serait pas du Wikipédia:Doxxing à l'envers? A moins que ce soit un poisson du 1er avril auquel cas je me suis bien fait attraper... --Sergent Cool (discuter) 1 avril 2025 à 09:19 (CEST)
    Bonjour @Sergent Cool. Ce n'est pas un poisson d'avril, ni du doxxing à l'envers : l'utilisateur est intervenu dans la presse successivement sous le nom de « Michel », « Michel wiki » et « Michel Sandrin » (peut-être un pseudonyme, d'ailleurs ?), en évoquant son « bannissement » (blocage indef, en fait), si bien que les wikipédiens ont fait le lien sans difficulté. — Jules* 💬 1 avril 2025 à 12:28 (CEST)
  • Bonjour Émoticône à tous et merci pour ce travail ! Je suis honoré de me découvrir nommément cité dans vos lignes (par @LD), quelle agréable surprise ! Tout ceci dans le cadre d'un débat ô combien actuel, qui plus est… C'est l'occasion de saluer la réflexion et les efforts ayant mené à ce numéro, et, plus généralement, la mise en lumière continuelle du travail collaboratif wikimédien dans les pages de ce magazine (dont je suis un lecteur assidu), tâche qui ne doit pas être aisée. Félicitations ! --Cosmophilus (discuter) 2 avril 2025 à 22:30 (CEST)

Renouveau — content de voir des forces vives travailler à l'évolution des RAW. Un merci particulier à Jules* pour son focus.
longue vie à la nouvelle rédaction! - Simon Villeneuve 3 avril 2025 à 12:42 (CEST)

Merci à tous les trois, @Sergent Cool, @Cosmophilus et @Simon Villeneuve, pour vos retours, c'est encourageant Émoticône sourire. — Jules* 💬 3 avril 2025 à 12:46 (CEST)
Un numéro intéressant. Émoticône — Cantons-de-l'Est p|d|d 🧹 4 avril 2025 à 00:37 (CEST)
Citations originales
Notes
Références
  1. Nicolas Gastineau, « Propos d’un patrouilleur de Wikipédia », sur Revue21.fr, (consulté le )
  2. « Pourquoi la droite américaine s’attaque-t-elle à Wikipédia? », sur ici.radio-canada.ca (consulté le )
  3. « Wikipédia, la méticuleuse fabrique du savoir », La Croix,‎ (ISSN 0242-6056, lire en ligne, consulté le )
  4. « Attaques contre Wikipédia : ce contributeur nous explique comment fonctionne l'encyclopédie libre et partagée », sur France 3 Grand Est, (consulté le )
  5. « Wikipedia : comment les contributions sont-elles contrôlées ? », sur France Culture, (consulté le )
  6. David Dufresne Euryale, « Wikipédia: qui veut sa peau (et pourquoi)? », sur Au Poste, média indépendant 100% Live & Libre, (consulté le )
  7. « Les outils d’IA comme ChatGPT ou Gemini utilisent des sites de propagande russe comme sources », Le Monde,‎ (lire en ligne, consulté le )
  8. Brice Laemle, « « Factuel », un nouveau média en ligne parrainé par Christine Kelly et Dominique Rizet », Le Monde,‎ (lire en ligne)
  9. « La Face cachée de Wikipédia », sur éditions du Cerf (consulté le ).
  10. Cet article a été partagé et discuté sur la page de discussion du Projet:Antipub.
  11. Comme le montre l'outil Search Engine Referrals.
  12. Le quotidien Le Monde y a aussi consacré un article.
  13. Lire à ce sujet ce billet sur le site du Comité européen de la protection des données.

Numéro du 21 avril 2025

Monday, 21 April 2025 00:00 UTC

L'édito — Les réflexions sur la modernisation de cette wikilettre se poursuivent. Dans ce cadre, nous aimerions créer de nouvelles rubriques. Vos suggestions sont les bienvenues en salle de rédaction : dites-nous ce que vous aimeriez lire dans les RAW, ou ce que vous voudriez y écrire !

C'est dans cette perspective que nous lançons un premier appel à commentaires afin de co-rédiger un futur dossier relatif à la possibilité de modifier Wikipédia sans créer de compte (actuellement sous IP, prochainement sous compte temporaire).

Bonne lecture !

Les brèves

Contributions de Jules*, Nanoyo88, Pyb en résidence, Trizek

Échos francophones

Les contributeurs à l'honneur dans les médias — La revue de presse wikipédienne est encore une fois très riche en mars 2025, mais elle voit surtout la mise à l'honneur de nombreux contributeurs tels que Le chat perché (d · c · b) sur XXI[1], Simon Villeneuve (d · c · b) sur Ici Radio-Canada[2], C.Salviani (d · c · b) dans La Croix[3], Lyokoï (d · c · b) sur France 3 Champagne-Ardenne[4] et d'autres sur France Culture[5] ou dans l'émission de David Dufresne[6]. Des interventions remarquables et remarquées !

2033 – Adieu joli wiki ? — Une projection de régression linéaire basée sur les données Google Trends laisse entendre que l'intérêt et l'utilisation continuera de décroître, menant Wikipedia à cesser d'exister le au profit des LLM. A-t-on oublié de préciser le caractère humoristique de cette brève Émoticône ?

Wikipédia / Le Point : clôture de la lettre ouverte et réponse aux mises en demeure — Dans le dernier numéro des RAW, nous vous parlions de la controverse opposant le magazine français Le Point à Wikipédia en français. La lettre ouverte a été close le . En trois semaines, elle a rassemblé 1 155 signatures de contributeurs de notre wiki ou d'autres. Aelxen a compté que le cumul des contributions des signataires sur la seule version francophone s'élevait à environ 22 900 000, soit environ 10 % du total des modifications effectuées sur l'encyclopédie depuis sa création.

Parmi les signatures, celle du co-fondateur de Wikipédia, Jimmy Wales, le , n'est pas passée inaperçue. La directrice du service Trust & Safety de la Fondation Wikimédia (WMF), Maggie Dennis, a également publié un message de soutien en page de discussion.

Le Point a cessé ses publications hostiles à Wikipédia, après une série de neuf articles en onze jours — du jamais vu. Les avocats du magazine ont en revanche adressé une deuxième mise en demeure à la WMF, dans laquelle ils maintiennent leurs demandes de censure de l'article Le Point, en dépit des améliorations apportées par la communauté, et dans laquelle ils qualifient la lettre ouverte de « diffamatoire ».

C'est ce que nous avons appris au détour d'un message incisif publié sur le Bistro par Phil Bradley-Schmieg au nom du service juridique de la WMF. Ce dernier indique clairement ne pas donner suite aux exigences éditoriales du Point et soutenir la lettre ouverte. Plus encore, il souligne, après avoir regretté l'absence d'excuses de la part du magazine, les « graves erreurs et malentendus » que contient la première mise en demeure. Non sans un brin de causticité, le service juridique indique avoir « proposé d'expliquer le fonctionnement de Wikipédia au Point et à ses avocats ». À suivre.

Au Comité d'arbitrage, un élu esseulé — Le CAr n'a pas terminé de casser des claviers sous de douces mélodies un peu naïve de refonte. Les élections de mars 2025 s'achèvent avec l'élection d'un arbitre. Mais concrètement, que se passera-t-il ensuite ? Ce qui est certain, c'est que le quorum de trois arbitres minimum n'est pas rempli pour relancer le CAr. Peut-être serait-ce l'occasion d'engager le processus de déconstruction et de création d'un nouvel organe tel que suggéré par plusieurs contributeurs dans les votes et discussions ? La communauté semble en effet attachée à l'existence d'un organe type CAr, comme en témoignent cette élection et, précédemment, le refus répété (2016, 2018, 2021) de dissoudre le CAr sans instance pour le remplacer.

Coups de griffes — Un conflit oppose la cabale féline et d'autres bénévoles, excédés par la profusion d'images de chats sur le Bistro. Les tensions se sont envenimées à la suite d'une proposition de passage en recommandation de la page Wikipédia:Ne mordez pas les chats, jugée discriminante à l'égard des poissons-chats. Plusieurs RA ont été déposées en mars, mais n'ont toujours pas été traitées ; un contributeur, soupçonnant les administrateurs de partialité, a réclamé qu'ils indiquent s'ils portent ou non la moustache. C'est en tout cas ce que rapporte le magazine français La Virgule qui, renseigné par un certain « Marcel Wiki » et faisant état des accusations lapidaires d'un concessionnaire automobile qui jouit d'une certaine notoriété outre-Atlantique, s'inquiète d'une dérive ailurophile de l'encyclopédie. Sur le Bistro, des commentateurs avisés ont jugé que cet article faisait fausse route : « On sait tous ici que le vrai désaccord dans la communauté porte en ce moment sur la nécessité ou non de capitaliser le nom des modèles dans le wikicode ! »

Attention à la désinformation russe — Des rapports indiquent que des fermes de contenus produisant de la désinformation russe sont utilisés sur Wikipédia[7]. Peu nombreux sur la version francophone et effectués de bonne foi, ces ajouts sont le fait de contributeurs avertis de la communauté ; la situation est semble-t-il différente sur d'autres versions linguistiques de Wikipédia.

Un livre sur Wikipédia... écrit par un utilisateur bloqué — En , l'éphémère média français d'extrême droite Factuel[8], au détour d'un article commenté sur le Bistro, annonçait un ouvrage à paraître en 2024 consacré à Wikipédia. Son auteur ? Un certain Michel1961 (d · c · b), bloqué indéfiniment en 2021 (notamment pour comportement non collaboratif, détournement de sources, rameutage et POV-pushing) et régulièrement cité dans des articles de presse sensationnalistes en 2020 (où des contributeurs expérimentés sont accusés d'être « islamo-conciliants »), 2021, 2023, février et mai 2024. L'ouvrage, annoncé dès 2023, paraît en aux éditions du Cerf sous le titre La face cachée de Wikipédia : Enquête sur les dérives de l'encyclopédie libre[9]. Cosigné par Victor Lefebvre, ancien journaliste au Figaro et à Factuel, l'ouvrage de 216 pages prétend apporter « une réponse argumentée et dépassionnée » à la question de savoir si l'encyclopédie est devenue « Wokipedia » comme allégué par Elon Musk. La réponse est donnée au dos de l'ouvrage : « Le pouvoir de nuisance d'une petite poignée d'utilisateurs ouvertement militants - pour ne pas dire woke - tend à se renforcer. »

L'actu technique

Nouvel aperçu de l'outil de traduction

L'outil de traduction évolue — L'équipe de Localisation de la langue et des produits a amélioré le Tableau de bord de traduction de contenu en intégrant des fonctionnalités de personnalisation de suggestions et en améliorant l'accessibilité du tableau de bord.

D'où viennent et où vont les lecteurs d'un article ? — L'outil Wikinav permet de répondre à ces questions. En plus de mettre en évidence que la majorité des consultations viennent des moteurs de recherche, l'analyse de l'article Elon Musk (le plus consulté en ) montre ainsi que l'article de Wikipédia par lequel le plus grand nombre de lecteurs arrivent est celui de son ex-compagne Grimes et celui le plus consulté consécutivement est celui de sa compagne actuelle, Shivon Zilis. Les clics entrants depuis ou sortants vers le département de l'Efficacité gouvernementale (DOGE) n'arrivent respectivement qu'en dixième et sixième positions. La vie privée avant la politique.

Dans le mouvement

Le logo de Wikipédia, en allemand, avec la mention « 3 Millionen Artikel ».
Et de trois !

Trois millions d'articles sur Wikipédia en allemand — C'est le seuil franchi par la version germanophone de Wikipédia le . Troisième plus grosse version linguistique en nombre d'articles, elle devance la version francophone, selon la liste des wikis. Il existe toutefois de nombreux autres indicateurs pour comparer les versions linguistiques, dont la profondeur, qui valorise le nombre d'éditions par article et le nombre de pages autres que les articles — en classant les wikis avec cet indicateur, la version francophone arrive en dix-neuvième position (loin devant la version germanophone). Pour en revenir au seuil symbolique de trois millions d'articles, les paris sur la date à laquelle Wikipédia en français l'atteindra sont toujours ouverts.

Une militaire américaine en train de se faire peindre la joue aux couleurs du drapeau LGBT.
Exemple de photo retirée.

Suppression de contenus de l'armée américaine — Le département de la Défense des États-Unis a récemment appliqué une décision présidentielle mettant fin aux politiques Diversité, équité et inclusion (DEI). Cela s'est traduit notamment par la mise hors ligne de beaucoup de contenus multimédia. Associated Press a récupéré une base de données de 26 000 photos concernées par la censure. Wikimedia Commons héberge de nombreuses photos de l'armée américaine, entre 10 et 20 % des 5 millions de photos stockées sur DVIDS, la médiathèque du départ de la Défense. Don-vip (d · c · b) poursuit l'import en masse des photos, que  (d · c · b) avait débuté. Une catégorisation des photos supprimées est en cours ainsi que l'import des vidéos manquantes, projet initié par Mvolz (d · c · b). Une fois ce travail de catégorisation réalisé, il sera possible d'extraire les données pour les mettre sur data.gouv.fr par exemple afin de permettre aux chercheurs et associations d'étudier les contenus retirés. Ce travail n'est pas sans soulever des questions éthiques auxquelles l'armée américaine a été confrontée en 2021 en procédant à un retrait massif de photos d'Afghans afin de les protéger des talibans.

Renforcer la neutralité de point de vue de Wikipédia — La Fondation Wikimédia a récemment mis en évidence des tendances essentielles et prioritaires pour le mouvement, à travers des conversations avec les communautés. Cette année, une tendance qui a suscité de nombreuses discussions au sein et au-delà du mouvement Wikimédia concerne la neutralité : la baisse de confiance dans les informations en ligne et la fragmentation du consensus sur la véracité des informations. Il s'avère que la manière dont le principe de neutralité de point de vue se traduit varie d'un projet Wikimédia à l'autre, ce qui met en évidence la possibilité pour les communautés d'apprendre les unes des autres et d'explorer si des normes mondiales communes de neutralité peuvent mieux protéger les projets (et les bénévoles) dans un environnement de menaces accrues et de réglementation croissante. Pour soutenir les communautés Wikimédia et réaffirmer notre engagement en faveur de la neutralité, la Fondation Wikimédia réunira un groupe de travail composé de contributeurs actifs, de membres du CA de la Fondation, de chercheurs et de conseillers afin d'étudier des recommandations de normes communes pour les politiques NPOV qui peuvent protéger Wikipédia, accroître l'intégrité des projets et fournir davantage de soutien aux bénévoles chargés d'administrer ces politiques. Pour en savoir plus, rendez-vous sur Diff, le blog hébergé par la Fondation à propos du mouvement.

Verrouillages globaux massifs — Le , la WMF a entrepris le verrouillage global de plus de 35 000 comptes (liste) compromis (mots de passe divulgués, vraisemblablement). Dans le communiqué qu'elle a publié quelques jours après, elle indique que cela fait suite à la découverte d'« un schéma de connexions inhabituelles à des comptes enregistrés », qui résulterait d'une fuite de données depuis un autre site web incluant des mots de passe, utilisés aussi sur Wikipédia. Un bon rappel de la nécessité de ne pas utiliser un même mot de passe sur plusieurs sites web, et l'occasion de lire ou relire Aide:Sécurité des comptes utilisateur.

Focus

RAW encourage les membres de la communauté à s'exprimer sur différents enjeux liés à l'écosystème Wikimedia. N'hésitez pas à proposer vos textes pour cette section. N'hésitez pas non plus à réagir dans la section du courrier du lectorat.

À la recherche des articles disparus de Google
par Jules*

Certains articles de Wikipédia sont déréférencés par Google. Combien ? Les déréférencements sont-ils légitimes ? C'est le grand flou.

Le Canard enchaîné publie une enquête qui vous déplaît ? Oubliez le communiqué de presse et la plainte pour diffamation. Le problème, ce n'est pas l'article : c'est le fait qu'il soit lu ! Et s'il était possible de le faire disparaître de Google ? Improbable ? C'est pourtant ce qui s'est passé, nous raconte Thibaut Schepman dans un article paru en janvier dernier dans La Revue des médias, éditée par l'Institut national de l'audiovisuel (INA)[10]. La méthode employée par les malandrins est la suivante : signaler à Google une violation des droits d'auteurs en affirmant que l'article de presse est un plagiat d'une page web, antidatée. Derrière la mésaventure vécue par une journaliste du Canard enchaîné se cache une véritable industrie du déréférencement indu, nous apprend Thibaut Schepman.

Si Google a rétabli le référencement de l'article du Canard enchaîné, est-il possible que Wikipédia soit également victime de telles manœuvres ? La question n'est pas anodine. La plupart des consultations de Wikipédia proviennent des moteurs de recherche, et parmi ceux-ci, Google est en position de quasi-monopole[11]. Un article Wikipédia déréférencé de Google, c'est donc probablement un article qui ne sera quasiment plus lu.

De la lumière mais pas trop

Pour savoir ce qu'il en est, première étape, la plateforme Lumen. Elle permet de consulter les demandes de déréférencement adressées à Google pour divers motifs : violation des droits d'auteurs, diffamation, droit à l'oubli... Mais les notices, dont la consultation n'est pas aisée, n'indiquent pas l'issue de ces demandes. Nous ne sommes guère éclairés.

De son côté, la Fondation Wikimédia (WMF) a commencé en 2014 à publier les notifications de déréférencement qu'elle recevait de Google (dont plusieurs dizaines pour Wikipédia en français). À l'époque, la WMF s'est émue de cette censure, motivée par le droit à l'oubli, dans un billet de blog en anglais[12].

Récemment, l'auteur de ces lignes a eu vent du déréférencement d'un article de Wikipédia en français par Google. Le déréférencement a-t-il été effectué au nom du droit à l'oubli ? Ou bien par une méthode retorse comme celle mise en lumière par La Revue des médias ? Aucune idée : aucun résultat sur Lumen avec le titre de l'article, et pas de notice relative sur la page tenue à jour par la WMF.

RGPD à la suédoise

Renseignement pris auprès du service juridique de la WMF, Google envoie depuis quelques années des notifications de déréférencement dépourvues de l'URL du contenu déréférencé (exemple) et donc parfaitement inutiles. Surprenant. Ce changement découle en fait d'une décision prise en 2020 par l'Autorité suédoise pour la protection de la vie privée, sur le fondement du règlement général sur la protection des données (RGPD). Elle a estimé qu'en fournissant l'URL du contenu déréférencé dans ses notifications, Google permettait à leur destinataire de republier les contenus litigieux sous une autre URL, et donc de bafouer le droit à l'oubli[13]. Exit les URL.

Tout au plus la WMF continue-t-elle de recevoir des notifications précises quand le requérant est situé hors Union européenne ; on sait ainsi que l'article Fusillade de l'université d'Eskişehir Osmangazi a disparu de certaines recherches Google en raison de la législation turque — sans plus de précision.

On ignore d'ailleurs si la WMF reçoit systématiquement une notification de Google en cas de déréférencement. En tout état de cause, la liste des notifications relatives à Wikipédia en français n'évoque aucun déréférencement pour violation des droits d'auteurs — c'est en revanche le cas pour Wikipédia en anglais, comme le relèvent nos confrères du Signpost.

S'agissant du droit à l'oubli, s'il est légitime de chercher un équilibre entre droit à l'information et droit au respect de la vie privée, il apparaît contestable qu'une entreprise privée, en l'espèce Google, puisse opérer sans aucune transparence le déréférencement d'articles.

Le dossier du mois

Dans cette section, le magazine aborde un sujet qui a fait beaucoup réagir à l'intérieur de la communauté, voire à l'extérieur.

Le bouleversement annoncé des pratiques par l'IA générative
par Nanoyo88

Cet article repose sur quatre interviews que vous pouvez consulter dans leur version complète.

Lors de précédentes éditions, nous avons régulièrement abordé le sujet de l'IA générative (genAI), ses implications et conséquences pour Wikipédia. Nous aimerions prendre le temps, au travers d'un dossier et d'interventions de quatre contributeurs, d'approfondir le sujet. Pa2chant.bis, LD, Aelxen et (:Julien:) analysent les usages de l'IA et les problèmes qu'ils engendrent ; ils discutent aussi de l'élaboration d'un texte pour les encadrer.

IA, genAI, LLM :
de quoi parle-t-on ?

De manière générale, les machines informatiques exécutent scrupuleusement des instructions (un programme informatique) écrites par des humains. Les humains disent explicitement quoi faire à la machine, pas à pas. L'intelligence artificielle (IA) est une discipline scientifique visant à permettre aux machines d'être « intelligentes » : apprentissage, raisonnement logique, compréhension du langage naturel (anglais, français…). L'IA cherche à permettre aux machines à gagner en autonomie pour effectuer des tâches plus complexes. L'intelligence artificielle générative (genAI) est un sous-domaine de l'IA dont le but est de générer automatiquement des textes en langage naturel. Les réseaux de neurones sont une technologie très puissante (et gourmande en ressources) largement utilisée dans l'IA.

Depuis 2017-2018, les grands modèles de langage (LLM) utilisent des (grands, très grands) réseaux de neurones pour comprendre du langage naturel, répondre à des questions ou générer du texte (genAI). Le texte écrit par un humain pour interagir avec le LLM est appelé prompt. Pour apprendre le langage et des connaissances, les LLM sont gavés de tonnes de données disponibles sur Internet (dont évidemment WP). Les LLM n'ont pas d'estimation de la valeur de vérité ou véracité de ce qu'ils répondent : ils répondent grosso modo ce qui est le plus probable parmi les textes sur lesquels leur apprentissage s'est fondé. Le LLM invente donc : parfois c'est juste, parfois c'est faux — on parle alors d'hallucination.

Pour en savoir plus, lire cet article sur Le Monde.

Ils fleurissent sur l'encyclopédie et le printemps n'y est pour rien. Les textes générés par IA sont de plus en plus nombreux sur les articles de Wikipédia à mesure que l'usage de l'IA générative se démocratise. Pour Pa2chant.bis, cet usage wikipédien se fait « en l'absence de recommandation », ce qui a pour conséquence de rendre « très lourd et coûteux en temps de démontrer des abus » et risque de démotiver les contributeurs qui se consacrent à ces vérifications.

Julien indique à ce propos qu'il est « difficile d'anticiper les usages qui seront faits des LLM. Mais c'est potentiellement un game changer pour WP », qui peut au choix « devenir un dépôt de connaissances approximatives via des masses de textes mal comprises ou un facilitateur de rédaction ».

« C'est l'avenir de Wikipédia qui se joue »

Pa2chant.bis n'y va pas par quatre chemins : « C'est l'avenir de Wikipédia qui se joue. » Les enjeux et les risques de ces nouvelles pratiques sont déjà connus : « outre les potentielles atteintes au droit d'auteur, on peut citer les problèmes de fiabilité de l'information de type absence ou détournement de source, les TI et les problèmes de style. »

La majorité des usages observés ne résistent pas aux vérifications et affichent différents problèmes qui pourraient être évités si la contribution était 100 % humaine. C'est notamment le cas des traductions automatiques, des synthèses de sources multiples, de l'identification de sources, etc.

Des usages problématiques, Pa2chant.bis en a vu quelques exemples surprenants. Par exemple, dans une page Wikipédia sur une maladie, indiquer aux parents que même traitée, elle peut être mortelle, alors qu'aucune source n'a été trouvée dans ce sens. Dans l'article 'Ndrangheta (la mafia calabraise), une famille dont le nom est parfaitement inconnu des sources a été désignée comme étant influente. Dans un autre article étaient indiqués des liens familiaux entre deux personnes, liens imaginaires sourcés avec un blog généré par IA. Les abus peuvent d'une envergure encore supérieure, comme les interventions mêlant TI, IA et vandalismes sur une profusion d'articles dédiés aux quasars : alors que le projet:Astronomie compte peu de membres, et encore moins de spécialistes de ce sous-domaine, cela va exiger d'utiliser WP:TNT.

« L'IA, on l'utilise depuis super longtemps »

Julien rappelle que les traductions automatiques relèvent de l'IA, et plus récemment de l'introduction des LLM. Or, « la communauté semble ok avec cette utilisation de l'IA », quand bien même Julien en est lui-même critique. Concernant les LLM, « des utilisateurs ont développé et rendu compte de pratiques plus avancées (Projet:Observatoire des IA/Documentation, Utilisateur:Global Donald/Création d'article via ChatGPT 4o et comparaison des prompts, Utilisateur:Nanoyo88/testIA…) ». La question revient dès lors à se demander si la relecture et la vérification sont bien effectuées, et c'est là que ça coince. Comme pour les traductions automatiques à la chaîne, les textes générés par IA augmentent la quantité de travail de vérification pour la communauté.

Il y a également des usages de LLM qui pourraient être utiles à l'automatisation de certaines opérations de maintenance sur Wikipédia. « Sur les projets sportifs (basket, foot, foot US), c'est toujours relou quand un joueur change de club : il faut rajouter des catégories, changer des palettes, mettre à jour l'infobox… Not fun. J'ai dans ma todo list le développement d'un outil automatique de mise à jour quand un joueur change de club, avec l'usage d'un LLM. » Les LLM pourraient également être utilisés afin de lutter contre le vandalisme, voire même contre les mésusages de LLM !

Une lutte contraignante

Dernièrement, un tracker a été mis en place par Julien sur la base du signalement, par Pa2chant.bis, de sources comportant un paramètre UTM lié à ChatGPT. Cette longue liste n'est que la partie émergée d'une analyse en profondeur nécessaire et dans laquelle il faut comparer les sources présentées et les informations ajoutées.

Afin de pouvoir rapidement identifier ce type d'ajout, un filtre anti-abus a été créé par Aelxen. « Le filtre consiste à détecter les insertions d'URL contenant un paramètre UTM provenant de ChatGPT. Actuellement, il est uniquement utilisé pour récupérer des statistiques. À terme, il pourrait permettre d'insérer un message d'avertissement lors de la publication des modifications. »

« Des détecteurs insuffisamment fiables »

Actuellement, on peut difficilement s'appuyer uniquement sur des outils de détection et éléments techniques pour identifier les usages de textes générés par IA avec fiabilité. « Ces outils sont imparfaits, explique Julien : les LLM sont des machines probabilistes donc il y a des risques de faux-positifs. Les études qui essaient de mesurer les faux positifs divergent pas mal et s'appuient sur des textes en anglais, donc il faut prévoir une décote pour le français. »

Aelxen et Pa2chant.bis jugent également la fiabilité de ces détecteurs insuffisante. Pour Pa2chant.bis, « le plus performant détecteur trouve en français un nombre impressionnant de probables faux-positifs » et Julien souligne une observation surprenante d'Esprit Fugace : il y a des faux positifs lorsque le contenu est rédigé « par des personnes neuroatypiques dont le style rédactionnel diffère » de la norme.

Sur les possibilités techniques, Aelxen suggère que « des outils semi-automatiques pourraient être envisagés pour aider à l'analyse, par exemple en signalant des passages suspects ou en identifiant des modèles d'écriture caractéristiques de l'IA ». Mais Julien considère que c'est « sans issue parce que les LLM s'aguerrissent et les méthodes de détection sont toujours en retard. Il est possible que le contenu genAI devienne rapidement indiscernable par un œil humain comme par un détecteur ».

« Ils voient surtout le verre à moitié plein sans voir le verre à moitié vide »
Mésusages de l'IA :
comment aider ?

Pour donner un coup de main sur le sujet, plusieurs possibilités. Vous pouvez participer à l'élaboration de la future recommandation ainsi qu'au sondage associé. La vérification des quelque 170 insertions de sources via ChatGPT peut également vous intéresser. De bonnes âmes sont aussi nécessaires pour l'analyse et le traitement de 284 + 400 sites générés par IA utilisés comme sources sur Wikipédia.

Enfin, si vous rencontrez des textes que vous soupçonnez d'être générés par IA et qui contreviennent aux PF, vous pouvez les signaler sur Projet:Observatoire des IA/Contrôle.

Votre aide est précieuse !

Identifier les textes générés par IA et leurs problèmes n'est pas chose aisée. Pa2chant.bis témoigne de sa pratique, indiquant que cela se fait « au hasard des analyses de créations d'articles, des relectures et de la patrouille ». Les mauvais usages possèdent plusieurs marqueurs tels que le style stéréotypé et souvent laudatif, le plan caractéristique et les détournements de sources par hallucination — « et là, c'est beaucoup plus long à identifier ».

Le second problème est qu'il est particulièrement complexe de faire comprendre aux utilisateurs d'IA, novices ou expérimentés, les problèmes de leurs contributions. Pa2chant.bis a l'impression « qu'ils voient surtout le verre à moitié plein (leurs prompts sont de plus en plus précis et performants, et le niveau de réponse des IA s'améliore) sans voir le verre à moitié vide (les erreurs, le langage stéréotypé et les traductions parfaites en mot à mot, mais porteuses de contresens, non-sens ou inventions) ».

Malheureusement, l'utilisation abusive de l'IA reste très tentante car elle est en mesure de produire des textes d'apparence robuste, auxquels il est aisé pour les contributeurs de faire confiance, en ayant la fausse impression d'avoir maitrisé un sujet. À cela s'ajoute la culture historique de Wikipédia « selon laquelle l'encyclopédie est en construction, les erreurs ne sont pas trop graves et finiront bien par être corrigées un jour » ainsi que le sentiment que refuser l'usage de l'IA relève « d'une forme de passéisme, ou d'une attitude rétrograde vis-à-vis des progrès technologiques ».

Vers la mise en place d'une recommandation

Le , Pa2chant.bis tirait une nouvelle fois la sonnette d'alarme, soulevant une nouvelle pratique consistant à sourcer des contenus, ou générer des contenus sourcés, par le biais de l'IA. Cette situation le pousse alors à inviter la communauté à se pencher sur un passage à l'état de recommandation d'un texte encadrant l'usage des IA. L'idée a été très bien accueillie et un sondage est en préparation. Deux versions existent actuellement, un essai élaboré depuis plusieurs mois et une contre-proposition simplifiée par LD.

Cependant, établir une recommandation présente plusieurs contraintes car elle a vocation à établir des lignes directrices à suivre dans la contribution. LD nous rappelle qu'elles doivent donc « répondre aux attentes et interrogations les plus courantes, tout en véhiculant un « savoir-faire » concret ».

« Elle doit être claire, non contradictoire avec les autres normes et permettre un ajustement progressif »

Le plus complexe est de produire une recommandation « claire, non contradictoire avec les autres normes (principes, règles, recommandations) et permettre un ajustement progressif ». Ce dernier élément est nécessaire afin de pouvoir répondre aux éventuelles évolutions législatives. En effet, l'IA générative pose la question de la propriété intellectuelle, dans la mesure où « les textes générés [peuvent provenir] de textes régis par le droit d'auteur et [où] ces générations [pourraient être] considérées comme également soumises au droit d'auteur (et/ou sont considérées comme des œuvres dérivées ou collectives) ».

Cette future recommandation ne supplantera donc pas les recommandations déjà existantes. LD évoque le propos de @Cosmophilus à ce sujet en soulignant que « le mauvais usage de l'IA se caractérise par la violation d'un principe ou d'une norme déjà définie, telle que WP:DA, WP:V, WP:STYLEetc. ». Aussi le but n'est-il pas de répéter le corpus réglementaire mais de donner des indications pour « se concentrer sur l'application de ces normes dans le cadre de l'IA ».

Si la communauté démontre une certaine hostilité à l'égard des contenus générés par IA et le démontre au travers de précédents sondages, il ne semble pas que l'on se dirige vers une interdiction stricte de son usage. Il est d'ores et déjà complexe de le démontrer.

Face à ces nouvelles pratiques, comme l'écrit LD, le mot d'ordre pourrait bien être de « rester guidé par le bon sens et le discernement ».

L'agenda

Le wik’hit-parade

Articles les plus vus en
No  Article Av. Vues Image Remarques
1 Émilie Dequenne B 1 608 141 Cette actrice belge, lauréate du prix d'interprétation féminine du Festival de Cannes pour Rosetta et du César de la meilleure actrice dans un second rôle pour Les choses qu'on dit, les choses qu'on fait, est décédée le des suites d'un cancer des surrénales à l'âge de 43 ans.
2 Elon Musk B 447 151 Cet homme d'affaires américain est très présent dans l'actualité depuis la réélection à la présidence des États-Unis de Donald Trump (no 9) qui l'a nommé à la tête d'un tout nouveau département de l'Efficacité gouvernementale.
3 Leïla Bekhti Bon début 430 921 Cette actrice française tient le premier rôle dans Ma mère, Dieu et Sylvie Vartan, sorti en salles en France le .
4 Herbert Léonard Bon début 417 692 Ce chanteur français, qui s'est fait connaître dans les années 1980 avec des tubes comme Pour le plaisir ou Quand tu m'aimes, est décédé le à l'âge de 80 ans.
5 Jean-Louis Debré Bon début 344 587 Cet homme politique français, ancien ministre de l'Intérieur, président de l'Assemblée nationale et président du Conseil constitutionnel, est décédé le , lui aussi à l'âge de 80 ans.
6 Adolescence (série télévisée) Bon début 337 219 Cette mini-série britannique, conçue par Jack Thorne (photo), a rencontré un grand succès à sa sortie sur Netflix, le . Elle aborde des sujets d'actualité (le cyberharcèlement, la culture incel, la radicalisation en ligne…) sous une forme inhabituelle (chaque épisode se compose d'un unique plan-séquence).
7 Claude Malhuret Bon début 310 362 Ce sénateur français, ancien président de Médecins sans frontières et cofondateur du site Doctissimo, a prononcé le 5 mars devant le Sénat un discours très remarqué en France et à l'international contre la politique menée par le président des États-Unis Donald Trump (no 9).
8 Michel Ferracci Bon début 302 884 Cet acteur français était le mari d'Émilie Dequenne (no 1).
9 Donald Trump B 297 837 Depuis sa réélection à la présidence des États-Unis en novembre dernier, cet homme d'affaires défraie constamment la chronique par ses décisions aussi nombreuses que controversées. Le mois de voit ainsi la déportation de détenus vénézuéliens au Salvador, le début du démantèlement du département de l'Éducation et la menace de l'instauration de droits de douane draconiens.
10 Olivier Giroud B 278 711 Ayant annoncé sa retraite internationale en , le footballeur français, champion du monde en 2018, a été ovationné par le Stade de France le avant le match France-Croatie comptant pour la Ligue des nations de l'UEFA 2024-2025.
11 Michael Olise Bon début 269 396 Ce footballeur français inscrit son premier but sous le maillot de l'équipe de France lors de ce même match France-Croatie du 23 mars.
12 Olympe de Gouges B 261 523 Cette pionnière française du féminisme est le sujet du téléfilm Olympe, une femme dans la Révolution, diffusé le 3 mars sur la chaîne France 2.
13 France AdQ AdQ 251 529 Le pays qui compte le plus grand nombre de francophones figure régulièrement parmi les articles les plus vus de Wikipédia en français.
14 Cyril Hanouna B 249 540 L'ancien animateur vedette de C8 poursuit la diffusion de son émission controversée Touche pas à mon poste ! sur Internet après la fermeture de la chaîne, le .
15 Carême B 239 339 Cette période du calendrier chrétien correspondant aux 40 jours précédant Pâques a commencé cette année le .
16 Gene Hackman Bon début 238 685 Figure de proue du Nouvel Hollywood, récompensé par deux Oscars et quatre Golden Globes, l'acteur américain a été retrouvé mort à son domicile de Santa Fe le avec son épouse Betsy Arakawa (en). Les résultats de l'enquête ont été publiés le .
17 Emilia Pérez Bon début 237 090 Cette comédie musicale sur un chef de cartel mexicain interprété par Karla Sofía Gascón (photo) qui change de sexe pour changer de vie a reçu sept récompenses lors des César, le , mais ses treize nominations aux Oscars ne se sont traduites que par deux victoires le .
18 Décès en mars 2025 Ébauche 233 582 Comme l'illustrent les numéros 1, 4, 5 et 16, la mort d'une personnalité entraîne presque systématiquement un pic de fréquentation de son article.
19 Jacques Audiard Bon début 227 677 Réalisateur du no 17, qui lui a valu le César de la meilleure réalisation.
20 Volodymyr Zelensky B 219 818 Alors que la guerre russo-ukrainienne se poursuit, le président ukrainien s'est rendu à Washington le pour une rencontre particulièrement houleuse avec Donald Trump (no 9).

Méthodologie : sur le modèle du Top 25 Report de Wikipédia en anglais, ce wik'hit-parade reprend les données fournies par l'outil « Pages les plus vues ». Sont exclues les entrées clairement aberrantes comme Cookie (informatique) ou Soudan du Sud, dont le nombre de visites élevé n'est pas le fruit d'un véritable intérêt des internautes : elles se distinguent par un taux très faible (moins de 5 %) ou au contraire très élevé (plus de 95 %) de consultations sur mobile.

Les autres infolettres

La page Wikipédia:RAW/Découvrir recense les infolettres et blogs relatifs à Wikimedia.

En plus de RAW, vous pouvez lire le Wikimag, newsletter hebdomadaire de la Wikipédia francophone (Voir le dernier numéro semaine 13), l'infolettre Wikifier la science (voir hiver 2024) et les Actualités mensuelles du Wiktionnaire (mars 2025).

Les anglophones peuvent aussi lire The Signpost, publié toutes les deux semaines, la newsletter hebdo de la communauté Wikidata (voir ici d:Wikidata:Status updates/2025 02 24) ou encore la newsletter du projet Wikifunction (wikifunctions:Wikifunctions:Status updates/2025-01-15).

Courrier du lectorat

Il nous fera plaisir de lire les messages déposés ici et, si nécessaire, d'y répondre dans les plus brefs délais.

  • bonjour, bravo pour ce numero. A propos du bouquin sur wikipedia qui va sortir on connait le nom reel de l'auteur mais comment on connait le nom d'utilisateur à celui de l'auteur? Et on a le droit de le dire? Ce serait pas du Wikipédia:Doxxing à l'envers? A moins que ce soit un poisson du 1er avril auquel cas je me suis bien fait attraper... --Sergent Cool (discuter) 1 avril 2025 à 09:19 (CEST)
    Bonjour @Sergent Cool. Ce n'est pas un poisson d'avril, ni du doxxing à l'envers : l'utilisateur est intervenu dans la presse successivement sous le nom de « Michel », « Michel wiki » et « Michel Sandrin » (peut-être un pseudonyme, d'ailleurs ?), en évoquant son « bannissement » (blocage indef, en fait), si bien que les wikipédiens ont fait le lien sans difficulté. — Jules* 💬 1 avril 2025 à 12:28 (CEST)
  • Bonjour Émoticône à tous et merci pour ce travail ! Je suis honoré de me découvrir nommément cité dans vos lignes (par @LD), quelle agréable surprise ! Tout ceci dans le cadre d'un débat ô combien actuel, qui plus est… C'est l'occasion de saluer la réflexion et les efforts ayant mené à ce numéro, et, plus généralement, la mise en lumière continuelle du travail collaboratif wikimédien dans les pages de ce magazine (dont je suis un lecteur assidu), tâche qui ne doit pas être aisée. Félicitations ! --Cosmophilus (discuter) 2 avril 2025 à 22:30 (CEST)

Renouveau — content de voir des forces vives travailler à l'évolution des RAW. Un merci particulier à Jules* pour son focus.
longue vie à la nouvelle rédaction! - Simon Villeneuve 3 avril 2025 à 12:42 (CEST)

Merci à tous les trois, @Sergent Cool, @Cosmophilus et @Simon Villeneuve, pour vos retours, c'est encourageant Émoticône sourire. — Jules* 💬 3 avril 2025 à 12:46 (CEST)
Un numéro intéressant. Émoticône — Cantons-de-l'Est p|d|d 🧹 4 avril 2025 à 00:37 (CEST)
Citations originales
Notes
Références
  1. Nicolas Gastineau, « Propos d’un patrouilleur de Wikipédia », sur Revue21.fr, (consulté le )
  2. « Pourquoi la droite américaine s’attaque-t-elle à Wikipédia? », sur ici.radio-canada.ca (consulté le )
  3. « Wikipédia, la méticuleuse fabrique du savoir », La Croix,‎ (ISSN 0242-6056, lire en ligne, consulté le )
  4. « Attaques contre Wikipédia : ce contributeur nous explique comment fonctionne l'encyclopédie libre et partagée », sur France 3 Grand Est, (consulté le )
  5. « Wikipedia : comment les contributions sont-elles contrôlées ? », sur France Culture, (consulté le )
  6. David Dufresne Euryale, « Wikipédia: qui veut sa peau (et pourquoi)? », sur Au Poste, média indépendant 100% Live & Libre, (consulté le )
  7. « Les outils d’IA comme ChatGPT ou Gemini utilisent des sites de propagande russe comme sources », Le Monde,‎ (lire en ligne, consulté le )
  8. Brice Laemle, « « Factuel », un nouveau média en ligne parrainé par Christine Kelly et Dominique Rizet », Le Monde,‎ (lire en ligne)
  9. « La Face cachée de Wikipédia », sur éditions du Cerf (consulté le ).
  10. Cet article a été partagé et discuté sur la page de discussion du Projet:Antipub.
  11. Comme le montre l'outil Search Engine Referrals.
  12. Le quotidien Le Monde y a aussi consacré un article.
  13. Lire à ce sujet ce billet sur le site du Comité européen de la protection des données.

Numéro de la semaine 2025-16

Sunday, 20 April 2025 22:00 UTC



Le saviez-vous ?

Avant d'être publiées en page d'accueil de Wikipédia les anecdotes sont proposées sur la page du projet dans l'attente de vos avis.
Les propositions de la semaine précédente sont rappelées ici, n'hésitez pas à participer : lecture et enrichissement de l'article support ; vérification des sources ; avis selon la grille de symboles ; etc... Pour cela cliquez sur le lien du titre qui vous inspire Émoticône !
Et pourquoi ne pas en soumettre une nouvelle de votre cru (après avoir vérifié que le sujet n'a pas déjà été évoqué) ?

Anecdotes de la semaine du 7 avril 2025 au 13 avril 2025 en attente de vos avis :

  1. Rubisco
  2. talibans à la sauce spaghettis
  3. Paris
  4. contesté frontalier de la France toujours en cours
  5. Nobel olympique
  6. Lettre à Sydney
  7. Chaud ou froid
  8. Épectase
  9. Parisiens râleurs
  10. C'est quoi... ce nom ?
  11. C'est quoi... cette langue ?
  12. C'est quoi... ce logo ?
  13. Houston, the movie has (had) a problem
  14. 24 heures du Faubourg Saint-Honoré
  15. Charles X
  16. Habemus einen Papst !
  17. Un apprêt est appliqué avant la peinture.


Attribution des labels


Articles de qualité

Propositions

Semaine du 7 au 13 avril 2025
Semaine du 24 au 30 mars 2025
Semaine du 10 au 16 mars 2025

Promus

Bons articles

Propositions

Semaine du 7 au 13 avril 2025
Semaine du 31 mars au 6 avril 2025
Semaine du 24 au 30 mars 2025

Promus


Planète Wikimédia

Les informations francophones

Article labellisé de la semaine

Article sélectionné au hasard dans la liste des articles du jour présentés cette semaine.

Un Accenteur à poitrine rousse mâle (Sikkim, Inde).
Un Accenteur à poitrine rousse mâle (Sikkim, Inde).

L'Accenteur à poitrine rousse (Prunella strophiata) est une espèce de petits passereaux de la famille des Prunellidae, endémique de l'Himalaya.

Sédentaire, il niche en haute montagne, entre 2 400 et 5 000 m, puis hiverne à plus basse altitude. Il est présent tout le long de l'Himalaya, de l'Afghanistan au Myanmar, en passant par le Pakistan, l'Inde, le Népal, le Bhoutan et la Chine. Il compte deux sous-espèces : Prunella strophiata strophiata, au plumage plus sombre, située à l'est, et Prunella strophiata jerdoni, plus claire, à l'ouest.

Il vit dans des buissons à la limite des arbres, parfois aussi en forêt, et approche les habitations humaines en hiver : on l'aperçoit alors dans les jardins, les friches et dans des abris pour bétail. Il est furtif et terrestre, fouillant le sol à la recherche d'invertébrés, à la manière des autres Accenteurs. S'il est dérangé, il s'envole brusquement en poussant un cri d'alarme.

Il tient son nom de la large bande rousse qu'il a sur la poitrine. Il porte un épais sourcil roux qui le distingue des espèces proches, notamment l'Accenteur rougegorge (Prunella rubeculoides) et l'Accenteur de l'Himalaya (Prunella himalayana). Son chant ressemble à celui du Troglodyte mignon (Troglodytes troglodytes).

Ses effectifs sont stables et son aire de répartition est très étendue : il est probablement l'Accenteur le plus répandu à l'ouest de l'Himalaya. Il n'est pas considéré comme en danger par l'UICN et donc classé en espèce de préoccupation mineure (LC).


Informations générales


En bref

Actuellement, Wikipédia compte 2 680 094 entrées encyclopédiques, dont 2 201 articles ayant obtenu le label « Article de qualité » et 4 108 articles ayant obtenu celui de « Bon article ».

Elle est en 4e position en nombre d'articles, après les éditions en anglais, en cebuano et en allemand ; l'édition en cebuano est développée en partie à l'aide d'un bot.

Plaisirs visuels


Des crocus recouverts de rosée.
(définition réelle 3 140 × 3 140)
Sceau et parchemin par lesquels Janusz Ier l'Aîné accorde aux citoyens de Varsovie le privilège de construire un bain public le .
(définition réelle 11 539 × 7 624)
Le temple maçonnique d'Orland (Californie).
(définition réelle 7 565 × 5 404)
Un muffin à la vanille dans un moule en papier sulfurisé.
(définition réelle 4 781 × 3 187)
Le Christ en Croix de Rubens (vers 1615, Alte Pinakothek).
(définition réelle 5 424 × 7 812)
Une photographie sous-marine d'un poisson-grenouille géant à Zanzibar (Tanzanie).
(définition réelle 5 296 × 5 296)
Un baobab africain photographié dans le parc national de Tarangire, au nord de la Tanzanie.
(définition réelle 8 169 × 5 776)


Astuce

Élaborer de nouvelles pages dans son espace personnel

Vous pouvez élaborer tranquillement une nouvelle page (article, modèle ou autre) dans une sous-page personnelle nommée, par exemple :

Utilisateur:votre pseudo/Bac à sable
Utilisateur:votre pseudo/Brouillon

ou encore

Utilisateur:votre pseudo/nom futur

Vous pouvez y placer {{Brouillon}}. Évitez, toutefois, de la « catégoriser » : il suffit de mettre les « [[Catégorie:…]] » en commentaire entre deux balises (<nowiki>texte en commentaire</nowiki>) ou en commentaire html (<!-- commentaire -->).

Lorsque la page est prête pour le transfert, ne recopiez pas son contenu, mais renommez-la ! Pour ratisser votre bac-à-sable, il suffit de blanchir la redirection.

Page de la catégorie Archives Astuces tirée au sort grâce à la page spéciale Page au hasard dans la catégorie.

Anniversaires à venir

Notes et références


Comité de rédaction

Cette édition a été rédigée par Pronoia (d · c).

Envoyez-nous vos remarques sur la rédaction du Wikimag, des annonces de débat, des tribunes d’expression libre ou le signalement de nouvelles pages d’intérêt commun sur Wikipédia.
Nous avons besoin de votre aide pour maintenir le Wikimag.

Commentaires sur cette édition

Pas de commentaires pour le moment, n'hésitez pas !


Numéro du 20 avril 2025

Sunday, 20 April 2025 00:00 UTC

L'édito — Les réflexions sur la modernisation de cette wikilettre se poursuivent. Dans ce cadre, nous aimerions créer de nouvelles rubriques. Vos suggestions sont les bienvenues en salle de rédaction : dites-nous ce que vous aimeriez lire dans les RAW, ou ce que vous voudriez y écrire !

C'est dans cette perspective que nous lançons un premier appel à commentaires afin de co-rédiger un futur dossier relatif à la possibilité de modifier Wikipédia sans créer de compte (actuellement sous IP, prochainement sous compte temporaire).

Bonne lecture !

Les brèves

Contributions de Jules*, Nanoyo88, Pyb en résidence, Trizek

Échos francophones

Les contributeurs à l'honneur dans les médias — La revue de presse wikipédienne est encore une fois très riche en mars 2025, mais elle voit surtout la mise à l'honneur de nombreux contributeurs tels que Le chat perché (d · c · b) sur XXI[1], Simon Villeneuve (d · c · b) sur Ici Radio-Canada[2], C.Salviani (d · c · b) dans La Croix[3], Lyokoï (d · c · b) sur France 3 Champagne-Ardenne[4] et d'autres sur France Culture[5] ou dans l'émission de David Dufresne[6]. Des interventions remarquables et remarquées !

2033 – Adieu joli wiki ? — Une projection de régression linéaire basée sur les données Google Trends laisse entendre que l'intérêt et l'utilisation continuera de décroître, menant Wikipedia à cesser d'exister le au profit des LLM. A-t-on oublié de préciser le caractère humoristique de cette brève Émoticône ?

Wikipédia / Le Point : clôture de la lettre ouverte et réponse aux mises en demeure — Dans le dernier numéro des RAW, nous vous parlions de la controverse opposant le magazine français Le Point à Wikipédia en français. La lettre ouverte a été close le . En trois semaines, elle a rassemblé 1 155 signatures de contributeurs de notre wiki ou d'autres. Aelxen a compté que le cumul des contributions des signataires sur la seule version francophone s'élevait à environ 22 900 000, soit environ 10 % du total des modifications effectuées sur l'encyclopédie depuis sa création.

Parmi les signatures, celle du co-fondateur de Wikipédia, Jimmy Wales, le , n'est pas passée inaperçue. La directrice du service Trust & Safety de la Fondation Wikimédia (WMF), Maggie Dennis, a également publié un message de soutien en page de discussion.

Le Point a cessé ses publications hostiles à Wikipédia, après une série de neuf articles en onze jours — du jamais vu. Les avocats du magazine ont en revanche adressé une deuxième mise en demeure à la WMF, dans laquelle ils maintiennent leurs demandes de censure de l'article Le Point, en dépit des améliorations apportées par la communauté, et dans laquelle ils qualifient la lettre ouverte de « diffamatoire ».

C'est ce que nous avons appris au détour d'un message incisif publié sur le Bistro par Phil Bradley-Schmieg au nom du service juridique de la WMF. Ce dernier indique clairement ne pas donner suite aux exigences éditoriales du Point et soutenir la lettre ouverte. Plus encore, il souligne, après avoir regretté l'absence d'excuses de la part du magazine, les « graves erreurs et malentendus » que contient la première mise en demeure. Non sans un brin de causticité, le service juridique indique avoir « proposé d'expliquer le fonctionnement de Wikipédia au Point et à ses avocats ». À suivre.

Au Comité d'arbitrage, un élu esseulé — Le CAr n'a pas terminé de casser des claviers sous de douces mélodies un peu naïve de refonte. Les élections de mars 2025 s'achèvent avec l'élection d'un arbitre. Mais concrètement, que se passera-t-il ensuite ? Ce qui est certain, c'est que le quorum de trois arbitres minimum n'est pas rempli pour relancer le CAr. Peut-être serait-ce l'occasion d'engager le processus de déconstruction et de création d'un nouvel organe tel que suggéré par plusieurs contributeurs dans les votes et discussions ? La communauté semble en effet attachée à l'existence d'un organe type CAr, comme en témoignent cette élection et, précédemment, le refus répété (2016, 2018, 2021) de dissoudre le CAr sans instance pour le remplacer.

Coups de griffes — Un conflit oppose la cabale féline et d'autres bénévoles, excédés par la profusion d'images de chats sur le Bistro. Les tensions se sont envenimées à la suite d'une proposition de passage en recommandation de la page Wikipédia:Ne mordez pas les chats, jugée discriminante à l'égard des poissons-chats. Plusieurs RA ont été déposées en mars, mais n'ont toujours pas été traitées ; un contributeur, soupçonnant les administrateurs de partialité, a réclamé qu'ils indiquent s'ils portent ou non la moustache. C'est en tout cas ce que rapporte le magazine français La Virgule qui, renseigné par un certain « Marcel Wiki » et faisant état des accusations lapidaires d'un concessionnaire automobile qui jouit d'une certaine notoriété outre-Atlantique, s'inquiète d'une dérive ailurophile de l'encyclopédie. Sur le Bistro, des commentateurs avisés ont jugé que cet article faisait fausse route : « On sait tous ici que le vrai désaccord dans la communauté porte en ce moment sur la nécessité ou non de capitaliser le nom des modèles dans le wikicode ! »

Attention à la désinformation russe — Des rapports indiquent que des fermes de contenus produisant de la désinformation russe sont utilisés sur Wikipédia[7]. Peu nombreux sur la version francophone et effectués de bonne foi, ces ajouts sont le fait de contributeurs avertis de la communauté ; la situation est semble-t-il différente sur d'autres versions linguistiques de Wikipédia.

Un livre sur Wikipédia... écrit par un utilisateur bloqué — En , l'éphémère média français d'extrême droite Factuel[8], au détour d'un article commenté sur le Bistro, annonçait un ouvrage à paraître en 2024 consacré à Wikipédia. Son auteur ? Un certain Michel1961 (d · c · b), bloqué indéfiniment en 2021 (notamment pour comportement non collaboratif, détournement de sources, rameutage et POV-pushing) et régulièrement cité dans des articles de presse sensationnalistes en 2020 (où des contributeurs expérimentés sont accusés d'être « islamo-conciliants »), 2021, 2023, février et mai 2024. L'ouvrage, annoncé dès 2023, paraît en aux éditions du Cerf sous le titre La face cachée de Wikipédia : Enquête sur les dérives de l'encyclopédie libre[9]. Cosigné par Victor Lefebvre, ancien journaliste au Figaro et à Factuel, l'ouvrage de 216 pages prétend apporter « une réponse argumentée et dépassionnée » à la question de savoir si l'encyclopédie est devenue « Wokipedia » comme allégué par Elon Musk. La réponse est donnée au dos de l'ouvrage : « Le pouvoir de nuisance d'une petite poignée d'utilisateurs ouvertement militants - pour ne pas dire woke - tend à se renforcer. »

L'actu technique

Nouvel aperçu de l'outil de traduction

L'outil de traduction évolue — L'équipe de Localisation de la langue et des produits a amélioré le Tableau de bord de traduction de contenu en intégrant des fonctionnalités de personnalisation de suggestions et en améliorant l'accessibilité du tableau de bord.

D'où viennent et où vont les lecteurs d'un article ? — L'outil Wikinav permet de répondre à ces questions. En plus de mettre en évidence que la majorité des consultations viennent des moteurs de recherche, l'analyse de l'article Elon Musk (le plus consulté en ) montre ainsi que l'article de Wikipédia par lequel le plus grand nombre de lecteurs arrivent est celui de son ex-compagne Grimes et celui le plus consulté consécutivement est celui de sa compagne actuelle, Shivon Zilis. Les clics entrants depuis ou sortants vers le département de l'Efficacité gouvernementale (DOGE) n'arrivent respectivement qu'en dixième et sixième positions. La vie privée avant la politique.

Dans le mouvement

Le logo de Wikipédia, en allemand, avec la mention « 3 Millionen Artikel ».
Et de trois !

Trois millions d'articles sur Wikipédia en allemand — C'est le seuil franchi par la version germanophone de Wikipédia le . Troisième plus grosse version linguistique en nombre d'articles, elle devance la version francophone, selon la liste des wikis. Il existe toutefois de nombreux autres indicateurs pour comparer les versions linguistiques, dont la profondeur, qui valorise le nombre d'éditions par article et le nombre de pages autres que les articles — en classant les wikis avec cet indicateur, la version francophone arrive en dix-neuvième position (loin devant la version germanophone). Pour en revenir au seuil symbolique de trois millions d'articles, les paris sur la date à laquelle Wikipédia en français l'atteindra sont toujours ouverts.

Une militaire américaine en train de se faire peindre la joue aux couleurs du drapeau LGBT.
Exemple de photo retirée.

Suppression de contenus de l'armée américaine — Le département de la Défense des États-Unis a récemment appliqué une décision présidentielle mettant fin aux politiques Diversité, équité et inclusion (DEI). Cela s'est traduit notamment par la mise hors ligne de beaucoup de contenus multimédia. Associated Press a récupéré une base de données de 26 000 photos concernées par la censure. Wikimedia Commons héberge de nombreuses photos de l'armée américaine, entre 10 et 20 % des 5 millions de photos stockées sur DVIDS, la médiathèque du départ de la Défense. Don-vip (d · c · b) poursuit l'import en masse des photos, que  (d · c · b) avait débuté. Une catégorisation des photos supprimées est en cours ainsi que l'import des vidéos manquantes, projet initié par Mvolz (d · c · b). Une fois ce travail de catégorisation réalisé, il sera possible d'extraire les données pour les mettre sur data.gouv.fr par exemple afin de permettre aux chercheurs et associations d'étudier les contenus retirés. Ce travail n'est pas sans soulever des questions éthiques auxquelles l'armée américaine a été confrontée en 2021 en procédant à un retrait massif de photos d'Afghans afin de les protéger des talibans.

Renforcer la neutralité de point de vue de Wikipédia — La Fondation Wikimédia a récemment mis en évidence des tendances essentielles et prioritaires pour le mouvement, à travers des conversations avec les communautés. Cette année, une tendance qui a suscité de nombreuses discussions au sein et au-delà du mouvement Wikimédia concerne la neutralité : la baisse de confiance dans les informations en ligne et la fragmentation du consensus sur la véracité des informations. Il s'avère que la manière dont le principe de neutralité de point de vue se traduit varie d'un projet Wikimédia à l'autre, ce qui met en évidence la possibilité pour les communautés d'apprendre les unes des autres et d'explorer si des normes mondiales communes de neutralité peuvent mieux protéger les projets (et les bénévoles) dans un environnement de menaces accrues et de réglementation croissante. Pour soutenir les communautés Wikimédia et réaffirmer notre engagement en faveur de la neutralité, la Fondation Wikimédia réunira un groupe de travail composé de contributeurs actifs, de membres du CA de la Fondation, de chercheurs et de conseillers afin d'étudier des recommandations de normes communes pour les politiques NPOV qui peuvent protéger Wikipédia, accroître l'intégrité des projets et fournir davantage de soutien aux bénévoles chargés d'administrer ces politiques. Pour en savoir plus, rendez-vous sur Diff, le blog hébergé par la Fondation à propos du mouvement.

Verrouillages globaux massifs — Le , la WMF a entrepris le verrouillage global de plus de 35 000 comptes (liste) compromis (mots de passe divulgués, vraisemblablement). Dans le communiqué qu'elle a publié quelques jours après, elle indique que cela fait suite à la découverte d'« un schéma de connexions inhabituelles à des comptes enregistrés », qui résulterait d'une fuite de données depuis un autre site web incluant des mots de passe, utilisés aussi sur Wikipédia. Un bon rappel de la nécessité de ne pas utiliser un même mot de passe sur plusieurs sites web, et l'occasion de lire ou relire Aide:Sécurité des comptes utilisateur.

Focus

RAW encourage les membres de la communauté à s'exprimer sur différents enjeux liés à l'écosystème Wikimedia. N'hésitez pas à proposer vos textes pour cette section. N'hésitez pas non plus à réagir dans la section du courrier du lectorat.

À la recherche des articles disparus de Google
par Jules*

Certains articles de Wikipédia sont déréférencés par Google. Combien ? Les déréférencements sont-ils légitimes ? C'est le grand flou.

Le Canard enchaîné publie une enquête qui vous déplaît ? Oubliez le communiqué de presse et la plainte pour diffamation. Le problème, ce n'est pas l'article : c'est le fait qu'il soit lu ! Et s'il était possible de le faire disparaître de Google ? Improbable ? C'est pourtant ce qui s'est passé, nous raconte Thibaut Schepman dans un article paru en janvier dernier dans La Revue des médias, éditée par l'Institut national de l'audiovisuel (INA)[10]. La méthode employée par les malandrins est la suivante : signaler à Google une violation des droits d'auteurs en affirmant que l'article de presse est un plagiat d'une page web, antidatée. Derrière la mésaventure vécue par une journaliste du Canard enchaîné se cache une véritable industrie du déréférencement indu, nous apprend Thibaut Schepman.

Si Google a rétabli le référencement de l'article du Canard enchaîné, est-il possible que Wikipédia soit également victime de telles manœuvres ? La question n'est pas anodine. La plupart des consultations de Wikipédia proviennent des moteurs de recherche, et parmi ceux-ci, Google est en position de quasi-monopole[11]. Un article Wikipédia déréférencé de Google, c'est donc probablement un article qui ne sera quasiment plus lu.

De la lumière mais pas trop

Pour savoir ce qu'il en est, première étape, la plateforme Lumen. Elle permet de consulter les demandes de déréférencement adressées à Google pour divers motifs : violation des droits d'auteurs, diffamation, droit à l'oubli... Mais les notices, dont la consultation n'est pas aisée, n'indiquent pas l'issue de ces demandes. Nous ne sommes guère éclairés.

De son côté, la Fondation Wikimédia (WMF) a commencé en 2014 à publier les notifications de déréférencement qu'elle recevait de Google (dont plusieurs dizaines pour Wikipédia en français). À l'époque, la WMF s'est émue de cette censure, motivée par le droit à l'oubli, dans un billet de blog en anglais[12].

Récemment, l'auteur de ces lignes a eu vent du déréférencement d'un article de Wikipédia en français par Google. Le déréférencement a-t-il été effectué au nom du droit à l'oubli ? Ou bien par une méthode retorse comme celle mise en lumière par La Revue des médias ? Aucune idée : aucun résultat sur Lumen avec le titre de l'article, et pas de notice relative sur la page tenue à jour par la WMF.

RGPD à la suédoise

Renseignement pris auprès du service juridique de la WMF, Google envoie depuis quelques années des notifications de déréférencement dépourvues de l'URL du contenu déréférencé (exemple) et donc parfaitement inutiles. Surprenant. Ce changement découle en fait d'une décision prise en 2020 par l'Autorité suédoise pour la protection de la vie privée, sur le fondement du règlement général sur la protection des données (RGPD). Elle a estimé qu'en fournissant l'URL du contenu déréférencé dans ses notifications, Google permettait à leur destinataire de republier les contenus litigieux sous une autre URL, et donc de bafouer le droit à l'oubli[13]. Exit les URL.

Tout au plus la WMF continue-t-elle de recevoir des notifications précises quand le requérant est situé hors Union européenne ; on sait ainsi que l'article Fusillade de l'université d'Eskişehir Osmangazi a disparu de certaines recherches Google en raison de la législation turque — sans plus de précision.

On ignore d'ailleurs si la WMF reçoit systématiquement une notification de Google en cas de déréférencement. En tout état de cause, la liste des notifications relatives à Wikipédia en français n'évoque aucun déréférencement pour violation des droits d'auteurs — c'est en revanche le cas pour Wikipédia en anglais, comme le relèvent nos confrères du Signpost.

S'agissant du droit à l'oubli, s'il est légitime de chercher un équilibre entre droit à l'information et droit au respect de la vie privée, il apparaît contestable qu'une entreprise privée, en l'espèce Google, puisse opérer sans aucune transparence le déréférencement d'articles.

Le dossier du mois

Dans cette section, le magazine aborde un sujet qui a fait beaucoup réagir à l'intérieur de la communauté, voire à l'extérieur.

Le bouleversement annoncé des pratiques par l'IA générative
par Nanoyo88

Cet article repose sur quatre interviews que vous pouvez consulter dans leur version complète.

Lors de précédentes éditions, nous avons régulièrement abordé le sujet de l'IA générative (genAI), ses implications et conséquences pour Wikipédia. Nous aimerions prendre le temps, au travers d'un dossier et d'interventions de quatre contributeurs, d'approfondir le sujet. Pa2chant.bis, LD, Aelxen et (:Julien:) analysent les usages de l'IA et les problèmes qu'ils engendrent ; ils discutent aussi de l'élaboration d'un texte pour les encadrer.

IA, genAI, LLM :
de quoi parle-t-on ?

De manière générale, les machines informatiques exécutent scrupuleusement des instructions (un programme informatique) écrites par des humains. Les humains disent explicitement quoi faire à la machine, pas à pas. L'intelligence artificielle (IA) est une discipline scientifique visant à permettre aux machines d'être « intelligentes » : apprentissage, raisonnement logique, compréhension du langage naturel (anglais, français…). L'IA cherche à permettre aux machines à gagner en autonomie pour effectuer des tâches plus complexes. L'intelligence artificielle générative (genAI) est un sous-domaine de l'IA dont le but est de générer automatiquement des textes en langage naturel. Les réseaux de neurones sont une technologie très puissante (et gourmande en ressources) largement utilisée dans l'IA.

Depuis 2017-2018, les grands modèles de langage (LLM) utilisent des (grands, très grands) réseaux de neurones pour comprendre du langage naturel, répondre à des questions ou générer du texte (genAI). Le texte écrit par un humain pour interagir avec le LLM est appelé prompt. Pour apprendre le langage et des connaissances, les LLM sont gavés de tonnes de données disponibles sur Internet (dont évidemment WP). Les LLM n'ont pas d'estimation de la valeur de vérité ou véracité de ce qu'ils répondent : ils répondent grosso modo ce qui est le plus probable parmi les textes sur lesquels leur apprentissage s'est fondé. Le LLM invente donc : parfois c'est juste, parfois c'est faux — on parle alors d'hallucination.

Pour en savoir plus, lire cet article sur Le Monde.

Ils fleurissent sur l'encyclopédie et le printemps n'y est pour rien. Les textes générés par IA sont de plus en plus nombreux sur les articles de Wikipédia à mesure que l'usage de l'IA générative se démocratise. Pour Pa2chant.bis, cet usage wikipédien se fait « en l'absence de recommandation », ce qui a pour conséquence de rendre « très lourd et coûteux en temps de démontrer des abus » et risque de démotiver les contributeurs qui se consacrent à ces vérifications.

Julien indique à ce propos qu'il est « difficile d'anticiper les usages qui seront faits des LLM. Mais c'est potentiellement un game changer pour WP », qui peut au choix « devenir un dépôt de connaissances approximatives via des masses de textes mal comprises ou un facilitateur de rédaction ».

« C'est l'avenir de Wikipédia qui se joue »

Pa2chant.bis n'y va pas par quatre chemins : « C'est l'avenir de Wikipédia qui se joue. » Les enjeux et les risques de ces nouvelles pratiques sont déjà connus : « outre les potentielles atteintes au droit d'auteur, on peut citer les problèmes de fiabilité de l'information de type absence ou détournement de source, les TI et les problèmes de style. »

La majorité des usages observés ne résistent pas aux vérifications et affichent différents problèmes qui pourraient être évités si la contribution était 100 % humaine. C'est notamment le cas des traductions automatiques, des synthèses de sources multiples, de l'identification de sources, etc.

Des usages problématiques, Pa2chant.bis en a vu quelques exemples surprenants. Par exemple, dans une page Wikipédia sur une maladie, indiquer aux parents que même traitée, elle peut être mortelle, alors qu'aucune source n'a été trouvée dans ce sens. Dans l'article 'Ndrangheta (la mafia calabraise), une famille dont le nom est parfaitement inconnu des sources a été désignée comme étant influente. Dans un autre article étaient indiqués des liens familiaux entre deux personnes, liens imaginaires sourcés avec un blog généré par IA. Les abus peuvent d'une envergure encore supérieure, comme les interventions mêlant TI, IA et vandalismes sur une profusion d'articles dédiés aux quasars : alors que le projet:Astronomie compte peu de membres, et encore moins de spécialistes de ce sous-domaine, cela va exiger d'utiliser WP:TNT.

« L'IA, on l'utilise depuis super longtemps »

Julien rappelle que les traductions automatiques relèvent de l'IA, et plus récemment de l'introduction des LLM. Or, « la communauté semble ok avec cette utilisation de l'IA », quand bien même Julien en est lui-même critique. Concernant les LLM, « des utilisateurs ont développé et rendu compte de pratiques plus avancées (Projet:Observatoire des IA/Documentation, Utilisateur:Global Donald/Création d'article via ChatGPT 4o et comparaison des prompts, Utilisateur:Nanoyo88/testIA…) ». La question revient dès lors à se demander si la relecture et la vérification sont bien effectuées, et c'est là que ça coince. Comme pour les traductions automatiques à la chaîne, les textes générés par IA augmentent la quantité de travail de vérification pour la communauté.

Il y a également des usages de LLM qui pourraient être utiles à l'automatisation de certaines opérations de maintenance sur Wikipédia. « Sur les projets sportifs (basket, foot, foot US), c'est toujours relou quand un joueur change de club : il faut rajouter des catégories, changer des palettes, mettre à jour l'infobox… Not fun. J'ai dans ma todo list le développement d'un outil automatique de mise à jour quand un joueur change de club, avec l'usage d'un LLM. » Les LLM pourraient également être utilisés afin de lutter contre le vandalisme, voire même contre les mésusages de LLM !

Une lutte contraignante

Dernièrement, un tracker a été mis en place par Julien sur la base du signalement, par Pa2chant.bis, de sources comportant un paramètre UTM lié à ChatGPT. Cette longue liste n'est que la partie émergée d'une analyse en profondeur nécessaire et dans laquelle il faut comparer les sources présentées et les informations ajoutées.

Afin de pouvoir rapidement identifier ce type d'ajout, un filtre anti-abus a été créé par Aelxen. « Le filtre consiste à détecter les insertions d'URL contenant un paramètre UTM provenant de ChatGPT. Actuellement, il est uniquement utilisé pour récupérer des statistiques. À terme, il pourrait permettre d'insérer un message d'avertissement lors de la publication des modifications. »

« Des détecteurs insuffisamment fiables »

Actuellement, on peut difficilement s'appuyer uniquement sur des outils de détection et éléments techniques pour identifier les usages de textes générés par IA avec fiabilité. « Ces outils sont imparfaits, explique Julien : les LLM sont des machines probabilistes donc il y a des risques de faux-positifs. Les études qui essaient de mesurer les faux positifs divergent pas mal et s'appuient sur des textes en anglais, donc il faut prévoir une décote pour le français. »

Aelxen et Pa2chant.bis jugent également la fiabilité de ces détecteurs insuffisante. Pour Pa2chant.bis, « le plus performant détecteur trouve en français un nombre impressionnant de probables faux-positifs » et Julien souligne une observation surprenante d'Esprit Fugace : il y a des faux positifs lorsque le contenu est rédigé « par des personnes neuroatypiques dont le style rédactionnel diffère » de la norme.

Sur les possibilités techniques, Aelxen suggère que « des outils semi-automatiques pourraient être envisagés pour aider à l'analyse, par exemple en signalant des passages suspects ou en identifiant des modèles d'écriture caractéristiques de l'IA ». Mais Julien considère que c'est « sans issue parce que les LLM s'aguerrissent et les méthodes de détection sont toujours en retard. Il est possible que le contenu genAI devienne rapidement indiscernable par un œil humain comme par un détecteur ».

« Ils voient surtout le verre à moitié plein sans voir le verre à moitié vide »
Mésusages de l'IA :
comment aider ?

Pour donner un coup de main sur le sujet, plusieurs possibilités. Vous pouvez participer à l'élaboration de la future recommandation ainsi qu'au sondage associé. La vérification des quelque 170 insertions de sources via ChatGPT peut également vous intéresser. De bonnes âmes sont aussi nécessaires pour l'analyse et le traitement de 284 + 400 sites générés par IA utilisés comme sources sur Wikipédia.

Enfin, si vous rencontrez des textes que vous soupçonnez d'être générés par IA et qui contreviennent aux PF, vous pouvez les signaler sur Projet:Observatoire des IA/Contrôle.

Votre aide est précieuse !

Identifier les textes générés par IA et leurs problèmes n'est pas chose aisée. Pa2chant.bis témoigne de sa pratique, indiquant que cela se fait « au hasard des analyses de créations d'articles, des relectures et de la patrouille ». Les mauvais usages possèdent plusieurs marqueurs tels que le style stéréotypé et souvent laudatif, le plan caractéristique et les détournements de sources par hallucination — « et là, c'est beaucoup plus long à identifier ».

Le second problème est qu'il est particulièrement complexe de faire comprendre aux utilisateurs d'IA, novices ou expérimentés, les problèmes de leurs contributions. Pa2chant.bis a l'impression « qu'ils voient surtout le verre à moitié plein (leurs prompts sont de plus en plus précis et performants, et le niveau de réponse des IA s'améliore) sans voir le verre à moitié vide (les erreurs, le langage stéréotypé et les traductions parfaites en mot à mot, mais porteuses de contresens, non-sens ou inventions) ».

Malheureusement, l'utilisation abusive de l'IA reste très tentante car elle est en mesure de produire des textes d'apparence robuste, auxquels il est aisé pour les contributeurs de faire confiance, en ayant la fausse impression d'avoir maitrisé un sujet. À cela s'ajoute la culture historique de Wikipédia « selon laquelle l'encyclopédie est en construction, les erreurs ne sont pas trop graves et finiront bien par être corrigées un jour » ainsi que le sentiment que refuser l'usage de l'IA relève « d'une forme de passéisme, ou d'une attitude rétrograde vis-à-vis des progrès technologiques ».

Vers la mise en place d'une recommandation

Le , Pa2chant.bis tirait une nouvelle fois la sonnette d'alarme, soulevant une nouvelle pratique consistant à sourcer des contenus, ou générer des contenus sourcés, par le biais de l'IA. Cette situation le pousse alors à inviter la communauté à se pencher sur un passage à l'état de recommandation d'un texte encadrant l'usage des IA. L'idée a été très bien accueillie et un sondage est en préparation. Deux versions existent actuellement, un essai élaboré depuis plusieurs mois et une contre-proposition simplifiée par LD.

Cependant, établir une recommandation présente plusieurs contraintes car elle a vocation à établir des lignes directrices à suivre dans la contribution. LD nous rappelle qu'elles doivent donc « répondre aux attentes et interrogations les plus courantes, tout en véhiculant un « savoir-faire » concret ».

« Elle doit être claire, non contradictoire avec les autres normes et permettre un ajustement progressif »

Le plus complexe est de produire une recommandation « claire, non contradictoire avec les autres normes (principes, règles, recommandations) et permettre un ajustement progressif ». Ce dernier élément est nécessaire afin de pouvoir répondre aux éventuelles évolutions législatives. En effet, l'IA générative pose la question de la propriété intellectuelle, dans la mesure où « les textes générés [peuvent provenir] de textes régis par le droit d'auteur et [où] ces générations [pourraient être] considérées comme également soumises au droit d'auteur (et/ou sont considérées comme des œuvres dérivées ou collectives) ».

Cette future recommandation ne supplantera donc pas les recommandations déjà existantes. LD évoque le propos de @Cosmophilus à ce sujet en soulignant que « le mauvais usage de l'IA se caractérise par la violation d'un principe ou d'une norme déjà définie, telle que WP:DA, WP:V, WP:STYLEetc. ». Aussi le but n'est-il pas de répéter le corpus réglementaire mais de donner des indications pour « se concentrer sur l'application de ces normes dans le cadre de l'IA ».

Si la communauté démontre une certaine hostilité à l'égard des contenus générés par IA et le démontre au travers de précédents sondages, il ne semble pas que l'on se dirige vers une interdiction stricte de son usage. Il est d'ores et déjà complexe de le démontrer.

Face à ces nouvelles pratiques, comme l'écrit LD, le mot d'ordre pourrait bien être de « rester guidé par le bon sens et le discernement ».

L'agenda

Le wik’hit-parade

Articles les plus vus en
No  Article Av. Vues Image Remarques
1 Émilie Dequenne B 1 608 141 Cette actrice belge, lauréate du prix d'interprétation féminine du Festival de Cannes pour Rosetta et du César de la meilleure actrice dans un second rôle pour Les choses qu'on dit, les choses qu'on fait, est décédée le des suites d'un cancer des surrénales à l'âge de 43 ans.
2 Elon Musk B 447 151 Cet homme d'affaires américain est très présent dans l'actualité depuis la réélection à la présidence des États-Unis de Donald Trump (no 9) qui l'a nommé à la tête d'un tout nouveau département de l'Efficacité gouvernementale.
3 Leïla Bekhti Bon début 430 921 Cette actrice française tient le premier rôle dans Ma mère, Dieu et Sylvie Vartan, sorti en salles en France le .
4 Herbert Léonard Bon début 417 692 Ce chanteur français, qui s'est fait connaître dans les années 1980 avec des tubes comme Pour le plaisir ou Quand tu m'aimes, est décédé le à l'âge de 80 ans.
5 Jean-Louis Debré Bon début 344 587 Cet homme politique français, ancien ministre de l'Intérieur, président de l'Assemblée nationale et président du Conseil constitutionnel, est décédé le , lui aussi à l'âge de 80 ans.
6 Adolescence (série télévisée) Bon début 337 219 Cette mini-série britannique, conçue par Jack Thorne (photo), a rencontré un grand succès à sa sortie sur Netflix, le . Elle aborde des sujets d'actualité (le cyberharcèlement, la culture incel, la radicalisation en ligne…) sous une forme inhabituelle (chaque épisode se compose d'un unique plan-séquence).
7 Claude Malhuret Bon début 310 362 Ce sénateur français, ancien président de Médecins sans frontières et cofondateur du site Doctissimo, a prononcé le 5 mars devant le Sénat un discours très remarqué en France et à l'international contre la politique menée par le président des États-Unis Donald Trump (no 9).
8 Michel Ferracci Bon début 302 884 Cet acteur français était le mari d'Émilie Dequenne (no 1).
9 Donald Trump B 297 837 Depuis sa réélection à la présidence des États-Unis en novembre dernier, cet homme d'affaires défraie constamment la chronique par ses décisions aussi nombreuses que controversées. Le mois de voit ainsi la déportation de détenus vénézuéliens au Salvador, le début du démantèlement du département de l'Éducation et la menace de l'instauration de droits de douane draconiens.
10 Olivier Giroud B 278 711 Ayant annoncé sa retraite internationale en , le footballeur français, champion du monde en 2018, a été ovationné par le Stade de France le avant le match France-Croatie comptant pour la Ligue des nations de l'UEFA 2024-2025.
11 Michael Olise Bon début 269 396 Ce footballeur français inscrit son premier but sous le maillot de l'équipe de France lors de ce même match France-Croatie du 23 mars.
12 Olympe de Gouges B 261 523 Cette pionnière française du féminisme est le sujet du téléfilm Olympe, une femme dans la Révolution, diffusé le 3 mars sur la chaîne France 2.
13 France AdQ AdQ 251 529 Le pays qui compte le plus grand nombre de francophones figure régulièrement parmi les articles les plus vus de Wikipédia en français.
14 Cyril Hanouna B 249 540 L'ancien animateur vedette de C8 poursuit la diffusion de son émission controversée Touche pas à mon poste ! sur Internet après la fermeture de la chaîne, le .
15 Carême B 239 339 Cette période du calendrier chrétien correspondant aux 40 jours précédant Pâques a commencé cette année le .
16 Gene Hackman Bon début 238 685 Figure de proue du Nouvel Hollywood, récompensé par deux Oscars et quatre Golden Globes, l'acteur américain a été retrouvé mort à son domicile de Santa Fe le avec son épouse Betsy Arakawa (en). Les résultats de l'enquête ont été publiés le .
17 Emilia Pérez Bon début 237 090 Cette comédie musicale sur un chef de cartel mexicain interprété par Karla Sofía Gascón (photo) qui change de sexe pour changer de vie a reçu sept récompenses lors des César, le , mais ses treize nominations aux Oscars ne se sont traduites que par deux victoires le .
18 Décès en mars 2025 Ébauche 233 582 Comme l'illustrent les numéros 1, 4, 5 et 16, la mort d'une personnalité entraîne presque systématiquement un pic de fréquentation de son article.
19 Jacques Audiard Bon début 227 677 Réalisateur du no 17, qui lui a valu le César de la meilleure réalisation.
20 Volodymyr Zelensky B 219 818 Alors que la guerre russo-ukrainienne se poursuit, le président ukrainien s'est rendu à Washington le pour une rencontre particulièrement houleuse avec Donald Trump (no 9).

Méthodologie : sur le modèle du Top 25 Report de Wikipédia en anglais, ce wik'hit-parade reprend les données fournies par l'outil « Pages les plus vues ». Sont exclues les entrées clairement aberrantes comme Cookie (informatique) ou Soudan du Sud, dont le nombre de visites élevé n'est pas le fruit d'un véritable intérêt des internautes : elles se distinguent par un taux très faible (moins de 5 %) ou au contraire très élevé (plus de 95 %) de consultations sur mobile.

Les autres infolettres

La page Wikipédia:RAW/Découvrir recense les infolettres et blogs relatifs à Wikimedia.

En plus de RAW, vous pouvez lire le Wikimag, newsletter hebdomadaire de la Wikipédia francophone (Voir le dernier numéro semaine 13), l'infolettre Wikifier la science (voir hiver 2024) et les Actualités mensuelles du Wiktionnaire (mars 2025).

Les anglophones peuvent aussi lire The Signpost, publié toutes les deux semaines, la newsletter hebdo de la communauté Wikidata (voir ici d:Wikidata:Status updates/2025 02 24) ou encore la newsletter du projet Wikifunction (wikifunctions:Wikifunctions:Status updates/2025-01-15).

Courrier du lectorat

Il nous fera plaisir de lire les messages déposés ici et, si nécessaire, d'y répondre dans les plus brefs délais.

  • bonjour, bravo pour ce numero. A propos du bouquin sur wikipedia qui va sortir on connait le nom reel de l'auteur mais comment on connait le nom d'utilisateur à celui de l'auteur? Et on a le droit de le dire? Ce serait pas du Wikipédia:Doxxing à l'envers? A moins que ce soit un poisson du 1er avril auquel cas je me suis bien fait attraper... --Sergent Cool (discuter) 1 avril 2025 à 09:19 (CEST)
    Bonjour @Sergent Cool. Ce n'est pas un poisson d'avril, ni du doxxing à l'envers : l'utilisateur est intervenu dans la presse successivement sous le nom de « Michel », « Michel wiki » et « Michel Sandrin » (peut-être un pseudonyme, d'ailleurs ?), en évoquant son « bannissement » (blocage indef, en fait), si bien que les wikipédiens ont fait le lien sans difficulté. — Jules* 💬 1 avril 2025 à 12:28 (CEST)
  • Bonjour Émoticône à tous et merci pour ce travail ! Je suis honoré de me découvrir nommément cité dans vos lignes (par @LD), quelle agréable surprise ! Tout ceci dans le cadre d'un débat ô combien actuel, qui plus est… C'est l'occasion de saluer la réflexion et les efforts ayant mené à ce numéro, et, plus généralement, la mise en lumière continuelle du travail collaboratif wikimédien dans les pages de ce magazine (dont je suis un lecteur assidu), tâche qui ne doit pas être aisée. Félicitations ! --Cosmophilus (discuter) 2 avril 2025 à 22:30 (CEST)

Renouveau — content de voir des forces vives travailler à l'évolution des RAW. Un merci particulier à Jules* pour son focus.
longue vie à la nouvelle rédaction! - Simon Villeneuve 3 avril 2025 à 12:42 (CEST)

Merci à tous les trois, @Sergent Cool, @Cosmophilus et @Simon Villeneuve, pour vos retours, c'est encourageant Émoticône sourire. — Jules* 💬 3 avril 2025 à 12:46 (CEST)
Un numéro intéressant. Émoticône — Cantons-de-l'Est p|d|d 🧹 4 avril 2025 à 00:37 (CEST)
Citations originales
Notes
Références
  1. Nicolas Gastineau, « Propos d’un patrouilleur de Wikipédia », sur Revue21.fr, (consulté le )
  2. « Pourquoi la droite américaine s’attaque-t-elle à Wikipédia? », sur ici.radio-canada.ca (consulté le )
  3. « Wikipédia, la méticuleuse fabrique du savoir », La Croix,‎ (ISSN 0242-6056, lire en ligne, consulté le )
  4. « Attaques contre Wikipédia : ce contributeur nous explique comment fonctionne l'encyclopédie libre et partagée », sur France 3 Grand Est, (consulté le )
  5. « Wikipedia : comment les contributions sont-elles contrôlées ? », sur France Culture, (consulté le )
  6. David Dufresne Euryale, « Wikipédia: qui veut sa peau (et pourquoi)? », sur Au Poste, média indépendant 100% Live & Libre, (consulté le )
  7. « Les outils d’IA comme ChatGPT ou Gemini utilisent des sites de propagande russe comme sources », Le Monde,‎ (lire en ligne, consulté le )
  8. Brice Laemle, « « Factuel », un nouveau média en ligne parrainé par Christine Kelly et Dominique Rizet », Le Monde,‎ (lire en ligne)
  9. « La Face cachée de Wikipédia », sur éditions du Cerf (consulté le ).
  10. Cet article a été partagé et discuté sur la page de discussion du Projet:Antipub.
  11. Comme le montre l'outil Search Engine Referrals.
  12. Le quotidien Le Monde y a aussi consacré un article.
  13. Lire à ce sujet ce billet sur le site du Comité européen de la protection des données.

Numéro du 19 avril 2025

Saturday, 19 April 2025 00:00 UTC

L'édito — Les réflexions sur la modernisation de cette wikilettre se poursuivent. Dans ce cadre, nous aimerions créer de nouvelles rubriques. Vos suggestions sont les bienvenues en salle de rédaction : dites-nous ce que vous aimeriez lire dans les RAW, ou ce que vous voudriez y écrire !

C'est dans cette perspective que nous lançons un premier appel à commentaires afin de co-rédiger un futur dossier relatif à la possibilité de modifier Wikipédia sans créer de compte (actuellement sous IP, prochainement sous compte temporaire).

Bonne lecture !

Les brèves

Contributions de Jules*, Nanoyo88, Pyb en résidence, Trizek

Échos francophones

Les contributeurs à l'honneur dans les médias — La revue de presse wikipédienne est encore une fois très riche en mars 2025, mais elle voit surtout la mise à l'honneur de nombreux contributeurs tels que Le chat perché (d · c · b) sur XXI[1], Simon Villeneuve (d · c · b) sur Ici Radio-Canada[2], C.Salviani (d · c · b) dans La Croix[3], Lyokoï (d · c · b) sur France 3 Champagne-Ardenne[4] et d'autres sur France Culture[5] ou dans l'émission de David Dufresne[6]. Des interventions remarquables et remarquées !

2033 – Adieu joli wiki ? — Une projection de régression linéaire basée sur les données Google Trends laisse entendre que l'intérêt et l'utilisation continuera de décroître, menant Wikipedia à cesser d'exister le au profit des LLM. A-t-on oublié de préciser le caractère humoristique de cette brève Émoticône ?

Wikipédia / Le Point : clôture de la lettre ouverte et réponse aux mises en demeure — Dans le dernier numéro des RAW, nous vous parlions de la controverse opposant le magazine français Le Point à Wikipédia en français. La lettre ouverte a été close le . En trois semaines, elle a rassemblé 1 155 signatures de contributeurs de notre wiki ou d'autres. Aelxen a compté que le cumul des contributions des signataires sur la seule version francophone s'élevait à environ 22 900 000, soit environ 10 % du total des modifications effectuées sur l'encyclopédie depuis sa création.

Parmi les signatures, celle du co-fondateur de Wikipédia, Jimmy Wales, le , n'est pas passée inaperçue. La directrice du service Trust & Safety de la Fondation Wikimédia (WMF), Maggie Dennis, a également publié un message de soutien en page de discussion.

Le Point a cessé ses publications hostiles à Wikipédia, après une série de neuf articles en onze jours — du jamais vu. Les avocats du magazine ont en revanche adressé une deuxième mise en demeure à la WMF, dans laquelle ils maintiennent leurs demandes de censure de l'article Le Point, en dépit des améliorations apportées par la communauté, et dans laquelle ils qualifient la lettre ouverte de « diffamatoire ».

C'est ce que nous avons appris au détour d'un message incisif publié sur le Bistro par Phil Bradley-Schmieg au nom du service juridique de la WMF. Ce dernier indique clairement ne pas donner suite aux exigences éditoriales du Point et soutenir la lettre ouverte. Plus encore, il souligne, après avoir regretté l'absence d'excuses de la part du magazine, les « graves erreurs et malentendus » que contient la première mise en demeure. Non sans un brin de causticité, le service juridique indique avoir « proposé d'expliquer le fonctionnement de Wikipédia au Point et à ses avocats ». À suivre.

Au Comité d'arbitrage, un élu esseulé — Le CAr n'a pas terminé de casser des claviers sous de douces mélodies un peu naïve de refonte. Les élections de mars 2025 s'achèvent avec l'élection d'un arbitre. Mais concrètement, que se passera-t-il ensuite ? Ce qui est certain, c'est que le quorum de trois arbitres minimum n'est pas rempli pour relancer le CAr. Peut-être serait-ce l'occasion d'engager le processus de déconstruction et de création d'un nouvel organe tel que suggéré par plusieurs contributeurs dans les votes et discussions ? La communauté semble en effet attachée à l'existence d'un organe type CAr, comme en témoignent cette élection et, précédemment, le refus répété (2016, 2018, 2021) de dissoudre le CAr sans instance pour le remplacer.

Coups de griffes — Un conflit oppose la cabale féline et d'autres bénévoles, excédés par la profusion d'images de chats sur le Bistro. Les tensions se sont envenimées à la suite d'une proposition de passage en recommandation de la page Wikipédia:Ne mordez pas les chats, jugée discriminante à l'égard des poissons-chats. Plusieurs RA ont été déposées en mars, mais n'ont toujours pas été traitées ; un contributeur, soupçonnant les administrateurs de partialité, a réclamé qu'ils indiquent s'ils portent ou non la moustache. C'est en tout cas ce que rapporte le magazine français La Virgule qui, renseigné par un certain « Marcel Wiki » et faisant état des accusations lapidaires d'un concessionnaire automobile qui jouit d'une certaine notoriété outre-Atlantique, s'inquiète d'une dérive ailurophile de l'encyclopédie. Sur le Bistro, des commentateurs avisés ont jugé que cet article faisait fausse route : « On sait tous ici que le vrai désaccord dans la communauté porte en ce moment sur la nécessité ou non de capitaliser le nom des modèles dans le wikicode ! »

Attention à la désinformation russe — Des rapports indiquent que des fermes de contenus produisant de la désinformation russe sont utilisés sur Wikipédia[7]. Peu nombreux sur la version francophone et effectués de bonne foi, ces ajouts sont le fait de contributeurs avertis de la communauté ; la situation est semble-t-il différente sur d'autres versions linguistiques de Wikipédia.

Un livre sur Wikipédia... écrit par un utilisateur bloqué — En , l'éphémère média français d'extrême droite Factuel[8], au détour d'un article commenté sur le Bistro, annonçait un ouvrage à paraître en 2024 consacré à Wikipédia. Son auteur ? Un certain Michel1961 (d · c · b), bloqué indéfiniment en 2021 (notamment pour comportement non collaboratif, détournement de sources, rameutage et POV-pushing) et régulièrement cité dans des articles de presse sensationnalistes en 2020 (où des contributeurs expérimentés sont accusés d'être « islamo-conciliants »), 2021, 2023, février et mai 2024. L'ouvrage, annoncé dès 2023, paraît en aux éditions du Cerf sous le titre La face cachée de Wikipédia : Enquête sur les dérives de l'encyclopédie libre[9]. Cosigné par Victor Lefebvre, ancien journaliste au Figaro et à Factuel, l'ouvrage de 216 pages prétend apporter « une réponse argumentée et dépassionnée » à la question de savoir si l'encyclopédie est devenue « Wokipedia » comme allégué par Elon Musk. La réponse est donnée au dos de l'ouvrage : « Le pouvoir de nuisance d'une petite poignée d'utilisateurs ouvertement militants - pour ne pas dire woke - tend à se renforcer. »

L'actu technique

Nouvel aperçu de l'outil de traduction

L'outil de traduction évolue — L'équipe de Localisation de la langue et des produits a amélioré le Tableau de bord de traduction de contenu en intégrant des fonctionnalités de personnalisation de suggestions et en améliorant l'accessibilité du tableau de bord.

D'où viennent et où vont les lecteurs d'un article ? — L'outil Wikinav permet de répondre à ces questions. En plus de mettre en évidence que la majorité des consultations viennent des moteurs de recherche, l'analyse de l'article Elon Musk (le plus consulté en ) montre ainsi que l'article de Wikipédia par lequel le plus grand nombre de lecteurs arrivent est celui de son ex-compagne Grimes et celui le plus consulté consécutivement est celui de sa compagne actuelle, Shivon Zilis. Les clics entrants depuis ou sortants vers le département de l'Efficacité gouvernementale (DOGE) n'arrivent respectivement qu'en dixième et sixième positions. La vie privée avant la politique.

Dans le mouvement

Le logo de Wikipédia, en allemand, avec la mention « 3 Millionen Artikel ».
Et de trois !

Trois millions d'articles sur Wikipédia en allemand — C'est le seuil franchi par la version germanophone de Wikipédia le . Troisième plus grosse version linguistique en nombre d'articles, elle devance la version francophone, selon la liste des wikis. Il existe toutefois de nombreux autres indicateurs pour comparer les versions linguistiques, dont la profondeur, qui valorise le nombre d'éditions par article et le nombre de pages autres que les articles — en classant les wikis avec cet indicateur, la version francophone arrive en dix-neuvième position (loin devant la version germanophone). Pour en revenir au seuil symbolique de trois millions d'articles, les paris sur la date à laquelle Wikipédia en français l'atteindra sont toujours ouverts.

Une militaire américaine en train de se faire peindre la joue aux couleurs du drapeau LGBT.
Exemple de photo retirée.

Suppression de contenus de l'armée américaine — Le département de la Défense des États-Unis a récemment appliqué une décision présidentielle mettant fin aux politiques Diversité, équité et inclusion (DEI). Cela s'est traduit notamment par la mise hors ligne de beaucoup de contenus multimédia. Associated Press a récupéré une base de données de 26 000 photos concernées par la censure. Wikimedia Commons héberge de nombreuses photos de l'armée américaine, entre 10 et 20 % des 5 millions de photos stockées sur DVIDS, la médiathèque du départ de la Défense. Don-vip (d · c · b) poursuit l'import en masse des photos, que  (d · c · b) avait débuté. Une catégorisation des photos supprimées est en cours ainsi que l'import des vidéos manquantes, projet initié par Mvolz (d · c · b). Une fois ce travail de catégorisation réalisé, il sera possible d'extraire les données pour les mettre sur data.gouv.fr par exemple afin de permettre aux chercheurs et associations d'étudier les contenus retirés. Ce travail n'est pas sans soulever des questions éthiques auxquelles l'armée américaine a été confrontée en 2021 en procédant à un retrait massif de photos d'Afghans afin de les protéger des talibans.

Renforcer la neutralité de point de vue de Wikipédia — La Fondation Wikimédia a récemment mis en évidence des tendances essentielles et prioritaires pour le mouvement, à travers des conversations avec les communautés. Cette année, une tendance qui a suscité de nombreuses discussions au sein et au-delà du mouvement Wikimédia concerne la neutralité : la baisse de confiance dans les informations en ligne et la fragmentation du consensus sur la véracité des informations. Il s'avère que la manière dont le principe de neutralité de point de vue se traduit varie d'un projet Wikimédia à l'autre, ce qui met en évidence la possibilité pour les communautés d'apprendre les unes des autres et d'explorer si des normes mondiales communes de neutralité peuvent mieux protéger les projets (et les bénévoles) dans un environnement de menaces accrues et de réglementation croissante. Pour soutenir les communautés Wikimédia et réaffirmer notre engagement en faveur de la neutralité, la Fondation Wikimédia réunira un groupe de travail composé de contributeurs actifs, de membres du CA de la Fondation, de chercheurs et de conseillers afin d'étudier des recommandations de normes communes pour les politiques NPOV qui peuvent protéger Wikipédia, accroître l'intégrité des projets et fournir davantage de soutien aux bénévoles chargés d'administrer ces politiques. Pour en savoir plus, rendez-vous sur Diff, le blog hébergé par la Fondation à propos du mouvement.

Verrouillages globaux massifs — Le , la WMF a entrepris le verrouillage global de plus de 35 000 comptes (liste) compromis (mots de passe divulgués, vraisemblablement). Dans le communiqué qu'elle a publié quelques jours après, elle indique que cela fait suite à la découverte d'« un schéma de connexions inhabituelles à des comptes enregistrés », qui résulterait d'une fuite de données depuis un autre site web incluant des mots de passe, utilisés aussi sur Wikipédia. Un bon rappel de la nécessité de ne pas utiliser un même mot de passe sur plusieurs sites web, et l'occasion de lire ou relire Aide:Sécurité des comptes utilisateur.

Focus

RAW encourage les membres de la communauté à s'exprimer sur différents enjeux liés à l'écosystème Wikimedia. N'hésitez pas à proposer vos textes pour cette section. N'hésitez pas non plus à réagir dans la section du courrier du lectorat.

À la recherche des articles disparus de Google
par Jules*

Certains articles de Wikipédia sont déréférencés par Google. Combien ? Les déréférencements sont-ils légitimes ? C'est le grand flou.

Le Canard enchaîné publie une enquête qui vous déplaît ? Oubliez le communiqué de presse et la plainte pour diffamation. Le problème, ce n'est pas l'article : c'est le fait qu'il soit lu ! Et s'il était possible de le faire disparaître de Google ? Improbable ? C'est pourtant ce qui s'est passé, nous raconte Thibaut Schepman dans un article paru en janvier dernier dans La Revue des médias, éditée par l'Institut national de l'audiovisuel (INA)[10]. La méthode employée par les malandrins est la suivante : signaler à Google une violation des droits d'auteurs en affirmant que l'article de presse est un plagiat d'une page web, antidatée. Derrière la mésaventure vécue par une journaliste du Canard enchaîné se cache une véritable industrie du déréférencement indu, nous apprend Thibaut Schepman.

Si Google a rétabli le référencement de l'article du Canard enchaîné, est-il possible que Wikipédia soit également victime de telles manœuvres ? La question n'est pas anodine. La plupart des consultations de Wikipédia proviennent des moteurs de recherche, et parmi ceux-ci, Google est en position de quasi-monopole[11]. Un article Wikipédia déréférencé de Google, c'est donc probablement un article qui ne sera quasiment plus lu.

De la lumière mais pas trop

Pour savoir ce qu'il en est, première étape, la plateforme Lumen. Elle permet de consulter les demandes de déréférencement adressées à Google pour divers motifs : violation des droits d'auteurs, diffamation, droit à l'oubli... Mais les notices, dont la consultation n'est pas aisée, n'indiquent pas l'issue de ces demandes. Nous ne sommes guère éclairés.

De son côté, la Fondation Wikimédia (WMF) a commencé en 2014 à publier les notifications de déréférencement qu'elle recevait de Google (dont plusieurs dizaines pour Wikipédia en français). À l'époque, la WMF s'est émue de cette censure, motivée par le droit à l'oubli, dans un billet de blog en anglais[12].

Récemment, l'auteur de ces lignes a eu vent du déréférencement d'un article de Wikipédia en français par Google. Le déréférencement a-t-il été effectué au nom du droit à l'oubli ? Ou bien par une méthode retorse comme celle mise en lumière par La Revue des médias ? Aucune idée : aucun résultat sur Lumen avec le titre de l'article, et pas de notice relative sur la page tenue à jour par la WMF.

RGPD à la suédoise

Renseignement pris auprès du service juridique de la WMF, Google envoie depuis quelques années des notifications de déréférencement dépourvues de l'URL du contenu déréférencé (exemple) et donc parfaitement inutiles. Surprenant. Ce changement découle en fait d'une décision prise en 2020 par l'Autorité suédoise pour la protection de la vie privée, sur le fondement du règlement général sur la protection des données (RGPD). Elle a estimé qu'en fournissant l'URL du contenu déréférencé dans ses notifications, Google permettait à leur destinataire de republier les contenus litigieux sous une autre URL, et donc de bafouer le droit à l'oubli[13]. Exit les URL.

Tout au plus la WMF continue-t-elle de recevoir des notifications précises quand le requérant est situé hors Union européenne ; on sait ainsi que l'article Fusillade de l'université d'Eskişehir Osmangazi a disparu de certaines recherches Google en raison de la législation turque — sans plus de précision.

On ignore d'ailleurs si la WMF reçoit systématiquement une notification de Google en cas de déréférencement. En tout état de cause, la liste des notifications relatives à Wikipédia en français n'évoque aucun déréférencement pour violation des droits d'auteurs — c'est en revanche le cas pour Wikipédia en anglais, comme le relèvent nos confrères du Signpost.

S'agissant du droit à l'oubli, s'il est légitime de chercher un équilibre entre droit à l'information et droit au respect de la vie privée, il apparaît contestable qu'une entreprise privée, en l'espèce Google, puisse opérer sans aucune transparence le déréférencement d'articles.

Le dossier du mois

Dans cette section, le magazine aborde un sujet qui a fait beaucoup réagir à l'intérieur de la communauté, voire à l'extérieur.

Le bouleversement annoncé des pratiques par l'IA générative
par Nanoyo88

Cet article repose sur quatre interviews que vous pouvez consulter dans leur version complète.

Lors de précédentes éditions, nous avons régulièrement abordé le sujet de l'IA générative (genAI), ses implications et conséquences pour Wikipédia. Nous aimerions prendre le temps, au travers d'un dossier et d'interventions de quatre contributeurs, d'approfondir le sujet. Pa2chant.bis, LD, Aelxen et (:Julien:) analysent les usages de l'IA et les problèmes qu'ils engendrent ; ils discutent aussi de l'élaboration d'un texte pour les encadrer.

IA, genAI, LLM :
de quoi parle-t-on ?

De manière générale, les machines informatiques exécutent scrupuleusement des instructions (un programme informatique) écrites par des humains. Les humains disent explicitement quoi faire à la machine, pas à pas. L'intelligence artificielle (IA) est une discipline scientifique visant à permettre aux machines d'être « intelligentes » : apprentissage, raisonnement logique, compréhension du langage naturel (anglais, français…). L'IA cherche à permettre aux machines à gagner en autonomie pour effectuer des tâches plus complexes. L'intelligence artificielle générative (genAI) est un sous-domaine de l'IA dont le but est de générer automatiquement des textes en langage naturel. Les réseaux de neurones sont une technologie très puissante (et gourmande en ressources) largement utilisée dans l'IA.

Depuis 2017-2018, les grands modèles de langage (LLM) utilisent des (grands, très grands) réseaux de neurones pour comprendre du langage naturel, répondre à des questions ou générer du texte (genAI). Le texte écrit par un humain pour interagir avec le LLM est appelé prompt. Pour apprendre le langage et des connaissances, les LLM sont gavés de tonnes de données disponibles sur Internet (dont évidemment WP). Les LLM n'ont pas d'estimation de la valeur de vérité ou véracité de ce qu'ils répondent : ils répondent grosso modo ce qui est le plus probable parmi les textes sur lesquels leur apprentissage s'est fondé. Le LLM invente donc : parfois c'est juste, parfois c'est faux — on parle alors d'hallucination.

Pour en savoir plus, lire cet article sur Le Monde.

Ils fleurissent sur l'encyclopédie et le printemps n'y est pour rien. Les textes générés par IA sont de plus en plus nombreux sur les articles de Wikipédia à mesure que l'usage de l'IA générative se démocratise. Pour Pa2chant.bis, cet usage wikipédien se fait « en l'absence de recommandation », ce qui a pour conséquence de rendre « très lourd et coûteux en temps de démontrer des abus » et risque de démotiver les contributeurs qui se consacrent à ces vérifications.

Julien indique à ce propos qu'il est « difficile d'anticiper les usages qui seront faits des LLM. Mais c'est potentiellement un game changer pour WP », qui peut au choix « devenir un dépôt de connaissances approximatives via des masses de textes mal comprises ou un facilitateur de rédaction ».

« C'est l'avenir de Wikipédia qui se joue »

Pa2chant.bis n'y va pas par quatre chemins : « C'est l'avenir de Wikipédia qui se joue. » Les enjeux et les risques de ces nouvelles pratiques sont déjà connus : « outre les potentielles atteintes au droit d'auteur, on peut citer les problèmes de fiabilité de l'information de type absence ou détournement de source, les TI et les problèmes de style. »

La majorité des usages observés ne résistent pas aux vérifications et affichent différents problèmes qui pourraient être évités si la contribution était 100 % humaine. C'est notamment le cas des traductions automatiques, des synthèses de sources multiples, de l'identification de sources, etc.

Des usages problématiques, Pa2chant.bis en a vu quelques exemples surprenants. Par exemple, dans une page Wikipédia sur une maladie, indiquer aux parents que même traitée, elle peut être mortelle, alors qu'aucune source n'a été trouvée dans ce sens. Dans l'article 'Ndrangheta (la mafia calabraise), une famille dont le nom est parfaitement inconnu des sources a été désignée comme étant influente. Dans un autre article étaient indiqués des liens familiaux entre deux personnes, liens imaginaires sourcés avec un blog généré par IA. Les abus peuvent d'une envergure encore supérieure, comme les interventions mêlant TI, IA et vandalismes sur une profusion d'articles dédiés aux quasars : alors que le projet:Astronomie compte peu de membres, et encore moins de spécialistes de ce sous-domaine, cela va exiger d'utiliser WP:TNT.

« L'IA, on l'utilise depuis super longtemps »

Julien rappelle que les traductions automatiques relèvent de l'IA, et plus récemment de l'introduction des LLM. Or, « la communauté semble ok avec cette utilisation de l'IA », quand bien même Julien en est lui-même critique. Concernant les LLM, « des utilisateurs ont développé et rendu compte de pratiques plus avancées (Projet:Observatoire des IA/Documentation, Utilisateur:Global Donald/Création d'article via ChatGPT 4o et comparaison des prompts, Utilisateur:Nanoyo88/testIA…) ». La question revient dès lors à se demander si la relecture et la vérification sont bien effectuées, et c'est là que ça coince. Comme pour les traductions automatiques à la chaîne, les textes générés par IA augmentent la quantité de travail de vérification pour la communauté.

Il y a également des usages de LLM qui pourraient être utiles à l'automatisation de certaines opérations de maintenance sur Wikipédia. « Sur les projets sportifs (basket, foot, foot US), c'est toujours relou quand un joueur change de club : il faut rajouter des catégories, changer des palettes, mettre à jour l'infobox… Not fun. J'ai dans ma todo list le développement d'un outil automatique de mise à jour quand un joueur change de club, avec l'usage d'un LLM. » Les LLM pourraient également être utilisés afin de lutter contre le vandalisme, voire même contre les mésusages de LLM !

Une lutte contraignante

Dernièrement, un tracker a été mis en place par Julien sur la base du signalement, par Pa2chant.bis, de sources comportant un paramètre UTM lié à ChatGPT. Cette longue liste n'est que la partie émergée d'une analyse en profondeur nécessaire et dans laquelle il faut comparer les sources présentées et les informations ajoutées.

Afin de pouvoir rapidement identifier ce type d'ajout, un filtre anti-abus a été créé par Aelxen. « Le filtre consiste à détecter les insertions d'URL contenant un paramètre UTM provenant de ChatGPT. Actuellement, il est uniquement utilisé pour récupérer des statistiques. À terme, il pourrait permettre d'insérer un message d'avertissement lors de la publication des modifications. »

« Des détecteurs insuffisamment fiables »

Actuellement, on peut difficilement s'appuyer uniquement sur des outils de détection et éléments techniques pour identifier les usages de textes générés par IA avec fiabilité. « Ces outils sont imparfaits, explique Julien : les LLM sont des machines probabilistes donc il y a des risques de faux-positifs. Les études qui essaient de mesurer les faux positifs divergent pas mal et s'appuient sur des textes en anglais, donc il faut prévoir une décote pour le français. »

Aelxen et Pa2chant.bis jugent également la fiabilité de ces détecteurs insuffisante. Pour Pa2chant.bis, « le plus performant détecteur trouve en français un nombre impressionnant de probables faux-positifs » et Julien souligne une observation surprenante d'Esprit Fugace : il y a des faux positifs lorsque le contenu est rédigé « par des personnes neuroatypiques dont le style rédactionnel diffère » de la norme.

Sur les possibilités techniques, Aelxen suggère que « des outils semi-automatiques pourraient être envisagés pour aider à l'analyse, par exemple en signalant des passages suspects ou en identifiant des modèles d'écriture caractéristiques de l'IA ». Mais Julien considère que c'est « sans issue parce que les LLM s'aguerrissent et les méthodes de détection sont toujours en retard. Il est possible que le contenu genAI devienne rapidement indiscernable par un œil humain comme par un détecteur ».

« Ils voient surtout le verre à moitié plein sans voir le verre à moitié vide »
Mésusages de l'IA :
comment aider ?

Pour donner un coup de main sur le sujet, plusieurs possibilités. Vous pouvez participer à l'élaboration de la future recommandation ainsi qu'au sondage associé. La vérification des quelque 170 insertions de sources via ChatGPT peut également vous intéresser. De bonnes âmes sont aussi nécessaires pour l'analyse et le traitement de 284 + 400 sites générés par IA utilisés comme sources sur Wikipédia.

Enfin, si vous rencontrez des textes que vous soupçonnez d'être générés par IA et qui contreviennent aux PF, vous pouvez les signaler sur Projet:Observatoire des IA/Contrôle.

Votre aide est précieuse !

Identifier les textes générés par IA et leurs problèmes n'est pas chose aisée. Pa2chant.bis témoigne de sa pratique, indiquant que cela se fait « au hasard des analyses de créations d'articles, des relectures et de la patrouille ». Les mauvais usages possèdent plusieurs marqueurs tels que le style stéréotypé et souvent laudatif, le plan caractéristique et les détournements de sources par hallucination — « et là, c'est beaucoup plus long à identifier ».

Le second problème est qu'il est particulièrement complexe de faire comprendre aux utilisateurs d'IA, novices ou expérimentés, les problèmes de leurs contributions. Pa2chant.bis a l'impression « qu'ils voient surtout le verre à moitié plein (leurs prompts sont de plus en plus précis et performants, et le niveau de réponse des IA s'améliore) sans voir le verre à moitié vide (les erreurs, le langage stéréotypé et les traductions parfaites en mot à mot, mais porteuses de contresens, non-sens ou inventions) ».

Malheureusement, l'utilisation abusive de l'IA reste très tentante car elle est en mesure de produire des textes d'apparence robuste, auxquels il est aisé pour les contributeurs de faire confiance, en ayant la fausse impression d'avoir maitrisé un sujet. À cela s'ajoute la culture historique de Wikipédia « selon laquelle l'encyclopédie est en construction, les erreurs ne sont pas trop graves et finiront bien par être corrigées un jour » ainsi que le sentiment que refuser l'usage de l'IA relève « d'une forme de passéisme, ou d'une attitude rétrograde vis-à-vis des progrès technologiques ».

Vers la mise en place d'une recommandation

Le , Pa2chant.bis tirait une nouvelle fois la sonnette d'alarme, soulevant une nouvelle pratique consistant à sourcer des contenus, ou générer des contenus sourcés, par le biais de l'IA. Cette situation le pousse alors à inviter la communauté à se pencher sur un passage à l'état de recommandation d'un texte encadrant l'usage des IA. L'idée a été très bien accueillie et un sondage est en préparation. Deux versions existent actuellement, un essai élaboré depuis plusieurs mois et une contre-proposition simplifiée par LD.

Cependant, établir une recommandation présente plusieurs contraintes car elle a vocation à établir des lignes directrices à suivre dans la contribution. LD nous rappelle qu'elles doivent donc « répondre aux attentes et interrogations les plus courantes, tout en véhiculant un « savoir-faire » concret ».

« Elle doit être claire, non contradictoire avec les autres normes et permettre un ajustement progressif »

Le plus complexe est de produire une recommandation « claire, non contradictoire avec les autres normes (principes, règles, recommandations) et permettre un ajustement progressif ». Ce dernier élément est nécessaire afin de pouvoir répondre aux éventuelles évolutions législatives. En effet, l'IA générative pose la question de la propriété intellectuelle, dans la mesure où « les textes générés [peuvent provenir] de textes régis par le droit d'auteur et [où] ces générations [pourraient être] considérées comme également soumises au droit d'auteur (et/ou sont considérées comme des œuvres dérivées ou collectives) ».

Cette future recommandation ne supplantera donc pas les recommandations déjà existantes. LD évoque le propos de @Cosmophilus à ce sujet en soulignant que « le mauvais usage de l'IA se caractérise par la violation d'un principe ou d'une norme déjà définie, telle que WP:DA, WP:V, WP:STYLEetc. ». Aussi le but n'est-il pas de répéter le corpus réglementaire mais de donner des indications pour « se concentrer sur l'application de ces normes dans le cadre de l'IA ».

Si la communauté démontre une certaine hostilité à l'égard des contenus générés par IA et le démontre au travers de précédents sondages, il ne semble pas que l'on se dirige vers une interdiction stricte de son usage. Il est d'ores et déjà complexe de le démontrer.

Face à ces nouvelles pratiques, comme l'écrit LD, le mot d'ordre pourrait bien être de « rester guidé par le bon sens et le discernement ».

L'agenda

Le wik’hit-parade

Articles les plus vus en
No  Article Av. Vues Image Remarques
1 Émilie Dequenne B 1 608 141 Cette actrice belge, lauréate du prix d'interprétation féminine du Festival de Cannes pour Rosetta et du César de la meilleure actrice dans un second rôle pour Les choses qu'on dit, les choses qu'on fait, est décédée le des suites d'un cancer des surrénales à l'âge de 43 ans.
2 Elon Musk B 447 151 Cet homme d'affaires américain est très présent dans l'actualité depuis la réélection à la présidence des États-Unis de Donald Trump (no 9) qui l'a nommé à la tête d'un tout nouveau département de l'Efficacité gouvernementale.
3 Leïla Bekhti Bon début 430 921 Cette actrice française tient le premier rôle dans Ma mère, Dieu et Sylvie Vartan, sorti en salles en France le .
4 Herbert Léonard Bon début 417 692 Ce chanteur français, qui s'est fait connaître dans les années 1980 avec des tubes comme Pour le plaisir ou Quand tu m'aimes, est décédé le à l'âge de 80 ans.
5 Jean-Louis Debré Bon début 344 587 Cet homme politique français, ancien ministre de l'Intérieur, président de l'Assemblée nationale et président du Conseil constitutionnel, est décédé le , lui aussi à l'âge de 80 ans.
6 Adolescence (série télévisée) Bon début 337 219 Cette mini-série britannique, conçue par Jack Thorne (photo), a rencontré un grand succès à sa sortie sur Netflix, le . Elle aborde des sujets d'actualité (le cyberharcèlement, la culture incel, la radicalisation en ligne…) sous une forme inhabituelle (chaque épisode se compose d'un unique plan-séquence).
7 Claude Malhuret Bon début 310 362 Ce sénateur français, ancien président de Médecins sans frontières et cofondateur du site Doctissimo, a prononcé le 5 mars devant le Sénat un discours très remarqué en France et à l'international contre la politique menée par le président des États-Unis Donald Trump (no 9).
8 Michel Ferracci Bon début 302 884 Cet acteur français était le mari d'Émilie Dequenne (no 1).
9 Donald Trump B 297 837 Depuis sa réélection à la présidence des États-Unis en novembre dernier, cet homme d'affaires défraie constamment la chronique par ses décisions aussi nombreuses que controversées. Le mois de voit ainsi la déportation de détenus vénézuéliens au Salvador, le début du démantèlement du département de l'Éducation et la menace de l'instauration de droits de douane draconiens.
10 Olivier Giroud B 278 711 Ayant annoncé sa retraite internationale en , le footballeur français, champion du monde en 2018, a été ovationné par le Stade de France le avant le match France-Croatie comptant pour la Ligue des nations de l'UEFA 2024-2025.
11 Michael Olise Bon début 269 396 Ce footballeur français inscrit son premier but sous le maillot de l'équipe de France lors de ce même match France-Croatie du 23 mars.
12 Olympe de Gouges B 261 523 Cette pionnière française du féminisme est le sujet du téléfilm Olympe, une femme dans la Révolution, diffusé le 3 mars sur la chaîne France 2.
13 France AdQ AdQ 251 529 Le pays qui compte le plus grand nombre de francophones figure régulièrement parmi les articles les plus vus de Wikipédia en français.
14 Cyril Hanouna B 249 540 L'ancien animateur vedette de C8 poursuit la diffusion de son émission controversée Touche pas à mon poste ! sur Internet après la fermeture de la chaîne, le .
15 Carême B 239 339 Cette période du calendrier chrétien correspondant aux 40 jours précédant Pâques a commencé cette année le .
16 Gene Hackman Bon début 238 685 Figure de proue du Nouvel Hollywood, récompensé par deux Oscars et quatre Golden Globes, l'acteur américain a été retrouvé mort à son domicile de Santa Fe le avec son épouse Betsy Arakawa (en). Les résultats de l'enquête ont été publiés le .
17 Emilia Pérez Bon début 237 090 Cette comédie musicale sur un chef de cartel mexicain interprété par Karla Sofía Gascón (photo) qui change de sexe pour changer de vie a reçu sept récompenses lors des César, le , mais ses treize nominations aux Oscars ne se sont traduites que par deux victoires le .
18 Décès en mars 2025 Ébauche 233 582 Comme l'illustrent les numéros 1, 4, 5 et 16, la mort d'une personnalité entraîne presque systématiquement un pic de fréquentation de son article.
19 Jacques Audiard Bon début 227 677 Réalisateur du no 17, qui lui a valu le César de la meilleure réalisation.
20 Volodymyr Zelensky B 219 818 Alors que la guerre russo-ukrainienne se poursuit, le président ukrainien s'est rendu à Washington le pour une rencontre particulièrement houleuse avec Donald Trump (no 9).

Méthodologie : sur le modèle du Top 25 Report de Wikipédia en anglais, ce wik'hit-parade reprend les données fournies par l'outil « Pages les plus vues ». Sont exclues les entrées clairement aberrantes comme Cookie (informatique) ou Soudan du Sud, dont le nombre de visites élevé n'est pas le fruit d'un véritable intérêt des internautes : elles se distinguent par un taux très faible (moins de 5 %) ou au contraire très élevé (plus de 95 %) de consultations sur mobile.

Les autres infolettres

La page Wikipédia:RAW/Découvrir recense les infolettres et blogs relatifs à Wikimedia.

En plus de RAW, vous pouvez lire le Wikimag, newsletter hebdomadaire de la Wikipédia francophone (Voir le dernier numéro semaine 13), l'infolettre Wikifier la science (voir hiver 2024) et les Actualités mensuelles du Wiktionnaire (mars 2025).

Les anglophones peuvent aussi lire The Signpost, publié toutes les deux semaines, la newsletter hebdo de la communauté Wikidata (voir ici d:Wikidata:Status updates/2025 02 24) ou encore la newsletter du projet Wikifunction (wikifunctions:Wikifunctions:Status updates/2025-01-15).

Courrier du lectorat

Il nous fera plaisir de lire les messages déposés ici et, si nécessaire, d'y répondre dans les plus brefs délais.

  • bonjour, bravo pour ce numero. A propos du bouquin sur wikipedia qui va sortir on connait le nom reel de l'auteur mais comment on connait le nom d'utilisateur à celui de l'auteur? Et on a le droit de le dire? Ce serait pas du Wikipédia:Doxxing à l'envers? A moins que ce soit un poisson du 1er avril auquel cas je me suis bien fait attraper... --Sergent Cool (discuter) 1 avril 2025 à 09:19 (CEST)
    Bonjour @Sergent Cool. Ce n'est pas un poisson d'avril, ni du doxxing à l'envers : l'utilisateur est intervenu dans la presse successivement sous le nom de « Michel », « Michel wiki » et « Michel Sandrin » (peut-être un pseudonyme, d'ailleurs ?), en évoquant son « bannissement » (blocage indef, en fait), si bien que les wikipédiens ont fait le lien sans difficulté. — Jules* 💬 1 avril 2025 à 12:28 (CEST)
  • Bonjour Émoticône à tous et merci pour ce travail ! Je suis honoré de me découvrir nommément cité dans vos lignes (par @LD), quelle agréable surprise ! Tout ceci dans le cadre d'un débat ô combien actuel, qui plus est… C'est l'occasion de saluer la réflexion et les efforts ayant mené à ce numéro, et, plus généralement, la mise en lumière continuelle du travail collaboratif wikimédien dans les pages de ce magazine (dont je suis un lecteur assidu), tâche qui ne doit pas être aisée. Félicitations ! --Cosmophilus (discuter) 2 avril 2025 à 22:30 (CEST)

Renouveau — content de voir des forces vives travailler à l'évolution des RAW. Un merci particulier à Jules* pour son focus.
longue vie à la nouvelle rédaction! - Simon Villeneuve 3 avril 2025 à 12:42 (CEST)

Merci à tous les trois, @Sergent Cool, @Cosmophilus et @Simon Villeneuve, pour vos retours, c'est encourageant Émoticône sourire. — Jules* 💬 3 avril 2025 à 12:46 (CEST)
Un numéro intéressant. Émoticône — Cantons-de-l'Est p|d|d 🧹 4 avril 2025 à 00:37 (CEST)
Citations originales
Notes
Références
  1. Nicolas Gastineau, « Propos d’un patrouilleur de Wikipédia », sur Revue21.fr, (consulté le )
  2. « Pourquoi la droite américaine s’attaque-t-elle à Wikipédia? », sur ici.radio-canada.ca (consulté le )
  3. « Wikipédia, la méticuleuse fabrique du savoir », La Croix,‎ (ISSN 0242-6056, lire en ligne, consulté le )
  4. « Attaques contre Wikipédia : ce contributeur nous explique comment fonctionne l'encyclopédie libre et partagée », sur France 3 Grand Est, (consulté le )
  5. « Wikipedia : comment les contributions sont-elles contrôlées ? », sur France Culture, (consulté le )
  6. David Dufresne Euryale, « Wikipédia: qui veut sa peau (et pourquoi)? », sur Au Poste, média indépendant 100% Live & Libre, (consulté le )
  7. « Les outils d’IA comme ChatGPT ou Gemini utilisent des sites de propagande russe comme sources », Le Monde,‎ (lire en ligne, consulté le )
  8. Brice Laemle, « « Factuel », un nouveau média en ligne parrainé par Christine Kelly et Dominique Rizet », Le Monde,‎ (lire en ligne)
  9. « La Face cachée de Wikipédia », sur éditions du Cerf (consulté le ).
  10. Cet article a été partagé et discuté sur la page de discussion du Projet:Antipub.
  11. Comme le montre l'outil Search Engine Referrals.
  12. Le quotidien Le Monde y a aussi consacré un article.
  13. Lire à ce sujet ce billet sur le site du Comité européen de la protection des données.

Numéro du 18 avril 2025

Friday, 18 April 2025 00:00 UTC

L'édito — Les réflexions sur la modernisation de cette wikilettre se poursuivent. Dans ce cadre, nous aimerions créer de nouvelles rubriques. Vos suggestions sont les bienvenues en salle de rédaction : dites-nous ce que vous aimeriez lire dans les RAW, ou ce que vous voudriez y écrire !

C'est dans cette perspective que nous lançons un premier appel à commentaires afin de co-rédiger un futur dossier relatif à la possibilité de modifier Wikipédia sans créer de compte (actuellement sous IP, prochainement sous compte temporaire).

Bonne lecture !

Les brèves

Contributions de Jules*, Nanoyo88, Pyb en résidence, Trizek

Échos francophones

Les contributeurs à l'honneur dans les médias — La revue de presse wikipédienne est encore une fois très riche en mars 2025, mais elle voit surtout la mise à l'honneur de nombreux contributeurs tels que Le chat perché (d · c · b) sur XXI[1], Simon Villeneuve (d · c · b) sur Ici Radio-Canada[2], C.Salviani (d · c · b) dans La Croix[3], Lyokoï (d · c · b) sur France 3 Champagne-Ardenne[4] et d'autres sur France Culture[5] ou dans l'émission de David Dufresne[6]. Des interventions remarquables et remarquées !

2033 – Adieu joli wiki ? — Une projection de régression linéaire basée sur les données Google Trends laisse entendre que l'intérêt et l'utilisation continuera de décroître, menant Wikipedia à cesser d'exister le au profit des LLM. A-t-on oublié de préciser le caractère humoristique de cette brève Émoticône ?

Wikipédia / Le Point : clôture de la lettre ouverte et réponse aux mises en demeure — Dans le dernier numéro des RAW, nous vous parlions de la controverse opposant le magazine français Le Point à Wikipédia en français. La lettre ouverte a été close le . En trois semaines, elle a rassemblé 1 155 signatures de contributeurs de notre wiki ou d'autres. Aelxen a compté que le cumul des contributions des signataires sur la seule version francophone s'élevait à environ 22 900 000, soit environ 10 % du total des modifications effectuées sur l'encyclopédie depuis sa création.

Parmi les signatures, celle du co-fondateur de Wikipédia, Jimmy Wales, le , n'est pas passée inaperçue. La directrice du service Trust & Safety de la Fondation Wikimédia (WMF), Maggie Dennis, a également publié un message de soutien en page de discussion.

Le Point a cessé ses publications hostiles à Wikipédia, après une série de neuf articles en onze jours — du jamais vu. Les avocats du magazine ont en revanche adressé une deuxième mise en demeure à la WMF, dans laquelle ils maintiennent leurs demandes de censure de l'article Le Point, en dépit des améliorations apportées par la communauté, et dans laquelle ils qualifient la lettre ouverte de « diffamatoire ».

C'est ce que nous avons appris au détour d'un message incisif publié sur le Bistro par Phil Bradley-Schmieg au nom du service juridique de la WMF. Ce dernier indique clairement ne pas donner suite aux exigences éditoriales du Point et soutenir la lettre ouverte. Plus encore, il souligne, après avoir regretté l'absence d'excuses de la part du magazine, les « graves erreurs et malentendus » que contient la première mise en demeure. Non sans un brin de causticité, le service juridique indique avoir « proposé d'expliquer le fonctionnement de Wikipédia au Point et à ses avocats ». À suivre.

Au Comité d'arbitrage, un élu esseulé — Le CAr n'a pas terminé de casser des claviers sous de douces mélodies un peu naïve de refonte. Les élections de mars 2025 s'achèvent avec l'élection d'un arbitre. Mais concrètement, que se passera-t-il ensuite ? Ce qui est certain, c'est que le quorum de trois arbitres minimum n'est pas rempli pour relancer le CAr. Peut-être serait-ce l'occasion d'engager le processus de déconstruction et de création d'un nouvel organe tel que suggéré par plusieurs contributeurs dans les votes et discussions ? La communauté semble en effet attachée à l'existence d'un organe type CAr, comme en témoignent cette élection et, précédemment, le refus répété (2016, 2018, 2021) de dissoudre le CAr sans instance pour le remplacer.

Coups de griffes — Un conflit oppose la cabale féline et d'autres bénévoles, excédés par la profusion d'images de chats sur le Bistro. Les tensions se sont envenimées à la suite d'une proposition de passage en recommandation de la page Wikipédia:Ne mordez pas les chats, jugée discriminante à l'égard des poissons-chats. Plusieurs RA ont été déposées en mars, mais n'ont toujours pas été traitées ; un contributeur, soupçonnant les administrateurs de partialité, a réclamé qu'ils indiquent s'ils portent ou non la moustache. C'est en tout cas ce que rapporte le magazine français La Virgule qui, renseigné par un certain « Marcel Wiki » et faisant état des accusations lapidaires d'un concessionnaire automobile qui jouit d'une certaine notoriété outre-Atlantique, s'inquiète d'une dérive ailurophile de l'encyclopédie. Sur le Bistro, des commentateurs avisés ont jugé que cet article faisait fausse route : « On sait tous ici que le vrai désaccord dans la communauté porte en ce moment sur la nécessité ou non de capitaliser le nom des modèles dans le wikicode ! »

Attention à la désinformation russe — Des rapports indiquent que des fermes de contenus produisant de la désinformation russe sont utilisés sur Wikipédia[7]. Peu nombreux sur la version francophone et effectués de bonne foi, ces ajouts sont le fait de contributeurs avertis de la communauté ; la situation est semble-t-il différente sur d'autres versions linguistiques de Wikipédia.

Un livre sur Wikipédia... écrit par un utilisateur bloqué — En , l'éphémère média français d'extrême droite Factuel[8], au détour d'un article commenté sur le Bistro, annonçait un ouvrage à paraître en 2024 consacré à Wikipédia. Son auteur ? Un certain Michel1961 (d · c · b), bloqué indéfiniment en 2021 (notamment pour comportement non collaboratif, détournement de sources, rameutage et POV-pushing) et régulièrement cité dans des articles de presse sensationnalistes en 2020 (où des contributeurs expérimentés sont accusés d'être « islamo-conciliants »), 2021, 2023, février et mai 2024. L'ouvrage, annoncé dès 2023, paraît en aux éditions du Cerf sous le titre La face cachée de Wikipédia : Enquête sur les dérives de l'encyclopédie libre[9]. Cosigné par Victor Lefebvre, ancien journaliste au Figaro et à Factuel, l'ouvrage de 216 pages prétend apporter « une réponse argumentée et dépassionnée » à la question de savoir si l'encyclopédie est devenue « Wokipedia » comme allégué par Elon Musk. La réponse est donnée au dos de l'ouvrage : « Le pouvoir de nuisance d'une petite poignée d'utilisateurs ouvertement militants - pour ne pas dire woke - tend à se renforcer. »

L'actu technique

Nouvel aperçu de l'outil de traduction

L'outil de traduction évolue — L'équipe de Localisation de la langue et des produits a amélioré le Tableau de bord de traduction de contenu en intégrant des fonctionnalités de personnalisation de suggestions et en améliorant l'accessibilité du tableau de bord.

D'où viennent et où vont les lecteurs d'un article ? — L'outil Wikinav permet de répondre à ces questions. En plus de mettre en évidence que la majorité des consultations viennent des moteurs de recherche, l'analyse de l'article Elon Musk (le plus consulté en ) montre ainsi que l'article de Wikipédia par lequel le plus grand nombre de lecteurs arrivent est celui de son ex-compagne Grimes et celui le plus consulté consécutivement est celui de sa compagne actuelle, Shivon Zilis. Les clics entrants depuis ou sortants vers le département de l'Efficacité gouvernementale (DOGE) n'arrivent respectivement qu'en dixième et sixième positions. La vie privée avant la politique.

Dans le mouvement

Le logo de Wikipédia, en allemand, avec la mention « 3 Millionen Artikel ».
Et de trois !

Trois millions d'articles sur Wikipédia en allemand — C'est le seuil franchi par la version germanophone de Wikipédia le . Troisième plus grosse version linguistique en nombre d'articles, elle devance la version francophone, selon la liste des wikis. Il existe toutefois de nombreux autres indicateurs pour comparer les versions linguistiques, dont la profondeur, qui valorise le nombre d'éditions par article et le nombre de pages autres que les articles — en classant les wikis avec cet indicateur, la version francophone arrive en dix-neuvième position (loin devant la version germanophone). Pour en revenir au seuil symbolique de trois millions d'articles, les paris sur la date à laquelle Wikipédia en français l'atteindra sont toujours ouverts.

Une militaire américaine en train de se faire peindre la joue aux couleurs du drapeau LGBT.
Exemple de photo retirée.

Suppression de contenus de l'armée américaine — Le département de la Défense des États-Unis a récemment appliqué une décision présidentielle mettant fin aux politiques Diversité, équité et inclusion (DEI). Cela s'est traduit notamment par la mise hors ligne de beaucoup de contenus multimédia. Associated Press a récupéré une base de données de 26 000 photos concernées par la censure. Wikimedia Commons héberge de nombreuses photos de l'armée américaine, entre 10 et 20 % des 5 millions de photos stockées sur DVIDS, la médiathèque du départ de la Défense. Don-vip (d · c · b) poursuit l'import en masse des photos, que  (d · c · b) avait débuté. Une catégorisation des photos supprimées est en cours ainsi que l'import des vidéos manquantes, projet initié par Mvolz (d · c · b). Une fois ce travail de catégorisation réalisé, il sera possible d'extraire les données pour les mettre sur data.gouv.fr par exemple afin de permettre aux chercheurs et associations d'étudier les contenus retirés. Ce travail n'est pas sans soulever des questions éthiques auxquelles l'armée américaine a été confrontée en 2021 en procédant à un retrait massif de photos d'Afghans afin de les protéger des talibans.

Renforcer la neutralité de point de vue de Wikipédia — La Fondation Wikimédia a récemment mis en évidence des tendances essentielles et prioritaires pour le mouvement, à travers des conversations avec les communautés. Cette année, une tendance qui a suscité de nombreuses discussions au sein et au-delà du mouvement Wikimédia concerne la neutralité : la baisse de confiance dans les informations en ligne et la fragmentation du consensus sur la véracité des informations. Il s'avère que la manière dont le principe de neutralité de point de vue se traduit varie d'un projet Wikimédia à l'autre, ce qui met en évidence la possibilité pour les communautés d'apprendre les unes des autres et d'explorer si des normes mondiales communes de neutralité peuvent mieux protéger les projets (et les bénévoles) dans un environnement de menaces accrues et de réglementation croissante. Pour soutenir les communautés Wikimédia et réaffirmer notre engagement en faveur de la neutralité, la Fondation Wikimédia réunira un groupe de travail composé de contributeurs actifs, de membres du CA de la Fondation, de chercheurs et de conseillers afin d'étudier des recommandations de normes communes pour les politiques NPOV qui peuvent protéger Wikipédia, accroître l'intégrité des projets et fournir davantage de soutien aux bénévoles chargés d'administrer ces politiques. Pour en savoir plus, rendez-vous sur Diff, le blog hébergé par la Fondation à propos du mouvement.

Verrouillages globaux massifs — Le , la WMF a entrepris le verrouillage global de plus de 35 000 comptes (liste) compromis (mots de passe divulgués, vraisemblablement). Dans le communiqué qu'elle a publié quelques jours après, elle indique que cela fait suite à la découverte d'« un schéma de connexions inhabituelles à des comptes enregistrés », qui résulterait d'une fuite de données depuis un autre site web incluant des mots de passe, utilisés aussi sur Wikipédia. Un bon rappel de la nécessité de ne pas utiliser un même mot de passe sur plusieurs sites web, et l'occasion de lire ou relire Aide:Sécurité des comptes utilisateur.

Focus

RAW encourage les membres de la communauté à s'exprimer sur différents enjeux liés à l'écosystème Wikimedia. N'hésitez pas à proposer vos textes pour cette section. N'hésitez pas non plus à réagir dans la section du courrier du lectorat.

À la recherche des articles disparus de Google
par Jules*

Certains articles de Wikipédia sont déréférencés par Google. Combien ? Les déréférencements sont-ils légitimes ? C'est le grand flou.

Le Canard enchaîné publie une enquête qui vous déplaît ? Oubliez le communiqué de presse et la plainte pour diffamation. Le problème, ce n'est pas l'article : c'est le fait qu'il soit lu ! Et s'il était possible de le faire disparaître de Google ? Improbable ? C'est pourtant ce qui s'est passé, nous raconte Thibaut Schepman dans un article paru en janvier dernier dans La Revue des médias, éditée par l'Institut national de l'audiovisuel (INA)[10]. La méthode employée par les malandrins est la suivante : signaler à Google une violation des droits d'auteurs en affirmant que l'article de presse est un plagiat d'une page web, antidatée. Derrière la mésaventure vécue par une journaliste du Canard enchaîné se cache une véritable industrie du déréférencement indu, nous apprend Thibaut Schepman.

Si Google a rétabli le référencement de l'article du Canard enchaîné, est-il possible que Wikipédia soit également victime de telles manœuvres ? La question n'est pas anodine. La plupart des consultations de Wikipédia proviennent des moteurs de recherche, et parmi ceux-ci, Google est en position de quasi-monopole[11]. Un article Wikipédia déréférencé de Google, c'est donc probablement un article qui ne sera quasiment plus lu.

De la lumière mais pas trop

Pour savoir ce qu'il en est, première étape, la plateforme Lumen. Elle permet de consulter les demandes de déréférencement adressées à Google pour divers motifs : violation des droits d'auteurs, diffamation, droit à l'oubli... Mais les notices, dont la consultation n'est pas aisée, n'indiquent pas l'issue de ces demandes. Nous ne sommes guère éclairés.

De son côté, la Fondation Wikimédia (WMF) a commencé en 2014 à publier les notifications de déréférencement qu'elle recevait de Google (dont plusieurs dizaines pour Wikipédia en français). À l'époque, la WMF s'est émue de cette censure, motivée par le droit à l'oubli, dans un billet de blog en anglais[12].

Récemment, l'auteur de ces lignes a eu vent du déréférencement d'un article de Wikipédia en français par Google. Le déréférencement a-t-il été effectué au nom du droit à l'oubli ? Ou bien par une méthode retorse comme celle mise en lumière par La Revue des médias ? Aucune idée : aucun résultat sur Lumen avec le titre de l'article, et pas de notice relative sur la page tenue à jour par la WMF.

RGPD à la suédoise

Renseignement pris auprès du service juridique de la WMF, Google envoie depuis quelques années des notifications de déréférencement dépourvues de l'URL du contenu déréférencé (exemple) et donc parfaitement inutiles. Surprenant. Ce changement découle en fait d'une décision prise en 2020 par l'Autorité suédoise pour la protection de la vie privée, sur le fondement du règlement général sur la protection des données (RGPD). Elle a estimé qu'en fournissant l'URL du contenu déréférencé dans ses notifications, Google permettait à leur destinataire de republier les contenus litigieux sous une autre URL, et donc de bafouer le droit à l'oubli[13]. Exit les URL.

Tout au plus la WMF continue-t-elle de recevoir des notifications précises quand le requérant est situé hors Union européenne ; on sait ainsi que l'article Fusillade de l'université d'Eskişehir Osmangazi a disparu de certaines recherches Google en raison de la législation turque — sans plus de précision.

On ignore d'ailleurs si la WMF reçoit systématiquement une notification de Google en cas de déréférencement. En tout état de cause, la liste des notifications relatives à Wikipédia en français n'évoque aucun déréférencement pour violation des droits d'auteurs — c'est en revanche le cas pour Wikipédia en anglais, comme le relèvent nos confrères du Signpost.

S'agissant du droit à l'oubli, s'il est légitime de chercher un équilibre entre droit à l'information et droit au respect de la vie privée, il apparaît contestable qu'une entreprise privée, en l'espèce Google, puisse opérer sans aucune transparence le déréférencement d'articles.

Le dossier du mois

Dans cette section, le magazine aborde un sujet qui a fait beaucoup réagir à l'intérieur de la communauté, voire à l'extérieur.

Le bouleversement annoncé des pratiques par l'IA générative
par Nanoyo88

Cet article repose sur quatre interviews que vous pouvez consulter dans leur version complète.

Lors de précédentes éditions, nous avons régulièrement abordé le sujet de l'IA générative (genAI), ses implications et conséquences pour Wikipédia. Nous aimerions prendre le temps, au travers d'un dossier et d'interventions de quatre contributeurs, d'approfondir le sujet. Pa2chant.bis, LD, Aelxen et (:Julien:) analysent les usages de l'IA et les problèmes qu'ils engendrent ; ils discutent aussi de l'élaboration d'un texte pour les encadrer.

IA, genAI, LLM :
de quoi parle-t-on ?

De manière générale, les machines informatiques exécutent scrupuleusement des instructions (un programme informatique) écrites par des humains. Les humains disent explicitement quoi faire à la machine, pas à pas. L'intelligence artificielle (IA) est une discipline scientifique visant à permettre aux machines d'être « intelligentes » : apprentissage, raisonnement logique, compréhension du langage naturel (anglais, français…). L'IA cherche à permettre aux machines à gagner en autonomie pour effectuer des tâches plus complexes. L'intelligence artificielle générative (genAI) est un sous-domaine de l'IA dont le but est de générer automatiquement des textes en langage naturel. Les réseaux de neurones sont une technologie très puissante (et gourmande en ressources) largement utilisée dans l'IA.

Depuis 2017-2018, les grands modèles de langage (LLM) utilisent des (grands, très grands) réseaux de neurones pour comprendre du langage naturel, répondre à des questions ou générer du texte (genAI). Le texte écrit par un humain pour interagir avec le LLM est appelé prompt. Pour apprendre le langage et des connaissances, les LLM sont gavés de tonnes de données disponibles sur Internet (dont évidemment WP). Les LLM n'ont pas d'estimation de la valeur de vérité ou véracité de ce qu'ils répondent : ils répondent grosso modo ce qui est le plus probable parmi les textes sur lesquels leur apprentissage s'est fondé. Le LLM invente donc : parfois c'est juste, parfois c'est faux — on parle alors d'hallucination.

Pour en savoir plus, lire cet article sur Le Monde.

Ils fleurissent sur l'encyclopédie et le printemps n'y est pour rien. Les textes générés par IA sont de plus en plus nombreux sur les articles de Wikipédia à mesure que l'usage de l'IA générative se démocratise. Pour Pa2chant.bis, cet usage wikipédien se fait « en l'absence de recommandation », ce qui a pour conséquence de rendre « très lourd et coûteux en temps de démontrer des abus » et risque de démotiver les contributeurs qui se consacrent à ces vérifications.

Julien indique à ce propos qu'il est « difficile d'anticiper les usages qui seront faits des LLM. Mais c'est potentiellement un game changer pour WP », qui peut au choix « devenir un dépôt de connaissances approximatives via des masses de textes mal comprises ou un facilitateur de rédaction ».

« C'est l'avenir de Wikipédia qui se joue »

Pa2chant.bis n'y va pas par quatre chemins : « C'est l'avenir de Wikipédia qui se joue. » Les enjeux et les risques de ces nouvelles pratiques sont déjà connus : « outre les potentielles atteintes au droit d'auteur, on peut citer les problèmes de fiabilité de l'information de type absence ou détournement de source, les TI et les problèmes de style. »

La majorité des usages observés ne résistent pas aux vérifications et affichent différents problèmes qui pourraient être évités si la contribution était 100 % humaine. C'est notamment le cas des traductions automatiques, des synthèses de sources multiples, de l'identification de sources, etc.

Des usages problématiques, Pa2chant.bis en a vu quelques exemples surprenants. Par exemple, dans une page Wikipédia sur une maladie, indiquer aux parents que même traitée, elle peut être mortelle, alors qu'aucune source n'a été trouvée dans ce sens. Dans l'article 'Ndrangheta (la mafia calabraise), une famille dont le nom est parfaitement inconnu des sources a été désignée comme étant influente. Dans un autre article étaient indiqués des liens familiaux entre deux personnes, liens imaginaires sourcés avec un blog généré par IA. Les abus peuvent d'une envergure encore supérieure, comme les interventions mêlant TI, IA et vandalismes sur une profusion d'articles dédiés aux quasars : alors que le projet:Astronomie compte peu de membres, et encore moins de spécialistes de ce sous-domaine, cela va exiger d'utiliser WP:TNT.

« L'IA, on l'utilise depuis super longtemps »

Julien rappelle que les traductions automatiques relèvent de l'IA, et plus récemment de l'introduction des LLM. Or, « la communauté semble ok avec cette utilisation de l'IA », quand bien même Julien en est lui-même critique. Concernant les LLM, « des utilisateurs ont développé et rendu compte de pratiques plus avancées (Projet:Observatoire des IA/Documentation, Utilisateur:Global Donald/Création d'article via ChatGPT 4o et comparaison des prompts, Utilisateur:Nanoyo88/testIA…) ». La question revient dès lors à se demander si la relecture et la vérification sont bien effectuées, et c'est là que ça coince. Comme pour les traductions automatiques à la chaîne, les textes générés par IA augmentent la quantité de travail de vérification pour la communauté.

Il y a également des usages de LLM qui pourraient être utiles à l'automatisation de certaines opérations de maintenance sur Wikipédia. « Sur les projets sportifs (basket, foot, foot US), c'est toujours relou quand un joueur change de club : il faut rajouter des catégories, changer des palettes, mettre à jour l'infobox… Not fun. J'ai dans ma todo list le développement d'un outil automatique de mise à jour quand un joueur change de club, avec l'usage d'un LLM. » Les LLM pourraient également être utilisés afin de lutter contre le vandalisme, voire même contre les mésusages de LLM !

Une lutte contraignante

Dernièrement, un tracker a été mis en place par Julien sur la base du signalement, par Pa2chant.bis, de sources comportant un paramètre UTM lié à ChatGPT. Cette longue liste n'est que la partie émergée d'une analyse en profondeur nécessaire et dans laquelle il faut comparer les sources présentées et les informations ajoutées.

Afin de pouvoir rapidement identifier ce type d'ajout, un filtre anti-abus a été créé par Aelxen. « Le filtre consiste à détecter les insertions d'URL contenant un paramètre UTM provenant de ChatGPT. Actuellement, il est uniquement utilisé pour récupérer des statistiques. À terme, il pourrait permettre d'insérer un message d'avertissement lors de la publication des modifications. »

« Des détecteurs insuffisamment fiables »

Actuellement, on peut difficilement s'appuyer uniquement sur des outils de détection et éléments techniques pour identifier les usages de textes générés par IA avec fiabilité. « Ces outils sont imparfaits, explique Julien : les LLM sont des machines probabilistes donc il y a des risques de faux-positifs. Les études qui essaient de mesurer les faux positifs divergent pas mal et s'appuient sur des textes en anglais, donc il faut prévoir une décote pour le français. »

Aelxen et Pa2chant.bis jugent également la fiabilité de ces détecteurs insuffisante. Pour Pa2chant.bis, « le plus performant détecteur trouve en français un nombre impressionnant de probables faux-positifs » et Julien souligne une observation surprenante d'Esprit Fugace : il y a des faux positifs lorsque le contenu est rédigé « par des personnes neuroatypiques dont le style rédactionnel diffère » de la norme.

Sur les possibilités techniques, Aelxen suggère que « des outils semi-automatiques pourraient être envisagés pour aider à l'analyse, par exemple en signalant des passages suspects ou en identifiant des modèles d'écriture caractéristiques de l'IA ». Mais Julien considère que c'est « sans issue parce que les LLM s'aguerrissent et les méthodes de détection sont toujours en retard. Il est possible que le contenu genAI devienne rapidement indiscernable par un œil humain comme par un détecteur ».

« Ils voient surtout le verre à moitié plein sans voir le verre à moitié vide »
Mésusages de l'IA :
comment aider ?

Pour donner un coup de main sur le sujet, plusieurs possibilités. Vous pouvez participer à l'élaboration de la future recommandation ainsi qu'au sondage associé. La vérification des quelque 170 insertions de sources via ChatGPT peut également vous intéresser. De bonnes âmes sont aussi nécessaires pour l'analyse et le traitement de 284 + 400 sites générés par IA utilisés comme sources sur Wikipédia.

Enfin, si vous rencontrez des textes que vous soupçonnez d'être générés par IA et qui contreviennent aux PF, vous pouvez les signaler sur Projet:Observatoire des IA/Contrôle.

Votre aide est précieuse !

Identifier les textes générés par IA et leurs problèmes n'est pas chose aisée. Pa2chant.bis témoigne de sa pratique, indiquant que cela se fait « au hasard des analyses de créations d'articles, des relectures et de la patrouille ». Les mauvais usages possèdent plusieurs marqueurs tels que le style stéréotypé et souvent laudatif, le plan caractéristique et les détournements de sources par hallucination — « et là, c'est beaucoup plus long à identifier ».

Le second problème est qu'il est particulièrement complexe de faire comprendre aux utilisateurs d'IA, novices ou expérimentés, les problèmes de leurs contributions. Pa2chant.bis a l'impression « qu'ils voient surtout le verre à moitié plein (leurs prompts sont de plus en plus précis et performants, et le niveau de réponse des IA s'améliore) sans voir le verre à moitié vide (les erreurs, le langage stéréotypé et les traductions parfaites en mot à mot, mais porteuses de contresens, non-sens ou inventions) ».

Malheureusement, l'utilisation abusive de l'IA reste très tentante car elle est en mesure de produire des textes d'apparence robuste, auxquels il est aisé pour les contributeurs de faire confiance, en ayant la fausse impression d'avoir maitrisé un sujet. À cela s'ajoute la culture historique de Wikipédia « selon laquelle l'encyclopédie est en construction, les erreurs ne sont pas trop graves et finiront bien par être corrigées un jour » ainsi que le sentiment que refuser l'usage de l'IA relève « d'une forme de passéisme, ou d'une attitude rétrograde vis-à-vis des progrès technologiques ».

Vers la mise en place d'une recommandation

Le , Pa2chant.bis tirait une nouvelle fois la sonnette d'alarme, soulevant une nouvelle pratique consistant à sourcer des contenus, ou générer des contenus sourcés, par le biais de l'IA. Cette situation le pousse alors à inviter la communauté à se pencher sur un passage à l'état de recommandation d'un texte encadrant l'usage des IA. L'idée a été très bien accueillie et un sondage est en préparation. Deux versions existent actuellement, un essai élaboré depuis plusieurs mois et une contre-proposition simplifiée par LD.

Cependant, établir une recommandation présente plusieurs contraintes car elle a vocation à établir des lignes directrices à suivre dans la contribution. LD nous rappelle qu'elles doivent donc « répondre aux attentes et interrogations les plus courantes, tout en véhiculant un « savoir-faire » concret ».

« Elle doit être claire, non contradictoire avec les autres normes et permettre un ajustement progressif »

Le plus complexe est de produire une recommandation « claire, non contradictoire avec les autres normes (principes, règles, recommandations) et permettre un ajustement progressif ». Ce dernier élément est nécessaire afin de pouvoir répondre aux éventuelles évolutions législatives. En effet, l'IA générative pose la question de la propriété intellectuelle, dans la mesure où « les textes générés [peuvent provenir] de textes régis par le droit d'auteur et [où] ces générations [pourraient être] considérées comme également soumises au droit d'auteur (et/ou sont considérées comme des œuvres dérivées ou collectives) ».

Cette future recommandation ne supplantera donc pas les recommandations déjà existantes. LD évoque le propos de @Cosmophilus à ce sujet en soulignant que « le mauvais usage de l'IA se caractérise par la violation d'un principe ou d'une norme déjà définie, telle que WP:DA, WP:V, WP:STYLEetc. ». Aussi le but n'est-il pas de répéter le corpus réglementaire mais de donner des indications pour « se concentrer sur l'application de ces normes dans le cadre de l'IA ».

Si la communauté démontre une certaine hostilité à l'égard des contenus générés par IA et le démontre au travers de précédents sondages, il ne semble pas que l'on se dirige vers une interdiction stricte de son usage. Il est d'ores et déjà complexe de le démontrer.

Face à ces nouvelles pratiques, comme l'écrit LD, le mot d'ordre pourrait bien être de « rester guidé par le bon sens et le discernement ».

L'agenda

Le wik’hit-parade

Articles les plus vus en
No  Article Av. Vues Image Remarques
1 Émilie Dequenne B 1 608 141 Cette actrice belge, lauréate du prix d'interprétation féminine du Festival de Cannes pour Rosetta et du César de la meilleure actrice dans un second rôle pour Les choses qu'on dit, les choses qu'on fait, est décédée le des suites d'un cancer des surrénales à l'âge de 43 ans.
2 Elon Musk B 447 151 Cet homme d'affaires américain est très présent dans l'actualité depuis la réélection à la présidence des États-Unis de Donald Trump (no 9) qui l'a nommé à la tête d'un tout nouveau département de l'Efficacité gouvernementale.
3 Leïla Bekhti Bon début 430 921 Cette actrice française tient le premier rôle dans Ma mère, Dieu et Sylvie Vartan, sorti en salles en France le .
4 Herbert Léonard Bon début 417 692 Ce chanteur français, qui s'est fait connaître dans les années 1980 avec des tubes comme Pour le plaisir ou Quand tu m'aimes, est décédé le à l'âge de 80 ans.
5 Jean-Louis Debré Bon début 344 587 Cet homme politique français, ancien ministre de l'Intérieur, président de l'Assemblée nationale et président du Conseil constitutionnel, est décédé le , lui aussi à l'âge de 80 ans.
6 Adolescence (série télévisée) Bon début 337 219 Cette mini-série britannique, conçue par Jack Thorne (photo), a rencontré un grand succès à sa sortie sur Netflix, le . Elle aborde des sujets d'actualité (le cyberharcèlement, la culture incel, la radicalisation en ligne…) sous une forme inhabituelle (chaque épisode se compose d'un unique plan-séquence).
7 Claude Malhuret Bon début 310 362 Ce sénateur français, ancien président de Médecins sans frontières et cofondateur du site Doctissimo, a prononcé le 5 mars devant le Sénat un discours très remarqué en France et à l'international contre la politique menée par le président des États-Unis Donald Trump (no 9).
8 Michel Ferracci Bon début 302 884 Cet acteur français était le mari d'Émilie Dequenne (no 1).
9 Donald Trump B 297 837 Depuis sa réélection à la présidence des États-Unis en novembre dernier, cet homme d'affaires défraie constamment la chronique par ses décisions aussi nombreuses que controversées. Le mois de voit ainsi la déportation de détenus vénézuéliens au Salvador, le début du démantèlement du département de l'Éducation et la menace de l'instauration de droits de douane draconiens.
10 Olivier Giroud B 278 711 Ayant annoncé sa retraite internationale en , le footballeur français, champion du monde en 2018, a été ovationné par le Stade de France le avant le match France-Croatie comptant pour la Ligue des nations de l'UEFA 2024-2025.
11 Michael Olise Bon début 269 396 Ce footballeur français inscrit son premier but sous le maillot de l'équipe de France lors de ce même match France-Croatie du 23 mars.
12 Olympe de Gouges B 261 523 Cette pionnière française du féminisme est le sujet du téléfilm Olympe, une femme dans la Révolution, diffusé le 3 mars sur la chaîne France 2.
13 France AdQ AdQ 251 529 Le pays qui compte le plus grand nombre de francophones figure régulièrement parmi les articles les plus vus de Wikipédia en français.
14 Cyril Hanouna B 249 540 L'ancien animateur vedette de C8 poursuit la diffusion de son émission controversée Touche pas à mon poste ! sur Internet après la fermeture de la chaîne, le .
15 Carême B 239 339 Cette période du calendrier chrétien correspondant aux 40 jours précédant Pâques a commencé cette année le .
16 Gene Hackman Bon début 238 685 Figure de proue du Nouvel Hollywood, récompensé par deux Oscars et quatre Golden Globes, l'acteur américain a été retrouvé mort à son domicile de Santa Fe le avec son épouse Betsy Arakawa (en). Les résultats de l'enquête ont été publiés le .
17 Emilia Pérez Bon début 237 090 Cette comédie musicale sur un chef de cartel mexicain interprété par Karla Sofía Gascón (photo) qui change de sexe pour changer de vie a reçu sept récompenses lors des César, le , mais ses treize nominations aux Oscars ne se sont traduites que par deux victoires le .
18 Décès en mars 2025 Ébauche 233 582 Comme l'illustrent les numéros 1, 4, 5 et 16, la mort d'une personnalité entraîne presque systématiquement un pic de fréquentation de son article.
19 Jacques Audiard Bon début 227 677 Réalisateur du no 17, qui lui a valu le César de la meilleure réalisation.
20 Volodymyr Zelensky B 219 818 Alors que la guerre russo-ukrainienne se poursuit, le président ukrainien s'est rendu à Washington le pour une rencontre particulièrement houleuse avec Donald Trump (no 9).

Méthodologie : sur le modèle du Top 25 Report de Wikipédia en anglais, ce wik'hit-parade reprend les données fournies par l'outil « Pages les plus vues ». Sont exclues les entrées clairement aberrantes comme Cookie (informatique) ou Soudan du Sud, dont le nombre de visites élevé n'est pas le fruit d'un véritable intérêt des internautes : elles se distinguent par un taux très faible (moins de 5 %) ou au contraire très élevé (plus de 95 %) de consultations sur mobile.

Les autres infolettres

La page Wikipédia:RAW/Découvrir recense les infolettres et blogs relatifs à Wikimedia.

En plus de RAW, vous pouvez lire le Wikimag, newsletter hebdomadaire de la Wikipédia francophone (Voir le dernier numéro semaine 13), l'infolettre Wikifier la science (voir hiver 2024) et les Actualités mensuelles du Wiktionnaire (mars 2025).

Les anglophones peuvent aussi lire The Signpost, publié toutes les deux semaines, la newsletter hebdo de la communauté Wikidata (voir ici d:Wikidata:Status updates/2025 02 24) ou encore la newsletter du projet Wikifunction (wikifunctions:Wikifunctions:Status updates/2025-01-15).

Courrier du lectorat

Il nous fera plaisir de lire les messages déposés ici et, si nécessaire, d'y répondre dans les plus brefs délais.

  • bonjour, bravo pour ce numero. A propos du bouquin sur wikipedia qui va sortir on connait le nom reel de l'auteur mais comment on connait le nom d'utilisateur à celui de l'auteur? Et on a le droit de le dire? Ce serait pas du Wikipédia:Doxxing à l'envers? A moins que ce soit un poisson du 1er avril auquel cas je me suis bien fait attraper... --Sergent Cool (discuter) 1 avril 2025 à 09:19 (CEST)
    Bonjour @Sergent Cool. Ce n'est pas un poisson d'avril, ni du doxxing à l'envers : l'utilisateur est intervenu dans la presse successivement sous le nom de « Michel », « Michel wiki » et « Michel Sandrin » (peut-être un pseudonyme, d'ailleurs ?), en évoquant son « bannissement » (blocage indef, en fait), si bien que les wikipédiens ont fait le lien sans difficulté. — Jules* 💬 1 avril 2025 à 12:28 (CEST)
  • Bonjour Émoticône à tous et merci pour ce travail ! Je suis honoré de me découvrir nommément cité dans vos lignes (par @LD), quelle agréable surprise ! Tout ceci dans le cadre d'un débat ô combien actuel, qui plus est… C'est l'occasion de saluer la réflexion et les efforts ayant mené à ce numéro, et, plus généralement, la mise en lumière continuelle du travail collaboratif wikimédien dans les pages de ce magazine (dont je suis un lecteur assidu), tâche qui ne doit pas être aisée. Félicitations ! --Cosmophilus (discuter) 2 avril 2025 à 22:30 (CEST)

Renouveau — content de voir des forces vives travailler à l'évolution des RAW. Un merci particulier à Jules* pour son focus.
longue vie à la nouvelle rédaction! - Simon Villeneuve 3 avril 2025 à 12:42 (CEST)

Merci à tous les trois, @Sergent Cool, @Cosmophilus et @Simon Villeneuve, pour vos retours, c'est encourageant Émoticône sourire. — Jules* 💬 3 avril 2025 à 12:46 (CEST)
Un numéro intéressant. Émoticône — Cantons-de-l'Est p|d|d 🧹 4 avril 2025 à 00:37 (CEST)
Citations originales
Notes
Références
  1. Nicolas Gastineau, « Propos d’un patrouilleur de Wikipédia », sur Revue21.fr, (consulté le )
  2. « Pourquoi la droite américaine s’attaque-t-elle à Wikipédia? », sur ici.radio-canada.ca (consulté le )
  3. « Wikipédia, la méticuleuse fabrique du savoir », La Croix,‎ (ISSN 0242-6056, lire en ligne, consulté le )
  4. « Attaques contre Wikipédia : ce contributeur nous explique comment fonctionne l'encyclopédie libre et partagée », sur France 3 Grand Est, (consulté le )
  5. « Wikipedia : comment les contributions sont-elles contrôlées ? », sur France Culture, (consulté le )
  6. David Dufresne Euryale, « Wikipédia: qui veut sa peau (et pourquoi)? », sur Au Poste, média indépendant 100% Live & Libre, (consulté le )
  7. « Les outils d’IA comme ChatGPT ou Gemini utilisent des sites de propagande russe comme sources », Le Monde,‎ (lire en ligne, consulté le )
  8. Brice Laemle, « « Factuel », un nouveau média en ligne parrainé par Christine Kelly et Dominique Rizet », Le Monde,‎ (lire en ligne)
  9. « La Face cachée de Wikipédia », sur éditions du Cerf (consulté le ).
  10. Cet article a été partagé et discuté sur la page de discussion du Projet:Antipub.
  11. Comme le montre l'outil Search Engine Referrals.
  12. Le quotidien Le Monde y a aussi consacré un article.
  13. Lire à ce sujet ce billet sur le site du Comité européen de la protection des données.

Numéro du 17 avril 2025

Thursday, 17 April 2025 00:00 UTC

L'édito — Les réflexions sur la modernisation de cette wikilettre se poursuivent. Dans ce cadre, nous aimerions créer de nouvelles rubriques. Vos suggestions sont les bienvenues en salle de rédaction : dites-nous ce que vous aimeriez lire dans les RAW, ou ce que vous voudriez y écrire !

C'est dans cette perspective que nous lançons un premier appel à commentaires afin de co-rédiger un futur dossier relatif à la possibilité de modifier Wikipédia sans créer de compte (actuellement sous IP, prochainement sous compte temporaire).

Bonne lecture !

Les brèves

Contributions de Jules*, Nanoyo88, Pyb en résidence, Trizek

Échos francophones

Les contributeurs à l'honneur dans les médias — La revue de presse wikipédienne est encore une fois très riche en mars 2025, mais elle voit surtout la mise à l'honneur de nombreux contributeurs tels que Le chat perché (d · c · b) sur XXI[1], Simon Villeneuve (d · c · b) sur Ici Radio-Canada[2], C.Salviani (d · c · b) dans La Croix[3], Lyokoï (d · c · b) sur France 3 Champagne-Ardenne[4] et d'autres sur France Culture[5] ou dans l'émission de David Dufresne[6]. Des interventions remarquables et remarquées !

2033 – Adieu joli wiki ? — Une projection de régression linéaire basée sur les données Google Trends laisse entendre que l'intérêt et l'utilisation continuera de décroître, menant Wikipedia à cesser d'exister le au profit des LLM. A-t-on oublié de préciser le caractère humoristique de cette brève Émoticône ?

Wikipédia / Le Point : clôture de la lettre ouverte et réponse aux mises en demeure — Dans le dernier numéro des RAW, nous vous parlions de la controverse opposant le magazine français Le Point à Wikipédia en français. La lettre ouverte a été close le . En trois semaines, elle a rassemblé 1 155 signatures de contributeurs de notre wiki ou d'autres. Aelxen a compté que le cumul des contributions des signataires sur la seule version francophone s'élevait à environ 22 900 000, soit environ 10 % du total des modifications effectuées sur l'encyclopédie depuis sa création.

Parmi les signatures, celle du co-fondateur de Wikipédia, Jimmy Wales, le , n'est pas passée inaperçue. La directrice du service Trust & Safety de la Fondation Wikimédia (WMF), Maggie Dennis, a également publié un message de soutien en page de discussion.

Le Point a cessé ses publications hostiles à Wikipédia, après une série de neuf articles en onze jours — du jamais vu. Les avocats du magazine ont en revanche adressé une deuxième mise en demeure à la WMF, dans laquelle ils maintiennent leurs demandes de censure de l'article Le Point, en dépit des améliorations apportées par la communauté, et dans laquelle ils qualifient la lettre ouverte de « diffamatoire ».

C'est ce que nous avons appris au détour d'un message incisif publié sur le Bistro par Phil Bradley-Schmieg au nom du service juridique de la WMF. Ce dernier indique clairement ne pas donner suite aux exigences éditoriales du Point et soutenir la lettre ouverte. Plus encore, il souligne, après avoir regretté l'absence d'excuses de la part du magazine, les « graves erreurs et malentendus » que contient la première mise en demeure. Non sans un brin de causticité, le service juridique indique avoir « proposé d'expliquer le fonctionnement de Wikipédia au Point et à ses avocats ». À suivre.

Au Comité d'arbitrage, un élu esseulé — Le CAr n'a pas terminé de casser des claviers sous de douces mélodies un peu naïve de refonte. Les élections de mars 2025 s'achèvent avec l'élection d'un arbitre. Mais concrètement, que se passera-t-il ensuite ? Ce qui est certain, c'est que le quorum de trois arbitres minimum n'est pas rempli pour relancer le CAr. Peut-être serait-ce l'occasion d'engager le processus de déconstruction et de création d'un nouvel organe tel que suggéré par plusieurs contributeurs dans les votes et discussions ? La communauté semble en effet attachée à l'existence d'un organe type CAr, comme en témoignent cette élection et, précédemment, le refus répété (2016, 2018, 2021) de dissoudre le CAr sans instance pour le remplacer.

Coups de griffes — Un conflit oppose la cabale féline et d'autres bénévoles, excédés par la profusion d'images de chats sur le Bistro. Les tensions se sont envenimées à la suite d'une proposition de passage en recommandation de la page Wikipédia:Ne mordez pas les chats, jugée discriminante à l'égard des poissons-chats. Plusieurs RA ont été déposées en mars, mais n'ont toujours pas été traitées ; un contributeur, soupçonnant les administrateurs de partialité, a réclamé qu'ils indiquent s'ils portent ou non la moustache. C'est en tout cas ce que rapporte le magazine français La Virgule qui, renseigné par un certain « Marcel Wiki » et faisant état des accusations lapidaires d'un concessionnaire automobile qui jouit d'une certaine notoriété outre-Atlantique, s'inquiète d'une dérive ailurophile de l'encyclopédie. Sur le Bistro, des commentateurs avisés ont jugé que cet article faisait fausse route : « On sait tous ici que le vrai désaccord dans la communauté porte en ce moment sur la nécessité ou non de capitaliser le nom des modèles dans le wikicode ! »

Attention à la désinformation russe — Des rapports indiquent que des fermes de contenus produisant de la désinformation russe sont utilisés sur Wikipédia[7]. Peu nombreux sur la version francophone et effectués de bonne foi, ces ajouts sont le fait de contributeurs avertis de la communauté ; la situation est semble-t-il différente sur d'autres versions linguistiques de Wikipédia.

Un livre sur Wikipédia... écrit par un utilisateur bloqué — En , l'éphémère média français d'extrême droite Factuel[8], au détour d'un article commenté sur le Bistro, annonçait un ouvrage à paraître en 2024 consacré à Wikipédia. Son auteur ? Un certain Michel1961 (d · c · b), bloqué indéfiniment en 2021 (notamment pour comportement non collaboratif, détournement de sources, rameutage et POV-pushing) et régulièrement cité dans des articles de presse sensationnalistes en 2020 (où des contributeurs expérimentés sont accusés d'être « islamo-conciliants »), 2021, 2023, février et mai 2024. L'ouvrage, annoncé dès 2023, paraît en aux éditions du Cerf sous le titre La face cachée de Wikipédia : Enquête sur les dérives de l'encyclopédie libre[9]. Cosigné par Victor Lefebvre, ancien journaliste au Figaro et à Factuel, l'ouvrage de 216 pages prétend apporter « une réponse argumentée et dépassionnée » à la question de savoir si l'encyclopédie est devenue « Wokipedia » comme allégué par Elon Musk. La réponse est donnée au dos de l'ouvrage : « Le pouvoir de nuisance d'une petite poignée d'utilisateurs ouvertement militants - pour ne pas dire woke - tend à se renforcer. »

L'actu technique

Nouvel aperçu de l'outil de traduction

L'outil de traduction évolue — L'équipe de Localisation de la langue et des produits a amélioré le Tableau de bord de traduction de contenu en intégrant des fonctionnalités de personnalisation de suggestions et en améliorant l'accessibilité du tableau de bord.

D'où viennent et où vont les lecteurs d'un article ? — L'outil Wikinav permet de répondre à ces questions. En plus de mettre en évidence que la majorité des consultations viennent des moteurs de recherche, l'analyse de l'article Elon Musk (le plus consulté en ) montre ainsi que l'article de Wikipédia par lequel le plus grand nombre de lecteurs arrivent est celui de son ex-compagne Grimes et celui le plus consulté consécutivement est celui de sa compagne actuelle, Shivon Zilis. Les clics entrants depuis ou sortants vers le département de l'Efficacité gouvernementale (DOGE) n'arrivent respectivement qu'en dixième et sixième positions. La vie privée avant la politique.

Dans le mouvement

Le logo de Wikipédia, en allemand, avec la mention « 3 Millionen Artikel ».
Et de trois !

Trois millions d'articles sur Wikipédia en allemand — C'est le seuil franchi par la version germanophone de Wikipédia le . Troisième plus grosse version linguistique en nombre d'articles, elle devance la version francophone, selon la liste des wikis. Il existe toutefois de nombreux autres indicateurs pour comparer les versions linguistiques, dont la profondeur, qui valorise le nombre d'éditions par article et le nombre de pages autres que les articles — en classant les wikis avec cet indicateur, la version francophone arrive en dix-neuvième position (loin devant la version germanophone). Pour en revenir au seuil symbolique de trois millions d'articles, les paris sur la date à laquelle Wikipédia en français l'atteindra sont toujours ouverts.

Une militaire américaine en train de se faire peindre la joue aux couleurs du drapeau LGBT.
Exemple de photo retirée.

Suppression de contenus de l'armée américaine — Le département de la Défense des États-Unis a récemment appliqué une décision présidentielle mettant fin aux politiques Diversité, équité et inclusion (DEI). Cela s'est traduit notamment par la mise hors ligne de beaucoup de contenus multimédia. Associated Press a récupéré une base de données de 26 000 photos concernées par la censure. Wikimedia Commons héberge de nombreuses photos de l'armée américaine, entre 10 et 20 % des 5 millions de photos stockées sur DVIDS, la médiathèque du départ de la Défense. Don-vip (d · c · b) poursuit l'import en masse des photos, que  (d · c · b) avait débuté. Une catégorisation des photos supprimées est en cours ainsi que l'import des vidéos manquantes, projet initié par Mvolz (d · c · b). Une fois ce travail de catégorisation réalisé, il sera possible d'extraire les données pour les mettre sur data.gouv.fr par exemple afin de permettre aux chercheurs et associations d'étudier les contenus retirés. Ce travail n'est pas sans soulever des questions éthiques auxquelles l'armée américaine a été confrontée en 2021 en procédant à un retrait massif de photos d'Afghans afin de les protéger des talibans.

Renforcer la neutralité de point de vue de Wikipédia — La Fondation Wikimédia a récemment mis en évidence des tendances essentielles et prioritaires pour le mouvement, à travers des conversations avec les communautés. Cette année, une tendance qui a suscité de nombreuses discussions au sein et au-delà du mouvement Wikimédia concerne la neutralité : la baisse de confiance dans les informations en ligne et la fragmentation du consensus sur la véracité des informations. Il s'avère que la manière dont le principe de neutralité de point de vue se traduit varie d'un projet Wikimédia à l'autre, ce qui met en évidence la possibilité pour les communautés d'apprendre les unes des autres et d'explorer si des normes mondiales communes de neutralité peuvent mieux protéger les projets (et les bénévoles) dans un environnement de menaces accrues et de réglementation croissante. Pour soutenir les communautés Wikimédia et réaffirmer notre engagement en faveur de la neutralité, la Fondation Wikimédia réunira un groupe de travail composé de contributeurs actifs, de membres du CA de la Fondation, de chercheurs et de conseillers afin d'étudier des recommandations de normes communes pour les politiques NPOV qui peuvent protéger Wikipédia, accroître l'intégrité des projets et fournir davantage de soutien aux bénévoles chargés d'administrer ces politiques. Pour en savoir plus, rendez-vous sur Diff, le blog hébergé par la Fondation à propos du mouvement.

Verrouillages globaux massifs — Le , la WMF a entrepris le verrouillage global de plus de 35 000 comptes (liste) compromis (mots de passe divulgués, vraisemblablement). Dans le communiqué qu'elle a publié quelques jours après, elle indique que cela fait suite à la découverte d'« un schéma de connexions inhabituelles à des comptes enregistrés », qui résulterait d'une fuite de données depuis un autre site web incluant des mots de passe, utilisés aussi sur Wikipédia. Un bon rappel de la nécessité de ne pas utiliser un même mot de passe sur plusieurs sites web, et l'occasion de lire ou relire Aide:Sécurité des comptes utilisateur.

Focus

RAW encourage les membres de la communauté à s'exprimer sur différents enjeux liés à l'écosystème Wikimedia. N'hésitez pas à proposer vos textes pour cette section. N'hésitez pas non plus à réagir dans la section du courrier du lectorat.

À la recherche des articles disparus de Google
par Jules*

Certains articles de Wikipédia sont déréférencés par Google. Combien ? Les déréférencements sont-ils légitimes ? C'est le grand flou.

Le Canard enchaîné publie une enquête qui vous déplaît ? Oubliez le communiqué de presse et la plainte pour diffamation. Le problème, ce n'est pas l'article : c'est le fait qu'il soit lu ! Et s'il était possible de le faire disparaître de Google ? Improbable ? C'est pourtant ce qui s'est passé, nous raconte Thibaut Schepman dans un article paru en janvier dernier dans La Revue des médias, éditée par l'Institut national de l'audiovisuel (INA)[10]. La méthode employée par les malandrins est la suivante : signaler à Google une violation des droits d'auteurs en affirmant que l'article de presse est un plagiat d'une page web, antidatée. Derrière la mésaventure vécue par une journaliste du Canard enchaîné se cache une véritable industrie du déréférencement indu, nous apprend Thibaut Schepman.

Si Google a rétabli le référencement de l'article du Canard enchaîné, est-il possible que Wikipédia soit également victime de telles manœuvres ? La question n'est pas anodine. La plupart des consultations de Wikipédia proviennent des moteurs de recherche, et parmi ceux-ci, Google est en position de quasi-monopole[11]. Un article Wikipédia déréférencé de Google, c'est donc probablement un article qui ne sera quasiment plus lu.

De la lumière mais pas trop

Pour savoir ce qu'il en est, première étape, la plateforme Lumen. Elle permet de consulter les demandes de déréférencement adressées à Google pour divers motifs : violation des droits d'auteurs, diffamation, droit à l'oubli... Mais les notices, dont la consultation n'est pas aisée, n'indiquent pas l'issue de ces demandes. Nous ne sommes guère éclairés.

De son côté, la Fondation Wikimédia (WMF) a commencé en 2014 à publier les notifications de déréférencement qu'elle recevait de Google (dont plusieurs dizaines pour Wikipédia en français). À l'époque, la WMF s'est émue de cette censure, motivée par le droit à l'oubli, dans un billet de blog en anglais[12].

Récemment, l'auteur de ces lignes a eu vent du déréférencement d'un article de Wikipédia en français par Google. Le déréférencement a-t-il été effectué au nom du droit à l'oubli ? Ou bien par une méthode retorse comme celle mise en lumière par La Revue des médias ? Aucune idée : aucun résultat sur Lumen avec le titre de l'article, et pas de notice relative sur la page tenue à jour par la WMF.

RGPD à la suédoise

Renseignement pris auprès du service juridique de la WMF, Google envoie depuis quelques années des notifications de déréférencement dépourvues de l'URL du contenu déréférencé (exemple) et donc parfaitement inutiles. Surprenant. Ce changement découle en fait d'une décision prise en 2020 par l'Autorité suédoise pour la protection de la vie privée, sur le fondement du règlement général sur la protection des données (RGPD). Elle a estimé qu'en fournissant l'URL du contenu déréférencé dans ses notifications, Google permettait à leur destinataire de republier les contenus litigieux sous une autre URL, et donc de bafouer le droit à l'oubli[13]. Exit les URL.

Tout au plus la WMF continue-t-elle de recevoir des notifications précises quand le requérant est situé hors Union européenne ; on sait ainsi que l'article Fusillade de l'université d'Eskişehir Osmangazi a disparu de certaines recherches Google en raison de la législation turque — sans plus de précision.

On ignore d'ailleurs si la WMF reçoit systématiquement une notification de Google en cas de déréférencement. En tout état de cause, la liste des notifications relatives à Wikipédia en français n'évoque aucun déréférencement pour violation des droits d'auteurs — c'est en revanche le cas pour Wikipédia en anglais, comme le relèvent nos confrères du Signpost.

S'agissant du droit à l'oubli, s'il est légitime de chercher un équilibre entre droit à l'information et droit au respect de la vie privée, il apparaît contestable qu'une entreprise privée, en l'espèce Google, puisse opérer sans aucune transparence le déréférencement d'articles.

Le dossier du mois

Dans cette section, le magazine aborde un sujet qui a fait beaucoup réagir à l'intérieur de la communauté, voire à l'extérieur.

Le bouleversement annoncé des pratiques par l'IA générative
par Nanoyo88

Cet article repose sur quatre interviews que vous pouvez consulter dans leur version complète.

Lors de précédentes éditions, nous avons régulièrement abordé le sujet de l'IA générative (genAI), ses implications et conséquences pour Wikipédia. Nous aimerions prendre le temps, au travers d'un dossier et d'interventions de quatre contributeurs, d'approfondir le sujet. Pa2chant.bis, LD, Aelxen et (:Julien:) analysent les usages de l'IA et les problèmes qu'ils engendrent ; ils discutent aussi de l'élaboration d'un texte pour les encadrer.

IA, genAI, LLM :
de quoi parle-t-on ?

De manière générale, les machines informatiques exécutent scrupuleusement des instructions (un programme informatique) écrites par des humains. Les humains disent explicitement quoi faire à la machine, pas à pas. L'intelligence artificielle (IA) est une discipline scientifique visant à permettre aux machines d'être « intelligentes » : apprentissage, raisonnement logique, compréhension du langage naturel (anglais, français…). L'IA cherche à permettre aux machines à gagner en autonomie pour effectuer des tâches plus complexes. L'intelligence artificielle générative (genAI) est un sous-domaine de l'IA dont le but est de générer automatiquement des textes en langage naturel. Les réseaux de neurones sont une technologie très puissante (et gourmande en ressources) largement utilisée dans l'IA.

Depuis 2017-2018, les grands modèles de langage (LLM) utilisent des (grands, très grands) réseaux de neurones pour comprendre du langage naturel, répondre à des questions ou générer du texte (genAI). Le texte écrit par un humain pour interagir avec le LLM est appelé prompt. Pour apprendre le langage et des connaissances, les LLM sont gavés de tonnes de données disponibles sur Internet (dont évidemment WP). Les LLM n'ont pas d'estimation de la valeur de vérité ou véracité de ce qu'ils répondent : ils répondent grosso modo ce qui est le plus probable parmi les textes sur lesquels leur apprentissage s'est fondé. Le LLM invente donc : parfois c'est juste, parfois c'est faux — on parle alors d'hallucination.

Pour en savoir plus, lire cet article sur Le Monde.

Ils fleurissent sur l'encyclopédie et le printemps n'y est pour rien. Les textes générés par IA sont de plus en plus nombreux sur les articles de Wikipédia à mesure que l'usage de l'IA générative se démocratise. Pour Pa2chant.bis, cet usage wikipédien se fait « en l'absence de recommandation », ce qui a pour conséquence de rendre « très lourd et coûteux en temps de démontrer des abus » et risque de démotiver les contributeurs qui se consacrent à ces vérifications.

Julien indique à ce propos qu'il est « difficile d'anticiper les usages qui seront faits des LLM. Mais c'est potentiellement un game changer pour WP », qui peut au choix « devenir un dépôt de connaissances approximatives via des masses de textes mal comprises ou un facilitateur de rédaction ».

« C'est l'avenir de Wikipédia qui se joue »

Pa2chant.bis n'y va pas par quatre chemins : « C'est l'avenir de Wikipédia qui se joue. » Les enjeux et les risques de ces nouvelles pratiques sont déjà connus : « outre les potentielles atteintes au droit d'auteur, on peut citer les problèmes de fiabilité de l'information de type absence ou détournement de source, les TI et les problèmes de style. »

La majorité des usages observés ne résistent pas aux vérifications et affichent différents problèmes qui pourraient être évités si la contribution était 100 % humaine. C'est notamment le cas des traductions automatiques, des synthèses de sources multiples, de l'identification de sources, etc.

Des usages problématiques, Pa2chant.bis en a vu quelques exemples surprenants. Par exemple, dans une page Wikipédia sur une maladie, indiquer aux parents que même traitée, elle peut être mortelle, alors qu'aucune source n'a été trouvée dans ce sens. Dans l'article 'Ndrangheta (la mafia calabraise), une famille dont le nom est parfaitement inconnu des sources a été désignée comme étant influente. Dans un autre article étaient indiqués des liens familiaux entre deux personnes, liens imaginaires sourcés avec un blog généré par IA. Les abus peuvent d'une envergure encore supérieure, comme les interventions mêlant TI, IA et vandalismes sur une profusion d'articles dédiés aux quasars : alors que le projet:Astronomie compte peu de membres, et encore moins de spécialistes de ce sous-domaine, cela va exiger d'utiliser WP:TNT.

« L'IA, on l'utilise depuis super longtemps »

Julien rappelle que les traductions automatiques relèvent de l'IA, et plus récemment de l'introduction des LLM. Or, « la communauté semble ok avec cette utilisation de l'IA », quand bien même Julien en est lui-même critique. Concernant les LLM, « des utilisateurs ont développé et rendu compte de pratiques plus avancées (Projet:Observatoire des IA/Documentation, Utilisateur:Global Donald/Création d'article via ChatGPT 4o et comparaison des prompts, Utilisateur:Nanoyo88/testIA…) ». La question revient dès lors à se demander si la relecture et la vérification sont bien effectuées, et c'est là que ça coince. Comme pour les traductions automatiques à la chaîne, les textes générés par IA augmentent la quantité de travail de vérification pour la communauté.

Il y a également des usages de LLM qui pourraient être utiles à l'automatisation de certaines opérations de maintenance sur Wikipédia. « Sur les projets sportifs (basket, foot, foot US), c'est toujours relou quand un joueur change de club : il faut rajouter des catégories, changer des palettes, mettre à jour l'infobox… Not fun. J'ai dans ma todo list le développement d'un outil automatique de mise à jour quand un joueur change de club, avec l'usage d'un LLM. » Les LLM pourraient également être utilisés afin de lutter contre le vandalisme, voire même contre les mésusages de LLM !

Une lutte contraignante

Dernièrement, un tracker a été mis en place par Julien sur la base du signalement, par Pa2chant.bis, de sources comportant un paramètre UTM lié à ChatGPT. Cette longue liste n'est que la partie émergée d'une analyse en profondeur nécessaire et dans laquelle il faut comparer les sources présentées et les informations ajoutées.

Afin de pouvoir rapidement identifier ce type d'ajout, un filtre anti-abus a été créé par Aelxen. « Le filtre consiste à détecter les insertions d'URL contenant un paramètre UTM provenant de ChatGPT. Actuellement, il est uniquement utilisé pour récupérer des statistiques. À terme, il pourrait permettre d'insérer un message d'avertissement lors de la publication des modifications. »

« Des détecteurs insuffisamment fiables »

Actuellement, on peut difficilement s'appuyer uniquement sur des outils de détection et éléments techniques pour identifier les usages de textes générés par IA avec fiabilité. « Ces outils sont imparfaits, explique Julien : les LLM sont des machines probabilistes donc il y a des risques de faux-positifs. Les études qui essaient de mesurer les faux positifs divergent pas mal et s'appuient sur des textes en anglais, donc il faut prévoir une décote pour le français. »

Aelxen et Pa2chant.bis jugent également la fiabilité de ces détecteurs insuffisante. Pour Pa2chant.bis, « le plus performant détecteur trouve en français un nombre impressionnant de probables faux-positifs » et Julien souligne une observation surprenante d'Esprit Fugace : il y a des faux positifs lorsque le contenu est rédigé « par des personnes neuroatypiques dont le style rédactionnel diffère » de la norme.

Sur les possibilités techniques, Aelxen suggère que « des outils semi-automatiques pourraient être envisagés pour aider à l'analyse, par exemple en signalant des passages suspects ou en identifiant des modèles d'écriture caractéristiques de l'IA ». Mais Julien considère que c'est « sans issue parce que les LLM s'aguerrissent et les méthodes de détection sont toujours en retard. Il est possible que le contenu genAI devienne rapidement indiscernable par un œil humain comme par un détecteur ».

« Ils voient surtout le verre à moitié plein sans voir le verre à moitié vide »
Mésusages de l'IA :
comment aider ?

Pour donner un coup de main sur le sujet, plusieurs possibilités. Vous pouvez participer à l'élaboration de la future recommandation ainsi qu'au sondage associé. La vérification des quelque 170 insertions de sources via ChatGPT peut également vous intéresser. De bonnes âmes sont aussi nécessaires pour l'analyse et le traitement de 284 + 400 sites générés par IA utilisés comme sources sur Wikipédia.

Enfin, si vous rencontrez des textes que vous soupçonnez d'être générés par IA et qui contreviennent aux PF, vous pouvez les signaler sur Projet:Observatoire des IA/Contrôle.

Votre aide est précieuse !

Identifier les textes générés par IA et leurs problèmes n'est pas chose aisée. Pa2chant.bis témoigne de sa pratique, indiquant que cela se fait « au hasard des analyses de créations d'articles, des relectures et de la patrouille ». Les mauvais usages possèdent plusieurs marqueurs tels que le style stéréotypé et souvent laudatif, le plan caractéristique et les détournements de sources par hallucination — « et là, c'est beaucoup plus long à identifier ».

Le second problème est qu'il est particulièrement complexe de faire comprendre aux utilisateurs d'IA, novices ou expérimentés, les problèmes de leurs contributions. Pa2chant.bis a l'impression « qu'ils voient surtout le verre à moitié plein (leurs prompts sont de plus en plus précis et performants, et le niveau de réponse des IA s'améliore) sans voir le verre à moitié vide (les erreurs, le langage stéréotypé et les traductions parfaites en mot à mot, mais porteuses de contresens, non-sens ou inventions) ».

Malheureusement, l'utilisation abusive de l'IA reste très tentante car elle est en mesure de produire des textes d'apparence robuste, auxquels il est aisé pour les contributeurs de faire confiance, en ayant la fausse impression d'avoir maitrisé un sujet. À cela s'ajoute la culture historique de Wikipédia « selon laquelle l'encyclopédie est en construction, les erreurs ne sont pas trop graves et finiront bien par être corrigées un jour » ainsi que le sentiment que refuser l'usage de l'IA relève « d'une forme de passéisme, ou d'une attitude rétrograde vis-à-vis des progrès technologiques ».

Vers la mise en place d'une recommandation

Le , Pa2chant.bis tirait une nouvelle fois la sonnette d'alarme, soulevant une nouvelle pratique consistant à sourcer des contenus, ou générer des contenus sourcés, par le biais de l'IA. Cette situation le pousse alors à inviter la communauté à se pencher sur un passage à l'état de recommandation d'un texte encadrant l'usage des IA. L'idée a été très bien accueillie et un sondage est en préparation. Deux versions existent actuellement, un essai élaboré depuis plusieurs mois et une contre-proposition simplifiée par LD.

Cependant, établir une recommandation présente plusieurs contraintes car elle a vocation à établir des lignes directrices à suivre dans la contribution. LD nous rappelle qu'elles doivent donc « répondre aux attentes et interrogations les plus courantes, tout en véhiculant un « savoir-faire » concret ».

« Elle doit être claire, non contradictoire avec les autres normes et permettre un ajustement progressif »

Le plus complexe est de produire une recommandation « claire, non contradictoire avec les autres normes (principes, règles, recommandations) et permettre un ajustement progressif ». Ce dernier élément est nécessaire afin de pouvoir répondre aux éventuelles évolutions législatives. En effet, l'IA générative pose la question de la propriété intellectuelle, dans la mesure où « les textes générés [peuvent provenir] de textes régis par le droit d'auteur et [où] ces générations [pourraient être] considérées comme également soumises au droit d'auteur (et/ou sont considérées comme des œuvres dérivées ou collectives) ».

Cette future recommandation ne supplantera donc pas les recommandations déjà existantes. LD évoque le propos de @Cosmophilus à ce sujet en soulignant que « le mauvais usage de l'IA se caractérise par la violation d'un principe ou d'une norme déjà définie, telle que WP:DA, WP:V, WP:STYLEetc. ». Aussi le but n'est-il pas de répéter le corpus réglementaire mais de donner des indications pour « se concentrer sur l'application de ces normes dans le cadre de l'IA ».

Si la communauté démontre une certaine hostilité à l'égard des contenus générés par IA et le démontre au travers de précédents sondages, il ne semble pas que l'on se dirige vers une interdiction stricte de son usage. Il est d'ores et déjà complexe de le démontrer.

Face à ces nouvelles pratiques, comme l'écrit LD, le mot d'ordre pourrait bien être de « rester guidé par le bon sens et le discernement ».

L'agenda

Le wik’hit-parade

Articles les plus vus en
No  Article Av. Vues Image Remarques
1 Émilie Dequenne B 1 608 141 Cette actrice belge, lauréate du prix d'interprétation féminine du Festival de Cannes pour Rosetta et du César de la meilleure actrice dans un second rôle pour Les choses qu'on dit, les choses qu'on fait, est décédée le des suites d'un cancer des surrénales à l'âge de 43 ans.
2 Elon Musk B 447 151 Cet homme d'affaires américain est très présent dans l'actualité depuis la réélection à la présidence des États-Unis de Donald Trump (no 9) qui l'a nommé à la tête d'un tout nouveau département de l'Efficacité gouvernementale.
3 Leïla Bekhti Bon début 430 921 Cette actrice française tient le premier rôle dans Ma mère, Dieu et Sylvie Vartan, sorti en salles en France le .
4 Herbert Léonard Bon début 417 692 Ce chanteur français, qui s'est fait connaître dans les années 1980 avec des tubes comme Pour le plaisir ou Quand tu m'aimes, est décédé le à l'âge de 80 ans.
5 Jean-Louis Debré Bon début 344 587 Cet homme politique français, ancien ministre de l'Intérieur, président de l'Assemblée nationale et président du Conseil constitutionnel, est décédé le , lui aussi à l'âge de 80 ans.
6 Adolescence (série télévisée) Bon début 337 219 Cette mini-série britannique, conçue par Jack Thorne (photo), a rencontré un grand succès à sa sortie sur Netflix, le . Elle aborde des sujets d'actualité (le cyberharcèlement, la culture incel, la radicalisation en ligne…) sous une forme inhabituelle (chaque épisode se compose d'un unique plan-séquence).
7 Claude Malhuret Bon début 310 362 Ce sénateur français, ancien président de Médecins sans frontières et cofondateur du site Doctissimo, a prononcé le 5 mars devant le Sénat un discours très remarqué en France et à l'international contre la politique menée par le président des États-Unis Donald Trump (no 9).
8 Michel Ferracci Bon début 302 884 Cet acteur français était le mari d'Émilie Dequenne (no 1).
9 Donald Trump B 297 837 Depuis sa réélection à la présidence des États-Unis en novembre dernier, cet homme d'affaires défraie constamment la chronique par ses décisions aussi nombreuses que controversées. Le mois de voit ainsi la déportation de détenus vénézuéliens au Salvador, le début du démantèlement du département de l'Éducation et la menace de l'instauration de droits de douane draconiens.
10 Olivier Giroud B 278 711 Ayant annoncé sa retraite internationale en , le footballeur français, champion du monde en 2018, a été ovationné par le Stade de France le avant le match France-Croatie comptant pour la Ligue des nations de l'UEFA 2024-2025.
11 Michael Olise Bon début 269 396 Ce footballeur français inscrit son premier but sous le maillot de l'équipe de France lors de ce même match France-Croatie du 23 mars.
12 Olympe de Gouges B 261 523 Cette pionnière française du féminisme est le sujet du téléfilm Olympe, une femme dans la Révolution, diffusé le 3 mars sur la chaîne France 2.
13 France AdQ AdQ 251 529 Le pays qui compte le plus grand nombre de francophones figure régulièrement parmi les articles les plus vus de Wikipédia en français.
14 Cyril Hanouna B 249 540 L'ancien animateur vedette de C8 poursuit la diffusion de son émission controversée Touche pas à mon poste ! sur Internet après la fermeture de la chaîne, le .
15 Carême B 239 339 Cette période du calendrier chrétien correspondant aux 40 jours précédant Pâques a commencé cette année le .
16 Gene Hackman Bon début 238 685 Figure de proue du Nouvel Hollywood, récompensé par deux Oscars et quatre Golden Globes, l'acteur américain a été retrouvé mort à son domicile de Santa Fe le avec son épouse Betsy Arakawa (en). Les résultats de l'enquête ont été publiés le .
17 Emilia Pérez Bon début 237 090 Cette comédie musicale sur un chef de cartel mexicain interprété par Karla Sofía Gascón (photo) qui change de sexe pour changer de vie a reçu sept récompenses lors des César, le , mais ses treize nominations aux Oscars ne se sont traduites que par deux victoires le .
18 Décès en mars 2025 Ébauche 233 582 Comme l'illustrent les numéros 1, 4, 5 et 16, la mort d'une personnalité entraîne presque systématiquement un pic de fréquentation de son article.
19 Jacques Audiard Bon début 227 677 Réalisateur du no 17, qui lui a valu le César de la meilleure réalisation.
20 Volodymyr Zelensky B 219 818 Alors que la guerre russo-ukrainienne se poursuit, le président ukrainien s'est rendu à Washington le pour une rencontre particulièrement houleuse avec Donald Trump (no 9).

Méthodologie : sur le modèle du Top 25 Report de Wikipédia en anglais, ce wik'hit-parade reprend les données fournies par l'outil « Pages les plus vues ». Sont exclues les entrées clairement aberrantes comme Cookie (informatique) ou Soudan du Sud, dont le nombre de visites élevé n'est pas le fruit d'un véritable intérêt des internautes : elles se distinguent par un taux très faible (moins de 5 %) ou au contraire très élevé (plus de 95 %) de consultations sur mobile.

Les autres infolettres

La page Wikipédia:RAW/Découvrir recense les infolettres et blogs relatifs à Wikimedia.

En plus de RAW, vous pouvez lire le Wikimag, newsletter hebdomadaire de la Wikipédia francophone (Voir le dernier numéro semaine 13), l'infolettre Wikifier la science (voir hiver 2024) et les Actualités mensuelles du Wiktionnaire (mars 2025).

Les anglophones peuvent aussi lire The Signpost, publié toutes les deux semaines, la newsletter hebdo de la communauté Wikidata (voir ici d:Wikidata:Status updates/2025 02 24) ou encore la newsletter du projet Wikifunction (wikifunctions:Wikifunctions:Status updates/2025-01-15).

Courrier du lectorat

Il nous fera plaisir de lire les messages déposés ici et, si nécessaire, d'y répondre dans les plus brefs délais.

  • bonjour, bravo pour ce numero. A propos du bouquin sur wikipedia qui va sortir on connait le nom reel de l'auteur mais comment on connait le nom d'utilisateur à celui de l'auteur? Et on a le droit de le dire? Ce serait pas du Wikipédia:Doxxing à l'envers? A moins que ce soit un poisson du 1er avril auquel cas je me suis bien fait attraper... --Sergent Cool (discuter) 1 avril 2025 à 09:19 (CEST)
    Bonjour @Sergent Cool. Ce n'est pas un poisson d'avril, ni du doxxing à l'envers : l'utilisateur est intervenu dans la presse successivement sous le nom de « Michel », « Michel wiki » et « Michel Sandrin » (peut-être un pseudonyme, d'ailleurs ?), en évoquant son « bannissement » (blocage indef, en fait), si bien que les wikipédiens ont fait le lien sans difficulté. — Jules* 💬 1 avril 2025 à 12:28 (CEST)
  • Bonjour Émoticône à tous et merci pour ce travail ! Je suis honoré de me découvrir nommément cité dans vos lignes (par @LD), quelle agréable surprise ! Tout ceci dans le cadre d'un débat ô combien actuel, qui plus est… C'est l'occasion de saluer la réflexion et les efforts ayant mené à ce numéro, et, plus généralement, la mise en lumière continuelle du travail collaboratif wikimédien dans les pages de ce magazine (dont je suis un lecteur assidu), tâche qui ne doit pas être aisée. Félicitations ! --Cosmophilus (discuter) 2 avril 2025 à 22:30 (CEST)

Renouveau — content de voir des forces vives travailler à l'évolution des RAW. Un merci particulier à Jules* pour son focus.
longue vie à la nouvelle rédaction! - Simon Villeneuve 3 avril 2025 à 12:42 (CEST)

Merci à tous les trois, @Sergent Cool, @Cosmophilus et @Simon Villeneuve, pour vos retours, c'est encourageant Émoticône sourire. — Jules* 💬 3 avril 2025 à 12:46 (CEST)
Un numéro intéressant. Émoticône — Cantons-de-l'Est p|d|d 🧹 4 avril 2025 à 00:37 (CEST)
Citations originales
Notes
Références
  1. Nicolas Gastineau, « Propos d’un patrouilleur de Wikipédia », sur Revue21.fr, (consulté le )
  2. « Pourquoi la droite américaine s’attaque-t-elle à Wikipédia? », sur ici.radio-canada.ca (consulté le )
  3. « Wikipédia, la méticuleuse fabrique du savoir », La Croix,‎ (ISSN 0242-6056, lire en ligne, consulté le )
  4. « Attaques contre Wikipédia : ce contributeur nous explique comment fonctionne l'encyclopédie libre et partagée », sur France 3 Grand Est, (consulté le )
  5. « Wikipedia : comment les contributions sont-elles contrôlées ? », sur France Culture, (consulté le )
  6. David Dufresne Euryale, « Wikipédia: qui veut sa peau (et pourquoi)? », sur Au Poste, média indépendant 100% Live & Libre, (consulté le )
  7. « Les outils d’IA comme ChatGPT ou Gemini utilisent des sites de propagande russe comme sources », Le Monde,‎ (lire en ligne, consulté le )
  8. Brice Laemle, « « Factuel », un nouveau média en ligne parrainé par Christine Kelly et Dominique Rizet », Le Monde,‎ (lire en ligne)
  9. « La Face cachée de Wikipédia », sur éditions du Cerf (consulté le ).
  10. Cet article a été partagé et discuté sur la page de discussion du Projet:Antipub.
  11. Comme le montre l'outil Search Engine Referrals.
  12. Le quotidien Le Monde y a aussi consacré un article.
  13. Lire à ce sujet ce billet sur le site du Comité européen de la protection des données.

Vous avez envie de vous investir aux côtés de Wikimédia France en faisant un don régulier ? On vous donne 7 bonnes raisons de franchir le pas. À Wikimédia France, nous œuvrons pour un savoir libre et gratuit. Nous soutenons les bénévoles contribuant sur les projets comme Wikipédia, Wikimedia Commons, ou Wikidata, et qui enrichissent […]

L’article Pourquoi passer à un don régulier pour garantir le futur des projets Wikimédia ? est apparu en premier sur Wikimédia France.

Numéro de la semaine 2025-15

Sunday, 13 April 2025 22:00 UTC


Comité de rédaction

Cette édition a été rédigée par Pronoia (d · c).

Envoyez-nous vos remarques sur la rédaction du Wikimag, des annonces de débat, des tribunes d’expression libre ou le signalement de nouvelles pages d’intérêt commun sur Wikipédia.
Nous avons besoin de votre aide pour maintenir le Wikimag.

Commentaires sur cette édition

  • Erreur de mois dans la section annonce

Dans la section des annonces le mois de mars est indiqué alors qu'on est en avril. Spectritus (discuter) 7 avril 2025 à 13:47 (CEST)

@Spectritus : merci de ta vigilance. Correction faite. --Warp3 (discuter) 7 avril 2025 à 20:42 (CEST).


Comment déclarer mes dons pour 2025 ?

Thursday, 10 April 2025 13:47 UTC

Comment déclarer vos dons sur votre déclaration 2025 des revenus de 2024 ? Sebastiaan ter Burg from Utrecht, The Netherlands, CC BY 2.0 Vous avez fait un don en 2023 à Wikimédia France et vous ne savez pas comment remplir votre déclaration de revenus en 2024 ? Voici 3 questions-réponses pour vous aider. 1. Déclarez […]

L’article Comment déclarer mes dons pour 2025 ? est apparu en premier sur Wikimédia France.

Rémy Gerbet, directeur exécutif et Michaël Barbereau, administrateur système chez Wikimédia France, lors d’une présentation du projet Live RC à la Fondation Free. Crédit Image Share It Début avril 2025, l’association Wikimédia France a remporté avec l’association Share It, l’appel à projets : « En commun : la tech libre ». Un projet qui va permettre de […]

L’article Wikimédia France lauréate de l’appel à projets « En commun : la tech libre » est apparu en premier sur Wikimédia France.

Numéro de la semaine 2025-14

Sunday, 6 April 2025 22:00 UTC


Comité de rédaction

Cette édition a été rédigée par Pronoia (d · c).

Envoyez-nous vos remarques sur la rédaction du Wikimag, des annonces de débat, des tribunes d’expression libre ou le signalement de nouvelles pages d’intérêt commun sur Wikipédia.
Nous avons besoin de votre aide pour maintenir le Wikimag.

Commentaires sur cette édition

Il manque ma rubrique préférée...--Legonin(oui ?) 31 mars 2025 à 21:21 (CEST)
Bonjour Legonin Émoticône,
Le bot qui initialise les statistiques de consultation a eu un problème malheureusement... sans doute l'effet "changement d'heure".
J'ai remonté le problème. J'espère que ce sera réparé la semaine prochaine.
Bonne soirée,--Pronoia (discuter) 31 mars 2025 à 21:33 (CEST)
Merci ! Legonin(oui ?) 31 mars 2025 à 21:37 (CEST)


Numéro de la semaine 2025-13

Sunday, 30 March 2025 22:00 UTC


Comité de rédaction

Cette édition a été rédigée par Pronoia (d · c).

Envoyez-nous vos remarques sur la rédaction du Wikimag, des annonces de débat, des tribunes d’expression libre ou le signalement de nouvelles pages d’intérêt commun sur Wikipédia.
Nous avons besoin de votre aide pour maintenir le Wikimag.

Commentaires sur cette édition

Pas de commentaires pour le moment, n'hésitez pas !


Numéro de la semaine 2025-12

Sunday, 23 March 2025 22:00 UTC


Comité de rédaction

Cette édition a été rédigée par Pronoia (d · c).

Envoyez-nous vos remarques sur la rédaction du Wikimag, des annonces de débat, des tribunes d’expression libre ou le signalement de nouvelles pages d’intérêt commun sur Wikipédia.
Nous avons besoin de votre aide pour maintenir le Wikimag.

Commentaires sur cette édition

Bonsoir à tous les wikipédiennes et wikipédiens, Bonjour Émoticône me voilà de retour, et même si c'est si j'ai peu de temps, je viens de parcourir le wikimag... Bravo et merci pour ce numéro varié... Dans la rubrique Articles les plus consultés, j'ai 6 sur 10, et enfin la moyenne ... les sujets sont modulés (Monde du cinéma avec l'actualité et malheureusement le décès de Émilie Dequenne le sport avec le rugby à XV et le football et bien sûre la politique nationale et internationale).... La Revue de presse est chargée depuis quelques semaines et le bistro aussi... Dans les Informations générales, le français se maintient à la quatrième place et les contributeurs enregistrés actifs sont en augmentation depuis l'affaire du Point suivi de la Lettre ouverte.... (Smiley: triste) Dans les Plaisirs visuels, les photos sont diversifiées et celle d'aujourd'hui est choisie en fonction de la Saint-Patrick, le Milan noir attrapant au vol un poisson est vraiment une prise de vue magnifique.... À la semaine prochaine si mon emploi du temps le permet et merci aux rédacteurs qui font un travail remarquable...Smiley fleur de tournesol....--Maleine258 (discuter) 17 mars 2025 à 14:38 (CET)


Le 19 mars prochain, la commission des affaires culturelles organise une table ronde pour échanger sur l’intelligence artificielle et le droit d’auteur. Les organisations représentatives des droits des usagers, les communs numériques ainsi que des industries opératrices de systèmes d’intelligence artificielle, n’y sont pas conviés. Pour dénoncer cette absence, Wikimédia France a co-signé et envoyé […]

L’article IA et droit d’auteur : Les acteurs du monde du libre doivent aussi être consultés est apparu en premier sur Wikimédia France.

Numéro de la semaine 2025-11

Sunday, 16 March 2025 22:00 UTC


Comité de rédaction

Cette édition a été rédigée par Pronoia (d · c).

Envoyez-nous vos remarques sur la rédaction du Wikimag, des annonces de débat, des tribunes d’expression libre ou le signalement de nouvelles pages d’intérêt commun sur Wikipédia.
Nous avons besoin de votre aide pour maintenir le Wikimag.

Commentaires sur cette édition

Pas de commentaires pour le moment, n'hésitez pas !


Numéro de la semaine 2025-10

Sunday, 9 March 2025 22:00 UTC


Comité de rédaction

Cette édition a été rédigée par Pronoia (d · c).

Envoyez-nous vos remarques sur la rédaction du Wikimag, des annonces de débat, des tribunes d’expression libre ou le signalement de nouvelles pages d’intérêt commun sur Wikipédia.
Nous avons besoin de votre aide pour maintenir le Wikimag.

Commentaires sur cette édition

Pas de commentaires pour le moment, n'hésitez pas !


Numéro de la semaine 2025-09

Sunday, 2 March 2025 22:00 UTC


Comité de rédaction

Cette édition a été rédigée par Pronoia (d · c).

Envoyez-nous vos remarques sur la rédaction du Wikimag, des annonces de débat, des tribunes d’expression libre ou le signalement de nouvelles pages d’intérêt commun sur Wikipédia.
Nous avons besoin de votre aide pour maintenir le Wikimag.

Commentaires sur cette édition

Bonjour,

Merci pour ce mag. Il semble y avoir une erreur d'URL pour l'article de Nature "Why these scientists devote time to editing and updating Wikipedia", le lien renvoyant vers un article de TexasHomePage intitulé "Chamber of Commerce leading the charge for updated city Wikipedia page".

N'ayant pas de compte, je préfère signaler plutôt que modifier directement.

Bonjour 109.190.62.72 Émoticône,
Merci beaucoup pour le signalement Émoticône sourire. C'est corrigé !--Pronoia (discuter) 24 février 2025 à 13:24 (CET)


Cet article est extrait de la vidéo, disponible en bas du texte. Depuis quelques jours, on lit plein d’articles dans la presse qui parlent de Wikipédia sans vraiment connaître son fonctionnement. Alors nous, l’association Wikimédia France qui œuvrons pour le libre partage de la connaissance libre et soutenons la communauté de contributeurs sur Wikipédia, nous […]

L’article [Réaction] « Wikipédia n’est pas un média privé, c’est un commun numérique » est apparu en premier sur Wikimédia France.

Numéro de la semaine 2025-08

Sunday, 23 February 2025 22:00 UTC


Comité de rédaction

Cette édition a été rédigée par Pronoia (d · c).

Envoyez-nous vos remarques sur la rédaction du Wikimag, des annonces de débat, des tribunes d’expression libre ou le signalement de nouvelles pages d’intérêt commun sur Wikipédia.
Nous avons besoin de votre aide pour maintenir le Wikimag.

Commentaires sur cette édition

Pas de commentaires pour le moment, n'hésitez pas !


L’association Wikimédia France, qui œuvre pour le libre partage de la connaissance au travers des projets Wikimedia dont Wikipédia, dénonce fermement les intimidations et menaces reçues par des contributeurs de l’encyclopédie. Ce samedi 15 février, un bénévole a reçu une menace de divulgation de son identité par un journaliste du magazine Le Point à la […]

L’article Réaction de Wikimédia France suite aux menaces du magazine Le Point envers des bénévoles de Wikipédia est apparu en premier sur Wikimédia France.

Wikipédia reconnue comme un bien public numérique

Monday, 17 February 2025 14:09 UTC

Sarah Krichen WMFr, CC BY-SA 4.0 , via Wikimedia Commons La Digital Public Goods Alliance, financée par l’ONU, a ajouté Wikipédia à son registre, affirmant le rôle important que jouent ses éditeurs bénévoles dans l’amélioration de l’Internet pour tous. 12 février 2025 – Wikipédia a été officiellement reconnue comme un bien public numérique (DPG) par […]

L’article Wikipédia reconnue comme un bien public numérique est apparu en premier sur Wikimédia France.

Célébrons le domaine public en 2025

Monday, 17 February 2025 09:39 UTC

Le 9 janvier 2025, Wikimedia France a célébré le domaine public et a participé à la journée européenne du domaine public à Bruxelles pour évoquer les problématiques liées au respect du domaine public et célébrer l’arrivée de nouvelles œuvres en son sein. La journée européenne du domaine public Cette année, la journée européenne du domaine […]

L’article Célébrons le domaine public en 2025 est apparu en premier sur Wikimédia France.

Numéro de la semaine 2025-07

Sunday, 16 February 2025 22:00 UTC


Comité de rédaction

Cette édition a été rédigée par Pronoia (d · c).

Envoyez-nous vos remarques sur la rédaction du Wikimag, des annonces de débat, des tribunes d’expression libre ou le signalement de nouvelles pages d’intérêt commun sur Wikipédia.
Nous avons besoin de votre aide pour maintenir le Wikimag.

Commentaires sur cette édition

Bonjour,

C'est un bon magazine malgré quelques petites erreurs d'orthographe et de grammaire.

Spectritus (discuter) 10 février 2025 à 09:03 (CET)

Bonjour Spectritus Émoticône,
Merci pour ton retour. N'hésite pas à corriger les erreurs. Le Wikimag est ouvert à tout le monde ;).--Pronoia (discuter) 10 février 2025 à 09:15 (CET)


mikemacmarketing, CC BY 2.0 , via Wikimedia Commons Il est grand temps de faire une vraie place à la société civile dans la gouvernance de l’IA. Une tribune initiée et publiée par Renaissance numérique, think tank indépendant et non partisan dédié à la transformation numérique de la société, co-signée par Wikimédia France et  43 signataires […]

L’article [Tribune] Gouvernance mondiale de l’IA : passer à l’action avec la société civile est apparu en premier sur Wikimédia France.