Numéro du 21 septembre 2023

Thursday, 21 September 2023 00:00 UTC

L'édito de PAC2

Ce numéro contient beaucoup de brèves sur un grand nombre de sujets : l'enquête sur la communauté Wikimédia, la régulation de la haine en ligne, une réflexion sur la contribution à Wikidata, les articles orphelins ou encore la modernisation de l'infrastructure d'apprentissage automatique de la fondation Wikimédia.

Nous introduisons aussi une nouvelle section pour faire un zoom sur un projet Wikimédia. La section est inaugurée avec une présentation de Wikivoyage en français.

Globalement, je me dis que le numéro est peut être un peu long pour le lecteur ou la lectrice (à peu près 20 minutes de lecture d'après la liseuse de Firefox). Chacun pourra picorer ce qu'il souhaite.

N'hésitez pas à contribuer au prochain numéro en proposant des sujets en salle de rédaction ou directement dans le contenu.

Bonne lecture !

Brèves

Community Insights — La Fondation Wikimédia publie chaque année une enquête sur la communauté Wikimédia intitulée Community Insights[1]. L'édition 2023 s'appuie sur des données collectées grâce à une enquête statistique entre juin et septembre 2022. L'enquête a été menée dans 28 langues différentes[2].

Estimation de la part des éditrices et éditeurs actifs par an.

Parmi les éditrices et éditeurs actifs, la part des femmes est passée de 11 % en 2019 à 15 % en 2020 et 13 % en 2022. En revanche, la part des éditrices et éditeurs considérés comme faisant partie des genres minoritaires (gender-diverse) est passée de 2 à 4 %. Le terme de gender-diverse est emprunté au Haut-Commissariat des Nations unies aux droits de l'homme pour désigner les personnes trans, non-binaires, genderqueer, agenrées ou les personnes s'identifiant à plusieurs genres.

Parmi les nouvelles personnes contribuant à Wikimédia depuis 2021, on trouve 20 % de femmes et 7 % de personnes gender-diverse.

Distribution par âge de la communauté comparée à la population mondiale

Globalement, la distribution par catégorie d'âge de la communauté correspond à la distribution mondiale par catégorie d'âge. Toutefois, les personnes de moins de 18 ans ne sont pas incluses dans l'enquête. En revanche, les éditrices et éditeurs actifs sont nettement plus diplômés que la population des pays de l'OCDE. Par ailleurs, 12 % des éditrices et éditeurs se considèrent comme appartenant à une minorité ethnique dans leur pays.

38 % des contributrices et contributeurs trouvent que la Fondation Wikimédia communique bien sur ses projets et ses initiatives. 56 % considèrent que la Fondation a les bons programmes et les bonnes stratégies pour atteindre l'objectif de 2030 de devenir l'infrastructure centrale de la connaissance libre et accessible à tous et toutes.

Part des éditrices et éditeurs qui se sont sentis en danger ou inconfortable au cours des 12 mois précédents.

44% des femmes, 53% des personnes gender-diverses et 33% des hommes contribuant activement se sont sentis en danger (unsafe) ou inconfortables (uncomfortable) au cours des 12 mois précédents l'enquête. 25% des éditrices et éditeurs déclarent avoir subi du harcèlement au cours des 12 derniers mois. La proportion est plus élevée pour les femmes (31%). 46% des éditrices et éditeurs savent comment trouver de l'aide en cas de harcèlement.

Part des éditrices et éditeurs qui déclarent avoir subi du harcèlement.

Lutte contre les contenus haineux

En juillet 2023, l'Autorité de régulation de la communication audiovisuelle et numérique (ARCOM) a publié un bilan des moyens mis en place par les plateformes en ligne dans la lutte contre la diffusion des contenus haineux en 2022. En France, l'article 42 de la Loi confortant le respect des principes de la République impose aux principales plateformes présentes sur le territoire national des obligations de moyen dans la lutte contre la diffusion des contenus haineux. L'ARCOM est chargée de superviser la mise en œuvre de ces obligations. Le règlement européen sur les services numériques (connu sous le nom de DSA pour Digital services act ou RSN en français) entre en œuvre dans les pays de l'Union européenne le 25 août 2023 pour les grandes plateformes en ligne (les VLOP pour very large online platforms) et le 17 février 2024 pour l'ensemble des services en ligne concernés. Les dispositions du DSA remplaceront donc les dispositions de la loi confortant le respect des principes de la République.

Dans ce rapport, l'ARCOM s'intéresse à l'accessibilité et l'intelligibilité des conditions générales, à la prise en compte dans les conditions générales de la législation sur les contenus haineux, aux dispositifs de signalement des contenus haineux, aux moyens mis en œuvre pour la modération des contenus, à la lutte contre les signalements abusifs et enfin à la coopération avec les autorités administratives et judiciaires, que ce soit pour informer les autorités des contenus haineux signalés ou pour traiter les demandes des autorités.

La fondation Wikimédia a fait remarquer à l'ARCOM que le questionnaire n'est pas adapté au fonctionnement collaboratif et communautaire de Wikipédia.

Dans une note au bas de la page 10, l'ARCOM regrette que le Code universel de conduite ne soit disponible qu'en anglais. Pourtant il existe une traduction en français[3].

Sur la modération des contenus illicites, l'ARCOM note : « En raison de l’approche collaborative et décentralisée de sa politique de modération, comparer Wikipédia à d’autres services apparaît peu pertinent. Toutefois, la description de cette politique dans les CG (ie conditions générales) de la plateforme mériterait de gagner en précision et en transparence. »

Sur les dispositions de signalement des contenus haineux, l'ARCOM note la spécificité de Wikipédia par rapport aux autres plateformes : « Wikipédia, en raison des spécificités de son modèle, ne dispose pas de dispositif de signalement « traditionnel ». Confronté à un contenu problématique, un utilisateur pourra (i) le corriger lui-même en modifiant la page, (ii) expliquer le problème sur la page de discussion de l’article concerné ou (iii) demander de l’aide sur le « Forum des nouveaux ». L'architecture de la modération sur la plateforme est remarquable, en ce qu'elle repose en priorité sur les utilisateurs, tout en assurant une expertise stable en matière de modération des contenus illicites grâce aux utilisateurs « administrateurs » de Wikipédia. » Sur les moyens mis en œuvre pour lutter contre les contenus illicites, la fondation note qu'une cinquantaine de bénévoles sont particulièrement vigilants sur cette question.

Sur la mise en œuvre du règlement européen sur les services numériques, nous avons déjà abordé le sujet dans le numéro du 1er juin. Par ailleurs, Wikimédia France a traduit en français un article initialement publié par la Fondation Wikimédia. Le règlement européen sur les services numériques est entré en vigueur le 25 août[4].

Wikidata et l'épistémologie des robots — Dans un article intitulé « Wikidata: why we contribute to the robot epistemology » publié sur le site du user group Whose Knowledge?, Maari Zwick-Maitreyi (d) Voir avec Reasonator explore les enjeux de la contribution à Wikidata pour les personnes de la majorité globale (en). Après avoir rappelé les enjeux de représentation des points de vue des personnes de la majorité globale dans Wikipédia et les efforts de la Wikimedia Foundation, l'autrice souligne que ces enjeux sont particulièrement prégnants dans Wikidata.

« Même si des efforts sont déployés pour combler le fossé, on craint que des projets de données structurées comme Wikidata ne codifient les points de vue, les valeurs et l'histoire des communautés hégémoniques dans l'intelligence artificielle, les érigeant en vérités dans l'épistémologie des robots et piégeant probablement les membres de la majorité globale dans de laborieuses batailles de connaissances qui se prolongeront dans les époques à venir[5]. »

En s'appuyant sur l'article « Working for the Invisible Machines or Pumping Information into an Empty Void? An Exploration of Wikidata Contributors' Motivations (d) Voir avec Reasonator », elle rappelle que 70 % des contributeurs et contributrices de Wikidata ignorent comment leurs contributions sont utilisées.

« Dans notre effort pour Wikidata, il semble que nous soyons éloignés des résultats de notre travail[6]. »

L'autrice rappelle que le travail de contribution gratuite et désintéressée à Wikidata est avant tout utilisé par les grandes entreprises du numérique pour construire des intelligences artificielles et faire des profits. Elle souligne alors un dilemme.

« Si nous ne nous engageons pas dans ces plateformes de production de connaissances par les pairs, nos histoires, nos idées, nos connaissances sont laissées de côté et l'effacement se poursuit. Lorsque nous le faisons, cela profite à des multinationales lointaines qui ont recours au travail clandestin, ont les poches pleines et exercent un pouvoir incontrôlé sur la vie et les moyens de subsistance des gens[7]. »

L'autrice termine l'article avec une série de questions à se poser sur Wikidata.

Synia : explorer Wikidata autrement — En mars 2023, Finn Årup Nielsen (d) Voir avec Reasonator (connu sous le pseudonyme fnielsen) a publié « Synia: Displaying data from Wikibases (d) Voir avec Reasonator » dans lequel il présente Synia, un nouvel outil qui permet d'explorer Wikidata autrement grâce à des requêtes SPARQL génériques[8],[9]. Concrètement, la communauté peut écrire des requêtes SPARQL génériques dans une page de configuration sur Wikidata et cela produit automatiquement une nouvelle page de profil dans Synia. C'est un excellent moyen d'explorer Wikidata. L'outil s'inspire largement de Scholia (d) Voir avec Reasonator[10], un outil qui permet grâce à des requêtes génériques dans Wikidata d'explorer les données de Wikidata relatives aux chercheurs et chercheuses, aux publications scientifiques, aux revues académiques et aux éditeurs scientifiques.

Voici quelques exemples :

Prenez plaisir à contribuerLepticed7 a publié une traduction de l'essai Enjoy yourself.

« Tout le monde devrait le garder à l’esprit tout le temps : prendre du plaisir à contribuer est la clé pour rester actif sur le projet. Si vous ne prenez plus de plaisir à contribuer, faites un pas en arrière et posez-vous des questions sur ce que vous aimez faire. »

Les débuts de Wikifunctions — Le mois dernier, nous avons annoncé le lancement de Wikifunctions. Dans un article publié sur le blog Diff, Denny Vrandečić donne plus de détails. Il définit Wikifunctions comme un espace destiné à créer et maintenir de manière collaborative une bibliothèque de fonctions. Il anticipe qu'elle permettra de générer des phrases, du texte et même des articles entiers. Elle permettra aussi de faire des calculs à partir des données brutes contenues dans Wikidata, comme par exemple calculer l'âge d'une personne à partir de sa date de naissance ou la densité de population à partir de la population et de la superficie d'un territoire.

La première fonction permet de joindre ensemble deux chaînes de caractère : https://www.wikifunctions.org/view/fr/Z10000

D'après Wikiscan, il existe déjà plus de 2 000 fonctions dans Wikifunctions[11].

Revues citées par Wikipédia — Dans The Signpost du 1er août dernier, Headbomb raconte le projet Journals cited by Wikipedia (Revues citées par Wikipédia), une idée née en 2009 qui consiste à compiler des statistiques sur les revues citées dans Wikipédia en anglais en extrayant les valeurs du paramètre journal= dans le modèle Cite journal (équivalent de {{Article}}) et d'autres modèles similaires.

On apprend notamment qu'Elsevier est l'éditeur scientifique le plus cité dans Wikipédia avec 360 000 citations. et Nature la revue la plus citée avec 51 000 citations.

Pourquoi y a-t-il si peu d'administrateurs et d'administratrices dans les wikipédiennes et wikipédiens récents ? — Dans The Signpost, WereSpielChequers s'inquiète du fait que la majorité des administrateurs et administratrices de la Wikipédia en anglais aient commencé à contribuer dans les années 2000. Sur les 881 administratrices et administrateurs, seul 64 ont commencé à contribuer après 2011.

« J'espère que nous pourrons persuader certains Wikipédiens qui ont rejoint la communauté dans les années 2010 de devenir administrateurs ; je suis sûr qu'il y a beaucoup d'entre vous qui passeraient facilement[12]. »

Ce serait intéressant de faire le même exercice sur Wikipédia en français.

Le Wikimédien de l'année — Le prix du wikipédien de l'année a été remis à Tofeiku, un contributeur originaire de Malaisie qui a commencé à contribuer à l'âge de 8 ans. Il s'est beaucoup investi dans le Wiktionnaire en malais (d) Voir avec Reasonator[13]. Le prix Wikimedia est remis à Siobhan Leachman et le prix du nouveau venu au japonais Eugene Ormandy.

La fondation Wikimédia modernise ses modèles d'apprentissage automatique — Depuis 2015, la fondation Wikimédia maintient un ensemble de modèles d'apprentissage automatique et une infrastructure appelés ORES. En tout, ORES comprend 110 modèles d'arbres de décision dans différentes langues qui permettent d'évaluer la qualité d'un article, la qualité d'une modification, la qualité d'un élément et le thème d'un article. Les modèles déployés par la fondation n'éditent pas directement Wikipédia mais permettent d'avertir les contributrices et les contributeurs. Par exemple, le modèle de détection de vandalisme permet de mettre des alertes dans la page modifications récentes de la Wikipédia en anglais.

Pour pouvoir déployer plus facilement une plus grande variété de modèles en passant rapidement à l'échelle, la fondation s'est lancé dans un grand chantier de modernisation de son infrastructure d'apprentissage automatique.

« Dans ce nouveau flux de travail, un ingénieur en apprentissage automatique de l'équipe machine learning travaille avec un créateur de modèle dès le premier jour du projet pour travailler avec lui sur le déploiement du modèle. L'objectif est que le modèle soit déployé dès le premier jour de sa création et à chaque nouvelle itération au cours de son processus de développement afin que les problèmes qui apparaissent en production soient identifiés et résolus dès le début du processus[14]. »

Cette approche du développement de modèles, dite MLOps, nécessite une nouvelle infrastructure qui s'appuie sur le logiciel Kubeflow (d) Voir avec Reasonator. L'infrastructure est divisée en deux parties, Train Wing pour l'entraînement et Lift Wing pour le déploiement. Les modèles déployés sur Lift Wing seront accessibles par API à travers le portail d'API de la fondation[15].

La seconde partie de l'infrastructure, Train Wing, permettra aux ingénieurs de la fondation mais aussi aux chercheurs d'entraîner leurs propres modèles.

Pour améliorer la documentation et la transparence des modèles d'apprentissage automatique, la fondation va mettre en place une documentation des modèles conformes à l'approche model cards développée par Mitchell et al. (2019) (voir l'exemple meta:User:AlgoAccountabilityBot/Enwiki Good Faith Model Card)[16].

8,8 millions d'articles orphelins dans les 319 versions de Wikipédia — Dans « Orphan Articles: The Dark Matter of Wikipedia (d) Voir avec Reasonator », les chercheurs Akhil Arora, Robert West (d) Voir avec Reasonator et Martin Gerlach (d) Voir avec Reasonator (meta:user:MGerlach (WMF)) se penchent sur l'accessibilité des articles et plus précisément sur les articles qui ne sont pas reliés au reste de l'encyclopédie par des liens internes. Ils estiment que sur les 319 versions linguistiques de Wikipédia, 15% (8,8 millions) des articles peuvent être considérés comme orphelins (aucun lien entrant). La Wikipédia en français se distingue avec seulement 1,7% d'articles orphelins (39 960 articles sur 2,363,875)[17]. A l'inverse, il y a très peu d'articles sans lien sortant. Les auteurs n'en trouvent que 300 000, soit 0,5%.

Les auteurs cherchent à caractériser les articles orphelins à travers plusieurs critères (article créé par un bot, article récent, article consacré à une femme, etc). Ils trouvent notamment que les articles consacrés à des femmes sont plus souvent orphelins que les autres. Par exemple, dans la Wikipédia en anglais, 29% des articles biographiques orphelins sont consacrés à des femmes, qui ne représentent pourtant que 19% des articles biographiques en général.

Les auteurs ont développé l'outil Wiki-Visibility pour aider à relier un article orphelin à partir de liens existants dans d'autres versions linguistiques de Wikipédia. Par exemple, pour l'article Ana Montès, Wiki-Visibility suggère d'ajouter un lien depuis Walter Kendall Myers parce que ce lien existe en anglais et en russe[18],[19].

Dans la Wikipédia en français, le Projet:Pages orphelines liste toutes les pages de la catégorie et cette requête petscan liste toutes les biographies de femmes orphelines (à la date du 4 juillet).

En très bref

Le zoom : Wikivoyage en français

Le zoom est une nouvelle rubrique pour faire le point sur un Wikiprojet. Premier de la série : wikivoyage en français.

Wikivoyage en français compte plus de 8 000 pages de contenu, c'est beaucoup moins que Wikivoyage en anglais (31 000 pages) ou en allemand (20 000 pages) mais beaucoup plus que wikivoyage en espagnol (3 000 pages)[21].

Le contenu de Wikivoyage des articles de Wikivoyage est très structuré avec des patrons d'articles très précis et l'utilisation importante de modèles pour structurer l'information comme modèle:Voir ou modèle:Manger. Wikivoyage s'appuie beaucoup sur Wikidata pour ses infobox ou ses bannières.

En juillet 2023, le site totalise 1 million de pages vues en juillet avec 16 utilisateurs actifs (plus de 5 contributions)[22].

En juillet 2023, les 5 articles les plus consultés sont Amérique du Sud, Palma de Majorque, Johannesburg, Europe et Singapour[23].

Le site compte 2 024 articles sur des éléments situés en France, 789 éléments au Canada et 353 en Belgique[24].

Wikivoyage en français comprend 44 articles étoilés (Catégorie:Article étoilé). Parmi ces articles étoilés, 19 concernent des éléments situés en Belgique, 8 en France, 4 au Canada, 4 au Kenya et 3 en Tanzanie (voir la carte)[25].

Événements

Edit-a-thon aux Archives nationales de France.
WikiConvention 2023
Conférence GLAM Wiki

Ailleurs dans le Wikiverse

La page Wikipédia:RAW/Découvrir recense les infolettres et blogs relatifs à Wikimedia.

Courrier du lectorat

(Il nous fera plaisir de lire les messages déposés ici et, si nécessaire, d'y répondre dans les plus brefs délais.)

Bonsoir, je viens de parcourir l'actualité que vous avez rédigé avec soin, j'ai trouvé intéressant la plupart des informations dont vous avez mentionnées, notamment sur la toute première partie avec les graphiques, bravo pour votre travail ! Hibrideacus (discuter) 31 août 2023 à 22:57 (CEST)

Merci beaucoup pour votre commentaire. ça fait plaisir. PAC2 (discuter) 1 septembre 2023 à 06:57 (CEST)

Bonsoir, merci pour cet important travail de mise à disposition de brèves ! À propos des articles orphelins : le projet francophone a fait le choix de considérer comme orphelin un article possédant moins de 3 liens entrants ; par ailleurs, j'ai testé l'outil indiqué, certes sur un échantillon réduit, et il donne les mêmes réponses que ce que propose déjà Dickensbot (voir par exemple : les Articles orphelins depuis février 2021) pourtant circonscrit à trois wikipédias. Ce faisant, la wikipédia francophone comporte un peu plus de 15 000 articles orphelins, en augmentation lente mais constante. Cela vaudrait sans doute le coup de relancer un concours Wiki-maintenance spécial Orphelins, non ?--Cbyd (discuter) 31 août 2023 à 23:33 (CEST)

Oui effectivement la définition d'un article orphelin peut varier. Dans l'article de recherche, ils considèrent les articles avec 0 liens entrants. PAC2 (discuter) 1 septembre 2023 à 07:00 (CEST)

VLOP

« une cinquantaine de bénévoles sont particulièrement vigilants.. » : sait-on qui sont ces 50 bénévoles ? (pas les noms, mais s'ils sont une catégorie d'utilisateurs bien identifiée) En quoi sont-ils plus particulièrement vigilants ? Quelqu'un sait-il ? C'est une phrase intrigante. --Jean-Christophe BENOIST (discuter) 1 septembre 2023 à 08:27 (CEST)

Je suis d'accord avec toi que c'est intriguant. J'ai parcouru la réponse de la fondation à l'ARCOM (https://www.arcom.fr/sites/default/files/2023-07/2023_anglais_Declaration_Fondation-Wikimedia_haine_en_ligne.pdf, question 7, page 3) mais je n'ai pas vu d'élément plus précis. PAC2 (discuter) 1 septembre 2023 à 08:48 (CEST)

Merci

Lecture instructive. Merci pour ce travail. TCY (discuter) 2 septembre 2023 à 10:44 (CEST)

Fort intéressant

Merci pour cette nouvelle édition très intéressante et très complète. Cela permet de faire un bon tour de l'article en général (Fondation, régulation, nouveaux projets, événements, etc...)
Concernant le problème du nombre de nouveaux administrateurs et administratrices, on pourrait effectivement faire une enquête sur Wikipédia en français.
De mon point de vue, c'est un rôle fondamental pour notre communauté... mais qui est aussi assez ingrat car il n'y a que des coups à prendre (à part si on s'occupe uniquement de la maintenance technique et de la lutte contre les vandalismes). Il y a également l'élection communautaire qui peut parfois virer au défouloir dans les avis. Peut-être qu'en modérant mieux les avis lors des élections, chaque candidature serait moins angoissante pour les candidats et candidates.--Pronoia (discuter) 2 septembre 2023 à 10:57 (CEST)


 –
Rédigé/traduit par PAC2
Citations originales
Notes
Références
  1. Repéré via https://mastodon.world/@OpenSexism/110817958836569741
  2. meta:Community_Insights#Languages
  3. https://foundation.wikimedia.org/wiki/Policy:Universal_Code_of_Conduct/fr
  4. Philippe Jacqué et Maria Udrescu, « Numérique : la loi européenne obligeant les géants d’Internet à réguler leurs contenus est entrée en vigueur », Le Monde,‎ (ISSN 1950-6244, lire en ligne).
  5. « Even as gap-closing efforts take place, there is fear that structured data projects like Wikidata are codifying the views, values, and histories of hegemonic communities into artificial intelligence, establishing them as truths in the robot epistemology, and likely trapping people of the Global Majority in laborious knowledge battles to extend into the eras to come. » traduit avec l'aide de DeepL
  6. « In our Wikidata effort, it seems that we are distanced from the outcomes of our labor. », traduit avec l'assistance de DeepL
  7. « If we don’t engage with these peer-production knowledge platforms, our histories, ideas, knowings, get left behind and the erasure continues. When we do, it profits far away multinationals with clandestine workings, bottomless pockets, and unchecked power over peoples’ lives and livelihoods. » traduit avec DeepL
  8. Finn Årup Nielsen (d) Voir avec Reasonator Synia: Displaying data from Wikibases (d) Voir avec Reasonator, https://arxiv.org/abs/2303.15133
  9. Découvert via le compte Mastodon de fnielsen : https://fosstodon.org/@fnielsen/110791751465369139
  10. https://scholia.toolforge.org/
  11. https://wikifunctions.wikiscan.org/ consulté le 28 août
  12. « My hope is that we can persuade some Wikipedians who joined the community in the 2010s to become admins; I'm sure there are many of you who would pass easily. »
  13. Découvert via https://wikis.world/@wikipedia/110900708319266865 et https://tech.lgbt/@wmlgbt/110898976230542024
  14. « In this new workflow, a machine learning engineer from the Machine Learning team works with a model creator from the first day of the project to work with them on model deployment. The goal is that the model is deployed on the first day it is created and at every new iteration during its development process so that issues that appear in production are identified and resolved early in the model creation process. »
  15. https://api.wikimedia.org/wiki/Lift_Wing_API
  16. (en) Margaret Mitchell, Simone Wu, Andrew Zaldivar, Parker Barnes, Lucy Vasserman, Ben Hutchinson, Elena Spitzer, Inioluwa Deborah Raji et Timnit Gebru, « Model Cards for Model Reporting », FAT* '19: Proceedings of the Conference on Fairness, Accountability, and Transparency,‎ (ISBN 978-1-4503-6125-5, DOI 10.1145/3287560.3287596, arXiv 1810.03993)Voir et modifier les données sur Wikidata
  17. meta:Research:Recommending links to increase visibility of articles/Link-translation
  18. https://linkrec.toolforge.org/
  19. Pour les utilisateurs de l'interface web mobile, le lien vers l'outil est intégré à Chouette.js
  20. Voir l'annonce : en:Wikipedia:Wikipedia Signpost/2023-08-31/From the editor
  21. https://www.wikivoyage.org/
  22. https://stats.wikimedia.org/#/fr.wikivoyage.org
  23. https://pageviews.wmcloud.org/topviews/?project=fr.wikivoyage.org&platform=all-access&date=last-month&excludes=
  24. Requête SPARQL : https://w.wiki/7GXf
  25. https://w.wiki/7GYT
  26. https://www.wikimedia.fr/inscrivez-vous-au-mooc-wikidata/ découvert via Projet:Wikifier la science/Infolettre/Août 2023

Numéro du 20 septembre 2023

Wednesday, 20 September 2023 00:00 UTC

L'édito de PAC2

Ce numéro contient beaucoup de brèves sur un grand nombre de sujets : l'enquête sur la communauté Wikimédia, la régulation de la haine en ligne, une réflexion sur la contribution à Wikidata, les articles orphelins ou encore la modernisation de l'infrastructure d'apprentissage automatique de la fondation Wikimédia.

Nous introduisons aussi une nouvelle section pour faire un zoom sur un projet Wikimédia. La section est inaugurée avec une présentation de Wikivoyage en français.

Globalement, je me dis que le numéro est peut être un peu long pour le lecteur ou la lectrice (à peu près 20 minutes de lecture d'après la liseuse de Firefox). Chacun pourra picorer ce qu'il souhaite.

N'hésitez pas à contribuer au prochain numéro en proposant des sujets en salle de rédaction ou directement dans le contenu.

Bonne lecture !

Brèves

Community Insights — La Fondation Wikimédia publie chaque année une enquête sur la communauté Wikimédia intitulée Community Insights[1]. L'édition 2023 s'appuie sur des données collectées grâce à une enquête statistique entre juin et septembre 2022. L'enquête a été menée dans 28 langues différentes[2].

Estimation de la part des éditrices et éditeurs actifs par an.

Parmi les éditrices et éditeurs actifs, la part des femmes est passée de 11 % en 2019 à 15 % en 2020 et 13 % en 2022. En revanche, la part des éditrices et éditeurs considérés comme faisant partie des genres minoritaires (gender-diverse) est passée de 2 à 4 %. Le terme de gender-diverse est emprunté au Haut-Commissariat des Nations unies aux droits de l'homme pour désigner les personnes trans, non-binaires, genderqueer, agenrées ou les personnes s'identifiant à plusieurs genres.

Parmi les nouvelles personnes contribuant à Wikimédia depuis 2021, on trouve 20 % de femmes et 7 % de personnes gender-diverse.

Distribution par âge de la communauté comparée à la population mondiale

Globalement, la distribution par catégorie d'âge de la communauté correspond à la distribution mondiale par catégorie d'âge. Toutefois, les personnes de moins de 18 ans ne sont pas incluses dans l'enquête. En revanche, les éditrices et éditeurs actifs sont nettement plus diplômés que la population des pays de l'OCDE. Par ailleurs, 12 % des éditrices et éditeurs se considèrent comme appartenant à une minorité ethnique dans leur pays.

38 % des contributrices et contributeurs trouvent que la Fondation Wikimédia communique bien sur ses projets et ses initiatives. 56 % considèrent que la Fondation a les bons programmes et les bonnes stratégies pour atteindre l'objectif de 2030 de devenir l'infrastructure centrale de la connaissance libre et accessible à tous et toutes.

Part des éditrices et éditeurs qui se sont sentis en danger ou inconfortable au cours des 12 mois précédents.

44% des femmes, 53% des personnes gender-diverses et 33% des hommes contribuant activement se sont sentis en danger (unsafe) ou inconfortables (uncomfortable) au cours des 12 mois précédents l'enquête. 25% des éditrices et éditeurs déclarent avoir subi du harcèlement au cours des 12 derniers mois. La proportion est plus élevée pour les femmes (31%). 46% des éditrices et éditeurs savent comment trouver de l'aide en cas de harcèlement.

Part des éditrices et éditeurs qui déclarent avoir subi du harcèlement.

Lutte contre les contenus haineux

En juillet 2023, l'Autorité de régulation de la communication audiovisuelle et numérique (ARCOM) a publié un bilan des moyens mis en place par les plateformes en ligne dans la lutte contre la diffusion des contenus haineux en 2022. En France, l'article 42 de la Loi confortant le respect des principes de la République impose aux principales plateformes présentes sur le territoire national des obligations de moyen dans la lutte contre la diffusion des contenus haineux. L'ARCOM est chargée de superviser la mise en œuvre de ces obligations. Le règlement européen sur les services numériques (connu sous le nom de DSA pour Digital services act ou RSN en français) entre en œuvre dans les pays de l'Union européenne le 25 août 2023 pour les grandes plateformes en ligne (les VLOP pour very large online platforms) et le 17 février 2024 pour l'ensemble des services en ligne concernés. Les dispositions du DSA remplaceront donc les dispositions de la loi confortant le respect des principes de la République.

Dans ce rapport, l'ARCOM s'intéresse à l'accessibilité et l'intelligibilité des conditions générales, à la prise en compte dans les conditions générales de la législation sur les contenus haineux, aux dispositifs de signalement des contenus haineux, aux moyens mis en œuvre pour la modération des contenus, à la lutte contre les signalements abusifs et enfin à la coopération avec les autorités administratives et judiciaires, que ce soit pour informer les autorités des contenus haineux signalés ou pour traiter les demandes des autorités.

La fondation Wikimédia a fait remarquer à l'ARCOM que le questionnaire n'est pas adapté au fonctionnement collaboratif et communautaire de Wikipédia.

Dans une note au bas de la page 10, l'ARCOM regrette que le Code universel de conduite ne soit disponible qu'en anglais. Pourtant il existe une traduction en français[3].

Sur la modération des contenus illicites, l'ARCOM note : « En raison de l’approche collaborative et décentralisée de sa politique de modération, comparer Wikipédia à d’autres services apparaît peu pertinent. Toutefois, la description de cette politique dans les CG (ie conditions générales) de la plateforme mériterait de gagner en précision et en transparence. »

Sur les dispositions de signalement des contenus haineux, l'ARCOM note la spécificité de Wikipédia par rapport aux autres plateformes : « Wikipédia, en raison des spécificités de son modèle, ne dispose pas de dispositif de signalement « traditionnel ». Confronté à un contenu problématique, un utilisateur pourra (i) le corriger lui-même en modifiant la page, (ii) expliquer le problème sur la page de discussion de l’article concerné ou (iii) demander de l’aide sur le « Forum des nouveaux ». L'architecture de la modération sur la plateforme est remarquable, en ce qu'elle repose en priorité sur les utilisateurs, tout en assurant une expertise stable en matière de modération des contenus illicites grâce aux utilisateurs « administrateurs » de Wikipédia. » Sur les moyens mis en œuvre pour lutter contre les contenus illicites, la fondation note qu'une cinquantaine de bénévoles sont particulièrement vigilants sur cette question.

Sur la mise en œuvre du règlement européen sur les services numériques, nous avons déjà abordé le sujet dans le numéro du 1er juin. Par ailleurs, Wikimédia France a traduit en français un article initialement publié par la Fondation Wikimédia. Le règlement européen sur les services numériques est entré en vigueur le 25 août[4].

Wikidata et l'épistémologie des robots — Dans un article intitulé « Wikidata: why we contribute to the robot epistemology » publié sur le site du user group Whose Knowledge?, Maari Zwick-Maitreyi (d) Voir avec Reasonator explore les enjeux de la contribution à Wikidata pour les personnes de la majorité globale (en). Après avoir rappelé les enjeux de représentation des points de vue des personnes de la majorité globale dans Wikipédia et les efforts de la Wikimedia Foundation, l'autrice souligne que ces enjeux sont particulièrement prégnants dans Wikidata.

« Même si des efforts sont déployés pour combler le fossé, on craint que des projets de données structurées comme Wikidata ne codifient les points de vue, les valeurs et l'histoire des communautés hégémoniques dans l'intelligence artificielle, les érigeant en vérités dans l'épistémologie des robots et piégeant probablement les membres de la majorité globale dans de laborieuses batailles de connaissances qui se prolongeront dans les époques à venir[5]. »

En s'appuyant sur l'article « Working for the Invisible Machines or Pumping Information into an Empty Void? An Exploration of Wikidata Contributors' Motivations (d) Voir avec Reasonator », elle rappelle que 70 % des contributeurs et contributrices de Wikidata ignorent comment leurs contributions sont utilisées.

« Dans notre effort pour Wikidata, il semble que nous soyons éloignés des résultats de notre travail[6]. »

L'autrice rappelle que le travail de contribution gratuite et désintéressée à Wikidata est avant tout utilisé par les grandes entreprises du numérique pour construire des intelligences artificielles et faire des profits. Elle souligne alors un dilemme.

« Si nous ne nous engageons pas dans ces plateformes de production de connaissances par les pairs, nos histoires, nos idées, nos connaissances sont laissées de côté et l'effacement se poursuit. Lorsque nous le faisons, cela profite à des multinationales lointaines qui ont recours au travail clandestin, ont les poches pleines et exercent un pouvoir incontrôlé sur la vie et les moyens de subsistance des gens[7]. »

L'autrice termine l'article avec une série de questions à se poser sur Wikidata.

Synia : explorer Wikidata autrement — En mars 2023, Finn Årup Nielsen (d) Voir avec Reasonator (connu sous le pseudonyme fnielsen) a publié « Synia: Displaying data from Wikibases (d) Voir avec Reasonator » dans lequel il présente Synia, un nouvel outil qui permet d'explorer Wikidata autrement grâce à des requêtes SPARQL génériques[8],[9]. Concrètement, la communauté peut écrire des requêtes SPARQL génériques dans une page de configuration sur Wikidata et cela produit automatiquement une nouvelle page de profil dans Synia. C'est un excellent moyen d'explorer Wikidata. L'outil s'inspire largement de Scholia (d) Voir avec Reasonator[10], un outil qui permet grâce à des requêtes génériques dans Wikidata d'explorer les données de Wikidata relatives aux chercheurs et chercheuses, aux publications scientifiques, aux revues académiques et aux éditeurs scientifiques.

Voici quelques exemples :

Prenez plaisir à contribuerLepticed7 a publié une traduction de l'essai Enjoy yourself.

« Tout le monde devrait le garder à l’esprit tout le temps : prendre du plaisir à contribuer est la clé pour rester actif sur le projet. Si vous ne prenez plus de plaisir à contribuer, faites un pas en arrière et posez-vous des questions sur ce que vous aimez faire. »

Les débuts de Wikifunctions — Le mois dernier, nous avons annoncé le lancement de Wikifunctions. Dans un article publié sur le blog Diff, Denny Vrandečić donne plus de détails. Il définit Wikifunctions comme un espace destiné à créer et maintenir de manière collaborative une bibliothèque de fonctions. Il anticipe qu'elle permettra de générer des phrases, du texte et même des articles entiers. Elle permettra aussi de faire des calculs à partir des données brutes contenues dans Wikidata, comme par exemple calculer l'âge d'une personne à partir de sa date de naissance ou la densité de population à partir de la population et de la superficie d'un territoire.

La première fonction permet de joindre ensemble deux chaînes de caractère : https://www.wikifunctions.org/view/fr/Z10000

D'après Wikiscan, il existe déjà plus de 2 000 fonctions dans Wikifunctions[11].

Revues citées par Wikipédia — Dans The Signpost du 1er août dernier, Headbomb raconte le projet Journals cited by Wikipedia (Revues citées par Wikipédia), une idée née en 2009 qui consiste à compiler des statistiques sur les revues citées dans Wikipédia en anglais en extrayant les valeurs du paramètre journal= dans le modèle Cite journal (équivalent de {{Article}}) et d'autres modèles similaires.

On apprend notamment qu'Elsevier est l'éditeur scientifique le plus cité dans Wikipédia avec 360 000 citations. et Nature la revue la plus citée avec 51 000 citations.

Pourquoi y a-t-il si peu d'administrateurs et d'administratrices dans les wikipédiennes et wikipédiens récents ? — Dans The Signpost, WereSpielChequers s'inquiète du fait que la majorité des administrateurs et administratrices de la Wikipédia en anglais aient commencé à contribuer dans les années 2000. Sur les 881 administratrices et administrateurs, seul 64 ont commencé à contribuer après 2011.

« J'espère que nous pourrons persuader certains Wikipédiens qui ont rejoint la communauté dans les années 2010 de devenir administrateurs ; je suis sûr qu'il y a beaucoup d'entre vous qui passeraient facilement[12]. »

Ce serait intéressant de faire le même exercice sur Wikipédia en français.

Le Wikimédien de l'année — Le prix du wikipédien de l'année a été remis à Tofeiku, un contributeur originaire de Malaisie qui a commencé à contribuer à l'âge de 8 ans. Il s'est beaucoup investi dans le Wiktionnaire en malais (d) Voir avec Reasonator[13]. Le prix Wikimedia est remis à Siobhan Leachman et le prix du nouveau venu au japonais Eugene Ormandy.

La fondation Wikimédia modernise ses modèles d'apprentissage automatique — Depuis 2015, la fondation Wikimédia maintient un ensemble de modèles d'apprentissage automatique et une infrastructure appelés ORES. En tout, ORES comprend 110 modèles d'arbres de décision dans différentes langues qui permettent d'évaluer la qualité d'un article, la qualité d'une modification, la qualité d'un élément et le thème d'un article. Les modèles déployés par la fondation n'éditent pas directement Wikipédia mais permettent d'avertir les contributrices et les contributeurs. Par exemple, le modèle de détection de vandalisme permet de mettre des alertes dans la page modifications récentes de la Wikipédia en anglais.

Pour pouvoir déployer plus facilement une plus grande variété de modèles en passant rapidement à l'échelle, la fondation s'est lancé dans un grand chantier de modernisation de son infrastructure d'apprentissage automatique.

« Dans ce nouveau flux de travail, un ingénieur en apprentissage automatique de l'équipe machine learning travaille avec un créateur de modèle dès le premier jour du projet pour travailler avec lui sur le déploiement du modèle. L'objectif est que le modèle soit déployé dès le premier jour de sa création et à chaque nouvelle itération au cours de son processus de développement afin que les problèmes qui apparaissent en production soient identifiés et résolus dès le début du processus[14]. »

Cette approche du développement de modèles, dite MLOps, nécessite une nouvelle infrastructure qui s'appuie sur le logiciel Kubeflow (d) Voir avec Reasonator. L'infrastructure est divisée en deux parties, Train Wing pour l'entraînement et Lift Wing pour le déploiement. Les modèles déployés sur Lift Wing seront accessibles par API à travers le portail d'API de la fondation[15].

La seconde partie de l'infrastructure, Train Wing, permettra aux ingénieurs de la fondation mais aussi aux chercheurs d'entraîner leurs propres modèles.

Pour améliorer la documentation et la transparence des modèles d'apprentissage automatique, la fondation va mettre en place une documentation des modèles conformes à l'approche model cards développée par Mitchell et al. (2019) (voir l'exemple meta:User:AlgoAccountabilityBot/Enwiki Good Faith Model Card)[16].

8,8 millions d'articles orphelins dans les 319 versions de Wikipédia — Dans « Orphan Articles: The Dark Matter of Wikipedia (d) Voir avec Reasonator », les chercheurs Akhil Arora, Robert West (d) Voir avec Reasonator et Martin Gerlach (d) Voir avec Reasonator (meta:user:MGerlach (WMF)) se penchent sur l'accessibilité des articles et plus précisément sur les articles qui ne sont pas reliés au reste de l'encyclopédie par des liens internes. Ils estiment que sur les 319 versions linguistiques de Wikipédia, 15% (8,8 millions) des articles peuvent être considérés comme orphelins (aucun lien entrant). La Wikipédia en français se distingue avec seulement 1,7% d'articles orphelins (39 960 articles sur 2,363,875)[17]. A l'inverse, il y a très peu d'articles sans lien sortant. Les auteurs n'en trouvent que 300 000, soit 0,5%.

Les auteurs cherchent à caractériser les articles orphelins à travers plusieurs critères (article créé par un bot, article récent, article consacré à une femme, etc). Ils trouvent notamment que les articles consacrés à des femmes sont plus souvent orphelins que les autres. Par exemple, dans la Wikipédia en anglais, 29% des articles biographiques orphelins sont consacrés à des femmes, qui ne représentent pourtant que 19% des articles biographiques en général.

Les auteurs ont développé l'outil Wiki-Visibility pour aider à relier un article orphelin à partir de liens existants dans d'autres versions linguistiques de Wikipédia. Par exemple, pour l'article Ana Montès, Wiki-Visibility suggère d'ajouter un lien depuis Walter Kendall Myers parce que ce lien existe en anglais et en russe[18],[19].

Dans la Wikipédia en français, le Projet:Pages orphelines liste toutes les pages de la catégorie et cette requête petscan liste toutes les biographies de femmes orphelines (à la date du 4 juillet).

En très bref

Le zoom : Wikivoyage en français

Le zoom est une nouvelle rubrique pour faire le point sur un Wikiprojet. Premier de la série : wikivoyage en français.

Wikivoyage en français compte plus de 8 000 pages de contenu, c'est beaucoup moins que Wikivoyage en anglais (31 000 pages) ou en allemand (20 000 pages) mais beaucoup plus que wikivoyage en espagnol (3 000 pages)[21].

Le contenu de Wikivoyage des articles de Wikivoyage est très structuré avec des patrons d'articles très précis et l'utilisation importante de modèles pour structurer l'information comme modèle:Voir ou modèle:Manger. Wikivoyage s'appuie beaucoup sur Wikidata pour ses infobox ou ses bannières.

En juillet 2023, le site totalise 1 million de pages vues en juillet avec 16 utilisateurs actifs (plus de 5 contributions)[22].

En juillet 2023, les 5 articles les plus consultés sont Amérique du Sud, Palma de Majorque, Johannesburg, Europe et Singapour[23].

Le site compte 2 024 articles sur des éléments situés en France, 789 éléments au Canada et 353 en Belgique[24].

Wikivoyage en français comprend 44 articles étoilés (Catégorie:Article étoilé). Parmi ces articles étoilés, 19 concernent des éléments situés en Belgique, 8 en France, 4 au Canada, 4 au Kenya et 3 en Tanzanie (voir la carte)[25].

Événements

Edit-a-thon aux Archives nationales de France.
WikiConvention 2023
Conférence GLAM Wiki

Ailleurs dans le Wikiverse

La page Wikipédia:RAW/Découvrir recense les infolettres et blogs relatifs à Wikimedia.

Courrier du lectorat

(Il nous fera plaisir de lire les messages déposés ici et, si nécessaire, d'y répondre dans les plus brefs délais.)

Bonsoir, je viens de parcourir l'actualité que vous avez rédigé avec soin, j'ai trouvé intéressant la plupart des informations dont vous avez mentionnées, notamment sur la toute première partie avec les graphiques, bravo pour votre travail ! Hibrideacus (discuter) 31 août 2023 à 22:57 (CEST)

Merci beaucoup pour votre commentaire. ça fait plaisir. PAC2 (discuter) 1 septembre 2023 à 06:57 (CEST)

Bonsoir, merci pour cet important travail de mise à disposition de brèves ! À propos des articles orphelins : le projet francophone a fait le choix de considérer comme orphelin un article possédant moins de 3 liens entrants ; par ailleurs, j'ai testé l'outil indiqué, certes sur un échantillon réduit, et il donne les mêmes réponses que ce que propose déjà Dickensbot (voir par exemple : les Articles orphelins depuis février 2021) pourtant circonscrit à trois wikipédias. Ce faisant, la wikipédia francophone comporte un peu plus de 15 000 articles orphelins, en augmentation lente mais constante. Cela vaudrait sans doute le coup de relancer un concours Wiki-maintenance spécial Orphelins, non ?--Cbyd (discuter) 31 août 2023 à 23:33 (CEST)

Oui effectivement la définition d'un article orphelin peut varier. Dans l'article de recherche, ils considèrent les articles avec 0 liens entrants. PAC2 (discuter) 1 septembre 2023 à 07:00 (CEST)

VLOP

« une cinquantaine de bénévoles sont particulièrement vigilants.. » : sait-on qui sont ces 50 bénévoles ? (pas les noms, mais s'ils sont une catégorie d'utilisateurs bien identifiée) En quoi sont-ils plus particulièrement vigilants ? Quelqu'un sait-il ? C'est une phrase intrigante. --Jean-Christophe BENOIST (discuter) 1 septembre 2023 à 08:27 (CEST)

Je suis d'accord avec toi que c'est intriguant. J'ai parcouru la réponse de la fondation à l'ARCOM (https://www.arcom.fr/sites/default/files/2023-07/2023_anglais_Declaration_Fondation-Wikimedia_haine_en_ligne.pdf, question 7, page 3) mais je n'ai pas vu d'élément plus précis. PAC2 (discuter) 1 septembre 2023 à 08:48 (CEST)

Merci

Lecture instructive. Merci pour ce travail. TCY (discuter) 2 septembre 2023 à 10:44 (CEST)

Fort intéressant

Merci pour cette nouvelle édition très intéressante et très complète. Cela permet de faire un bon tour de l'article en général (Fondation, régulation, nouveaux projets, événements, etc...)
Concernant le problème du nombre de nouveaux administrateurs et administratrices, on pourrait effectivement faire une enquête sur Wikipédia en français.
De mon point de vue, c'est un rôle fondamental pour notre communauté... mais qui est aussi assez ingrat car il n'y a que des coups à prendre (à part si on s'occupe uniquement de la maintenance technique et de la lutte contre les vandalismes). Il y a également l'élection communautaire qui peut parfois virer au défouloir dans les avis. Peut-être qu'en modérant mieux les avis lors des élections, chaque candidature serait moins angoissante pour les candidats et candidates.--Pronoia (discuter) 2 septembre 2023 à 10:57 (CEST)


 –
Rédigé/traduit par PAC2
Citations originales
Notes
Références
  1. Repéré via https://mastodon.world/@OpenSexism/110817958836569741
  2. meta:Community_Insights#Languages
  3. https://foundation.wikimedia.org/wiki/Policy:Universal_Code_of_Conduct/fr
  4. Philippe Jacqué et Maria Udrescu, « Numérique : la loi européenne obligeant les géants d’Internet à réguler leurs contenus est entrée en vigueur », Le Monde,‎ (ISSN 1950-6244, lire en ligne).
  5. « Even as gap-closing efforts take place, there is fear that structured data projects like Wikidata are codifying the views, values, and histories of hegemonic communities into artificial intelligence, establishing them as truths in the robot epistemology, and likely trapping people of the Global Majority in laborious knowledge battles to extend into the eras to come. » traduit avec l'aide de DeepL
  6. « In our Wikidata effort, it seems that we are distanced from the outcomes of our labor. », traduit avec l'assistance de DeepL
  7. « If we don’t engage with these peer-production knowledge platforms, our histories, ideas, knowings, get left behind and the erasure continues. When we do, it profits far away multinationals with clandestine workings, bottomless pockets, and unchecked power over peoples’ lives and livelihoods. » traduit avec DeepL
  8. Finn Årup Nielsen (d) Voir avec Reasonator Synia: Displaying data from Wikibases (d) Voir avec Reasonator, https://arxiv.org/abs/2303.15133
  9. Découvert via le compte Mastodon de fnielsen : https://fosstodon.org/@fnielsen/110791751465369139
  10. https://scholia.toolforge.org/
  11. https://wikifunctions.wikiscan.org/ consulté le 28 août
  12. « My hope is that we can persuade some Wikipedians who joined the community in the 2010s to become admins; I'm sure there are many of you who would pass easily. »
  13. Découvert via https://wikis.world/@wikipedia/110900708319266865 et https://tech.lgbt/@wmlgbt/110898976230542024
  14. « In this new workflow, a machine learning engineer from the Machine Learning team works with a model creator from the first day of the project to work with them on model deployment. The goal is that the model is deployed on the first day it is created and at every new iteration during its development process so that issues that appear in production are identified and resolved early in the model creation process. »
  15. https://api.wikimedia.org/wiki/Lift_Wing_API
  16. (en) Margaret Mitchell, Simone Wu, Andrew Zaldivar, Parker Barnes, Lucy Vasserman, Ben Hutchinson, Elena Spitzer, Inioluwa Deborah Raji et Timnit Gebru, « Model Cards for Model Reporting », FAT* '19: Proceedings of the Conference on Fairness, Accountability, and Transparency,‎ (ISBN 978-1-4503-6125-5, DOI 10.1145/3287560.3287596, arXiv 1810.03993)Voir et modifier les données sur Wikidata
  17. meta:Research:Recommending links to increase visibility of articles/Link-translation
  18. https://linkrec.toolforge.org/
  19. Pour les utilisateurs de l'interface web mobile, le lien vers l'outil est intégré à Chouette.js
  20. Voir l'annonce : en:Wikipedia:Wikipedia Signpost/2023-08-31/From the editor
  21. https://www.wikivoyage.org/
  22. https://stats.wikimedia.org/#/fr.wikivoyage.org
  23. https://pageviews.wmcloud.org/topviews/?project=fr.wikivoyage.org&platform=all-access&date=last-month&excludes=
  24. Requête SPARQL : https://w.wiki/7GXf
  25. https://w.wiki/7GYT
  26. https://www.wikimedia.fr/inscrivez-vous-au-mooc-wikidata/ découvert via Projet:Wikifier la science/Infolettre/Août 2023

Numéro du 19 septembre 2023

Tuesday, 19 September 2023 00:00 UTC

L'édito de PAC2

Ce numéro contient beaucoup de brèves sur un grand nombre de sujets : l'enquête sur la communauté Wikimédia, la régulation de la haine en ligne, une réflexion sur la contribution à Wikidata, les articles orphelins ou encore la modernisation de l'infrastructure d'apprentissage automatique de la fondation Wikimédia.

Nous introduisons aussi une nouvelle section pour faire un zoom sur un projet Wikimédia. La section est inaugurée avec une présentation de Wikivoyage en français.

Globalement, je me dis que le numéro est peut être un peu long pour le lecteur ou la lectrice (à peu près 20 minutes de lecture d'après la liseuse de Firefox). Chacun pourra picorer ce qu'il souhaite.

N'hésitez pas à contribuer au prochain numéro en proposant des sujets en salle de rédaction ou directement dans le contenu.

Bonne lecture !

Brèves

Community Insights — La Fondation Wikimédia publie chaque année une enquête sur la communauté Wikimédia intitulée Community Insights[1]. L'édition 2023 s'appuie sur des données collectées grâce à une enquête statistique entre juin et septembre 2022. L'enquête a été menée dans 28 langues différentes[2].

Estimation de la part des éditrices et éditeurs actifs par an.

Parmi les éditrices et éditeurs actifs, la part des femmes est passée de 11 % en 2019 à 15 % en 2020 et 13 % en 2022. En revanche, la part des éditrices et éditeurs considérés comme faisant partie des genres minoritaires (gender-diverse) est passée de 2 à 4 %. Le terme de gender-diverse est emprunté au Haut-Commissariat des Nations unies aux droits de l'homme pour désigner les personnes trans, non-binaires, genderqueer, agenrées ou les personnes s'identifiant à plusieurs genres.

Parmi les nouvelles personnes contribuant à Wikimédia depuis 2021, on trouve 20 % de femmes et 7 % de personnes gender-diverse.

Distribution par âge de la communauté comparée à la population mondiale

Globalement, la distribution par catégorie d'âge de la communauté correspond à la distribution mondiale par catégorie d'âge. Toutefois, les personnes de moins de 18 ans ne sont pas incluses dans l'enquête. En revanche, les éditrices et éditeurs actifs sont nettement plus diplômés que la population des pays de l'OCDE. Par ailleurs, 12 % des éditrices et éditeurs se considèrent comme appartenant à une minorité ethnique dans leur pays.

38 % des contributrices et contributeurs trouvent que la Fondation Wikimédia communique bien sur ses projets et ses initiatives. 56 % considèrent que la Fondation a les bons programmes et les bonnes stratégies pour atteindre l'objectif de 2030 de devenir l'infrastructure centrale de la connaissance libre et accessible à tous et toutes.

Part des éditrices et éditeurs qui se sont sentis en danger ou inconfortable au cours des 12 mois précédents.

44% des femmes, 53% des personnes gender-diverses et 33% des hommes contribuant activement se sont sentis en danger (unsafe) ou inconfortables (uncomfortable) au cours des 12 mois précédents l'enquête. 25% des éditrices et éditeurs déclarent avoir subi du harcèlement au cours des 12 derniers mois. La proportion est plus élevée pour les femmes (31%). 46% des éditrices et éditeurs savent comment trouver de l'aide en cas de harcèlement.

Part des éditrices et éditeurs qui déclarent avoir subi du harcèlement.

Lutte contre les contenus haineux

En juillet 2023, l'Autorité de régulation de la communication audiovisuelle et numérique (ARCOM) a publié un bilan des moyens mis en place par les plateformes en ligne dans la lutte contre la diffusion des contenus haineux en 2022. En France, l'article 42 de la Loi confortant le respect des principes de la République impose aux principales plateformes présentes sur le territoire national des obligations de moyen dans la lutte contre la diffusion des contenus haineux. L'ARCOM est chargée de superviser la mise en œuvre de ces obligations. Le règlement européen sur les services numériques (connu sous le nom de DSA pour Digital services act ou RSN en français) entre en œuvre dans les pays de l'Union européenne le 25 août 2023 pour les grandes plateformes en ligne (les VLOP pour very large online platforms) et le 17 février 2024 pour l'ensemble des services en ligne concernés. Les dispositions du DSA remplaceront donc les dispositions de la loi confortant le respect des principes de la République.

Dans ce rapport, l'ARCOM s'intéresse à l'accessibilité et l'intelligibilité des conditions générales, à la prise en compte dans les conditions générales de la législation sur les contenus haineux, aux dispositifs de signalement des contenus haineux, aux moyens mis en œuvre pour la modération des contenus, à la lutte contre les signalements abusifs et enfin à la coopération avec les autorités administratives et judiciaires, que ce soit pour informer les autorités des contenus haineux signalés ou pour traiter les demandes des autorités.

La fondation Wikimédia a fait remarquer à l'ARCOM que le questionnaire n'est pas adapté au fonctionnement collaboratif et communautaire de Wikipédia.

Dans une note au bas de la page 10, l'ARCOM regrette que le Code universel de conduite ne soit disponible qu'en anglais. Pourtant il existe une traduction en français[3].

Sur la modération des contenus illicites, l'ARCOM note : « En raison de l’approche collaborative et décentralisée de sa politique de modération, comparer Wikipédia à d’autres services apparaît peu pertinent. Toutefois, la description de cette politique dans les CG (ie conditions générales) de la plateforme mériterait de gagner en précision et en transparence. »

Sur les dispositions de signalement des contenus haineux, l'ARCOM note la spécificité de Wikipédia par rapport aux autres plateformes : « Wikipédia, en raison des spécificités de son modèle, ne dispose pas de dispositif de signalement « traditionnel ». Confronté à un contenu problématique, un utilisateur pourra (i) le corriger lui-même en modifiant la page, (ii) expliquer le problème sur la page de discussion de l’article concerné ou (iii) demander de l’aide sur le « Forum des nouveaux ». L'architecture de la modération sur la plateforme est remarquable, en ce qu'elle repose en priorité sur les utilisateurs, tout en assurant une expertise stable en matière de modération des contenus illicites grâce aux utilisateurs « administrateurs » de Wikipédia. » Sur les moyens mis en œuvre pour lutter contre les contenus illicites, la fondation note qu'une cinquantaine de bénévoles sont particulièrement vigilants sur cette question.

Sur la mise en œuvre du règlement européen sur les services numériques, nous avons déjà abordé le sujet dans le numéro du 1er juin. Par ailleurs, Wikimédia France a traduit en français un article initialement publié par la Fondation Wikimédia. Le règlement européen sur les services numériques est entré en vigueur le 25 août[4].

Wikidata et l'épistémologie des robots — Dans un article intitulé « Wikidata: why we contribute to the robot epistemology » publié sur le site du user group Whose Knowledge?, Maari Zwick-Maitreyi (d) Voir avec Reasonator explore les enjeux de la contribution à Wikidata pour les personnes de la majorité globale (en). Après avoir rappelé les enjeux de représentation des points de vue des personnes de la majorité globale dans Wikipédia et les efforts de la Wikimedia Foundation, l'autrice souligne que ces enjeux sont particulièrement prégnants dans Wikidata.

« Même si des efforts sont déployés pour combler le fossé, on craint que des projets de données structurées comme Wikidata ne codifient les points de vue, les valeurs et l'histoire des communautés hégémoniques dans l'intelligence artificielle, les érigeant en vérités dans l'épistémologie des robots et piégeant probablement les membres de la majorité globale dans de laborieuses batailles de connaissances qui se prolongeront dans les époques à venir[5]. »

En s'appuyant sur l'article « Working for the Invisible Machines or Pumping Information into an Empty Void? An Exploration of Wikidata Contributors' Motivations (d) Voir avec Reasonator », elle rappelle que 70 % des contributeurs et contributrices de Wikidata ignorent comment leurs contributions sont utilisées.

« Dans notre effort pour Wikidata, il semble que nous soyons éloignés des résultats de notre travail[6]. »

L'autrice rappelle que le travail de contribution gratuite et désintéressée à Wikidata est avant tout utilisé par les grandes entreprises du numérique pour construire des intelligences artificielles et faire des profits. Elle souligne alors un dilemme.

« Si nous ne nous engageons pas dans ces plateformes de production de connaissances par les pairs, nos histoires, nos idées, nos connaissances sont laissées de côté et l'effacement se poursuit. Lorsque nous le faisons, cela profite à des multinationales lointaines qui ont recours au travail clandestin, ont les poches pleines et exercent un pouvoir incontrôlé sur la vie et les moyens de subsistance des gens[7]. »

L'autrice termine l'article avec une série de questions à se poser sur Wikidata.

Synia : explorer Wikidata autrement — En mars 2023, Finn Årup Nielsen (d) Voir avec Reasonator (connu sous le pseudonyme fnielsen) a publié « Synia: Displaying data from Wikibases (d) Voir avec Reasonator » dans lequel il présente Synia, un nouvel outil qui permet d'explorer Wikidata autrement grâce à des requêtes SPARQL génériques[8],[9]. Concrètement, la communauté peut écrire des requêtes SPARQL génériques dans une page de configuration sur Wikidata et cela produit automatiquement une nouvelle page de profil dans Synia. C'est un excellent moyen d'explorer Wikidata. L'outil s'inspire largement de Scholia (d) Voir avec Reasonator[10], un outil qui permet grâce à des requêtes génériques dans Wikidata d'explorer les données de Wikidata relatives aux chercheurs et chercheuses, aux publications scientifiques, aux revues académiques et aux éditeurs scientifiques.

Voici quelques exemples :

Prenez plaisir à contribuerLepticed7 a publié une traduction de l'essai Enjoy yourself.

« Tout le monde devrait le garder à l’esprit tout le temps : prendre du plaisir à contribuer est la clé pour rester actif sur le projet. Si vous ne prenez plus de plaisir à contribuer, faites un pas en arrière et posez-vous des questions sur ce que vous aimez faire. »

Les débuts de Wikifunctions — Le mois dernier, nous avons annoncé le lancement de Wikifunctions. Dans un article publié sur le blog Diff, Denny Vrandečić donne plus de détails. Il définit Wikifunctions comme un espace destiné à créer et maintenir de manière collaborative une bibliothèque de fonctions. Il anticipe qu'elle permettra de générer des phrases, du texte et même des articles entiers. Elle permettra aussi de faire des calculs à partir des données brutes contenues dans Wikidata, comme par exemple calculer l'âge d'une personne à partir de sa date de naissance ou la densité de population à partir de la population et de la superficie d'un territoire.

La première fonction permet de joindre ensemble deux chaînes de caractère : https://www.wikifunctions.org/view/fr/Z10000

D'après Wikiscan, il existe déjà plus de 2 000 fonctions dans Wikifunctions[11].

Revues citées par Wikipédia — Dans The Signpost du 1er août dernier, Headbomb raconte le projet Journals cited by Wikipedia (Revues citées par Wikipédia), une idée née en 2009 qui consiste à compiler des statistiques sur les revues citées dans Wikipédia en anglais en extrayant les valeurs du paramètre journal= dans le modèle Cite journal (équivalent de {{Article}}) et d'autres modèles similaires.

On apprend notamment qu'Elsevier est l'éditeur scientifique le plus cité dans Wikipédia avec 360 000 citations. et Nature la revue la plus citée avec 51 000 citations.

Pourquoi y a-t-il si peu d'administrateurs et d'administratrices dans les wikipédiennes et wikipédiens récents ? — Dans The Signpost, WereSpielChequers s'inquiète du fait que la majorité des administrateurs et administratrices de la Wikipédia en anglais aient commencé à contribuer dans les années 2000. Sur les 881 administratrices et administrateurs, seul 64 ont commencé à contribuer après 2011.

« J'espère que nous pourrons persuader certains Wikipédiens qui ont rejoint la communauté dans les années 2010 de devenir administrateurs ; je suis sûr qu'il y a beaucoup d'entre vous qui passeraient facilement[12]. »

Ce serait intéressant de faire le même exercice sur Wikipédia en français.

Le Wikimédien de l'année — Le prix du wikipédien de l'année a été remis à Tofeiku, un contributeur originaire de Malaisie qui a commencé à contribuer à l'âge de 8 ans. Il s'est beaucoup investi dans le Wiktionnaire en malais (d) Voir avec Reasonator[13]. Le prix Wikimedia est remis à Siobhan Leachman et le prix du nouveau venu au japonais Eugene Ormandy.

La fondation Wikimédia modernise ses modèles d'apprentissage automatique — Depuis 2015, la fondation Wikimédia maintient un ensemble de modèles d'apprentissage automatique et une infrastructure appelés ORES. En tout, ORES comprend 110 modèles d'arbres de décision dans différentes langues qui permettent d'évaluer la qualité d'un article, la qualité d'une modification, la qualité d'un élément et le thème d'un article. Les modèles déployés par la fondation n'éditent pas directement Wikipédia mais permettent d'avertir les contributrices et les contributeurs. Par exemple, le modèle de détection de vandalisme permet de mettre des alertes dans la page modifications récentes de la Wikipédia en anglais.

Pour pouvoir déployer plus facilement une plus grande variété de modèles en passant rapidement à l'échelle, la fondation s'est lancé dans un grand chantier de modernisation de son infrastructure d'apprentissage automatique.

« Dans ce nouveau flux de travail, un ingénieur en apprentissage automatique de l'équipe machine learning travaille avec un créateur de modèle dès le premier jour du projet pour travailler avec lui sur le déploiement du modèle. L'objectif est que le modèle soit déployé dès le premier jour de sa création et à chaque nouvelle itération au cours de son processus de développement afin que les problèmes qui apparaissent en production soient identifiés et résolus dès le début du processus[14]. »

Cette approche du développement de modèles, dite MLOps, nécessite une nouvelle infrastructure qui s'appuie sur le logiciel Kubeflow (d) Voir avec Reasonator. L'infrastructure est divisée en deux parties, Train Wing pour l'entraînement et Lift Wing pour le déploiement. Les modèles déployés sur Lift Wing seront accessibles par API à travers le portail d'API de la fondation[15].

La seconde partie de l'infrastructure, Train Wing, permettra aux ingénieurs de la fondation mais aussi aux chercheurs d'entraîner leurs propres modèles.

Pour améliorer la documentation et la transparence des modèles d'apprentissage automatique, la fondation va mettre en place une documentation des modèles conformes à l'approche model cards développée par Mitchell et al. (2019) (voir l'exemple meta:User:AlgoAccountabilityBot/Enwiki Good Faith Model Card)[16].

8,8 millions d'articles orphelins dans les 319 versions de Wikipédia — Dans « Orphan Articles: The Dark Matter of Wikipedia (d) Voir avec Reasonator », les chercheurs Akhil Arora, Robert West (d) Voir avec Reasonator et Martin Gerlach (d) Voir avec Reasonator (meta:user:MGerlach (WMF)) se penchent sur l'accessibilité des articles et plus précisément sur les articles qui ne sont pas reliés au reste de l'encyclopédie par des liens internes. Ils estiment que sur les 319 versions linguistiques de Wikipédia, 15% (8,8 millions) des articles peuvent être considérés comme orphelins (aucun lien entrant). La Wikipédia en français se distingue avec seulement 1,7% d'articles orphelins (39 960 articles sur 2,363,875)[17]. A l'inverse, il y a très peu d'articles sans lien sortant. Les auteurs n'en trouvent que 300 000, soit 0,5%.

Les auteurs cherchent à caractériser les articles orphelins à travers plusieurs critères (article créé par un bot, article récent, article consacré à une femme, etc). Ils trouvent notamment que les articles consacrés à des femmes sont plus souvent orphelins que les autres. Par exemple, dans la Wikipédia en anglais, 29% des articles biographiques orphelins sont consacrés à des femmes, qui ne représentent pourtant que 19% des articles biographiques en général.

Les auteurs ont développé l'outil Wiki-Visibility pour aider à relier un article orphelin à partir de liens existants dans d'autres versions linguistiques de Wikipédia. Par exemple, pour l'article Ana Montès, Wiki-Visibility suggère d'ajouter un lien depuis Walter Kendall Myers parce que ce lien existe en anglais et en russe[18],[19].

Dans la Wikipédia en français, le Projet:Pages orphelines liste toutes les pages de la catégorie et cette requête petscan liste toutes les biographies de femmes orphelines (à la date du 4 juillet).

En très bref

Le zoom : Wikivoyage en français

Le zoom est une nouvelle rubrique pour faire le point sur un Wikiprojet. Premier de la série : wikivoyage en français.

Wikivoyage en français compte plus de 8 000 pages de contenu, c'est beaucoup moins que Wikivoyage en anglais (31 000 pages) ou en allemand (20 000 pages) mais beaucoup plus que wikivoyage en espagnol (3 000 pages)[21].

Le contenu de Wikivoyage des articles de Wikivoyage est très structuré avec des patrons d'articles très précis et l'utilisation importante de modèles pour structurer l'information comme modèle:Voir ou modèle:Manger. Wikivoyage s'appuie beaucoup sur Wikidata pour ses infobox ou ses bannières.

En juillet 2023, le site totalise 1 million de pages vues en juillet avec 16 utilisateurs actifs (plus de 5 contributions)[22].

En juillet 2023, les 5 articles les plus consultés sont Amérique du Sud, Palma de Majorque, Johannesburg, Europe et Singapour[23].

Le site compte 2 024 articles sur des éléments situés en France, 789 éléments au Canada et 353 en Belgique[24].

Wikivoyage en français comprend 44 articles étoilés (Catégorie:Article étoilé). Parmi ces articles étoilés, 19 concernent des éléments situés en Belgique, 8 en France, 4 au Canada, 4 au Kenya et 3 en Tanzanie (voir la carte)[25].

Événements

Edit-a-thon aux Archives nationales de France.
WikiConvention 2023
Conférence GLAM Wiki

Ailleurs dans le Wikiverse

La page Wikipédia:RAW/Découvrir recense les infolettres et blogs relatifs à Wikimedia.

Courrier du lectorat

(Il nous fera plaisir de lire les messages déposés ici et, si nécessaire, d'y répondre dans les plus brefs délais.)

Bonsoir, je viens de parcourir l'actualité que vous avez rédigé avec soin, j'ai trouvé intéressant la plupart des informations dont vous avez mentionnées, notamment sur la toute première partie avec les graphiques, bravo pour votre travail ! Hibrideacus (discuter) 31 août 2023 à 22:57 (CEST)

Merci beaucoup pour votre commentaire. ça fait plaisir. PAC2 (discuter) 1 septembre 2023 à 06:57 (CEST)

Bonsoir, merci pour cet important travail de mise à disposition de brèves ! À propos des articles orphelins : le projet francophone a fait le choix de considérer comme orphelin un article possédant moins de 3 liens entrants ; par ailleurs, j'ai testé l'outil indiqué, certes sur un échantillon réduit, et il donne les mêmes réponses que ce que propose déjà Dickensbot (voir par exemple : les Articles orphelins depuis février 2021) pourtant circonscrit à trois wikipédias. Ce faisant, la wikipédia francophone comporte un peu plus de 15 000 articles orphelins, en augmentation lente mais constante. Cela vaudrait sans doute le coup de relancer un concours Wiki-maintenance spécial Orphelins, non ?--Cbyd (discuter) 31 août 2023 à 23:33 (CEST)

Oui effectivement la définition d'un article orphelin peut varier. Dans l'article de recherche, ils considèrent les articles avec 0 liens entrants. PAC2 (discuter) 1 septembre 2023 à 07:00 (CEST)

VLOP

« une cinquantaine de bénévoles sont particulièrement vigilants.. » : sait-on qui sont ces 50 bénévoles ? (pas les noms, mais s'ils sont une catégorie d'utilisateurs bien identifiée) En quoi sont-ils plus particulièrement vigilants ? Quelqu'un sait-il ? C'est une phrase intrigante. --Jean-Christophe BENOIST (discuter) 1 septembre 2023 à 08:27 (CEST)

Je suis d'accord avec toi que c'est intriguant. J'ai parcouru la réponse de la fondation à l'ARCOM (https://www.arcom.fr/sites/default/files/2023-07/2023_anglais_Declaration_Fondation-Wikimedia_haine_en_ligne.pdf, question 7, page 3) mais je n'ai pas vu d'élément plus précis. PAC2 (discuter) 1 septembre 2023 à 08:48 (CEST)

Merci

Lecture instructive. Merci pour ce travail. TCY (discuter) 2 septembre 2023 à 10:44 (CEST)

Fort intéressant

Merci pour cette nouvelle édition très intéressante et très complète. Cela permet de faire un bon tour de l'article en général (Fondation, régulation, nouveaux projets, événements, etc...)
Concernant le problème du nombre de nouveaux administrateurs et administratrices, on pourrait effectivement faire une enquête sur Wikipédia en français.
De mon point de vue, c'est un rôle fondamental pour notre communauté... mais qui est aussi assez ingrat car il n'y a que des coups à prendre (à part si on s'occupe uniquement de la maintenance technique et de la lutte contre les vandalismes). Il y a également l'élection communautaire qui peut parfois virer au défouloir dans les avis. Peut-être qu'en modérant mieux les avis lors des élections, chaque candidature serait moins angoissante pour les candidats et candidates.--Pronoia (discuter) 2 septembre 2023 à 10:57 (CEST)


 –
Rédigé/traduit par PAC2
Citations originales
Notes
Références
  1. Repéré via https://mastodon.world/@OpenSexism/110817958836569741
  2. meta:Community_Insights#Languages
  3. https://foundation.wikimedia.org/wiki/Policy:Universal_Code_of_Conduct/fr
  4. Philippe Jacqué et Maria Udrescu, « Numérique : la loi européenne obligeant les géants d’Internet à réguler leurs contenus est entrée en vigueur », Le Monde,‎ (ISSN 1950-6244, lire en ligne).
  5. « Even as gap-closing efforts take place, there is fear that structured data projects like Wikidata are codifying the views, values, and histories of hegemonic communities into artificial intelligence, establishing them as truths in the robot epistemology, and likely trapping people of the Global Majority in laborious knowledge battles to extend into the eras to come. » traduit avec l'aide de DeepL
  6. « In our Wikidata effort, it seems that we are distanced from the outcomes of our labor. », traduit avec l'assistance de DeepL
  7. « If we don’t engage with these peer-production knowledge platforms, our histories, ideas, knowings, get left behind and the erasure continues. When we do, it profits far away multinationals with clandestine workings, bottomless pockets, and unchecked power over peoples’ lives and livelihoods. » traduit avec DeepL
  8. Finn Årup Nielsen (d) Voir avec Reasonator Synia: Displaying data from Wikibases (d) Voir avec Reasonator, https://arxiv.org/abs/2303.15133
  9. Découvert via le compte Mastodon de fnielsen : https://fosstodon.org/@fnielsen/110791751465369139
  10. https://scholia.toolforge.org/
  11. https://wikifunctions.wikiscan.org/ consulté le 28 août
  12. « My hope is that we can persuade some Wikipedians who joined the community in the 2010s to become admins; I'm sure there are many of you who would pass easily. »
  13. Découvert via https://wikis.world/@wikipedia/110900708319266865 et https://tech.lgbt/@wmlgbt/110898976230542024
  14. « In this new workflow, a machine learning engineer from the Machine Learning team works with a model creator from the first day of the project to work with them on model deployment. The goal is that the model is deployed on the first day it is created and at every new iteration during its development process so that issues that appear in production are identified and resolved early in the model creation process. »
  15. https://api.wikimedia.org/wiki/Lift_Wing_API
  16. (en) Margaret Mitchell, Simone Wu, Andrew Zaldivar, Parker Barnes, Lucy Vasserman, Ben Hutchinson, Elena Spitzer, Inioluwa Deborah Raji et Timnit Gebru, « Model Cards for Model Reporting », FAT* '19: Proceedings of the Conference on Fairness, Accountability, and Transparency,‎ (ISBN 978-1-4503-6125-5, DOI 10.1145/3287560.3287596, arXiv 1810.03993)Voir et modifier les données sur Wikidata
  17. meta:Research:Recommending links to increase visibility of articles/Link-translation
  18. https://linkrec.toolforge.org/
  19. Pour les utilisateurs de l'interface web mobile, le lien vers l'outil est intégré à Chouette.js
  20. Voir l'annonce : en:Wikipedia:Wikipedia Signpost/2023-08-31/From the editor
  21. https://www.wikivoyage.org/
  22. https://stats.wikimedia.org/#/fr.wikivoyage.org
  23. https://pageviews.wmcloud.org/topviews/?project=fr.wikivoyage.org&platform=all-access&date=last-month&excludes=
  24. Requête SPARQL : https://w.wiki/7GXf
  25. https://w.wiki/7GYT
  26. https://www.wikimedia.fr/inscrivez-vous-au-mooc-wikidata/ découvert via Projet:Wikifier la science/Infolettre/Août 2023

Numéro du 18 septembre 2023

Monday, 18 September 2023 00:00 UTC

L'édito de PAC2

Ce numéro contient beaucoup de brèves sur un grand nombre de sujets : l'enquête sur la communauté Wikimédia, la régulation de la haine en ligne, une réflexion sur la contribution à Wikidata, les articles orphelins ou encore la modernisation de l'infrastructure d'apprentissage automatique de la fondation Wikimédia.

Nous introduisons aussi une nouvelle section pour faire un zoom sur un projet Wikimédia. La section est inaugurée avec une présentation de Wikivoyage en français.

Globalement, je me dis que le numéro est peut être un peu long pour le lecteur ou la lectrice (à peu près 20 minutes de lecture d'après la liseuse de Firefox). Chacun pourra picorer ce qu'il souhaite.

N'hésitez pas à contribuer au prochain numéro en proposant des sujets en salle de rédaction ou directement dans le contenu.

Bonne lecture !

Brèves

Community Insights — La Fondation Wikimédia publie chaque année une enquête sur la communauté Wikimédia intitulée Community Insights[1]. L'édition 2023 s'appuie sur des données collectées grâce à une enquête statistique entre juin et septembre 2022. L'enquête a été menée dans 28 langues différentes[2].

Estimation de la part des éditrices et éditeurs actifs par an.

Parmi les éditrices et éditeurs actifs, la part des femmes est passée de 11 % en 2019 à 15 % en 2020 et 13 % en 2022. En revanche, la part des éditrices et éditeurs considérés comme faisant partie des genres minoritaires (gender-diverse) est passée de 2 à 4 %. Le terme de gender-diverse est emprunté au Haut-Commissariat des Nations unies aux droits de l'homme pour désigner les personnes trans, non-binaires, genderqueer, agenrées ou les personnes s'identifiant à plusieurs genres.

Parmi les nouvelles personnes contribuant à Wikimédia depuis 2021, on trouve 20 % de femmes et 7 % de personnes gender-diverse.

Distribution par âge de la communauté comparée à la population mondiale

Globalement, la distribution par catégorie d'âge de la communauté correspond à la distribution mondiale par catégorie d'âge. Toutefois, les personnes de moins de 18 ans ne sont pas incluses dans l'enquête. En revanche, les éditrices et éditeurs actifs sont nettement plus diplômés que la population des pays de l'OCDE. Par ailleurs, 12 % des éditrices et éditeurs se considèrent comme appartenant à une minorité ethnique dans leur pays.

38 % des contributrices et contributeurs trouvent que la Fondation Wikimédia communique bien sur ses projets et ses initiatives. 56 % considèrent que la Fondation a les bons programmes et les bonnes stratégies pour atteindre l'objectif de 2030 de devenir l'infrastructure centrale de la connaissance libre et accessible à tous et toutes.

Part des éditrices et éditeurs qui se sont sentis en danger ou inconfortable au cours des 12 mois précédents.

44% des femmes, 53% des personnes gender-diverses et 33% des hommes contribuant activement se sont sentis en danger (unsafe) ou inconfortables (uncomfortable) au cours des 12 mois précédents l'enquête. 25% des éditrices et éditeurs déclarent avoir subi du harcèlement au cours des 12 derniers mois. La proportion est plus élevée pour les femmes (31%). 46% des éditrices et éditeurs savent comment trouver de l'aide en cas de harcèlement.

Part des éditrices et éditeurs qui déclarent avoir subi du harcèlement.

Lutte contre les contenus haineux

En juillet 2023, l'Autorité de régulation de la communication audiovisuelle et numérique (ARCOM) a publié un bilan des moyens mis en place par les plateformes en ligne dans la lutte contre la diffusion des contenus haineux en 2022. En France, l'article 42 de la Loi confortant le respect des principes de la République impose aux principales plateformes présentes sur le territoire national des obligations de moyen dans la lutte contre la diffusion des contenus haineux. L'ARCOM est chargée de superviser la mise en œuvre de ces obligations. Le règlement européen sur les services numériques (connu sous le nom de DSA pour Digital services act ou RSN en français) entre en œuvre dans les pays de l'Union européenne le 25 août 2023 pour les grandes plateformes en ligne (les VLOP pour very large online platforms) et le 17 février 2024 pour l'ensemble des services en ligne concernés. Les dispositions du DSA remplaceront donc les dispositions de la loi confortant le respect des principes de la République.

Dans ce rapport, l'ARCOM s'intéresse à l'accessibilité et l'intelligibilité des conditions générales, à la prise en compte dans les conditions générales de la législation sur les contenus haineux, aux dispositifs de signalement des contenus haineux, aux moyens mis en œuvre pour la modération des contenus, à la lutte contre les signalements abusifs et enfin à la coopération avec les autorités administratives et judiciaires, que ce soit pour informer les autorités des contenus haineux signalés ou pour traiter les demandes des autorités.

La fondation Wikimédia a fait remarquer à l'ARCOM que le questionnaire n'est pas adapté au fonctionnement collaboratif et communautaire de Wikipédia.

Dans une note au bas de la page 10, l'ARCOM regrette que le Code universel de conduite ne soit disponible qu'en anglais. Pourtant il existe une traduction en français[3].

Sur la modération des contenus illicites, l'ARCOM note : « En raison de l’approche collaborative et décentralisée de sa politique de modération, comparer Wikipédia à d’autres services apparaît peu pertinent. Toutefois, la description de cette politique dans les CG (ie conditions générales) de la plateforme mériterait de gagner en précision et en transparence. »

Sur les dispositions de signalement des contenus haineux, l'ARCOM note la spécificité de Wikipédia par rapport aux autres plateformes : « Wikipédia, en raison des spécificités de son modèle, ne dispose pas de dispositif de signalement « traditionnel ». Confronté à un contenu problématique, un utilisateur pourra (i) le corriger lui-même en modifiant la page, (ii) expliquer le problème sur la page de discussion de l’article concerné ou (iii) demander de l’aide sur le « Forum des nouveaux ». L'architecture de la modération sur la plateforme est remarquable, en ce qu'elle repose en priorité sur les utilisateurs, tout en assurant une expertise stable en matière de modération des contenus illicites grâce aux utilisateurs « administrateurs » de Wikipédia. » Sur les moyens mis en œuvre pour lutter contre les contenus illicites, la fondation note qu'une cinquantaine de bénévoles sont particulièrement vigilants sur cette question.

Sur la mise en œuvre du règlement européen sur les services numériques, nous avons déjà abordé le sujet dans le numéro du 1er juin. Par ailleurs, Wikimédia France a traduit en français un article initialement publié par la Fondation Wikimédia. Le règlement européen sur les services numériques est entré en vigueur le 25 août[4].

Wikidata et l'épistémologie des robots — Dans un article intitulé « Wikidata: why we contribute to the robot epistemology » publié sur le site du user group Whose Knowledge?, Maari Zwick-Maitreyi (d) Voir avec Reasonator explore les enjeux de la contribution à Wikidata pour les personnes de la majorité globale (en). Après avoir rappelé les enjeux de représentation des points de vue des personnes de la majorité globale dans Wikipédia et les efforts de la Wikimedia Foundation, l'autrice souligne que ces enjeux sont particulièrement prégnants dans Wikidata.

« Même si des efforts sont déployés pour combler le fossé, on craint que des projets de données structurées comme Wikidata ne codifient les points de vue, les valeurs et l'histoire des communautés hégémoniques dans l'intelligence artificielle, les érigeant en vérités dans l'épistémologie des robots et piégeant probablement les membres de la majorité globale dans de laborieuses batailles de connaissances qui se prolongeront dans les époques à venir[5]. »

En s'appuyant sur l'article « Working for the Invisible Machines or Pumping Information into an Empty Void? An Exploration of Wikidata Contributors' Motivations (d) Voir avec Reasonator », elle rappelle que 70 % des contributeurs et contributrices de Wikidata ignorent comment leurs contributions sont utilisées.

« Dans notre effort pour Wikidata, il semble que nous soyons éloignés des résultats de notre travail[6]. »

L'autrice rappelle que le travail de contribution gratuite et désintéressée à Wikidata est avant tout utilisé par les grandes entreprises du numérique pour construire des intelligences artificielles et faire des profits. Elle souligne alors un dilemme.

« Si nous ne nous engageons pas dans ces plateformes de production de connaissances par les pairs, nos histoires, nos idées, nos connaissances sont laissées de côté et l'effacement se poursuit. Lorsque nous le faisons, cela profite à des multinationales lointaines qui ont recours au travail clandestin, ont les poches pleines et exercent un pouvoir incontrôlé sur la vie et les moyens de subsistance des gens[7]. »

L'autrice termine l'article avec une série de questions à se poser sur Wikidata.

Synia : explorer Wikidata autrement — En mars 2023, Finn Årup Nielsen (d) Voir avec Reasonator (connu sous le pseudonyme fnielsen) a publié « Synia: Displaying data from Wikibases (d) Voir avec Reasonator » dans lequel il présente Synia, un nouvel outil qui permet d'explorer Wikidata autrement grâce à des requêtes SPARQL génériques[8],[9]. Concrètement, la communauté peut écrire des requêtes SPARQL génériques dans une page de configuration sur Wikidata et cela produit automatiquement une nouvelle page de profil dans Synia. C'est un excellent moyen d'explorer Wikidata. L'outil s'inspire largement de Scholia (d) Voir avec Reasonator[10], un outil qui permet grâce à des requêtes génériques dans Wikidata d'explorer les données de Wikidata relatives aux chercheurs et chercheuses, aux publications scientifiques, aux revues académiques et aux éditeurs scientifiques.

Voici quelques exemples :

Prenez plaisir à contribuerLepticed7 a publié une traduction de l'essai Enjoy yourself.

« Tout le monde devrait le garder à l’esprit tout le temps : prendre du plaisir à contribuer est la clé pour rester actif sur le projet. Si vous ne prenez plus de plaisir à contribuer, faites un pas en arrière et posez-vous des questions sur ce que vous aimez faire. »

Les débuts de Wikifunctions — Le mois dernier, nous avons annoncé le lancement de Wikifunctions. Dans un article publié sur le blog Diff, Denny Vrandečić donne plus de détails. Il définit Wikifunctions comme un espace destiné à créer et maintenir de manière collaborative une bibliothèque de fonctions. Il anticipe qu'elle permettra de générer des phrases, du texte et même des articles entiers. Elle permettra aussi de faire des calculs à partir des données brutes contenues dans Wikidata, comme par exemple calculer l'âge d'une personne à partir de sa date de naissance ou la densité de population à partir de la population et de la superficie d'un territoire.

La première fonction permet de joindre ensemble deux chaînes de caractère : https://www.wikifunctions.org/view/fr/Z10000

D'après Wikiscan, il existe déjà plus de 2 000 fonctions dans Wikifunctions[11].

Revues citées par Wikipédia — Dans The Signpost du 1er août dernier, Headbomb raconte le projet Journals cited by Wikipedia (Revues citées par Wikipédia), une idée née en 2009 qui consiste à compiler des statistiques sur les revues citées dans Wikipédia en anglais en extrayant les valeurs du paramètre journal= dans le modèle Cite journal (équivalent de {{Article}}) et d'autres modèles similaires.

On apprend notamment qu'Elsevier est l'éditeur scientifique le plus cité dans Wikipédia avec 360 000 citations. et Nature la revue la plus citée avec 51 000 citations.

Pourquoi y a-t-il si peu d'administrateurs et d'administratrices dans les wikipédiennes et wikipédiens récents ? — Dans The Signpost, WereSpielChequers s'inquiète du fait que la majorité des administrateurs et administratrices de la Wikipédia en anglais aient commencé à contribuer dans les années 2000. Sur les 881 administratrices et administrateurs, seul 64 ont commencé à contribuer après 2011.

« J'espère que nous pourrons persuader certains Wikipédiens qui ont rejoint la communauté dans les années 2010 de devenir administrateurs ; je suis sûr qu'il y a beaucoup d'entre vous qui passeraient facilement[12]. »

Ce serait intéressant de faire le même exercice sur Wikipédia en français.

Le Wikimédien de l'année — Le prix du wikipédien de l'année a été remis à Tofeiku, un contributeur originaire de Malaisie qui a commencé à contribuer à l'âge de 8 ans. Il s'est beaucoup investi dans le Wiktionnaire en malais (d) Voir avec Reasonator[13]. Le prix Wikimedia est remis à Siobhan Leachman et le prix du nouveau venu au japonais Eugene Ormandy.

La fondation Wikimédia modernise ses modèles d'apprentissage automatique — Depuis 2015, la fondation Wikimédia maintient un ensemble de modèles d'apprentissage automatique et une infrastructure appelés ORES. En tout, ORES comprend 110 modèles d'arbres de décision dans différentes langues qui permettent d'évaluer la qualité d'un article, la qualité d'une modification, la qualité d'un élément et le thème d'un article. Les modèles déployés par la fondation n'éditent pas directement Wikipédia mais permettent d'avertir les contributrices et les contributeurs. Par exemple, le modèle de détection de vandalisme permet de mettre des alertes dans la page modifications récentes de la Wikipédia en anglais.

Pour pouvoir déployer plus facilement une plus grande variété de modèles en passant rapidement à l'échelle, la fondation s'est lancé dans un grand chantier de modernisation de son infrastructure d'apprentissage automatique.

« Dans ce nouveau flux de travail, un ingénieur en apprentissage automatique de l'équipe machine learning travaille avec un créateur de modèle dès le premier jour du projet pour travailler avec lui sur le déploiement du modèle. L'objectif est que le modèle soit déployé dès le premier jour de sa création et à chaque nouvelle itération au cours de son processus de développement afin que les problèmes qui apparaissent en production soient identifiés et résolus dès le début du processus[14]. »

Cette approche du développement de modèles, dite MLOps, nécessite une nouvelle infrastructure qui s'appuie sur le logiciel Kubeflow (d) Voir avec Reasonator. L'infrastructure est divisée en deux parties, Train Wing pour l'entraînement et Lift Wing pour le déploiement. Les modèles déployés sur Lift Wing seront accessibles par API à travers le portail d'API de la fondation[15].

La seconde partie de l'infrastructure, Train Wing, permettra aux ingénieurs de la fondation mais aussi aux chercheurs d'entraîner leurs propres modèles.

Pour améliorer la documentation et la transparence des modèles d'apprentissage automatique, la fondation va mettre en place une documentation des modèles conformes à l'approche model cards développée par Mitchell et al. (2019) (voir l'exemple meta:User:AlgoAccountabilityBot/Enwiki Good Faith Model Card)[16].

8,8 millions d'articles orphelins dans les 319 versions de Wikipédia — Dans « Orphan Articles: The Dark Matter of Wikipedia (d) Voir avec Reasonator », les chercheurs Akhil Arora, Robert West (d) Voir avec Reasonator et Martin Gerlach (d) Voir avec Reasonator (meta:user:MGerlach (WMF)) se penchent sur l'accessibilité des articles et plus précisément sur les articles qui ne sont pas reliés au reste de l'encyclopédie par des liens internes. Ils estiment que sur les 319 versions linguistiques de Wikipédia, 15% (8,8 millions) des articles peuvent être considérés comme orphelins (aucun lien entrant). La Wikipédia en français se distingue avec seulement 1,7% d'articles orphelins (39 960 articles sur 2,363,875)[17]. A l'inverse, il y a très peu d'articles sans lien sortant. Les auteurs n'en trouvent que 300 000, soit 0,5%.

Les auteurs cherchent à caractériser les articles orphelins à travers plusieurs critères (article créé par un bot, article récent, article consacré à une femme, etc). Ils trouvent notamment que les articles consacrés à des femmes sont plus souvent orphelins que les autres. Par exemple, dans la Wikipédia en anglais, 29% des articles biographiques orphelins sont consacrés à des femmes, qui ne représentent pourtant que 19% des articles biographiques en général.

Les auteurs ont développé l'outil Wiki-Visibility pour aider à relier un article orphelin à partir de liens existants dans d'autres versions linguistiques de Wikipédia. Par exemple, pour l'article Ana Montès, Wiki-Visibility suggère d'ajouter un lien depuis Walter Kendall Myers parce que ce lien existe en anglais et en russe[18],[19].

Dans la Wikipédia en français, le Projet:Pages orphelines liste toutes les pages de la catégorie et cette requête petscan liste toutes les biographies de femmes orphelines (à la date du 4 juillet).

En très bref

Le zoom : Wikivoyage en français

Le zoom est une nouvelle rubrique pour faire le point sur un Wikiprojet. Premier de la série : wikivoyage en français.

Wikivoyage en français compte plus de 8 000 pages de contenu, c'est beaucoup moins que Wikivoyage en anglais (31 000 pages) ou en allemand (20 000 pages) mais beaucoup plus que wikivoyage en espagnol (3 000 pages)[21].

Le contenu de Wikivoyage des articles de Wikivoyage est très structuré avec des patrons d'articles très précis et l'utilisation importante de modèles pour structurer l'information comme modèle:Voir ou modèle:Manger. Wikivoyage s'appuie beaucoup sur Wikidata pour ses infobox ou ses bannières.

En juillet 2023, le site totalise 1 million de pages vues en juillet avec 16 utilisateurs actifs (plus de 5 contributions)[22].

En juillet 2023, les 5 articles les plus consultés sont Amérique du Sud, Palma de Majorque, Johannesburg, Europe et Singapour[23].

Le site compte 2 024 articles sur des éléments situés en France, 789 éléments au Canada et 353 en Belgique[24].

Wikivoyage en français comprend 44 articles étoilés (Catégorie:Article étoilé). Parmi ces articles étoilés, 19 concernent des éléments situés en Belgique, 8 en France, 4 au Canada, 4 au Kenya et 3 en Tanzanie (voir la carte)[25].

Événements

Edit-a-thon aux Archives nationales de France.
WikiConvention 2023
Conférence GLAM Wiki

Ailleurs dans le Wikiverse

La page Wikipédia:RAW/Découvrir recense les infolettres et blogs relatifs à Wikimedia.

Courrier du lectorat

(Il nous fera plaisir de lire les messages déposés ici et, si nécessaire, d'y répondre dans les plus brefs délais.)

Bonsoir, je viens de parcourir l'actualité que vous avez rédigé avec soin, j'ai trouvé intéressant la plupart des informations dont vous avez mentionnées, notamment sur la toute première partie avec les graphiques, bravo pour votre travail ! Hibrideacus (discuter) 31 août 2023 à 22:57 (CEST)

Merci beaucoup pour votre commentaire. ça fait plaisir. PAC2 (discuter) 1 septembre 2023 à 06:57 (CEST)

Bonsoir, merci pour cet important travail de mise à disposition de brèves ! À propos des articles orphelins : le projet francophone a fait le choix de considérer comme orphelin un article possédant moins de 3 liens entrants ; par ailleurs, j'ai testé l'outil indiqué, certes sur un échantillon réduit, et il donne les mêmes réponses que ce que propose déjà Dickensbot (voir par exemple : les Articles orphelins depuis février 2021) pourtant circonscrit à trois wikipédias. Ce faisant, la wikipédia francophone comporte un peu plus de 15 000 articles orphelins, en augmentation lente mais constante. Cela vaudrait sans doute le coup de relancer un concours Wiki-maintenance spécial Orphelins, non ?--Cbyd (discuter) 31 août 2023 à 23:33 (CEST)

Oui effectivement la définition d'un article orphelin peut varier. Dans l'article de recherche, ils considèrent les articles avec 0 liens entrants. PAC2 (discuter) 1 septembre 2023 à 07:00 (CEST)

VLOP

« une cinquantaine de bénévoles sont particulièrement vigilants.. » : sait-on qui sont ces 50 bénévoles ? (pas les noms, mais s'ils sont une catégorie d'utilisateurs bien identifiée) En quoi sont-ils plus particulièrement vigilants ? Quelqu'un sait-il ? C'est une phrase intrigante. --Jean-Christophe BENOIST (discuter) 1 septembre 2023 à 08:27 (CEST)

Je suis d'accord avec toi que c'est intriguant. J'ai parcouru la réponse de la fondation à l'ARCOM (https://www.arcom.fr/sites/default/files/2023-07/2023_anglais_Declaration_Fondation-Wikimedia_haine_en_ligne.pdf, question 7, page 3) mais je n'ai pas vu d'élément plus précis. PAC2 (discuter) 1 septembre 2023 à 08:48 (CEST)

Merci

Lecture instructive. Merci pour ce travail. TCY (discuter) 2 septembre 2023 à 10:44 (CEST)

Fort intéressant

Merci pour cette nouvelle édition très intéressante et très complète. Cela permet de faire un bon tour de l'article en général (Fondation, régulation, nouveaux projets, événements, etc...)
Concernant le problème du nombre de nouveaux administrateurs et administratrices, on pourrait effectivement faire une enquête sur Wikipédia en français.
De mon point de vue, c'est un rôle fondamental pour notre communauté... mais qui est aussi assez ingrat car il n'y a que des coups à prendre (à part si on s'occupe uniquement de la maintenance technique et de la lutte contre les vandalismes). Il y a également l'élection communautaire qui peut parfois virer au défouloir dans les avis. Peut-être qu'en modérant mieux les avis lors des élections, chaque candidature serait moins angoissante pour les candidats et candidates.--Pronoia (discuter) 2 septembre 2023 à 10:57 (CEST)


 –
Rédigé/traduit par PAC2
Citations originales
Notes
Références
  1. Repéré via https://mastodon.world/@OpenSexism/110817958836569741
  2. meta:Community_Insights#Languages
  3. https://foundation.wikimedia.org/wiki/Policy:Universal_Code_of_Conduct/fr
  4. Philippe Jacqué et Maria Udrescu, « Numérique : la loi européenne obligeant les géants d’Internet à réguler leurs contenus est entrée en vigueur », Le Monde,‎ (ISSN 1950-6244, lire en ligne).
  5. « Even as gap-closing efforts take place, there is fear that structured data projects like Wikidata are codifying the views, values, and histories of hegemonic communities into artificial intelligence, establishing them as truths in the robot epistemology, and likely trapping people of the Global Majority in laborious knowledge battles to extend into the eras to come. » traduit avec l'aide de DeepL
  6. « In our Wikidata effort, it seems that we are distanced from the outcomes of our labor. », traduit avec l'assistance de DeepL
  7. « If we don’t engage with these peer-production knowledge platforms, our histories, ideas, knowings, get left behind and the erasure continues. When we do, it profits far away multinationals with clandestine workings, bottomless pockets, and unchecked power over peoples’ lives and livelihoods. » traduit avec DeepL
  8. Finn Årup Nielsen (d) Voir avec Reasonator Synia: Displaying data from Wikibases (d) Voir avec Reasonator, https://arxiv.org/abs/2303.15133
  9. Découvert via le compte Mastodon de fnielsen : https://fosstodon.org/@fnielsen/110791751465369139
  10. https://scholia.toolforge.org/
  11. https://wikifunctions.wikiscan.org/ consulté le 28 août
  12. « My hope is that we can persuade some Wikipedians who joined the community in the 2010s to become admins; I'm sure there are many of you who would pass easily. »
  13. Découvert via https://wikis.world/@wikipedia/110900708319266865 et https://tech.lgbt/@wmlgbt/110898976230542024
  14. « In this new workflow, a machine learning engineer from the Machine Learning team works with a model creator from the first day of the project to work with them on model deployment. The goal is that the model is deployed on the first day it is created and at every new iteration during its development process so that issues that appear in production are identified and resolved early in the model creation process. »
  15. https://api.wikimedia.org/wiki/Lift_Wing_API
  16. (en) Margaret Mitchell, Simone Wu, Andrew Zaldivar, Parker Barnes, Lucy Vasserman, Ben Hutchinson, Elena Spitzer, Inioluwa Deborah Raji et Timnit Gebru, « Model Cards for Model Reporting », FAT* '19: Proceedings of the Conference on Fairness, Accountability, and Transparency,‎ (ISBN 978-1-4503-6125-5, DOI 10.1145/3287560.3287596, arXiv 1810.03993)Voir et modifier les données sur Wikidata
  17. meta:Research:Recommending links to increase visibility of articles/Link-translation
  18. https://linkrec.toolforge.org/
  19. Pour les utilisateurs de l'interface web mobile, le lien vers l'outil est intégré à Chouette.js
  20. Voir l'annonce : en:Wikipedia:Wikipedia Signpost/2023-08-31/From the editor
  21. https://www.wikivoyage.org/
  22. https://stats.wikimedia.org/#/fr.wikivoyage.org
  23. https://pageviews.wmcloud.org/topviews/?project=fr.wikivoyage.org&platform=all-access&date=last-month&excludes=
  24. Requête SPARQL : https://w.wiki/7GXf
  25. https://w.wiki/7GYT
  26. https://www.wikimedia.fr/inscrivez-vous-au-mooc-wikidata/ découvert via Projet:Wikifier la science/Infolettre/Août 2023

Numéro du 17 septembre 2023

Sunday, 17 September 2023 00:00 UTC

L'édito de PAC2

Ce numéro contient beaucoup de brèves sur un grand nombre de sujets : l'enquête sur la communauté Wikimédia, la régulation de la haine en ligne, une réflexion sur la contribution à Wikidata, les articles orphelins ou encore la modernisation de l'infrastructure d'apprentissage automatique de la fondation Wikimédia.

Nous introduisons aussi une nouvelle section pour faire un zoom sur un projet Wikimédia. La section est inaugurée avec une présentation de Wikivoyage en français.

Globalement, je me dis que le numéro est peut être un peu long pour le lecteur ou la lectrice (à peu près 20 minutes de lecture d'après la liseuse de Firefox). Chacun pourra picorer ce qu'il souhaite.

N'hésitez pas à contribuer au prochain numéro en proposant des sujets en salle de rédaction ou directement dans le contenu.

Bonne lecture !

Brèves

Community Insights — La Fondation Wikimédia publie chaque année une enquête sur la communauté Wikimédia intitulée Community Insights[1]. L'édition 2023 s'appuie sur des données collectées grâce à une enquête statistique entre juin et septembre 2022. L'enquête a été menée dans 28 langues différentes[2].

Estimation de la part des éditrices et éditeurs actifs par an.

Parmi les éditrices et éditeurs actifs, la part des femmes est passée de 11 % en 2019 à 15 % en 2020 et 13 % en 2022. En revanche, la part des éditrices et éditeurs considérés comme faisant partie des genres minoritaires (gender-diverse) est passée de 2 à 4 %. Le terme de gender-diverse est emprunté au Haut-Commissariat des Nations unies aux droits de l'homme pour désigner les personnes trans, non-binaires, genderqueer, agenrées ou les personnes s'identifiant à plusieurs genres.

Parmi les nouvelles personnes contribuant à Wikimédia depuis 2021, on trouve 20 % de femmes et 7 % de personnes gender-diverse.

Distribution par âge de la communauté comparée à la population mondiale

Globalement, la distribution par catégorie d'âge de la communauté correspond à la distribution mondiale par catégorie d'âge. Toutefois, les personnes de moins de 18 ans ne sont pas incluses dans l'enquête. En revanche, les éditrices et éditeurs actifs sont nettement plus diplômés que la population des pays de l'OCDE. Par ailleurs, 12 % des éditrices et éditeurs se considèrent comme appartenant à une minorité ethnique dans leur pays.

38 % des contributrices et contributeurs trouvent que la Fondation Wikimédia communique bien sur ses projets et ses initiatives. 56 % considèrent que la Fondation a les bons programmes et les bonnes stratégies pour atteindre l'objectif de 2030 de devenir l'infrastructure centrale de la connaissance libre et accessible à tous et toutes.

Part des éditrices et éditeurs qui se sont sentis en danger ou inconfortable au cours des 12 mois précédents.

44% des femmes, 53% des personnes gender-diverses et 33% des hommes contribuant activement se sont sentis en danger (unsafe) ou inconfortables (uncomfortable) au cours des 12 mois précédents l'enquête. 25% des éditrices et éditeurs déclarent avoir subi du harcèlement au cours des 12 derniers mois. La proportion est plus élevée pour les femmes (31%). 46% des éditrices et éditeurs savent comment trouver de l'aide en cas de harcèlement.

Part des éditrices et éditeurs qui déclarent avoir subi du harcèlement.

Lutte contre les contenus haineux

En juillet 2023, l'Autorité de régulation de la communication audiovisuelle et numérique (ARCOM) a publié un bilan des moyens mis en place par les plateformes en ligne dans la lutte contre la diffusion des contenus haineux en 2022. En France, l'article 42 de la Loi confortant le respect des principes de la République impose aux principales plateformes présentes sur le territoire national des obligations de moyen dans la lutte contre la diffusion des contenus haineux. L'ARCOM est chargée de superviser la mise en œuvre de ces obligations. Le règlement européen sur les services numériques (connu sous le nom de DSA pour Digital services act ou RSN en français) entre en œuvre dans les pays de l'Union européenne le 25 août 2023 pour les grandes plateformes en ligne (les VLOP pour very large online platforms) et le 17 février 2024 pour l'ensemble des services en ligne concernés. Les dispositions du DSA remplaceront donc les dispositions de la loi confortant le respect des principes de la République.

Dans ce rapport, l'ARCOM s'intéresse à l'accessibilité et l'intelligibilité des conditions générales, à la prise en compte dans les conditions générales de la législation sur les contenus haineux, aux dispositifs de signalement des contenus haineux, aux moyens mis en œuvre pour la modération des contenus, à la lutte contre les signalements abusifs et enfin à la coopération avec les autorités administratives et judiciaires, que ce soit pour informer les autorités des contenus haineux signalés ou pour traiter les demandes des autorités.

La fondation Wikimédia a fait remarquer à l'ARCOM que le questionnaire n'est pas adapté au fonctionnement collaboratif et communautaire de Wikipédia.

Dans une note au bas de la page 10, l'ARCOM regrette que le Code universel de conduite ne soit disponible qu'en anglais. Pourtant il existe une traduction en français[3].

Sur la modération des contenus illicites, l'ARCOM note : « En raison de l’approche collaborative et décentralisée de sa politique de modération, comparer Wikipédia à d’autres services apparaît peu pertinent. Toutefois, la description de cette politique dans les CG (ie conditions générales) de la plateforme mériterait de gagner en précision et en transparence. »

Sur les dispositions de signalement des contenus haineux, l'ARCOM note la spécificité de Wikipédia par rapport aux autres plateformes : « Wikipédia, en raison des spécificités de son modèle, ne dispose pas de dispositif de signalement « traditionnel ». Confronté à un contenu problématique, un utilisateur pourra (i) le corriger lui-même en modifiant la page, (ii) expliquer le problème sur la page de discussion de l’article concerné ou (iii) demander de l’aide sur le « Forum des nouveaux ». L'architecture de la modération sur la plateforme est remarquable, en ce qu'elle repose en priorité sur les utilisateurs, tout en assurant une expertise stable en matière de modération des contenus illicites grâce aux utilisateurs « administrateurs » de Wikipédia. » Sur les moyens mis en œuvre pour lutter contre les contenus illicites, la fondation note qu'une cinquantaine de bénévoles sont particulièrement vigilants sur cette question.

Sur la mise en œuvre du règlement européen sur les services numériques, nous avons déjà abordé le sujet dans le numéro du 1er juin. Par ailleurs, Wikimédia France a traduit en français un article initialement publié par la Fondation Wikimédia. Le règlement européen sur les services numériques est entré en vigueur le 25 août[4].

Wikidata et l'épistémologie des robots — Dans un article intitulé « Wikidata: why we contribute to the robot epistemology » publié sur le site du user group Whose Knowledge?, Maari Zwick-Maitreyi (d) Voir avec Reasonator explore les enjeux de la contribution à Wikidata pour les personnes de la majorité globale (en). Après avoir rappelé les enjeux de représentation des points de vue des personnes de la majorité globale dans Wikipédia et les efforts de la Wikimedia Foundation, l'autrice souligne que ces enjeux sont particulièrement prégnants dans Wikidata.

« Même si des efforts sont déployés pour combler le fossé, on craint que des projets de données structurées comme Wikidata ne codifient les points de vue, les valeurs et l'histoire des communautés hégémoniques dans l'intelligence artificielle, les érigeant en vérités dans l'épistémologie des robots et piégeant probablement les membres de la majorité globale dans de laborieuses batailles de connaissances qui se prolongeront dans les époques à venir[5]. »

En s'appuyant sur l'article « Working for the Invisible Machines or Pumping Information into an Empty Void? An Exploration of Wikidata Contributors' Motivations (d) Voir avec Reasonator », elle rappelle que 70 % des contributeurs et contributrices de Wikidata ignorent comment leurs contributions sont utilisées.

« Dans notre effort pour Wikidata, il semble que nous soyons éloignés des résultats de notre travail[6]. »

L'autrice rappelle que le travail de contribution gratuite et désintéressée à Wikidata est avant tout utilisé par les grandes entreprises du numérique pour construire des intelligences artificielles et faire des profits. Elle souligne alors un dilemme.

« Si nous ne nous engageons pas dans ces plateformes de production de connaissances par les pairs, nos histoires, nos idées, nos connaissances sont laissées de côté et l'effacement se poursuit. Lorsque nous le faisons, cela profite à des multinationales lointaines qui ont recours au travail clandestin, ont les poches pleines et exercent un pouvoir incontrôlé sur la vie et les moyens de subsistance des gens[7]. »

L'autrice termine l'article avec une série de questions à se poser sur Wikidata.

Synia : explorer Wikidata autrement — En mars 2023, Finn Årup Nielsen (d) Voir avec Reasonator (connu sous le pseudonyme fnielsen) a publié « Synia: Displaying data from Wikibases (d) Voir avec Reasonator » dans lequel il présente Synia, un nouvel outil qui permet d'explorer Wikidata autrement grâce à des requêtes SPARQL génériques[8],[9]. Concrètement, la communauté peut écrire des requêtes SPARQL génériques dans une page de configuration sur Wikidata et cela produit automatiquement une nouvelle page de profil dans Synia. C'est un excellent moyen d'explorer Wikidata. L'outil s'inspire largement de Scholia (d) Voir avec Reasonator[10], un outil qui permet grâce à des requêtes génériques dans Wikidata d'explorer les données de Wikidata relatives aux chercheurs et chercheuses, aux publications scientifiques, aux revues académiques et aux éditeurs scientifiques.

Voici quelques exemples :

Prenez plaisir à contribuerLepticed7 a publié une traduction de l'essai Enjoy yourself.

« Tout le monde devrait le garder à l’esprit tout le temps : prendre du plaisir à contribuer est la clé pour rester actif sur le projet. Si vous ne prenez plus de plaisir à contribuer, faites un pas en arrière et posez-vous des questions sur ce que vous aimez faire. »

Les débuts de Wikifunctions — Le mois dernier, nous avons annoncé le lancement de Wikifunctions. Dans un article publié sur le blog Diff, Denny Vrandečić donne plus de détails. Il définit Wikifunctions comme un espace destiné à créer et maintenir de manière collaborative une bibliothèque de fonctions. Il anticipe qu'elle permettra de générer des phrases, du texte et même des articles entiers. Elle permettra aussi de faire des calculs à partir des données brutes contenues dans Wikidata, comme par exemple calculer l'âge d'une personne à partir de sa date de naissance ou la densité de population à partir de la population et de la superficie d'un territoire.

La première fonction permet de joindre ensemble deux chaînes de caractère : https://www.wikifunctions.org/view/fr/Z10000

D'après Wikiscan, il existe déjà plus de 2 000 fonctions dans Wikifunctions[11].

Revues citées par Wikipédia — Dans The Signpost du 1er août dernier, Headbomb raconte le projet Journals cited by Wikipedia (Revues citées par Wikipédia), une idée née en 2009 qui consiste à compiler des statistiques sur les revues citées dans Wikipédia en anglais en extrayant les valeurs du paramètre journal= dans le modèle Cite journal (équivalent de {{Article}}) et d'autres modèles similaires.

On apprend notamment qu'Elsevier est l'éditeur scientifique le plus cité dans Wikipédia avec 360 000 citations. et Nature la revue la plus citée avec 51 000 citations.

Pourquoi y a-t-il si peu d'administrateurs et d'administratrices dans les wikipédiennes et wikipédiens récents ? — Dans The Signpost, WereSpielChequers s'inquiète du fait que la majorité des administrateurs et administratrices de la Wikipédia en anglais aient commencé à contribuer dans les années 2000. Sur les 881 administratrices et administrateurs, seul 64 ont commencé à contribuer après 2011.

« J'espère que nous pourrons persuader certains Wikipédiens qui ont rejoint la communauté dans les années 2010 de devenir administrateurs ; je suis sûr qu'il y a beaucoup d'entre vous qui passeraient facilement[12]. »

Ce serait intéressant de faire le même exercice sur Wikipédia en français.

Le Wikimédien de l'année — Le prix du wikipédien de l'année a été remis à Tofeiku, un contributeur originaire de Malaisie qui a commencé à contribuer à l'âge de 8 ans. Il s'est beaucoup investi dans le Wiktionnaire en malais (d) Voir avec Reasonator[13]. Le prix Wikimedia est remis à Siobhan Leachman et le prix du nouveau venu au japonais Eugene Ormandy.

La fondation Wikimédia modernise ses modèles d'apprentissage automatique — Depuis 2015, la fondation Wikimédia maintient un ensemble de modèles d'apprentissage automatique et une infrastructure appelés ORES. En tout, ORES comprend 110 modèles d'arbres de décision dans différentes langues qui permettent d'évaluer la qualité d'un article, la qualité d'une modification, la qualité d'un élément et le thème d'un article. Les modèles déployés par la fondation n'éditent pas directement Wikipédia mais permettent d'avertir les contributrices et les contributeurs. Par exemple, le modèle de détection de vandalisme permet de mettre des alertes dans la page modifications récentes de la Wikipédia en anglais.

Pour pouvoir déployer plus facilement une plus grande variété de modèles en passant rapidement à l'échelle, la fondation s'est lancé dans un grand chantier de modernisation de son infrastructure d'apprentissage automatique.

« Dans ce nouveau flux de travail, un ingénieur en apprentissage automatique de l'équipe machine learning travaille avec un créateur de modèle dès le premier jour du projet pour travailler avec lui sur le déploiement du modèle. L'objectif est que le modèle soit déployé dès le premier jour de sa création et à chaque nouvelle itération au cours de son processus de développement afin que les problèmes qui apparaissent en production soient identifiés et résolus dès le début du processus[14]. »

Cette approche du développement de modèles, dite MLOps, nécessite une nouvelle infrastructure qui s'appuie sur le logiciel Kubeflow (d) Voir avec Reasonator. L'infrastructure est divisée en deux parties, Train Wing pour l'entraînement et Lift Wing pour le déploiement. Les modèles déployés sur Lift Wing seront accessibles par API à travers le portail d'API de la fondation[15].

La seconde partie de l'infrastructure, Train Wing, permettra aux ingénieurs de la fondation mais aussi aux chercheurs d'entraîner leurs propres modèles.

Pour améliorer la documentation et la transparence des modèles d'apprentissage automatique, la fondation va mettre en place une documentation des modèles conformes à l'approche model cards développée par Mitchell et al. (2019) (voir l'exemple meta:User:AlgoAccountabilityBot/Enwiki Good Faith Model Card)[16].

8,8 millions d'articles orphelins dans les 319 versions de Wikipédia — Dans « Orphan Articles: The Dark Matter of Wikipedia (d) Voir avec Reasonator », les chercheurs Akhil Arora, Robert West (d) Voir avec Reasonator et Martin Gerlach (d) Voir avec Reasonator (meta:user:MGerlach (WMF)) se penchent sur l'accessibilité des articles et plus précisément sur les articles qui ne sont pas reliés au reste de l'encyclopédie par des liens internes. Ils estiment que sur les 319 versions linguistiques de Wikipédia, 15% (8,8 millions) des articles peuvent être considérés comme orphelins (aucun lien entrant). La Wikipédia en français se distingue avec seulement 1,7% d'articles orphelins (39 960 articles sur 2,363,875)[17]. A l'inverse, il y a très peu d'articles sans lien sortant. Les auteurs n'en trouvent que 300 000, soit 0,5%.

Les auteurs cherchent à caractériser les articles orphelins à travers plusieurs critères (article créé par un bot, article récent, article consacré à une femme, etc). Ils trouvent notamment que les articles consacrés à des femmes sont plus souvent orphelins que les autres. Par exemple, dans la Wikipédia en anglais, 29% des articles biographiques orphelins sont consacrés à des femmes, qui ne représentent pourtant que 19% des articles biographiques en général.

Les auteurs ont développé l'outil Wiki-Visibility pour aider à relier un article orphelin à partir de liens existants dans d'autres versions linguistiques de Wikipédia. Par exemple, pour l'article Ana Montès, Wiki-Visibility suggère d'ajouter un lien depuis Walter Kendall Myers parce que ce lien existe en anglais et en russe[18],[19].

Dans la Wikipédia en français, le Projet:Pages orphelines liste toutes les pages de la catégorie et cette requête petscan liste toutes les biographies de femmes orphelines (à la date du 4 juillet).

En très bref

Le zoom : Wikivoyage en français

Le zoom est une nouvelle rubrique pour faire le point sur un Wikiprojet. Premier de la série : wikivoyage en français.

Wikivoyage en français compte plus de 8 000 pages de contenu, c'est beaucoup moins que Wikivoyage en anglais (31 000 pages) ou en allemand (20 000 pages) mais beaucoup plus que wikivoyage en espagnol (3 000 pages)[21].

Le contenu de Wikivoyage des articles de Wikivoyage est très structuré avec des patrons d'articles très précis et l'utilisation importante de modèles pour structurer l'information comme modèle:Voir ou modèle:Manger. Wikivoyage s'appuie beaucoup sur Wikidata pour ses infobox ou ses bannières.

En juillet 2023, le site totalise 1 million de pages vues en juillet avec 16 utilisateurs actifs (plus de 5 contributions)[22].

En juillet 2023, les 5 articles les plus consultés sont Amérique du Sud, Palma de Majorque, Johannesburg, Europe et Singapour[23].

Le site compte 2 024 articles sur des éléments situés en France, 789 éléments au Canada et 353 en Belgique[24].

Wikivoyage en français comprend 44 articles étoilés (Catégorie:Article étoilé). Parmi ces articles étoilés, 19 concernent des éléments situés en Belgique, 8 en France, 4 au Canada, 4 au Kenya et 3 en Tanzanie (voir la carte)[25].

Événements

Edit-a-thon aux Archives nationales de France.
WikiConvention 2023
Conférence GLAM Wiki

Ailleurs dans le Wikiverse

La page Wikipédia:RAW/Découvrir recense les infolettres et blogs relatifs à Wikimedia.

Courrier du lectorat

(Il nous fera plaisir de lire les messages déposés ici et, si nécessaire, d'y répondre dans les plus brefs délais.)

Bonsoir, je viens de parcourir l'actualité que vous avez rédigé avec soin, j'ai trouvé intéressant la plupart des informations dont vous avez mentionnées, notamment sur la toute première partie avec les graphiques, bravo pour votre travail ! Hibrideacus (discuter) 31 août 2023 à 22:57 (CEST)

Merci beaucoup pour votre commentaire. ça fait plaisir. PAC2 (discuter) 1 septembre 2023 à 06:57 (CEST)

Bonsoir, merci pour cet important travail de mise à disposition de brèves ! À propos des articles orphelins : le projet francophone a fait le choix de considérer comme orphelin un article possédant moins de 3 liens entrants ; par ailleurs, j'ai testé l'outil indiqué, certes sur un échantillon réduit, et il donne les mêmes réponses que ce que propose déjà Dickensbot (voir par exemple : les Articles orphelins depuis février 2021) pourtant circonscrit à trois wikipédias. Ce faisant, la wikipédia francophone comporte un peu plus de 15 000 articles orphelins, en augmentation lente mais constante. Cela vaudrait sans doute le coup de relancer un concours Wiki-maintenance spécial Orphelins, non ?--Cbyd (discuter) 31 août 2023 à 23:33 (CEST)

Oui effectivement la définition d'un article orphelin peut varier. Dans l'article de recherche, ils considèrent les articles avec 0 liens entrants. PAC2 (discuter) 1 septembre 2023 à 07:00 (CEST)

VLOP

« une cinquantaine de bénévoles sont particulièrement vigilants.. » : sait-on qui sont ces 50 bénévoles ? (pas les noms, mais s'ils sont une catégorie d'utilisateurs bien identifiée) En quoi sont-ils plus particulièrement vigilants ? Quelqu'un sait-il ? C'est une phrase intrigante. --Jean-Christophe BENOIST (discuter) 1 septembre 2023 à 08:27 (CEST)

Je suis d'accord avec toi que c'est intriguant. J'ai parcouru la réponse de la fondation à l'ARCOM (https://www.arcom.fr/sites/default/files/2023-07/2023_anglais_Declaration_Fondation-Wikimedia_haine_en_ligne.pdf, question 7, page 3) mais je n'ai pas vu d'élément plus précis. PAC2 (discuter) 1 septembre 2023 à 08:48 (CEST)

Merci

Lecture instructive. Merci pour ce travail. TCY (discuter) 2 septembre 2023 à 10:44 (CEST)

Fort intéressant

Merci pour cette nouvelle édition très intéressante et très complète. Cela permet de faire un bon tour de l'article en général (Fondation, régulation, nouveaux projets, événements, etc...)
Concernant le problème du nombre de nouveaux administrateurs et administratrices, on pourrait effectivement faire une enquête sur Wikipédia en français.
De mon point de vue, c'est un rôle fondamental pour notre communauté... mais qui est aussi assez ingrat car il n'y a que des coups à prendre (à part si on s'occupe uniquement de la maintenance technique et de la lutte contre les vandalismes). Il y a également l'élection communautaire qui peut parfois virer au défouloir dans les avis. Peut-être qu'en modérant mieux les avis lors des élections, chaque candidature serait moins angoissante pour les candidats et candidates.--Pronoia (discuter) 2 septembre 2023 à 10:57 (CEST)


 –
Rédigé/traduit par PAC2
Citations originales
Notes
Références
  1. Repéré via https://mastodon.world/@OpenSexism/110817958836569741
  2. meta:Community_Insights#Languages
  3. https://foundation.wikimedia.org/wiki/Policy:Universal_Code_of_Conduct/fr
  4. Philippe Jacqué et Maria Udrescu, « Numérique : la loi européenne obligeant les géants d’Internet à réguler leurs contenus est entrée en vigueur », Le Monde,‎ (ISSN 1950-6244, lire en ligne).
  5. « Even as gap-closing efforts take place, there is fear that structured data projects like Wikidata are codifying the views, values, and histories of hegemonic communities into artificial intelligence, establishing them as truths in the robot epistemology, and likely trapping people of the Global Majority in laborious knowledge battles to extend into the eras to come. » traduit avec l'aide de DeepL
  6. « In our Wikidata effort, it seems that we are distanced from the outcomes of our labor. », traduit avec l'assistance de DeepL
  7. « If we don’t engage with these peer-production knowledge platforms, our histories, ideas, knowings, get left behind and the erasure continues. When we do, it profits far away multinationals with clandestine workings, bottomless pockets, and unchecked power over peoples’ lives and livelihoods. » traduit avec DeepL
  8. Finn Årup Nielsen (d) Voir avec Reasonator Synia: Displaying data from Wikibases (d) Voir avec Reasonator, https://arxiv.org/abs/2303.15133
  9. Découvert via le compte Mastodon de fnielsen : https://fosstodon.org/@fnielsen/110791751465369139
  10. https://scholia.toolforge.org/
  11. https://wikifunctions.wikiscan.org/ consulté le 28 août
  12. « My hope is that we can persuade some Wikipedians who joined the community in the 2010s to become admins; I'm sure there are many of you who would pass easily. »
  13. Découvert via https://wikis.world/@wikipedia/110900708319266865 et https://tech.lgbt/@wmlgbt/110898976230542024
  14. « In this new workflow, a machine learning engineer from the Machine Learning team works with a model creator from the first day of the project to work with them on model deployment. The goal is that the model is deployed on the first day it is created and at every new iteration during its development process so that issues that appear in production are identified and resolved early in the model creation process. »
  15. https://api.wikimedia.org/wiki/Lift_Wing_API
  16. (en) Margaret Mitchell, Simone Wu, Andrew Zaldivar, Parker Barnes, Lucy Vasserman, Ben Hutchinson, Elena Spitzer, Inioluwa Deborah Raji et Timnit Gebru, « Model Cards for Model Reporting », FAT* '19: Proceedings of the Conference on Fairness, Accountability, and Transparency,‎ (ISBN 978-1-4503-6125-5, DOI 10.1145/3287560.3287596, arXiv 1810.03993)Voir et modifier les données sur Wikidata
  17. meta:Research:Recommending links to increase visibility of articles/Link-translation
  18. https://linkrec.toolforge.org/
  19. Pour les utilisateurs de l'interface web mobile, le lien vers l'outil est intégré à Chouette.js
  20. Voir l'annonce : en:Wikipedia:Wikipedia Signpost/2023-08-31/From the editor
  21. https://www.wikivoyage.org/
  22. https://stats.wikimedia.org/#/fr.wikivoyage.org
  23. https://pageviews.wmcloud.org/topviews/?project=fr.wikivoyage.org&platform=all-access&date=last-month&excludes=
  24. Requête SPARQL : https://w.wiki/7GXf
  25. https://w.wiki/7GYT
  26. https://www.wikimedia.fr/inscrivez-vous-au-mooc-wikidata/ découvert via Projet:Wikifier la science/Infolettre/Août 2023

Numéro du 16 septembre 2023

Saturday, 16 September 2023 00:00 UTC

L'édito de PAC2

Ce numéro contient beaucoup de brèves sur un grand nombre de sujets : l'enquête sur la communauté Wikimédia, la régulation de la haine en ligne, une réflexion sur la contribution à Wikidata, les articles orphelins ou encore la modernisation de l'infrastructure d'apprentissage automatique de la fondation Wikimédia.

Nous introduisons aussi une nouvelle section pour faire un zoom sur un projet Wikimédia. La section est inaugurée avec une présentation de Wikivoyage en français.

Globalement, je me dis que le numéro est peut être un peu long pour le lecteur ou la lectrice (à peu près 20 minutes de lecture d'après la liseuse de Firefox). Chacun pourra picorer ce qu'il souhaite.

N'hésitez pas à contribuer au prochain numéro en proposant des sujets en salle de rédaction ou directement dans le contenu.

Bonne lecture !

Brèves

Community Insights — La Fondation Wikimédia publie chaque année une enquête sur la communauté Wikimédia intitulée Community Insights[1]. L'édition 2023 s'appuie sur des données collectées grâce à une enquête statistique entre juin et septembre 2022. L'enquête a été menée dans 28 langues différentes[2].

Estimation de la part des éditrices et éditeurs actifs par an.

Parmi les éditrices et éditeurs actifs, la part des femmes est passée de 11 % en 2019 à 15 % en 2020 et 13 % en 2022. En revanche, la part des éditrices et éditeurs considérés comme faisant partie des genres minoritaires (gender-diverse) est passée de 2 à 4 %. Le terme de gender-diverse est emprunté au Haut-Commissariat des Nations unies aux droits de l'homme pour désigner les personnes trans, non-binaires, genderqueer, agenrées ou les personnes s'identifiant à plusieurs genres.

Parmi les nouvelles personnes contribuant à Wikimédia depuis 2021, on trouve 20 % de femmes et 7 % de personnes gender-diverse.

Distribution par âge de la communauté comparée à la population mondiale

Globalement, la distribution par catégorie d'âge de la communauté correspond à la distribution mondiale par catégorie d'âge. Toutefois, les personnes de moins de 18 ans ne sont pas incluses dans l'enquête. En revanche, les éditrices et éditeurs actifs sont nettement plus diplômés que la population des pays de l'OCDE. Par ailleurs, 12 % des éditrices et éditeurs se considèrent comme appartenant à une minorité ethnique dans leur pays.

38 % des contributrices et contributeurs trouvent que la Fondation Wikimédia communique bien sur ses projets et ses initiatives. 56 % considèrent que la Fondation a les bons programmes et les bonnes stratégies pour atteindre l'objectif de 2030 de devenir l'infrastructure centrale de la connaissance libre et accessible à tous et toutes.

Part des éditrices et éditeurs qui se sont sentis en danger ou inconfortable au cours des 12 mois précédents.

44% des femmes, 53% des personnes gender-diverses et 33% des hommes contribuant activement se sont sentis en danger (unsafe) ou inconfortables (uncomfortable) au cours des 12 mois précédents l'enquête. 25% des éditrices et éditeurs déclarent avoir subi du harcèlement au cours des 12 derniers mois. La proportion est plus élevée pour les femmes (31%). 46% des éditrices et éditeurs savent comment trouver de l'aide en cas de harcèlement.

Part des éditrices et éditeurs qui déclarent avoir subi du harcèlement.

Lutte contre les contenus haineux

En juillet 2023, l'Autorité de régulation de la communication audiovisuelle et numérique (ARCOM) a publié un bilan des moyens mis en place par les plateformes en ligne dans la lutte contre la diffusion des contenus haineux en 2022. En France, l'article 42 de la Loi confortant le respect des principes de la République impose aux principales plateformes présentes sur le territoire national des obligations de moyen dans la lutte contre la diffusion des contenus haineux. L'ARCOM est chargée de superviser la mise en œuvre de ces obligations. Le règlement européen sur les services numériques (connu sous le nom de DSA pour Digital services act ou RSN en français) entre en œuvre dans les pays de l'Union européenne le 25 août 2023 pour les grandes plateformes en ligne (les VLOP pour very large online platforms) et le 17 février 2024 pour l'ensemble des services en ligne concernés. Les dispositions du DSA remplaceront donc les dispositions de la loi confortant le respect des principes de la République.

Dans ce rapport, l'ARCOM s'intéresse à l'accessibilité et l'intelligibilité des conditions générales, à la prise en compte dans les conditions générales de la législation sur les contenus haineux, aux dispositifs de signalement des contenus haineux, aux moyens mis en œuvre pour la modération des contenus, à la lutte contre les signalements abusifs et enfin à la coopération avec les autorités administratives et judiciaires, que ce soit pour informer les autorités des contenus haineux signalés ou pour traiter les demandes des autorités.

La fondation Wikimédia a fait remarquer à l'ARCOM que le questionnaire n'est pas adapté au fonctionnement collaboratif et communautaire de Wikipédia.

Dans une note au bas de la page 10, l'ARCOM regrette que le Code universel de conduite ne soit disponible qu'en anglais. Pourtant il existe une traduction en français[3].

Sur la modération des contenus illicites, l'ARCOM note : « En raison de l’approche collaborative et décentralisée de sa politique de modération, comparer Wikipédia à d’autres services apparaît peu pertinent. Toutefois, la description de cette politique dans les CG (ie conditions générales) de la plateforme mériterait de gagner en précision et en transparence. »

Sur les dispositions de signalement des contenus haineux, l'ARCOM note la spécificité de Wikipédia par rapport aux autres plateformes : « Wikipédia, en raison des spécificités de son modèle, ne dispose pas de dispositif de signalement « traditionnel ». Confronté à un contenu problématique, un utilisateur pourra (i) le corriger lui-même en modifiant la page, (ii) expliquer le problème sur la page de discussion de l’article concerné ou (iii) demander de l’aide sur le « Forum des nouveaux ». L'architecture de la modération sur la plateforme est remarquable, en ce qu'elle repose en priorité sur les utilisateurs, tout en assurant une expertise stable en matière de modération des contenus illicites grâce aux utilisateurs « administrateurs » de Wikipédia. » Sur les moyens mis en œuvre pour lutter contre les contenus illicites, la fondation note qu'une cinquantaine de bénévoles sont particulièrement vigilants sur cette question.

Sur la mise en œuvre du règlement européen sur les services numériques, nous avons déjà abordé le sujet dans le numéro du 1er juin. Par ailleurs, Wikimédia France a traduit en français un article initialement publié par la Fondation Wikimédia. Le règlement européen sur les services numériques est entré en vigueur le 25 août[4].

Wikidata et l'épistémologie des robots — Dans un article intitulé « Wikidata: why we contribute to the robot epistemology » publié sur le site du user group Whose Knowledge?, Maari Zwick-Maitreyi (d) Voir avec Reasonator explore les enjeux de la contribution à Wikidata pour les personnes de la majorité globale (en). Après avoir rappelé les enjeux de représentation des points de vue des personnes de la majorité globale dans Wikipédia et les efforts de la Wikimedia Foundation, l'autrice souligne que ces enjeux sont particulièrement prégnants dans Wikidata.

« Même si des efforts sont déployés pour combler le fossé, on craint que des projets de données structurées comme Wikidata ne codifient les points de vue, les valeurs et l'histoire des communautés hégémoniques dans l'intelligence artificielle, les érigeant en vérités dans l'épistémologie des robots et piégeant probablement les membres de la majorité globale dans de laborieuses batailles de connaissances qui se prolongeront dans les époques à venir[5]. »

En s'appuyant sur l'article « Working for the Invisible Machines or Pumping Information into an Empty Void? An Exploration of Wikidata Contributors' Motivations (d) Voir avec Reasonator », elle rappelle que 70 % des contributeurs et contributrices de Wikidata ignorent comment leurs contributions sont utilisées.

« Dans notre effort pour Wikidata, il semble que nous soyons éloignés des résultats de notre travail[6]. »

L'autrice rappelle que le travail de contribution gratuite et désintéressée à Wikidata est avant tout utilisé par les grandes entreprises du numérique pour construire des intelligences artificielles et faire des profits. Elle souligne alors un dilemme.

« Si nous ne nous engageons pas dans ces plateformes de production de connaissances par les pairs, nos histoires, nos idées, nos connaissances sont laissées de côté et l'effacement se poursuit. Lorsque nous le faisons, cela profite à des multinationales lointaines qui ont recours au travail clandestin, ont les poches pleines et exercent un pouvoir incontrôlé sur la vie et les moyens de subsistance des gens[7]. »

L'autrice termine l'article avec une série de questions à se poser sur Wikidata.

Synia : explorer Wikidata autrement — En mars 2023, Finn Årup Nielsen (d) Voir avec Reasonator (connu sous le pseudonyme fnielsen) a publié « Synia: Displaying data from Wikibases (d) Voir avec Reasonator » dans lequel il présente Synia, un nouvel outil qui permet d'explorer Wikidata autrement grâce à des requêtes SPARQL génériques[8],[9]. Concrètement, la communauté peut écrire des requêtes SPARQL génériques dans une page de configuration sur Wikidata et cela produit automatiquement une nouvelle page de profil dans Synia. C'est un excellent moyen d'explorer Wikidata. L'outil s'inspire largement de Scholia (d) Voir avec Reasonator[10], un outil qui permet grâce à des requêtes génériques dans Wikidata d'explorer les données de Wikidata relatives aux chercheurs et chercheuses, aux publications scientifiques, aux revues académiques et aux éditeurs scientifiques.

Voici quelques exemples :

Prenez plaisir à contribuerLepticed7 a publié une traduction de l'essai Enjoy yourself.

« Tout le monde devrait le garder à l’esprit tout le temps : prendre du plaisir à contribuer est la clé pour rester actif sur le projet. Si vous ne prenez plus de plaisir à contribuer, faites un pas en arrière et posez-vous des questions sur ce que vous aimez faire. »

Les débuts de Wikifunctions — Le mois dernier, nous avons annoncé le lancement de Wikifunctions. Dans un article publié sur le blog Diff, Denny Vrandečić donne plus de détails. Il définit Wikifunctions comme un espace destiné à créer et maintenir de manière collaborative une bibliothèque de fonctions. Il anticipe qu'elle permettra de générer des phrases, du texte et même des articles entiers. Elle permettra aussi de faire des calculs à partir des données brutes contenues dans Wikidata, comme par exemple calculer l'âge d'une personne à partir de sa date de naissance ou la densité de population à partir de la population et de la superficie d'un territoire.

La première fonction permet de joindre ensemble deux chaînes de caractère : https://www.wikifunctions.org/view/fr/Z10000

D'après Wikiscan, il existe déjà plus de 2 000 fonctions dans Wikifunctions[11].

Revues citées par Wikipédia — Dans The Signpost du 1er août dernier, Headbomb raconte le projet Journals cited by Wikipedia (Revues citées par Wikipédia), une idée née en 2009 qui consiste à compiler des statistiques sur les revues citées dans Wikipédia en anglais en extrayant les valeurs du paramètre journal= dans le modèle Cite journal (équivalent de {{Article}}) et d'autres modèles similaires.

On apprend notamment qu'Elsevier est l'éditeur scientifique le plus cité dans Wikipédia avec 360 000 citations. et Nature la revue la plus citée avec 51 000 citations.

Pourquoi y a-t-il si peu d'administrateurs et d'administratrices dans les wikipédiennes et wikipédiens récents ? — Dans The Signpost, WereSpielChequers s'inquiète du fait que la majorité des administrateurs et administratrices de la Wikipédia en anglais aient commencé à contribuer dans les années 2000. Sur les 881 administratrices et administrateurs, seul 64 ont commencé à contribuer après 2011.

« J'espère que nous pourrons persuader certains Wikipédiens qui ont rejoint la communauté dans les années 2010 de devenir administrateurs ; je suis sûr qu'il y a beaucoup d'entre vous qui passeraient facilement[12]. »

Ce serait intéressant de faire le même exercice sur Wikipédia en français.

Le Wikimédien de l'année — Le prix du wikipédien de l'année a été remis à Tofeiku, un contributeur originaire de Malaisie qui a commencé à contribuer à l'âge de 8 ans. Il s'est beaucoup investi dans le Wiktionnaire en malais (d) Voir avec Reasonator[13]. Le prix Wikimedia est remis à Siobhan Leachman et le prix du nouveau venu au japonais Eugene Ormandy.

La fondation Wikimédia modernise ses modèles d'apprentissage automatique — Depuis 2015, la fondation Wikimédia maintient un ensemble de modèles d'apprentissage automatique et une infrastructure appelés ORES. En tout, ORES comprend 110 modèles d'arbres de décision dans différentes langues qui permettent d'évaluer la qualité d'un article, la qualité d'une modification, la qualité d'un élément et le thème d'un article. Les modèles déployés par la fondation n'éditent pas directement Wikipédia mais permettent d'avertir les contributrices et les contributeurs. Par exemple, le modèle de détection de vandalisme permet de mettre des alertes dans la page modifications récentes de la Wikipédia en anglais.

Pour pouvoir déployer plus facilement une plus grande variété de modèles en passant rapidement à l'échelle, la fondation s'est lancé dans un grand chantier de modernisation de son infrastructure d'apprentissage automatique.

« Dans ce nouveau flux de travail, un ingénieur en apprentissage automatique de l'équipe machine learning travaille avec un créateur de modèle dès le premier jour du projet pour travailler avec lui sur le déploiement du modèle. L'objectif est que le modèle soit déployé dès le premier jour de sa création et à chaque nouvelle itération au cours de son processus de développement afin que les problèmes qui apparaissent en production soient identifiés et résolus dès le début du processus[14]. »

Cette approche du développement de modèles, dite MLOps, nécessite une nouvelle infrastructure qui s'appuie sur le logiciel Kubeflow (d) Voir avec Reasonator. L'infrastructure est divisée en deux parties, Train Wing pour l'entraînement et Lift Wing pour le déploiement. Les modèles déployés sur Lift Wing seront accessibles par API à travers le portail d'API de la fondation[15].

La seconde partie de l'infrastructure, Train Wing, permettra aux ingénieurs de la fondation mais aussi aux chercheurs d'entraîner leurs propres modèles.

Pour améliorer la documentation et la transparence des modèles d'apprentissage automatique, la fondation va mettre en place une documentation des modèles conformes à l'approche model cards développée par Mitchell et al. (2019) (voir l'exemple meta:User:AlgoAccountabilityBot/Enwiki Good Faith Model Card)[16].

8,8 millions d'articles orphelins dans les 319 versions de Wikipédia — Dans « Orphan Articles: The Dark Matter of Wikipedia (d) Voir avec Reasonator », les chercheurs Akhil Arora, Robert West (d) Voir avec Reasonator et Martin Gerlach (d) Voir avec Reasonator (meta:user:MGerlach (WMF)) se penchent sur l'accessibilité des articles et plus précisément sur les articles qui ne sont pas reliés au reste de l'encyclopédie par des liens internes. Ils estiment que sur les 319 versions linguistiques de Wikipédia, 15% (8,8 millions) des articles peuvent être considérés comme orphelins (aucun lien entrant). La Wikipédia en français se distingue avec seulement 1,7% d'articles orphelins (39 960 articles sur 2,363,875)[17]. A l'inverse, il y a très peu d'articles sans lien sortant. Les auteurs n'en trouvent que 300 000, soit 0,5%.

Les auteurs cherchent à caractériser les articles orphelins à travers plusieurs critères (article créé par un bot, article récent, article consacré à une femme, etc). Ils trouvent notamment que les articles consacrés à des femmes sont plus souvent orphelins que les autres. Par exemple, dans la Wikipédia en anglais, 29% des articles biographiques orphelins sont consacrés à des femmes, qui ne représentent pourtant que 19% des articles biographiques en général.

Les auteurs ont développé l'outil Wiki-Visibility pour aider à relier un article orphelin à partir de liens existants dans d'autres versions linguistiques de Wikipédia. Par exemple, pour l'article Ana Montès, Wiki-Visibility suggère d'ajouter un lien depuis Walter Kendall Myers parce que ce lien existe en anglais et en russe[18],[19].

Dans la Wikipédia en français, le Projet:Pages orphelines liste toutes les pages de la catégorie et cette requête petscan liste toutes les biographies de femmes orphelines (à la date du 4 juillet).

En très bref

Le zoom : Wikivoyage en français

Le zoom est une nouvelle rubrique pour faire le point sur un Wikiprojet. Premier de la série : wikivoyage en français.

Wikivoyage en français compte plus de 8 000 pages de contenu, c'est beaucoup moins que Wikivoyage en anglais (31 000 pages) ou en allemand (20 000 pages) mais beaucoup plus que wikivoyage en espagnol (3 000 pages)[21].

Le contenu de Wikivoyage des articles de Wikivoyage est très structuré avec des patrons d'articles très précis et l'utilisation importante de modèles pour structurer l'information comme modèle:Voir ou modèle:Manger. Wikivoyage s'appuie beaucoup sur Wikidata pour ses infobox ou ses bannières.

En juillet 2023, le site totalise 1 million de pages vues en juillet avec 16 utilisateurs actifs (plus de 5 contributions)[22].

En juillet 2023, les 5 articles les plus consultés sont Amérique du Sud, Palma de Majorque, Johannesburg, Europe et Singapour[23].

Le site compte 2 024 articles sur des éléments situés en France, 789 éléments au Canada et 353 en Belgique[24].

Wikivoyage en français comprend 44 articles étoilés (Catégorie:Article étoilé). Parmi ces articles étoilés, 19 concernent des éléments situés en Belgique, 8 en France, 4 au Canada, 4 au Kenya et 3 en Tanzanie (voir la carte)[25].

Événements

Edit-a-thon aux Archives nationales de France.
WikiConvention 2023
Conférence GLAM Wiki

Ailleurs dans le Wikiverse

La page Wikipédia:RAW/Découvrir recense les infolettres et blogs relatifs à Wikimedia.

Courrier du lectorat

(Il nous fera plaisir de lire les messages déposés ici et, si nécessaire, d'y répondre dans les plus brefs délais.)

Bonsoir, je viens de parcourir l'actualité que vous avez rédigé avec soin, j'ai trouvé intéressant la plupart des informations dont vous avez mentionnées, notamment sur la toute première partie avec les graphiques, bravo pour votre travail ! Hibrideacus (discuter) 31 août 2023 à 22:57 (CEST)

Merci beaucoup pour votre commentaire. ça fait plaisir. PAC2 (discuter) 1 septembre 2023 à 06:57 (CEST)

Bonsoir, merci pour cet important travail de mise à disposition de brèves ! À propos des articles orphelins : le projet francophone a fait le choix de considérer comme orphelin un article possédant moins de 3 liens entrants ; par ailleurs, j'ai testé l'outil indiqué, certes sur un échantillon réduit, et il donne les mêmes réponses que ce que propose déjà Dickensbot (voir par exemple : les Articles orphelins depuis février 2021) pourtant circonscrit à trois wikipédias. Ce faisant, la wikipédia francophone comporte un peu plus de 15 000 articles orphelins, en augmentation lente mais constante. Cela vaudrait sans doute le coup de relancer un concours Wiki-maintenance spécial Orphelins, non ?--Cbyd (discuter) 31 août 2023 à 23:33 (CEST)

Oui effectivement la définition d'un article orphelin peut varier. Dans l'article de recherche, ils considèrent les articles avec 0 liens entrants. PAC2 (discuter) 1 septembre 2023 à 07:00 (CEST)

VLOP

« une cinquantaine de bénévoles sont particulièrement vigilants.. » : sait-on qui sont ces 50 bénévoles ? (pas les noms, mais s'ils sont une catégorie d'utilisateurs bien identifiée) En quoi sont-ils plus particulièrement vigilants ? Quelqu'un sait-il ? C'est une phrase intrigante. --Jean-Christophe BENOIST (discuter) 1 septembre 2023 à 08:27 (CEST)

Je suis d'accord avec toi que c'est intriguant. J'ai parcouru la réponse de la fondation à l'ARCOM (https://www.arcom.fr/sites/default/files/2023-07/2023_anglais_Declaration_Fondation-Wikimedia_haine_en_ligne.pdf, question 7, page 3) mais je n'ai pas vu d'élément plus précis. PAC2 (discuter) 1 septembre 2023 à 08:48 (CEST)

Merci

Lecture instructive. Merci pour ce travail. TCY (discuter) 2 septembre 2023 à 10:44 (CEST)

Fort intéressant

Merci pour cette nouvelle édition très intéressante et très complète. Cela permet de faire un bon tour de l'article en général (Fondation, régulation, nouveaux projets, événements, etc...)
Concernant le problème du nombre de nouveaux administrateurs et administratrices, on pourrait effectivement faire une enquête sur Wikipédia en français.
De mon point de vue, c'est un rôle fondamental pour notre communauté... mais qui est aussi assez ingrat car il n'y a que des coups à prendre (à part si on s'occupe uniquement de la maintenance technique et de la lutte contre les vandalismes). Il y a également l'élection communautaire qui peut parfois virer au défouloir dans les avis. Peut-être qu'en modérant mieux les avis lors des élections, chaque candidature serait moins angoissante pour les candidats et candidates.--Pronoia (discuter) 2 septembre 2023 à 10:57 (CEST)


 –
Rédigé/traduit par PAC2
Citations originales
Notes
Références
  1. Repéré via https://mastodon.world/@OpenSexism/110817958836569741
  2. meta:Community_Insights#Languages
  3. https://foundation.wikimedia.org/wiki/Policy:Universal_Code_of_Conduct/fr
  4. Philippe Jacqué et Maria Udrescu, « Numérique : la loi européenne obligeant les géants d’Internet à réguler leurs contenus est entrée en vigueur », Le Monde,‎ (ISSN 1950-6244, lire en ligne).
  5. « Even as gap-closing efforts take place, there is fear that structured data projects like Wikidata are codifying the views, values, and histories of hegemonic communities into artificial intelligence, establishing them as truths in the robot epistemology, and likely trapping people of the Global Majority in laborious knowledge battles to extend into the eras to come. » traduit avec l'aide de DeepL
  6. « In our Wikidata effort, it seems that we are distanced from the outcomes of our labor. », traduit avec l'assistance de DeepL
  7. « If we don’t engage with these peer-production knowledge platforms, our histories, ideas, knowings, get left behind and the erasure continues. When we do, it profits far away multinationals with clandestine workings, bottomless pockets, and unchecked power over peoples’ lives and livelihoods. » traduit avec DeepL
  8. Finn Årup Nielsen (d) Voir avec Reasonator Synia: Displaying data from Wikibases (d) Voir avec Reasonator, https://arxiv.org/abs/2303.15133
  9. Découvert via le compte Mastodon de fnielsen : https://fosstodon.org/@fnielsen/110791751465369139
  10. https://scholia.toolforge.org/
  11. https://wikifunctions.wikiscan.org/ consulté le 28 août
  12. « My hope is that we can persuade some Wikipedians who joined the community in the 2010s to become admins; I'm sure there are many of you who would pass easily. »
  13. Découvert via https://wikis.world/@wikipedia/110900708319266865 et https://tech.lgbt/@wmlgbt/110898976230542024
  14. « In this new workflow, a machine learning engineer from the Machine Learning team works with a model creator from the first day of the project to work with them on model deployment. The goal is that the model is deployed on the first day it is created and at every new iteration during its development process so that issues that appear in production are identified and resolved early in the model creation process. »
  15. https://api.wikimedia.org/wiki/Lift_Wing_API
  16. (en) Margaret Mitchell, Simone Wu, Andrew Zaldivar, Parker Barnes, Lucy Vasserman, Ben Hutchinson, Elena Spitzer, Inioluwa Deborah Raji et Timnit Gebru, « Model Cards for Model Reporting », FAT* '19: Proceedings of the Conference on Fairness, Accountability, and Transparency,‎ (ISBN 978-1-4503-6125-5, DOI 10.1145/3287560.3287596, arXiv 1810.03993)Voir et modifier les données sur Wikidata
  17. meta:Research:Recommending links to increase visibility of articles/Link-translation
  18. https://linkrec.toolforge.org/
  19. Pour les utilisateurs de l'interface web mobile, le lien vers l'outil est intégré à Chouette.js
  20. Voir l'annonce : en:Wikipedia:Wikipedia Signpost/2023-08-31/From the editor
  21. https://www.wikivoyage.org/
  22. https://stats.wikimedia.org/#/fr.wikivoyage.org
  23. https://pageviews.wmcloud.org/topviews/?project=fr.wikivoyage.org&platform=all-access&date=last-month&excludes=
  24. Requête SPARQL : https://w.wiki/7GXf
  25. https://w.wiki/7GYT
  26. https://www.wikimedia.fr/inscrivez-vous-au-mooc-wikidata/ découvert via Projet:Wikifier la science/Infolettre/Août 2023

Numéro du 15 septembre 2023

Friday, 15 September 2023 00:00 UTC

L'édito de PAC2

Ce numéro contient beaucoup de brèves sur un grand nombre de sujets : l'enquête sur la communauté Wikimédia, la régulation de la haine en ligne, une réflexion sur la contribution à Wikidata, les articles orphelins ou encore la modernisation de l'infrastructure d'apprentissage automatique de la fondation Wikimédia.

Nous introduisons aussi une nouvelle section pour faire un zoom sur un projet Wikimédia. La section est inaugurée avec une présentation de Wikivoyage en français.

Globalement, je me dis que le numéro est peut être un peu long pour le lecteur ou la lectrice (à peu près 20 minutes de lecture d'après la liseuse de Firefox). Chacun pourra picorer ce qu'il souhaite.

N'hésitez pas à contribuer au prochain numéro en proposant des sujets en salle de rédaction ou directement dans le contenu.

Bonne lecture !

Brèves

Community Insights — La Fondation Wikimédia publie chaque année une enquête sur la communauté Wikimédia intitulée Community Insights[1]. L'édition 2023 s'appuie sur des données collectées grâce à une enquête statistique entre juin et septembre 2022. L'enquête a été menée dans 28 langues différentes[2].

Estimation de la part des éditrices et éditeurs actifs par an.

Parmi les éditrices et éditeurs actifs, la part des femmes est passée de 11 % en 2019 à 15 % en 2020 et 13 % en 2022. En revanche, la part des éditrices et éditeurs considérés comme faisant partie des genres minoritaires (gender-diverse) est passée de 2 à 4 %. Le terme de gender-diverse est emprunté au Haut-Commissariat des Nations unies aux droits de l'homme pour désigner les personnes trans, non-binaires, genderqueer, agenrées ou les personnes s'identifiant à plusieurs genres.

Parmi les nouvelles personnes contribuant à Wikimédia depuis 2021, on trouve 20 % de femmes et 7 % de personnes gender-diverse.

Distribution par âge de la communauté comparée à la population mondiale

Globalement, la distribution par catégorie d'âge de la communauté correspond à la distribution mondiale par catégorie d'âge. Toutefois, les personnes de moins de 18 ans ne sont pas incluses dans l'enquête. En revanche, les éditrices et éditeurs actifs sont nettement plus diplômés que la population des pays de l'OCDE. Par ailleurs, 12 % des éditrices et éditeurs se considèrent comme appartenant à une minorité ethnique dans leur pays.

38 % des contributrices et contributeurs trouvent que la Fondation Wikimédia communique bien sur ses projets et ses initiatives. 56 % considèrent que la Fondation a les bons programmes et les bonnes stratégies pour atteindre l'objectif de 2030 de devenir l'infrastructure centrale de la connaissance libre et accessible à tous et toutes.

Part des éditrices et éditeurs qui se sont sentis en danger ou inconfortable au cours des 12 mois précédents.

44% des femmes, 53% des personnes gender-diverses et 33% des hommes contribuant activement se sont sentis en danger (unsafe) ou inconfortables (uncomfortable) au cours des 12 mois précédents l'enquête. 25% des éditrices et éditeurs déclarent avoir subi du harcèlement au cours des 12 derniers mois. La proportion est plus élevée pour les femmes (31%). 46% des éditrices et éditeurs savent comment trouver de l'aide en cas de harcèlement.

Part des éditrices et éditeurs qui déclarent avoir subi du harcèlement.

Lutte contre les contenus haineux

En juillet 2023, l'Autorité de régulation de la communication audiovisuelle et numérique (ARCOM) a publié un bilan des moyens mis en place par les plateformes en ligne dans la lutte contre la diffusion des contenus haineux en 2022. En France, l'article 42 de la Loi confortant le respect des principes de la République impose aux principales plateformes présentes sur le territoire national des obligations de moyen dans la lutte contre la diffusion des contenus haineux. L'ARCOM est chargée de superviser la mise en œuvre de ces obligations. Le règlement européen sur les services numériques (connu sous le nom de DSA pour Digital services act ou RSN en français) entre en œuvre dans les pays de l'Union européenne le 25 août 2023 pour les grandes plateformes en ligne (les VLOP pour very large online platforms) et le 17 février 2024 pour l'ensemble des services en ligne concernés. Les dispositions du DSA remplaceront donc les dispositions de la loi confortant le respect des principes de la République.

Dans ce rapport, l'ARCOM s'intéresse à l'accessibilité et l'intelligibilité des conditions générales, à la prise en compte dans les conditions générales de la législation sur les contenus haineux, aux dispositifs de signalement des contenus haineux, aux moyens mis en œuvre pour la modération des contenus, à la lutte contre les signalements abusifs et enfin à la coopération avec les autorités administratives et judiciaires, que ce soit pour informer les autorités des contenus haineux signalés ou pour traiter les demandes des autorités.

La fondation Wikimédia a fait remarquer à l'ARCOM que le questionnaire n'est pas adapté au fonctionnement collaboratif et communautaire de Wikipédia.

Dans une note au bas de la page 10, l'ARCOM regrette que le Code universel de conduite ne soit disponible qu'en anglais. Pourtant il existe une traduction en français[3].

Sur la modération des contenus illicites, l'ARCOM note : « En raison de l’approche collaborative et décentralisée de sa politique de modération, comparer Wikipédia à d’autres services apparaît peu pertinent. Toutefois, la description de cette politique dans les CG (ie conditions générales) de la plateforme mériterait de gagner en précision et en transparence. »

Sur les dispositions de signalement des contenus haineux, l'ARCOM note la spécificité de Wikipédia par rapport aux autres plateformes : « Wikipédia, en raison des spécificités de son modèle, ne dispose pas de dispositif de signalement « traditionnel ». Confronté à un contenu problématique, un utilisateur pourra (i) le corriger lui-même en modifiant la page, (ii) expliquer le problème sur la page de discussion de l’article concerné ou (iii) demander de l’aide sur le « Forum des nouveaux ». L'architecture de la modération sur la plateforme est remarquable, en ce qu'elle repose en priorité sur les utilisateurs, tout en assurant une expertise stable en matière de modération des contenus illicites grâce aux utilisateurs « administrateurs » de Wikipédia. » Sur les moyens mis en œuvre pour lutter contre les contenus illicites, la fondation note qu'une cinquantaine de bénévoles sont particulièrement vigilants sur cette question.

Sur la mise en œuvre du règlement européen sur les services numériques, nous avons déjà abordé le sujet dans le numéro du 1er juin. Par ailleurs, Wikimédia France a traduit en français un article initialement publié par la Fondation Wikimédia. Le règlement européen sur les services numériques est entré en vigueur le 25 août[4].

Wikidata et l'épistémologie des robots — Dans un article intitulé « Wikidata: why we contribute to the robot epistemology » publié sur le site du user group Whose Knowledge?, Maari Zwick-Maitreyi (d) Voir avec Reasonator explore les enjeux de la contribution à Wikidata pour les personnes de la majorité globale (en). Après avoir rappelé les enjeux de représentation des points de vue des personnes de la majorité globale dans Wikipédia et les efforts de la Wikimedia Foundation, l'autrice souligne que ces enjeux sont particulièrement prégnants dans Wikidata.

« Même si des efforts sont déployés pour combler le fossé, on craint que des projets de données structurées comme Wikidata ne codifient les points de vue, les valeurs et l'histoire des communautés hégémoniques dans l'intelligence artificielle, les érigeant en vérités dans l'épistémologie des robots et piégeant probablement les membres de la majorité globale dans de laborieuses batailles de connaissances qui se prolongeront dans les époques à venir[5]. »

En s'appuyant sur l'article « Working for the Invisible Machines or Pumping Information into an Empty Void? An Exploration of Wikidata Contributors' Motivations (d) Voir avec Reasonator », elle rappelle que 70 % des contributeurs et contributrices de Wikidata ignorent comment leurs contributions sont utilisées.

« Dans notre effort pour Wikidata, il semble que nous soyons éloignés des résultats de notre travail[6]. »

L'autrice rappelle que le travail de contribution gratuite et désintéressée à Wikidata est avant tout utilisé par les grandes entreprises du numérique pour construire des intelligences artificielles et faire des profits. Elle souligne alors un dilemme.

« Si nous ne nous engageons pas dans ces plateformes de production de connaissances par les pairs, nos histoires, nos idées, nos connaissances sont laissées de côté et l'effacement se poursuit. Lorsque nous le faisons, cela profite à des multinationales lointaines qui ont recours au travail clandestin, ont les poches pleines et exercent un pouvoir incontrôlé sur la vie et les moyens de subsistance des gens[7]. »

L'autrice termine l'article avec une série de questions à se poser sur Wikidata.

Synia : explorer Wikidata autrement — En mars 2023, Finn Årup Nielsen (d) Voir avec Reasonator (connu sous le pseudonyme fnielsen) a publié « Synia: Displaying data from Wikibases (d) Voir avec Reasonator » dans lequel il présente Synia, un nouvel outil qui permet d'explorer Wikidata autrement grâce à des requêtes SPARQL génériques[8],[9]. Concrètement, la communauté peut écrire des requêtes SPARQL génériques dans une page de configuration sur Wikidata et cela produit automatiquement une nouvelle page de profil dans Synia. C'est un excellent moyen d'explorer Wikidata. L'outil s'inspire largement de Scholia (d) Voir avec Reasonator[10], un outil qui permet grâce à des requêtes génériques dans Wikidata d'explorer les données de Wikidata relatives aux chercheurs et chercheuses, aux publications scientifiques, aux revues académiques et aux éditeurs scientifiques.

Voici quelques exemples :

Prenez plaisir à contribuerLepticed7 a publié une traduction de l'essai Enjoy yourself.

« Tout le monde devrait le garder à l’esprit tout le temps : prendre du plaisir à contribuer est la clé pour rester actif sur le projet. Si vous ne prenez plus de plaisir à contribuer, faites un pas en arrière et posez-vous des questions sur ce que vous aimez faire. »

Les débuts de Wikifunctions — Le mois dernier, nous avons annoncé le lancement de Wikifunctions. Dans un article publié sur le blog Diff, Denny Vrandečić donne plus de détails. Il définit Wikifunctions comme un espace destiné à créer et maintenir de manière collaborative une bibliothèque de fonctions. Il anticipe qu'elle permettra de générer des phrases, du texte et même des articles entiers. Elle permettra aussi de faire des calculs à partir des données brutes contenues dans Wikidata, comme par exemple calculer l'âge d'une personne à partir de sa date de naissance ou la densité de population à partir de la population et de la superficie d'un territoire.

La première fonction permet de joindre ensemble deux chaînes de caractère : https://www.wikifunctions.org/view/fr/Z10000

D'après Wikiscan, il existe déjà plus de 2 000 fonctions dans Wikifunctions[11].

Revues citées par Wikipédia — Dans The Signpost du 1er août dernier, Headbomb raconte le projet Journals cited by Wikipedia (Revues citées par Wikipédia), une idée née en 2009 qui consiste à compiler des statistiques sur les revues citées dans Wikipédia en anglais en extrayant les valeurs du paramètre journal= dans le modèle Cite journal (équivalent de {{Article}}) et d'autres modèles similaires.

On apprend notamment qu'Elsevier est l'éditeur scientifique le plus cité dans Wikipédia avec 360 000 citations. et Nature la revue la plus citée avec 51 000 citations.

Pourquoi y a-t-il si peu d'administrateurs et d'administratrices dans les wikipédiennes et wikipédiens récents ? — Dans The Signpost, WereSpielChequers s'inquiète du fait que la majorité des administrateurs et administratrices de la Wikipédia en anglais aient commencé à contribuer dans les années 2000. Sur les 881 administratrices et administrateurs, seul 64 ont commencé à contribuer après 2011.

« J'espère que nous pourrons persuader certains Wikipédiens qui ont rejoint la communauté dans les années 2010 de devenir administrateurs ; je suis sûr qu'il y a beaucoup d'entre vous qui passeraient facilement[12]. »

Ce serait intéressant de faire le même exercice sur Wikipédia en français.

Le Wikimédien de l'année — Le prix du wikipédien de l'année a été remis à Tofeiku, un contributeur originaire de Malaisie qui a commencé à contribuer à l'âge de 8 ans. Il s'est beaucoup investi dans le Wiktionnaire en malais (d) Voir avec Reasonator[13]. Le prix Wikimedia est remis à Siobhan Leachman et le prix du nouveau venu au japonais Eugene Ormandy.

La fondation Wikimédia modernise ses modèles d'apprentissage automatique — Depuis 2015, la fondation Wikimédia maintient un ensemble de modèles d'apprentissage automatique et une infrastructure appelés ORES. En tout, ORES comprend 110 modèles d'arbres de décision dans différentes langues qui permettent d'évaluer la qualité d'un article, la qualité d'une modification, la qualité d'un élément et le thème d'un article. Les modèles déployés par la fondation n'éditent pas directement Wikipédia mais permettent d'avertir les contributrices et les contributeurs. Par exemple, le modèle de détection de vandalisme permet de mettre des alertes dans la page modifications récentes de la Wikipédia en anglais.

Pour pouvoir déployer plus facilement une plus grande variété de modèles en passant rapidement à l'échelle, la fondation s'est lancé dans un grand chantier de modernisation de son infrastructure d'apprentissage automatique.

« Dans ce nouveau flux de travail, un ingénieur en apprentissage automatique de l'équipe machine learning travaille avec un créateur de modèle dès le premier jour du projet pour travailler avec lui sur le déploiement du modèle. L'objectif est que le modèle soit déployé dès le premier jour de sa création et à chaque nouvelle itération au cours de son processus de développement afin que les problèmes qui apparaissent en production soient identifiés et résolus dès le début du processus[14]. »

Cette approche du développement de modèles, dite MLOps, nécessite une nouvelle infrastructure qui s'appuie sur le logiciel Kubeflow (d) Voir avec Reasonator. L'infrastructure est divisée en deux parties, Train Wing pour l'entraînement et Lift Wing pour le déploiement. Les modèles déployés sur Lift Wing seront accessibles par API à travers le portail d'API de la fondation[15].

La seconde partie de l'infrastructure, Train Wing, permettra aux ingénieurs de la fondation mais aussi aux chercheurs d'entraîner leurs propres modèles.

Pour améliorer la documentation et la transparence des modèles d'apprentissage automatique, la fondation va mettre en place une documentation des modèles conformes à l'approche model cards développée par Mitchell et al. (2019) (voir l'exemple meta:User:AlgoAccountabilityBot/Enwiki Good Faith Model Card)[16].

8,8 millions d'articles orphelins dans les 319 versions de Wikipédia — Dans « Orphan Articles: The Dark Matter of Wikipedia (d) Voir avec Reasonator », les chercheurs Akhil Arora, Robert West (d) Voir avec Reasonator et Martin Gerlach (d) Voir avec Reasonator (meta:user:MGerlach (WMF)) se penchent sur l'accessibilité des articles et plus précisément sur les articles qui ne sont pas reliés au reste de l'encyclopédie par des liens internes. Ils estiment que sur les 319 versions linguistiques de Wikipédia, 15% (8,8 millions) des articles peuvent être considérés comme orphelins (aucun lien entrant). La Wikipédia en français se distingue avec seulement 1,7% d'articles orphelins (39 960 articles sur 2,363,875)[17]. A l'inverse, il y a très peu d'articles sans lien sortant. Les auteurs n'en trouvent que 300 000, soit 0,5%.

Les auteurs cherchent à caractériser les articles orphelins à travers plusieurs critères (article créé par un bot, article récent, article consacré à une femme, etc). Ils trouvent notamment que les articles consacrés à des femmes sont plus souvent orphelins que les autres. Par exemple, dans la Wikipédia en anglais, 29% des articles biographiques orphelins sont consacrés à des femmes, qui ne représentent pourtant que 19% des articles biographiques en général.

Les auteurs ont développé l'outil Wiki-Visibility pour aider à relier un article orphelin à partir de liens existants dans d'autres versions linguistiques de Wikipédia. Par exemple, pour l'article Ana Montès, Wiki-Visibility suggère d'ajouter un lien depuis Walter Kendall Myers parce que ce lien existe en anglais et en russe[18],[19].

Dans la Wikipédia en français, le Projet:Pages orphelines liste toutes les pages de la catégorie et cette requête petscan liste toutes les biographies de femmes orphelines (à la date du 4 juillet).

En très bref

Le zoom : Wikivoyage en français

Le zoom est une nouvelle rubrique pour faire le point sur un Wikiprojet. Premier de la série : wikivoyage en français.

Wikivoyage en français compte plus de 8 000 pages de contenu, c'est beaucoup moins que Wikivoyage en anglais (31 000 pages) ou en allemand (20 000 pages) mais beaucoup plus que wikivoyage en espagnol (3 000 pages)[21].

Le contenu de Wikivoyage des articles de Wikivoyage est très structuré avec des patrons d'articles très précis et l'utilisation importante de modèles pour structurer l'information comme modèle:Voir ou modèle:Manger. Wikivoyage s'appuie beaucoup sur Wikidata pour ses infobox ou ses bannières.

En juillet 2023, le site totalise 1 million de pages vues en juillet avec 16 utilisateurs actifs (plus de 5 contributions)[22].

En juillet 2023, les 5 articles les plus consultés sont Amérique du Sud, Palma de Majorque, Johannesburg, Europe et Singapour[23].

Le site compte 2 024 articles sur des éléments situés en France, 789 éléments au Canada et 353 en Belgique[24].

Wikivoyage en français comprend 44 articles étoilés (Catégorie:Article étoilé). Parmi ces articles étoilés, 19 concernent des éléments situés en Belgique, 8 en France, 4 au Canada, 4 au Kenya et 3 en Tanzanie (voir la carte)[25].

Événements

Edit-a-thon aux Archives nationales de France.
WikiConvention 2023
Conférence GLAM Wiki

Ailleurs dans le Wikiverse

La page Wikipédia:RAW/Découvrir recense les infolettres et blogs relatifs à Wikimedia.

Courrier du lectorat

(Il nous fera plaisir de lire les messages déposés ici et, si nécessaire, d'y répondre dans les plus brefs délais.)

Bonsoir, je viens de parcourir l'actualité que vous avez rédigé avec soin, j'ai trouvé intéressant la plupart des informations dont vous avez mentionnées, notamment sur la toute première partie avec les graphiques, bravo pour votre travail ! Hibrideacus (discuter) 31 août 2023 à 22:57 (CEST)

Merci beaucoup pour votre commentaire. ça fait plaisir. PAC2 (discuter) 1 septembre 2023 à 06:57 (CEST)

Bonsoir, merci pour cet important travail de mise à disposition de brèves ! À propos des articles orphelins : le projet francophone a fait le choix de considérer comme orphelin un article possédant moins de 3 liens entrants ; par ailleurs, j'ai testé l'outil indiqué, certes sur un échantillon réduit, et il donne les mêmes réponses que ce que propose déjà Dickensbot (voir par exemple : les Articles orphelins depuis février 2021) pourtant circonscrit à trois wikipédias. Ce faisant, la wikipédia francophone comporte un peu plus de 15 000 articles orphelins, en augmentation lente mais constante. Cela vaudrait sans doute le coup de relancer un concours Wiki-maintenance spécial Orphelins, non ?--Cbyd (discuter) 31 août 2023 à 23:33 (CEST)

Oui effectivement la définition d'un article orphelin peut varier. Dans l'article de recherche, ils considèrent les articles avec 0 liens entrants. PAC2 (discuter) 1 septembre 2023 à 07:00 (CEST)

VLOP

« une cinquantaine de bénévoles sont particulièrement vigilants.. » : sait-on qui sont ces 50 bénévoles ? (pas les noms, mais s'ils sont une catégorie d'utilisateurs bien identifiée) En quoi sont-ils plus particulièrement vigilants ? Quelqu'un sait-il ? C'est une phrase intrigante. --Jean-Christophe BENOIST (discuter) 1 septembre 2023 à 08:27 (CEST)

Je suis d'accord avec toi que c'est intriguant. J'ai parcouru la réponse de la fondation à l'ARCOM (https://www.arcom.fr/sites/default/files/2023-07/2023_anglais_Declaration_Fondation-Wikimedia_haine_en_ligne.pdf, question 7, page 3) mais je n'ai pas vu d'élément plus précis. PAC2 (discuter) 1 septembre 2023 à 08:48 (CEST)

Merci

Lecture instructive. Merci pour ce travail. TCY (discuter) 2 septembre 2023 à 10:44 (CEST)

Fort intéressant

Merci pour cette nouvelle édition très intéressante et très complète. Cela permet de faire un bon tour de l'article en général (Fondation, régulation, nouveaux projets, événements, etc...)
Concernant le problème du nombre de nouveaux administrateurs et administratrices, on pourrait effectivement faire une enquête sur Wikipédia en français.
De mon point de vue, c'est un rôle fondamental pour notre communauté... mais qui est aussi assez ingrat car il n'y a que des coups à prendre (à part si on s'occupe uniquement de la maintenance technique et de la lutte contre les vandalismes). Il y a également l'élection communautaire qui peut parfois virer au défouloir dans les avis. Peut-être qu'en modérant mieux les avis lors des élections, chaque candidature serait moins angoissante pour les candidats et candidates.--Pronoia (discuter) 2 septembre 2023 à 10:57 (CEST)


 –
Rédigé/traduit par PAC2
Citations originales
Notes
Références
  1. Repéré via https://mastodon.world/@OpenSexism/110817958836569741
  2. meta:Community_Insights#Languages
  3. https://foundation.wikimedia.org/wiki/Policy:Universal_Code_of_Conduct/fr
  4. Philippe Jacqué et Maria Udrescu, « Numérique : la loi européenne obligeant les géants d’Internet à réguler leurs contenus est entrée en vigueur », Le Monde,‎ (ISSN 1950-6244, lire en ligne).
  5. « Even as gap-closing efforts take place, there is fear that structured data projects like Wikidata are codifying the views, values, and histories of hegemonic communities into artificial intelligence, establishing them as truths in the robot epistemology, and likely trapping people of the Global Majority in laborious knowledge battles to extend into the eras to come. » traduit avec l'aide de DeepL
  6. « In our Wikidata effort, it seems that we are distanced from the outcomes of our labor. », traduit avec l'assistance de DeepL
  7. « If we don’t engage with these peer-production knowledge platforms, our histories, ideas, knowings, get left behind and the erasure continues. When we do, it profits far away multinationals with clandestine workings, bottomless pockets, and unchecked power over peoples’ lives and livelihoods. » traduit avec DeepL
  8. Finn Årup Nielsen (d) Voir avec Reasonator Synia: Displaying data from Wikibases (d) Voir avec Reasonator, https://arxiv.org/abs/2303.15133
  9. Découvert via le compte Mastodon de fnielsen : https://fosstodon.org/@fnielsen/110791751465369139
  10. https://scholia.toolforge.org/
  11. https://wikifunctions.wikiscan.org/ consulté le 28 août
  12. « My hope is that we can persuade some Wikipedians who joined the community in the 2010s to become admins; I'm sure there are many of you who would pass easily. »
  13. Découvert via https://wikis.world/@wikipedia/110900708319266865 et https://tech.lgbt/@wmlgbt/110898976230542024
  14. « In this new workflow, a machine learning engineer from the Machine Learning team works with a model creator from the first day of the project to work with them on model deployment. The goal is that the model is deployed on the first day it is created and at every new iteration during its development process so that issues that appear in production are identified and resolved early in the model creation process. »
  15. https://api.wikimedia.org/wiki/Lift_Wing_API
  16. (en) Margaret Mitchell, Simone Wu, Andrew Zaldivar, Parker Barnes, Lucy Vasserman, Ben Hutchinson, Elena Spitzer, Inioluwa Deborah Raji et Timnit Gebru, « Model Cards for Model Reporting », FAT* '19: Proceedings of the Conference on Fairness, Accountability, and Transparency,‎ (ISBN 978-1-4503-6125-5, DOI 10.1145/3287560.3287596, arXiv 1810.03993)Voir et modifier les données sur Wikidata
  17. meta:Research:Recommending links to increase visibility of articles/Link-translation
  18. https://linkrec.toolforge.org/
  19. Pour les utilisateurs de l'interface web mobile, le lien vers l'outil est intégré à Chouette.js
  20. Voir l'annonce : en:Wikipedia:Wikipedia Signpost/2023-08-31/From the editor
  21. https://www.wikivoyage.org/
  22. https://stats.wikimedia.org/#/fr.wikivoyage.org
  23. https://pageviews.wmcloud.org/topviews/?project=fr.wikivoyage.org&platform=all-access&date=last-month&excludes=
  24. Requête SPARQL : https://w.wiki/7GXf
  25. https://w.wiki/7GYT
  26. https://www.wikimedia.fr/inscrivez-vous-au-mooc-wikidata/ découvert via Projet:Wikifier la science/Infolettre/Août 2023

Numéro du 14 septembre 2023

Thursday, 14 September 2023 00:00 UTC

L'édito de PAC2

Ce numéro contient beaucoup de brèves sur un grand nombre de sujets : l'enquête sur la communauté Wikimédia, la régulation de la haine en ligne, une réflexion sur la contribution à Wikidata, les articles orphelins ou encore la modernisation de l'infrastructure d'apprentissage automatique de la fondation Wikimédia.

Nous introduisons aussi une nouvelle section pour faire un zoom sur un projet Wikimédia. La section est inaugurée avec une présentation de Wikivoyage en français.

Globalement, je me dis que le numéro est peut être un peu long pour le lecteur ou la lectrice (à peu près 20 minutes de lecture d'après la liseuse de Firefox). Chacun pourra picorer ce qu'il souhaite.

N'hésitez pas à contribuer au prochain numéro en proposant des sujets en salle de rédaction ou directement dans le contenu.

Bonne lecture !

Brèves

Community Insights — La Fondation Wikimédia publie chaque année une enquête sur la communauté Wikimédia intitulée Community Insights[1]. L'édition 2023 s'appuie sur des données collectées grâce à une enquête statistique entre juin et septembre 2022. L'enquête a été menée dans 28 langues différentes[2].

Estimation de la part des éditrices et éditeurs actifs par an.

Parmi les éditrices et éditeurs actifs, la part des femmes est passée de 11 % en 2019 à 15 % en 2020 et 13 % en 2022. En revanche, la part des éditrices et éditeurs considérés comme faisant partie des genres minoritaires (gender-diverse) est passée de 2 à 4 %. Le terme de gender-diverse est emprunté au Haut-Commissariat des Nations unies aux droits de l'homme pour désigner les personnes trans, non-binaires, genderqueer, agenrées ou les personnes s'identifiant à plusieurs genres.

Parmi les nouvelles personnes contribuant à Wikimédia depuis 2021, on trouve 20 % de femmes et 7 % de personnes gender-diverse.

Distribution par âge de la communauté comparée à la population mondiale

Globalement, la distribution par catégorie d'âge de la communauté correspond à la distribution mondiale par catégorie d'âge. Toutefois, les personnes de moins de 18 ans ne sont pas incluses dans l'enquête. En revanche, les éditrices et éditeurs actifs sont nettement plus diplômés que la population des pays de l'OCDE. Par ailleurs, 12 % des éditrices et éditeurs se considèrent comme appartenant à une minorité ethnique dans leur pays.

38 % des contributrices et contributeurs trouvent que la Fondation Wikimédia communique bien sur ses projets et ses initiatives. 56 % considèrent que la Fondation a les bons programmes et les bonnes stratégies pour atteindre l'objectif de 2030 de devenir l'infrastructure centrale de la connaissance libre et accessible à tous et toutes.

Part des éditrices et éditeurs qui se sont sentis en danger ou inconfortable au cours des 12 mois précédents.

44% des femmes, 53% des personnes gender-diverses et 33% des hommes contribuant activement se sont sentis en danger (unsafe) ou inconfortables (uncomfortable) au cours des 12 mois précédents l'enquête. 25% des éditrices et éditeurs déclarent avoir subi du harcèlement au cours des 12 derniers mois. La proportion est plus élevée pour les femmes (31%). 46% des éditrices et éditeurs savent comment trouver de l'aide en cas de harcèlement.

Part des éditrices et éditeurs qui déclarent avoir subi du harcèlement.

Lutte contre les contenus haineux

En juillet 2023, l'Autorité de régulation de la communication audiovisuelle et numérique (ARCOM) a publié un bilan des moyens mis en place par les plateformes en ligne dans la lutte contre la diffusion des contenus haineux en 2022. En France, l'article 42 de la Loi confortant le respect des principes de la République impose aux principales plateformes présentes sur le territoire national des obligations de moyen dans la lutte contre la diffusion des contenus haineux. L'ARCOM est chargée de superviser la mise en œuvre de ces obligations. Le règlement européen sur les services numériques (connu sous le nom de DSA pour Digital services act ou RSN en français) entre en œuvre dans les pays de l'Union européenne le 25 août 2023 pour les grandes plateformes en ligne (les VLOP pour very large online platforms) et le 17 février 2024 pour l'ensemble des services en ligne concernés. Les dispositions du DSA remplaceront donc les dispositions de la loi confortant le respect des principes de la République.

Dans ce rapport, l'ARCOM s'intéresse à l'accessibilité et l'intelligibilité des conditions générales, à la prise en compte dans les conditions générales de la législation sur les contenus haineux, aux dispositifs de signalement des contenus haineux, aux moyens mis en œuvre pour la modération des contenus, à la lutte contre les signalements abusifs et enfin à la coopération avec les autorités administratives et judiciaires, que ce soit pour informer les autorités des contenus haineux signalés ou pour traiter les demandes des autorités.

La fondation Wikimédia a fait remarquer à l'ARCOM que le questionnaire n'est pas adapté au fonctionnement collaboratif et communautaire de Wikipédia.

Dans une note au bas de la page 10, l'ARCOM regrette que le Code universel de conduite ne soit disponible qu'en anglais. Pourtant il existe une traduction en français[3].

Sur la modération des contenus illicites, l'ARCOM note : « En raison de l’approche collaborative et décentralisée de sa politique de modération, comparer Wikipédia à d’autres services apparaît peu pertinent. Toutefois, la description de cette politique dans les CG (ie conditions générales) de la plateforme mériterait de gagner en précision et en transparence. »

Sur les dispositions de signalement des contenus haineux, l'ARCOM note la spécificité de Wikipédia par rapport aux autres plateformes : « Wikipédia, en raison des spécificités de son modèle, ne dispose pas de dispositif de signalement « traditionnel ». Confronté à un contenu problématique, un utilisateur pourra (i) le corriger lui-même en modifiant la page, (ii) expliquer le problème sur la page de discussion de l’article concerné ou (iii) demander de l’aide sur le « Forum des nouveaux ». L'architecture de la modération sur la plateforme est remarquable, en ce qu'elle repose en priorité sur les utilisateurs, tout en assurant une expertise stable en matière de modération des contenus illicites grâce aux utilisateurs « administrateurs » de Wikipédia. » Sur les moyens mis en œuvre pour lutter contre les contenus illicites, la fondation note qu'une cinquantaine de bénévoles sont particulièrement vigilants sur cette question.

Sur la mise en œuvre du règlement européen sur les services numériques, nous avons déjà abordé le sujet dans le numéro du 1er juin. Par ailleurs, Wikimédia France a traduit en français un article initialement publié par la Fondation Wikimédia. Le règlement européen sur les services numériques est entré en vigueur le 25 août[4].

Wikidata et l'épistémologie des robots — Dans un article intitulé « Wikidata: why we contribute to the robot epistemology » publié sur le site du user group Whose Knowledge?, Maari Zwick-Maitreyi (d) Voir avec Reasonator explore les enjeux de la contribution à Wikidata pour les personnes de la majorité globale (en). Après avoir rappelé les enjeux de représentation des points de vue des personnes de la majorité globale dans Wikipédia et les efforts de la Wikimedia Foundation, l'autrice souligne que ces enjeux sont particulièrement prégnants dans Wikidata.

« Même si des efforts sont déployés pour combler le fossé, on craint que des projets de données structurées comme Wikidata ne codifient les points de vue, les valeurs et l'histoire des communautés hégémoniques dans l'intelligence artificielle, les érigeant en vérités dans l'épistémologie des robots et piégeant probablement les membres de la majorité globale dans de laborieuses batailles de connaissances qui se prolongeront dans les époques à venir[5]. »

En s'appuyant sur l'article « Working for the Invisible Machines or Pumping Information into an Empty Void? An Exploration of Wikidata Contributors' Motivations (d) Voir avec Reasonator », elle rappelle que 70 % des contributeurs et contributrices de Wikidata ignorent comment leurs contributions sont utilisées.

« Dans notre effort pour Wikidata, il semble que nous soyons éloignés des résultats de notre travail[6]. »

L'autrice rappelle que le travail de contribution gratuite et désintéressée à Wikidata est avant tout utilisé par les grandes entreprises du numérique pour construire des intelligences artificielles et faire des profits. Elle souligne alors un dilemme.

« Si nous ne nous engageons pas dans ces plateformes de production de connaissances par les pairs, nos histoires, nos idées, nos connaissances sont laissées de côté et l'effacement se poursuit. Lorsque nous le faisons, cela profite à des multinationales lointaines qui ont recours au travail clandestin, ont les poches pleines et exercent un pouvoir incontrôlé sur la vie et les moyens de subsistance des gens[7]. »

L'autrice termine l'article avec une série de questions à se poser sur Wikidata.

Synia : explorer Wikidata autrement — En mars 2023, Finn Årup Nielsen (d) Voir avec Reasonator (connu sous le pseudonyme fnielsen) a publié « Synia: Displaying data from Wikibases (d) Voir avec Reasonator » dans lequel il présente Synia, un nouvel outil qui permet d'explorer Wikidata autrement grâce à des requêtes SPARQL génériques[8],[9]. Concrètement, la communauté peut écrire des requêtes SPARQL génériques dans une page de configuration sur Wikidata et cela produit automatiquement une nouvelle page de profil dans Synia. C'est un excellent moyen d'explorer Wikidata. L'outil s'inspire largement de Scholia (d) Voir avec Reasonator[10], un outil qui permet grâce à des requêtes génériques dans Wikidata d'explorer les données de Wikidata relatives aux chercheurs et chercheuses, aux publications scientifiques, aux revues académiques et aux éditeurs scientifiques.

Voici quelques exemples :

Prenez plaisir à contribuerLepticed7 a publié une traduction de l'essai Enjoy yourself.

« Tout le monde devrait le garder à l’esprit tout le temps : prendre du plaisir à contribuer est la clé pour rester actif sur le projet. Si vous ne prenez plus de plaisir à contribuer, faites un pas en arrière et posez-vous des questions sur ce que vous aimez faire. »

Les débuts de Wikifunctions — Le mois dernier, nous avons annoncé le lancement de Wikifunctions. Dans un article publié sur le blog Diff, Denny Vrandečić donne plus de détails. Il définit Wikifunctions comme un espace destiné à créer et maintenir de manière collaborative une bibliothèque de fonctions. Il anticipe qu'elle permettra de générer des phrases, du texte et même des articles entiers. Elle permettra aussi de faire des calculs à partir des données brutes contenues dans Wikidata, comme par exemple calculer l'âge d'une personne à partir de sa date de naissance ou la densité de population à partir de la population et de la superficie d'un territoire.

La première fonction permet de joindre ensemble deux chaînes de caractère : https://www.wikifunctions.org/view/fr/Z10000

D'après Wikiscan, il existe déjà plus de 2 000 fonctions dans Wikifunctions[11].

Revues citées par Wikipédia — Dans The Signpost du 1er août dernier, Headbomb raconte le projet Journals cited by Wikipedia (Revues citées par Wikipédia), une idée née en 2009 qui consiste à compiler des statistiques sur les revues citées dans Wikipédia en anglais en extrayant les valeurs du paramètre journal= dans le modèle Cite journal (équivalent de {{Article}}) et d'autres modèles similaires.

On apprend notamment qu'Elsevier est l'éditeur scientifique le plus cité dans Wikipédia avec 360 000 citations. et Nature la revue la plus citée avec 51 000 citations.

Pourquoi y a-t-il si peu d'administrateurs et d'administratrices dans les wikipédiennes et wikipédiens récents ? — Dans The Signpost, WereSpielChequers s'inquiète du fait que la majorité des administrateurs et administratrices de la Wikipédia en anglais aient commencé à contribuer dans les années 2000. Sur les 881 administratrices et administrateurs, seul 64 ont commencé à contribuer après 2011.

« J'espère que nous pourrons persuader certains Wikipédiens qui ont rejoint la communauté dans les années 2010 de devenir administrateurs ; je suis sûr qu'il y a beaucoup d'entre vous qui passeraient facilement[12]. »

Ce serait intéressant de faire le même exercice sur Wikipédia en français.

Le Wikimédien de l'année — Le prix du wikipédien de l'année a été remis à Tofeiku, un contributeur originaire de Malaisie qui a commencé à contribuer à l'âge de 8 ans. Il s'est beaucoup investi dans le Wiktionnaire en malais (d) Voir avec Reasonator[13]. Le prix Wikimedia est remis à Siobhan Leachman et le prix du nouveau venu au japonais Eugene Ormandy.

La fondation Wikimédia modernise ses modèles d'apprentissage automatique — Depuis 2015, la fondation Wikimédia maintient un ensemble de modèles d'apprentissage automatique et une infrastructure appelés ORES. En tout, ORES comprend 110 modèles d'arbres de décision dans différentes langues qui permettent d'évaluer la qualité d'un article, la qualité d'une modification, la qualité d'un élément et le thème d'un article. Les modèles déployés par la fondation n'éditent pas directement Wikipédia mais permettent d'avertir les contributrices et les contributeurs. Par exemple, le modèle de détection de vandalisme permet de mettre des alertes dans la page modifications récentes de la Wikipédia en anglais.

Pour pouvoir déployer plus facilement une plus grande variété de modèles en passant rapidement à l'échelle, la fondation s'est lancé dans un grand chantier de modernisation de son infrastructure d'apprentissage automatique.

« Dans ce nouveau flux de travail, un ingénieur en apprentissage automatique de l'équipe machine learning travaille avec un créateur de modèle dès le premier jour du projet pour travailler avec lui sur le déploiement du modèle. L'objectif est que le modèle soit déployé dès le premier jour de sa création et à chaque nouvelle itération au cours de son processus de développement afin que les problèmes qui apparaissent en production soient identifiés et résolus dès le début du processus[14]. »

Cette approche du développement de modèles, dite MLOps, nécessite une nouvelle infrastructure qui s'appuie sur le logiciel Kubeflow (d) Voir avec Reasonator. L'infrastructure est divisée en deux parties, Train Wing pour l'entraînement et Lift Wing pour le déploiement. Les modèles déployés sur Lift Wing seront accessibles par API à travers le portail d'API de la fondation[15].

La seconde partie de l'infrastructure, Train Wing, permettra aux ingénieurs de la fondation mais aussi aux chercheurs d'entraîner leurs propres modèles.

Pour améliorer la documentation et la transparence des modèles d'apprentissage automatique, la fondation va mettre en place une documentation des modèles conformes à l'approche model cards développée par Mitchell et al. (2019) (voir l'exemple meta:User:AlgoAccountabilityBot/Enwiki Good Faith Model Card)[16].

8,8 millions d'articles orphelins dans les 319 versions de Wikipédia — Dans « Orphan Articles: The Dark Matter of Wikipedia (d) Voir avec Reasonator », les chercheurs Akhil Arora, Robert West (d) Voir avec Reasonator et Martin Gerlach (d) Voir avec Reasonator (meta:user:MGerlach (WMF)) se penchent sur l'accessibilité des articles et plus précisément sur les articles qui ne sont pas reliés au reste de l'encyclopédie par des liens internes. Ils estiment que sur les 319 versions linguistiques de Wikipédia, 15% (8,8 millions) des articles peuvent être considérés comme orphelins (aucun lien entrant). La Wikipédia en français se distingue avec seulement 1,7% d'articles orphelins (39 960 articles sur 2,363,875)[17]. A l'inverse, il y a très peu d'articles sans lien sortant. Les auteurs n'en trouvent que 300 000, soit 0,5%.

Les auteurs cherchent à caractériser les articles orphelins à travers plusieurs critères (article créé par un bot, article récent, article consacré à une femme, etc). Ils trouvent notamment que les articles consacrés à des femmes sont plus souvent orphelins que les autres. Par exemple, dans la Wikipédia en anglais, 29% des articles biographiques orphelins sont consacrés à des femmes, qui ne représentent pourtant que 19% des articles biographiques en général.

Les auteurs ont développé l'outil Wiki-Visibility pour aider à relier un article orphelin à partir de liens existants dans d'autres versions linguistiques de Wikipédia. Par exemple, pour l'article Ana Montès, Wiki-Visibility suggère d'ajouter un lien depuis Walter Kendall Myers parce que ce lien existe en anglais et en russe[18],[19].

Dans la Wikipédia en français, le Projet:Pages orphelines liste toutes les pages de la catégorie et cette requête petscan liste toutes les biographies de femmes orphelines (à la date du 4 juillet).

En très bref

Le zoom : Wikivoyage en français

Le zoom est une nouvelle rubrique pour faire le point sur un Wikiprojet. Premier de la série : wikivoyage en français.

Wikivoyage en français compte plus de 8 000 pages de contenu, c'est beaucoup moins que Wikivoyage en anglais (31 000 pages) ou en allemand (20 000 pages) mais beaucoup plus que wikivoyage en espagnol (3 000 pages)[21].

Le contenu de Wikivoyage des articles de Wikivoyage est très structuré avec des patrons d'articles très précis et l'utilisation importante de modèles pour structurer l'information comme modèle:Voir ou modèle:Manger. Wikivoyage s'appuie beaucoup sur Wikidata pour ses infobox ou ses bannières.

En juillet 2023, le site totalise 1 million de pages vues en juillet avec 16 utilisateurs actifs (plus de 5 contributions)[22].

En juillet 2023, les 5 articles les plus consultés sont Amérique du Sud, Palma de Majorque, Johannesburg, Europe et Singapour[23].

Le site compte 2 024 articles sur des éléments situés en France, 789 éléments au Canada et 353 en Belgique[24].

Wikivoyage en français comprend 44 articles étoilés (Catégorie:Article étoilé). Parmi ces articles étoilés, 19 concernent des éléments situés en Belgique, 8 en France, 4 au Canada, 4 au Kenya et 3 en Tanzanie (voir la carte)[25].

Événements

Edit-a-thon aux Archives nationales de France.
WikiConvention 2023
Conférence GLAM Wiki

Ailleurs dans le Wikiverse

La page Wikipédia:RAW/Découvrir recense les infolettres et blogs relatifs à Wikimedia.

Courrier du lectorat

(Il nous fera plaisir de lire les messages déposés ici et, si nécessaire, d'y répondre dans les plus brefs délais.)

Bonsoir, je viens de parcourir l'actualité que vous avez rédigé avec soin, j'ai trouvé intéressant la plupart des informations dont vous avez mentionnées, notamment sur la toute première partie avec les graphiques, bravo pour votre travail ! Hibrideacus (discuter) 31 août 2023 à 22:57 (CEST)

Merci beaucoup pour votre commentaire. ça fait plaisir. PAC2 (discuter) 1 septembre 2023 à 06:57 (CEST)

Bonsoir, merci pour cet important travail de mise à disposition de brèves ! À propos des articles orphelins : le projet francophone a fait le choix de considérer comme orphelin un article possédant moins de 3 liens entrants ; par ailleurs, j'ai testé l'outil indiqué, certes sur un échantillon réduit, et il donne les mêmes réponses que ce que propose déjà Dickensbot (voir par exemple : les Articles orphelins depuis février 2021) pourtant circonscrit à trois wikipédias. Ce faisant, la wikipédia francophone comporte un peu plus de 15 000 articles orphelins, en augmentation lente mais constante. Cela vaudrait sans doute le coup de relancer un concours Wiki-maintenance spécial Orphelins, non ?--Cbyd (discuter) 31 août 2023 à 23:33 (CEST)

Oui effectivement la définition d'un article orphelin peut varier. Dans l'article de recherche, ils considèrent les articles avec 0 liens entrants. PAC2 (discuter) 1 septembre 2023 à 07:00 (CEST)

VLOP

« une cinquantaine de bénévoles sont particulièrement vigilants.. » : sait-on qui sont ces 50 bénévoles ? (pas les noms, mais s'ils sont une catégorie d'utilisateurs bien identifiée) En quoi sont-ils plus particulièrement vigilants ? Quelqu'un sait-il ? C'est une phrase intrigante. --Jean-Christophe BENOIST (discuter) 1 septembre 2023 à 08:27 (CEST)

Je suis d'accord avec toi que c'est intriguant. J'ai parcouru la réponse de la fondation à l'ARCOM (https://www.arcom.fr/sites/default/files/2023-07/2023_anglais_Declaration_Fondation-Wikimedia_haine_en_ligne.pdf, question 7, page 3) mais je n'ai pas vu d'élément plus précis. PAC2 (discuter) 1 septembre 2023 à 08:48 (CEST)

Merci

Lecture instructive. Merci pour ce travail. TCY (discuter) 2 septembre 2023 à 10:44 (CEST)

Fort intéressant

Merci pour cette nouvelle édition très intéressante et très complète. Cela permet de faire un bon tour de l'article en général (Fondation, régulation, nouveaux projets, événements, etc...)
Concernant le problème du nombre de nouveaux administrateurs et administratrices, on pourrait effectivement faire une enquête sur Wikipédia en français.
De mon point de vue, c'est un rôle fondamental pour notre communauté... mais qui est aussi assez ingrat car il n'y a que des coups à prendre (à part si on s'occupe uniquement de la maintenance technique et de la lutte contre les vandalismes). Il y a également l'élection communautaire qui peut parfois virer au défouloir dans les avis. Peut-être qu'en modérant mieux les avis lors des élections, chaque candidature serait moins angoissante pour les candidats et candidates.--Pronoia (discuter) 2 septembre 2023 à 10:57 (CEST)


 –
Rédigé/traduit par PAC2
Citations originales
Notes
Références
  1. Repéré via https://mastodon.world/@OpenSexism/110817958836569741
  2. meta:Community_Insights#Languages
  3. https://foundation.wikimedia.org/wiki/Policy:Universal_Code_of_Conduct/fr
  4. Philippe Jacqué et Maria Udrescu, « Numérique : la loi européenne obligeant les géants d’Internet à réguler leurs contenus est entrée en vigueur », Le Monde,‎ (ISSN 1950-6244, lire en ligne).
  5. « Even as gap-closing efforts take place, there is fear that structured data projects like Wikidata are codifying the views, values, and histories of hegemonic communities into artificial intelligence, establishing them as truths in the robot epistemology, and likely trapping people of the Global Majority in laborious knowledge battles to extend into the eras to come. » traduit avec l'aide de DeepL
  6. « In our Wikidata effort, it seems that we are distanced from the outcomes of our labor. », traduit avec l'assistance de DeepL
  7. « If we don’t engage with these peer-production knowledge platforms, our histories, ideas, knowings, get left behind and the erasure continues. When we do, it profits far away multinationals with clandestine workings, bottomless pockets, and unchecked power over peoples’ lives and livelihoods. » traduit avec DeepL
  8. Finn Årup Nielsen (d) Voir avec Reasonator Synia: Displaying data from Wikibases (d) Voir avec Reasonator, https://arxiv.org/abs/2303.15133
  9. Découvert via le compte Mastodon de fnielsen : https://fosstodon.org/@fnielsen/110791751465369139
  10. https://scholia.toolforge.org/
  11. https://wikifunctions.wikiscan.org/ consulté le 28 août
  12. « My hope is that we can persuade some Wikipedians who joined the community in the 2010s to become admins; I'm sure there are many of you who would pass easily. »
  13. Découvert via https://wikis.world/@wikipedia/110900708319266865 et https://tech.lgbt/@wmlgbt/110898976230542024
  14. « In this new workflow, a machine learning engineer from the Machine Learning team works with a model creator from the first day of the project to work with them on model deployment. The goal is that the model is deployed on the first day it is created and at every new iteration during its development process so that issues that appear in production are identified and resolved early in the model creation process. »
  15. https://api.wikimedia.org/wiki/Lift_Wing_API
  16. (en) Margaret Mitchell, Simone Wu, Andrew Zaldivar, Parker Barnes, Lucy Vasserman, Ben Hutchinson, Elena Spitzer, Inioluwa Deborah Raji et Timnit Gebru, « Model Cards for Model Reporting », FAT* '19: Proceedings of the Conference on Fairness, Accountability, and Transparency,‎ (ISBN 978-1-4503-6125-5, DOI 10.1145/3287560.3287596, arXiv 1810.03993)Voir et modifier les données sur Wikidata
  17. meta:Research:Recommending links to increase visibility of articles/Link-translation
  18. https://linkrec.toolforge.org/
  19. Pour les utilisateurs de l'interface web mobile, le lien vers l'outil est intégré à Chouette.js
  20. Voir l'annonce : en:Wikipedia:Wikipedia Signpost/2023-08-31/From the editor
  21. https://www.wikivoyage.org/
  22. https://stats.wikimedia.org/#/fr.wikivoyage.org
  23. https://pageviews.wmcloud.org/topviews/?project=fr.wikivoyage.org&platform=all-access&date=last-month&excludes=
  24. Requête SPARQL : https://w.wiki/7GXf
  25. https://w.wiki/7GYT
  26. https://www.wikimedia.fr/inscrivez-vous-au-mooc-wikidata/ découvert via Projet:Wikifier la science/Infolettre/Août 2023

Numéro du 13 septembre 2023

Wednesday, 13 September 2023 00:00 UTC

L'édito de PAC2

Ce numéro contient beaucoup de brèves sur un grand nombre de sujets : l'enquête sur la communauté Wikimédia, la régulation de la haine en ligne, une réflexion sur la contribution à Wikidata, les articles orphelins ou encore la modernisation de l'infrastructure d'apprentissage automatique de la fondation Wikimédia.

Nous introduisons aussi une nouvelle section pour faire un zoom sur un projet Wikimédia. La section est inaugurée avec une présentation de Wikivoyage en français.

Globalement, je me dis que le numéro est peut être un peu long pour le lecteur ou la lectrice (à peu près 20 minutes de lecture d'après la liseuse de Firefox). Chacun pourra picorer ce qu'il souhaite.

N'hésitez pas à contribuer au prochain numéro en proposant des sujets en salle de rédaction ou directement dans le contenu.

Bonne lecture !

Brèves

Community Insights — La Fondation Wikimédia publie chaque année une enquête sur la communauté Wikimédia intitulée Community Insights[1]. L'édition 2023 s'appuie sur des données collectées grâce à une enquête statistique entre juin et septembre 2022. L'enquête a été menée dans 28 langues différentes[2].

Estimation de la part des éditrices et éditeurs actifs par an.

Parmi les éditrices et éditeurs actifs, la part des femmes est passée de 11 % en 2019 à 15 % en 2020 et 13 % en 2022. En revanche, la part des éditrices et éditeurs considérés comme faisant partie des genres minoritaires (gender-diverse) est passée de 2 à 4 %. Le terme de gender-diverse est emprunté au Haut-Commissariat des Nations unies aux droits de l'homme pour désigner les personnes trans, non-binaires, genderqueer, agenrées ou les personnes s'identifiant à plusieurs genres.

Parmi les nouvelles personnes contribuant à Wikimédia depuis 2021, on trouve 20 % de femmes et 7 % de personnes gender-diverse.

Distribution par âge de la communauté comparée à la population mondiale

Globalement, la distribution par catégorie d'âge de la communauté correspond à la distribution mondiale par catégorie d'âge. Toutefois, les personnes de moins de 18 ans ne sont pas incluses dans l'enquête. En revanche, les éditrices et éditeurs actifs sont nettement plus diplômés que la population des pays de l'OCDE. Par ailleurs, 12 % des éditrices et éditeurs se considèrent comme appartenant à une minorité ethnique dans leur pays.

38 % des contributrices et contributeurs trouvent que la Fondation Wikimédia communique bien sur ses projets et ses initiatives. 56 % considèrent que la Fondation a les bons programmes et les bonnes stratégies pour atteindre l'objectif de 2030 de devenir l'infrastructure centrale de la connaissance libre et accessible à tous et toutes.

Part des éditrices et éditeurs qui se sont sentis en danger ou inconfortable au cours des 12 mois précédents.

44% des femmes, 53% des personnes gender-diverses et 33% des hommes contribuant activement se sont sentis en danger (unsafe) ou inconfortables (uncomfortable) au cours des 12 mois précédents l'enquête. 25% des éditrices et éditeurs déclarent avoir subi du harcèlement au cours des 12 derniers mois. La proportion est plus élevée pour les femmes (31%). 46% des éditrices et éditeurs savent comment trouver de l'aide en cas de harcèlement.

Part des éditrices et éditeurs qui déclarent avoir subi du harcèlement.

Lutte contre les contenus haineux

En juillet 2023, l'Autorité de régulation de la communication audiovisuelle et numérique (ARCOM) a publié un bilan des moyens mis en place par les plateformes en ligne dans la lutte contre la diffusion des contenus haineux en 2022. En France, l'article 42 de la Loi confortant le respect des principes de la République impose aux principales plateformes présentes sur le territoire national des obligations de moyen dans la lutte contre la diffusion des contenus haineux. L'ARCOM est chargée de superviser la mise en œuvre de ces obligations. Le règlement européen sur les services numériques (connu sous le nom de DSA pour Digital services act ou RSN en français) entre en œuvre dans les pays de l'Union européenne le 25 août 2023 pour les grandes plateformes en ligne (les VLOP pour very large online platforms) et le 17 février 2024 pour l'ensemble des services en ligne concernés. Les dispositions du DSA remplaceront donc les dispositions de la loi confortant le respect des principes de la République.

Dans ce rapport, l'ARCOM s'intéresse à l'accessibilité et l'intelligibilité des conditions générales, à la prise en compte dans les conditions générales de la législation sur les contenus haineux, aux dispositifs de signalement des contenus haineux, aux moyens mis en œuvre pour la modération des contenus, à la lutte contre les signalements abusifs et enfin à la coopération avec les autorités administratives et judiciaires, que ce soit pour informer les autorités des contenus haineux signalés ou pour traiter les demandes des autorités.

La fondation Wikimédia a fait remarquer à l'ARCOM que le questionnaire n'est pas adapté au fonctionnement collaboratif et communautaire de Wikipédia.

Dans une note au bas de la page 10, l'ARCOM regrette que le Code universel de conduite ne soit disponible qu'en anglais. Pourtant il existe une traduction en français[3].

Sur la modération des contenus illicites, l'ARCOM note : « En raison de l’approche collaborative et décentralisée de sa politique de modération, comparer Wikipédia à d’autres services apparaît peu pertinent. Toutefois, la description de cette politique dans les CG (ie conditions générales) de la plateforme mériterait de gagner en précision et en transparence. »

Sur les dispositions de signalement des contenus haineux, l'ARCOM note la spécificité de Wikipédia par rapport aux autres plateformes : « Wikipédia, en raison des spécificités de son modèle, ne dispose pas de dispositif de signalement « traditionnel ». Confronté à un contenu problématique, un utilisateur pourra (i) le corriger lui-même en modifiant la page, (ii) expliquer le problème sur la page de discussion de l’article concerné ou (iii) demander de l’aide sur le « Forum des nouveaux ». L'architecture de la modération sur la plateforme est remarquable, en ce qu'elle repose en priorité sur les utilisateurs, tout en assurant une expertise stable en matière de modération des contenus illicites grâce aux utilisateurs « administrateurs » de Wikipédia. » Sur les moyens mis en œuvre pour lutter contre les contenus illicites, la fondation note qu'une cinquantaine de bénévoles sont particulièrement vigilants sur cette question.

Sur la mise en œuvre du règlement européen sur les services numériques, nous avons déjà abordé le sujet dans le numéro du 1er juin. Par ailleurs, Wikimédia France a traduit en français un article initialement publié par la Fondation Wikimédia. Le règlement européen sur les services numériques est entré en vigueur le 25 août[4].

Wikidata et l'épistémologie des robots — Dans un article intitulé « Wikidata: why we contribute to the robot epistemology » publié sur le site du user group Whose Knowledge?, Maari Zwick-Maitreyi (d) Voir avec Reasonator explore les enjeux de la contribution à Wikidata pour les personnes de la majorité globale (en). Après avoir rappelé les enjeux de représentation des points de vue des personnes de la majorité globale dans Wikipédia et les efforts de la Wikimedia Foundation, l'autrice souligne que ces enjeux sont particulièrement prégnants dans Wikidata.

« Même si des efforts sont déployés pour combler le fossé, on craint que des projets de données structurées comme Wikidata ne codifient les points de vue, les valeurs et l'histoire des communautés hégémoniques dans l'intelligence artificielle, les érigeant en vérités dans l'épistémologie des robots et piégeant probablement les membres de la majorité globale dans de laborieuses batailles de connaissances qui se prolongeront dans les époques à venir[5]. »

En s'appuyant sur l'article « Working for the Invisible Machines or Pumping Information into an Empty Void? An Exploration of Wikidata Contributors' Motivations (d) Voir avec Reasonator », elle rappelle que 70 % des contributeurs et contributrices de Wikidata ignorent comment leurs contributions sont utilisées.

« Dans notre effort pour Wikidata, il semble que nous soyons éloignés des résultats de notre travail[6]. »

L'autrice rappelle que le travail de contribution gratuite et désintéressée à Wikidata est avant tout utilisé par les grandes entreprises du numérique pour construire des intelligences artificielles et faire des profits. Elle souligne alors un dilemme.

« Si nous ne nous engageons pas dans ces plateformes de production de connaissances par les pairs, nos histoires, nos idées, nos connaissances sont laissées de côté et l'effacement se poursuit. Lorsque nous le faisons, cela profite à des multinationales lointaines qui ont recours au travail clandestin, ont les poches pleines et exercent un pouvoir incontrôlé sur la vie et les moyens de subsistance des gens[7]. »

L'autrice termine l'article avec une série de questions à se poser sur Wikidata.

Synia : explorer Wikidata autrement — En mars 2023, Finn Årup Nielsen (d) Voir avec Reasonator (connu sous le pseudonyme fnielsen) a publié « Synia: Displaying data from Wikibases (d) Voir avec Reasonator » dans lequel il présente Synia, un nouvel outil qui permet d'explorer Wikidata autrement grâce à des requêtes SPARQL génériques[8],[9]. Concrètement, la communauté peut écrire des requêtes SPARQL génériques dans une page de configuration sur Wikidata et cela produit automatiquement une nouvelle page de profil dans Synia. C'est un excellent moyen d'explorer Wikidata. L'outil s'inspire largement de Scholia (d) Voir avec Reasonator[10], un outil qui permet grâce à des requêtes génériques dans Wikidata d'explorer les données de Wikidata relatives aux chercheurs et chercheuses, aux publications scientifiques, aux revues académiques et aux éditeurs scientifiques.

Voici quelques exemples :

Prenez plaisir à contribuerLepticed7 a publié une traduction de l'essai Enjoy yourself.

« Tout le monde devrait le garder à l’esprit tout le temps : prendre du plaisir à contribuer est la clé pour rester actif sur le projet. Si vous ne prenez plus de plaisir à contribuer, faites un pas en arrière et posez-vous des questions sur ce que vous aimez faire. »

Les débuts de Wikifunctions — Le mois dernier, nous avons annoncé le lancement de Wikifunctions. Dans un article publié sur le blog Diff, Denny Vrandečić donne plus de détails. Il définit Wikifunctions comme un espace destiné à créer et maintenir de manière collaborative une bibliothèque de fonctions. Il anticipe qu'elle permettra de générer des phrases, du texte et même des articles entiers. Elle permettra aussi de faire des calculs à partir des données brutes contenues dans Wikidata, comme par exemple calculer l'âge d'une personne à partir de sa date de naissance ou la densité de population à partir de la population et de la superficie d'un territoire.

La première fonction permet de joindre ensemble deux chaînes de caractère : https://www.wikifunctions.org/view/fr/Z10000

D'après Wikiscan, il existe déjà plus de 2 000 fonctions dans Wikifunctions[11].

Revues citées par Wikipédia — Dans The Signpost du 1er août dernier, Headbomb raconte le projet Journals cited by Wikipedia (Revues citées par Wikipédia), une idée née en 2009 qui consiste à compiler des statistiques sur les revues citées dans Wikipédia en anglais en extrayant les valeurs du paramètre journal= dans le modèle Cite journal (équivalent de {{Article}}) et d'autres modèles similaires.

On apprend notamment qu'Elsevier est l'éditeur scientifique le plus cité dans Wikipédia avec 360 000 citations. et Nature la revue la plus citée avec 51 000 citations.

Pourquoi y a-t-il si peu d'administrateurs et d'administratrices dans les wikipédiennes et wikipédiens récents ? — Dans The Signpost, WereSpielChequers s'inquiète du fait que la majorité des administrateurs et administratrices de la Wikipédia en anglais aient commencé à contribuer dans les années 2000. Sur les 881 administratrices et administrateurs, seul 64 ont commencé à contribuer après 2011.

« J'espère que nous pourrons persuader certains Wikipédiens qui ont rejoint la communauté dans les années 2010 de devenir administrateurs ; je suis sûr qu'il y a beaucoup d'entre vous qui passeraient facilement[12]. »

Ce serait intéressant de faire le même exercice sur Wikipédia en français.

Le Wikimédien de l'année — Le prix du wikipédien de l'année a été remis à Tofeiku, un contributeur originaire de Malaisie qui a commencé à contribuer à l'âge de 8 ans. Il s'est beaucoup investi dans le Wiktionnaire en malais (d) Voir avec Reasonator[13]. Le prix Wikimedia est remis à Siobhan Leachman et le prix du nouveau venu au japonais Eugene Ormandy.

La fondation Wikimédia modernise ses modèles d'apprentissage automatique — Depuis 2015, la fondation Wikimédia maintient un ensemble de modèles d'apprentissage automatique et une infrastructure appelés ORES. En tout, ORES comprend 110 modèles d'arbres de décision dans différentes langues qui permettent d'évaluer la qualité d'un article, la qualité d'une modification, la qualité d'un élément et le thème d'un article. Les modèles déployés par la fondation n'éditent pas directement Wikipédia mais permettent d'avertir les contributrices et les contributeurs. Par exemple, le modèle de détection de vandalisme permet de mettre des alertes dans la page modifications récentes de la Wikipédia en anglais.

Pour pouvoir déployer plus facilement une plus grande variété de modèles en passant rapidement à l'échelle, la fondation s'est lancé dans un grand chantier de modernisation de son infrastructure d'apprentissage automatique.

« Dans ce nouveau flux de travail, un ingénieur en apprentissage automatique de l'équipe machine learning travaille avec un créateur de modèle dès le premier jour du projet pour travailler avec lui sur le déploiement du modèle. L'objectif est que le modèle soit déployé dès le premier jour de sa création et à chaque nouvelle itération au cours de son processus de développement afin que les problèmes qui apparaissent en production soient identifiés et résolus dès le début du processus[14]. »

Cette approche du développement de modèles, dite MLOps, nécessite une nouvelle infrastructure qui s'appuie sur le logiciel Kubeflow (d) Voir avec Reasonator. L'infrastructure est divisée en deux parties, Train Wing pour l'entraînement et Lift Wing pour le déploiement. Les modèles déployés sur Lift Wing seront accessibles par API à travers le portail d'API de la fondation[15].

La seconde partie de l'infrastructure, Train Wing, permettra aux ingénieurs de la fondation mais aussi aux chercheurs d'entraîner leurs propres modèles.

Pour améliorer la documentation et la transparence des modèles d'apprentissage automatique, la fondation va mettre en place une documentation des modèles conformes à l'approche model cards développée par Mitchell et al. (2019) (voir l'exemple meta:User:AlgoAccountabilityBot/Enwiki Good Faith Model Card)[16].

8,8 millions d'articles orphelins dans les 319 versions de Wikipédia — Dans « Orphan Articles: The Dark Matter of Wikipedia (d) Voir avec Reasonator », les chercheurs Akhil Arora, Robert West (d) Voir avec Reasonator et Martin Gerlach (d) Voir avec Reasonator (meta:user:MGerlach (WMF)) se penchent sur l'accessibilité des articles et plus précisément sur les articles qui ne sont pas reliés au reste de l'encyclopédie par des liens internes. Ils estiment que sur les 319 versions linguistiques de Wikipédia, 15% (8,8 millions) des articles peuvent être considérés comme orphelins (aucun lien entrant). La Wikipédia en français se distingue avec seulement 1,7% d'articles orphelins (39 960 articles sur 2,363,875)[17]. A l'inverse, il y a très peu d'articles sans lien sortant. Les auteurs n'en trouvent que 300 000, soit 0,5%.

Les auteurs cherchent à caractériser les articles orphelins à travers plusieurs critères (article créé par un bot, article récent, article consacré à une femme, etc). Ils trouvent notamment que les articles consacrés à des femmes sont plus souvent orphelins que les autres. Par exemple, dans la Wikipédia en anglais, 29% des articles biographiques orphelins sont consacrés à des femmes, qui ne représentent pourtant que 19% des articles biographiques en général.

Les auteurs ont développé l'outil Wiki-Visibility pour aider à relier un article orphelin à partir de liens existants dans d'autres versions linguistiques de Wikipédia. Par exemple, pour l'article Ana Montès, Wiki-Visibility suggère d'ajouter un lien depuis Walter Kendall Myers parce que ce lien existe en anglais et en russe[18],[19].

Dans la Wikipédia en français, le Projet:Pages orphelines liste toutes les pages de la catégorie et cette requête petscan liste toutes les biographies de femmes orphelines (à la date du 4 juillet).

En très bref

Le zoom : Wikivoyage en français

Le zoom est une nouvelle rubrique pour faire le point sur un Wikiprojet. Premier de la série : wikivoyage en français.

Wikivoyage en français compte plus de 8 000 pages de contenu, c'est beaucoup moins que Wikivoyage en anglais (31 000 pages) ou en allemand (20 000 pages) mais beaucoup plus que wikivoyage en espagnol (3 000 pages)[21].

Le contenu de Wikivoyage des articles de Wikivoyage est très structuré avec des patrons d'articles très précis et l'utilisation importante de modèles pour structurer l'information comme modèle:Voir ou modèle:Manger. Wikivoyage s'appuie beaucoup sur Wikidata pour ses infobox ou ses bannières.

En juillet 2023, le site totalise 1 million de pages vues en juillet avec 16 utilisateurs actifs (plus de 5 contributions)[22].

En juillet 2023, les 5 articles les plus consultés sont Amérique du Sud, Palma de Majorque, Johannesburg, Europe et Singapour[23].

Le site compte 2 024 articles sur des éléments situés en France, 789 éléments au Canada et 353 en Belgique[24].

Wikivoyage en français comprend 44 articles étoilés (Catégorie:Article étoilé). Parmi ces articles étoilés, 19 concernent des éléments situés en Belgique, 8 en France, 4 au Canada, 4 au Kenya et 3 en Tanzanie (voir la carte)[25].

Événements

Edit-a-thon aux Archives nationales de France.
WikiConvention 2023
Conférence GLAM Wiki

Ailleurs dans le Wikiverse

La page Wikipédia:RAW/Découvrir recense les infolettres et blogs relatifs à Wikimedia.

Courrier du lectorat

(Il nous fera plaisir de lire les messages déposés ici et, si nécessaire, d'y répondre dans les plus brefs délais.)

Bonsoir, je viens de parcourir l'actualité que vous avez rédigé avec soin, j'ai trouvé intéressant la plupart des informations dont vous avez mentionnées, notamment sur la toute première partie avec les graphiques, bravo pour votre travail ! Hibrideacus (discuter) 31 août 2023 à 22:57 (CEST)

Merci beaucoup pour votre commentaire. ça fait plaisir. PAC2 (discuter) 1 septembre 2023 à 06:57 (CEST)

Bonsoir, merci pour cet important travail de mise à disposition de brèves ! À propos des articles orphelins : le projet francophone a fait le choix de considérer comme orphelin un article possédant moins de 3 liens entrants ; par ailleurs, j'ai testé l'outil indiqué, certes sur un échantillon réduit, et il donne les mêmes réponses que ce que propose déjà Dickensbot (voir par exemple : les Articles orphelins depuis février 2021) pourtant circonscrit à trois wikipédias. Ce faisant, la wikipédia francophone comporte un peu plus de 15 000 articles orphelins, en augmentation lente mais constante. Cela vaudrait sans doute le coup de relancer un concours Wiki-maintenance spécial Orphelins, non ?--Cbyd (discuter) 31 août 2023 à 23:33 (CEST)

Oui effectivement la définition d'un article orphelin peut varier. Dans l'article de recherche, ils considèrent les articles avec 0 liens entrants. PAC2 (discuter) 1 septembre 2023 à 07:00 (CEST)

VLOP

« une cinquantaine de bénévoles sont particulièrement vigilants.. » : sait-on qui sont ces 50 bénévoles ? (pas les noms, mais s'ils sont une catégorie d'utilisateurs bien identifiée) En quoi sont-ils plus particulièrement vigilants ? Quelqu'un sait-il ? C'est une phrase intrigante. --Jean-Christophe BENOIST (discuter) 1 septembre 2023 à 08:27 (CEST)

Je suis d'accord avec toi que c'est intriguant. J'ai parcouru la réponse de la fondation à l'ARCOM (https://www.arcom.fr/sites/default/files/2023-07/2023_anglais_Declaration_Fondation-Wikimedia_haine_en_ligne.pdf, question 7, page 3) mais je n'ai pas vu d'élément plus précis. PAC2 (discuter) 1 septembre 2023 à 08:48 (CEST)

Merci

Lecture instructive. Merci pour ce travail. TCY (discuter) 2 septembre 2023 à 10:44 (CEST)

Fort intéressant

Merci pour cette nouvelle édition très intéressante et très complète. Cela permet de faire un bon tour de l'article en général (Fondation, régulation, nouveaux projets, événements, etc...)
Concernant le problème du nombre de nouveaux administrateurs et administratrices, on pourrait effectivement faire une enquête sur Wikipédia en français.
De mon point de vue, c'est un rôle fondamental pour notre communauté... mais qui est aussi assez ingrat car il n'y a que des coups à prendre (à part si on s'occupe uniquement de la maintenance technique et de la lutte contre les vandalismes). Il y a également l'élection communautaire qui peut parfois virer au défouloir dans les avis. Peut-être qu'en modérant mieux les avis lors des élections, chaque candidature serait moins angoissante pour les candidats et candidates.--Pronoia (discuter) 2 septembre 2023 à 10:57 (CEST)


 –
Rédigé/traduit par PAC2
Citations originales
Notes
Références
  1. Repéré via https://mastodon.world/@OpenSexism/110817958836569741
  2. meta:Community_Insights#Languages
  3. https://foundation.wikimedia.org/wiki/Policy:Universal_Code_of_Conduct/fr
  4. Philippe Jacqué et Maria Udrescu, « Numérique : la loi européenne obligeant les géants d’Internet à réguler leurs contenus est entrée en vigueur », Le Monde,‎ (ISSN 1950-6244, lire en ligne).
  5. « Even as gap-closing efforts take place, there is fear that structured data projects like Wikidata are codifying the views, values, and histories of hegemonic communities into artificial intelligence, establishing them as truths in the robot epistemology, and likely trapping people of the Global Majority in laborious knowledge battles to extend into the eras to come. » traduit avec l'aide de DeepL
  6. « In our Wikidata effort, it seems that we are distanced from the outcomes of our labor. », traduit avec l'assistance de DeepL
  7. « If we don’t engage with these peer-production knowledge platforms, our histories, ideas, knowings, get left behind and the erasure continues. When we do, it profits far away multinationals with clandestine workings, bottomless pockets, and unchecked power over peoples’ lives and livelihoods. » traduit avec DeepL
  8. Finn Årup Nielsen (d) Voir avec Reasonator Synia: Displaying data from Wikibases (d) Voir avec Reasonator, https://arxiv.org/abs/2303.15133
  9. Découvert via le compte Mastodon de fnielsen : https://fosstodon.org/@fnielsen/110791751465369139
  10. https://scholia.toolforge.org/
  11. https://wikifunctions.wikiscan.org/ consulté le 28 août
  12. « My hope is that we can persuade some Wikipedians who joined the community in the 2010s to become admins; I'm sure there are many of you who would pass easily. »
  13. Découvert via https://wikis.world/@wikipedia/110900708319266865 et https://tech.lgbt/@wmlgbt/110898976230542024
  14. « In this new workflow, a machine learning engineer from the Machine Learning team works with a model creator from the first day of the project to work with them on model deployment. The goal is that the model is deployed on the first day it is created and at every new iteration during its development process so that issues that appear in production are identified and resolved early in the model creation process. »
  15. https://api.wikimedia.org/wiki/Lift_Wing_API
  16. (en) Margaret Mitchell, Simone Wu, Andrew Zaldivar, Parker Barnes, Lucy Vasserman, Ben Hutchinson, Elena Spitzer, Inioluwa Deborah Raji et Timnit Gebru, « Model Cards for Model Reporting », FAT* '19: Proceedings of the Conference on Fairness, Accountability, and Transparency,‎ (ISBN 978-1-4503-6125-5, DOI 10.1145/3287560.3287596, arXiv 1810.03993)Voir et modifier les données sur Wikidata
  17. meta:Research:Recommending links to increase visibility of articles/Link-translation
  18. https://linkrec.toolforge.org/
  19. Pour les utilisateurs de l'interface web mobile, le lien vers l'outil est intégré à Chouette.js
  20. Voir l'annonce : en:Wikipedia:Wikipedia Signpost/2023-08-31/From the editor
  21. https://www.wikivoyage.org/
  22. https://stats.wikimedia.org/#/fr.wikivoyage.org
  23. https://pageviews.wmcloud.org/topviews/?project=fr.wikivoyage.org&platform=all-access&date=last-month&excludes=
  24. Requête SPARQL : https://w.wiki/7GXf
  25. https://w.wiki/7GYT
  26. https://www.wikimedia.fr/inscrivez-vous-au-mooc-wikidata/ découvert via Projet:Wikifier la science/Infolettre/Août 2023

Numéro du 12 septembre 2023

Tuesday, 12 September 2023 00:00 UTC

L'édito de PAC2

Ce numéro contient beaucoup de brèves sur un grand nombre de sujets : l'enquête sur la communauté Wikimédia, la régulation de la haine en ligne, une réflexion sur la contribution à Wikidata, les articles orphelins ou encore la modernisation de l'infrastructure d'apprentissage automatique de la fondation Wikimédia.

Nous introduisons aussi une nouvelle section pour faire un zoom sur un projet Wikimédia. La section est inaugurée avec une présentation de Wikivoyage en français.

Globalement, je me dis que le numéro est peut être un peu long pour le lecteur ou la lectrice (à peu près 20 minutes de lecture d'après la liseuse de Firefox). Chacun pourra picorer ce qu'il souhaite.

N'hésitez pas à contribuer au prochain numéro en proposant des sujets en salle de rédaction ou directement dans le contenu.

Bonne lecture !

Brèves

Community Insights — La Fondation Wikimédia publie chaque année une enquête sur la communauté Wikimédia intitulée Community Insights[1]. L'édition 2023 s'appuie sur des données collectées grâce à une enquête statistique entre juin et septembre 2022. L'enquête a été menée dans 28 langues différentes[2].

Estimation de la part des éditrices et éditeurs actifs par an.

Parmi les éditrices et éditeurs actifs, la part des femmes est passée de 11 % en 2019 à 15 % en 2020 et 13 % en 2022. En revanche, la part des éditrices et éditeurs considérés comme faisant partie des genres minoritaires (gender-diverse) est passée de 2 à 4 %. Le terme de gender-diverse est emprunté au Haut-Commissariat des Nations unies aux droits de l'homme pour désigner les personnes trans, non-binaires, genderqueer, agenrées ou les personnes s'identifiant à plusieurs genres.

Parmi les nouvelles personnes contribuant à Wikimédia depuis 2021, on trouve 20 % de femmes et 7 % de personnes gender-diverse.

Distribution par âge de la communauté comparée à la population mondiale

Globalement, la distribution par catégorie d'âge de la communauté correspond à la distribution mondiale par catégorie d'âge. Toutefois, les personnes de moins de 18 ans ne sont pas incluses dans l'enquête. En revanche, les éditrices et éditeurs actifs sont nettement plus diplômés que la population des pays de l'OCDE. Par ailleurs, 12 % des éditrices et éditeurs se considèrent comme appartenant à une minorité ethnique dans leur pays.

38 % des contributrices et contributeurs trouvent que la Fondation Wikimédia communique bien sur ses projets et ses initiatives. 56 % considèrent que la Fondation a les bons programmes et les bonnes stratégies pour atteindre l'objectif de 2030 de devenir l'infrastructure centrale de la connaissance libre et accessible à tous et toutes.

Part des éditrices et éditeurs qui se sont sentis en danger ou inconfortable au cours des 12 mois précédents.

44% des femmes, 53% des personnes gender-diverses et 33% des hommes contribuant activement se sont sentis en danger (unsafe) ou inconfortables (uncomfortable) au cours des 12 mois précédents l'enquête. 25% des éditrices et éditeurs déclarent avoir subi du harcèlement au cours des 12 derniers mois. La proportion est plus élevée pour les femmes (31%). 46% des éditrices et éditeurs savent comment trouver de l'aide en cas de harcèlement.

Part des éditrices et éditeurs qui déclarent avoir subi du harcèlement.

Lutte contre les contenus haineux

En juillet 2023, l'Autorité de régulation de la communication audiovisuelle et numérique (ARCOM) a publié un bilan des moyens mis en place par les plateformes en ligne dans la lutte contre la diffusion des contenus haineux en 2022. En France, l'article 42 de la Loi confortant le respect des principes de la République impose aux principales plateformes présentes sur le territoire national des obligations de moyen dans la lutte contre la diffusion des contenus haineux. L'ARCOM est chargée de superviser la mise en œuvre de ces obligations. Le règlement européen sur les services numériques (connu sous le nom de DSA pour Digital services act ou RSN en français) entre en œuvre dans les pays de l'Union européenne le 25 août 2023 pour les grandes plateformes en ligne (les VLOP pour very large online platforms) et le 17 février 2024 pour l'ensemble des services en ligne concernés. Les dispositions du DSA remplaceront donc les dispositions de la loi confortant le respect des principes de la République.

Dans ce rapport, l'ARCOM s'intéresse à l'accessibilité et l'intelligibilité des conditions générales, à la prise en compte dans les conditions générales de la législation sur les contenus haineux, aux dispositifs de signalement des contenus haineux, aux moyens mis en œuvre pour la modération des contenus, à la lutte contre les signalements abusifs et enfin à la coopération avec les autorités administratives et judiciaires, que ce soit pour informer les autorités des contenus haineux signalés ou pour traiter les demandes des autorités.

La fondation Wikimédia a fait remarquer à l'ARCOM que le questionnaire n'est pas adapté au fonctionnement collaboratif et communautaire de Wikipédia.

Dans une note au bas de la page 10, l'ARCOM regrette que le Code universel de conduite ne soit disponible qu'en anglais. Pourtant il existe une traduction en français[3].

Sur la modération des contenus illicites, l'ARCOM note : « En raison de l’approche collaborative et décentralisée de sa politique de modération, comparer Wikipédia à d’autres services apparaît peu pertinent. Toutefois, la description de cette politique dans les CG (ie conditions générales) de la plateforme mériterait de gagner en précision et en transparence. »

Sur les dispositions de signalement des contenus haineux, l'ARCOM note la spécificité de Wikipédia par rapport aux autres plateformes : « Wikipédia, en raison des spécificités de son modèle, ne dispose pas de dispositif de signalement « traditionnel ». Confronté à un contenu problématique, un utilisateur pourra (i) le corriger lui-même en modifiant la page, (ii) expliquer le problème sur la page de discussion de l’article concerné ou (iii) demander de l’aide sur le « Forum des nouveaux ». L'architecture de la modération sur la plateforme est remarquable, en ce qu'elle repose en priorité sur les utilisateurs, tout en assurant une expertise stable en matière de modération des contenus illicites grâce aux utilisateurs « administrateurs » de Wikipédia. » Sur les moyens mis en œuvre pour lutter contre les contenus illicites, la fondation note qu'une cinquantaine de bénévoles sont particulièrement vigilants sur cette question.

Sur la mise en œuvre du règlement européen sur les services numériques, nous avons déjà abordé le sujet dans le numéro du 1er juin. Par ailleurs, Wikimédia France a traduit en français un article initialement publié par la Fondation Wikimédia. Le règlement européen sur les services numériques est entré en vigueur le 25 août[4].

Wikidata et l'épistémologie des robots — Dans un article intitulé « Wikidata: why we contribute to the robot epistemology » publié sur le site du user group Whose Knowledge?, Maari Zwick-Maitreyi (d) Voir avec Reasonator explore les enjeux de la contribution à Wikidata pour les personnes de la majorité globale (en). Après avoir rappelé les enjeux de représentation des points de vue des personnes de la majorité globale dans Wikipédia et les efforts de la Wikimedia Foundation, l'autrice souligne que ces enjeux sont particulièrement prégnants dans Wikidata.

« Même si des efforts sont déployés pour combler le fossé, on craint que des projets de données structurées comme Wikidata ne codifient les points de vue, les valeurs et l'histoire des communautés hégémoniques dans l'intelligence artificielle, les érigeant en vérités dans l'épistémologie des robots et piégeant probablement les membres de la majorité globale dans de laborieuses batailles de connaissances qui se prolongeront dans les époques à venir[5]. »

En s'appuyant sur l'article « Working for the Invisible Machines or Pumping Information into an Empty Void? An Exploration of Wikidata Contributors' Motivations (d) Voir avec Reasonator », elle rappelle que 70 % des contributeurs et contributrices de Wikidata ignorent comment leurs contributions sont utilisées.

« Dans notre effort pour Wikidata, il semble que nous soyons éloignés des résultats de notre travail[6]. »

L'autrice rappelle que le travail de contribution gratuite et désintéressée à Wikidata est avant tout utilisé par les grandes entreprises du numérique pour construire des intelligences artificielles et faire des profits. Elle souligne alors un dilemme.

« Si nous ne nous engageons pas dans ces plateformes de production de connaissances par les pairs, nos histoires, nos idées, nos connaissances sont laissées de côté et l'effacement se poursuit. Lorsque nous le faisons, cela profite à des multinationales lointaines qui ont recours au travail clandestin, ont les poches pleines et exercent un pouvoir incontrôlé sur la vie et les moyens de subsistance des gens[7]. »

L'autrice termine l'article avec une série de questions à se poser sur Wikidata.

Synia : explorer Wikidata autrement — En mars 2023, Finn Årup Nielsen (d) Voir avec Reasonator (connu sous le pseudonyme fnielsen) a publié « Synia: Displaying data from Wikibases (d) Voir avec Reasonator » dans lequel il présente Synia, un nouvel outil qui permet d'explorer Wikidata autrement grâce à des requêtes SPARQL génériques[8],[9]. Concrètement, la communauté peut écrire des requêtes SPARQL génériques dans une page de configuration sur Wikidata et cela produit automatiquement une nouvelle page de profil dans Synia. C'est un excellent moyen d'explorer Wikidata. L'outil s'inspire largement de Scholia (d) Voir avec Reasonator[10], un outil qui permet grâce à des requêtes génériques dans Wikidata d'explorer les données de Wikidata relatives aux chercheurs et chercheuses, aux publications scientifiques, aux revues académiques et aux éditeurs scientifiques.

Voici quelques exemples :

Prenez plaisir à contribuerLepticed7 a publié une traduction de l'essai Enjoy yourself.

« Tout le monde devrait le garder à l’esprit tout le temps : prendre du plaisir à contribuer est la clé pour rester actif sur le projet. Si vous ne prenez plus de plaisir à contribuer, faites un pas en arrière et posez-vous des questions sur ce que vous aimez faire. »

Les débuts de Wikifunctions — Le mois dernier, nous avons annoncé le lancement de Wikifunctions. Dans un article publié sur le blog Diff, Denny Vrandečić donne plus de détails. Il définit Wikifunctions comme un espace destiné à créer et maintenir de manière collaborative une bibliothèque de fonctions. Il anticipe qu'elle permettra de générer des phrases, du texte et même des articles entiers. Elle permettra aussi de faire des calculs à partir des données brutes contenues dans Wikidata, comme par exemple calculer l'âge d'une personne à partir de sa date de naissance ou la densité de population à partir de la population et de la superficie d'un territoire.

La première fonction permet de joindre ensemble deux chaînes de caractère : https://www.wikifunctions.org/view/fr/Z10000

D'après Wikiscan, il existe déjà plus de 2 000 fonctions dans Wikifunctions[11].

Revues citées par Wikipédia — Dans The Signpost du 1er août dernier, Headbomb raconte le projet Journals cited by Wikipedia (Revues citées par Wikipédia), une idée née en 2009 qui consiste à compiler des statistiques sur les revues citées dans Wikipédia en anglais en extrayant les valeurs du paramètre journal= dans le modèle Cite journal (équivalent de {{Article}}) et d'autres modèles similaires.

On apprend notamment qu'Elsevier est l'éditeur scientifique le plus cité dans Wikipédia avec 360 000 citations. et Nature la revue la plus citée avec 51 000 citations.

Pourquoi y a-t-il si peu d'administrateurs et d'administratrices dans les wikipédiennes et wikipédiens récents ? — Dans The Signpost, WereSpielChequers s'inquiète du fait que la majorité des administrateurs et administratrices de la Wikipédia en anglais aient commencé à contribuer dans les années 2000. Sur les 881 administratrices et administrateurs, seul 64 ont commencé à contribuer après 2011.

« J'espère que nous pourrons persuader certains Wikipédiens qui ont rejoint la communauté dans les années 2010 de devenir administrateurs ; je suis sûr qu'il y a beaucoup d'entre vous qui passeraient facilement[12]. »

Ce serait intéressant de faire le même exercice sur Wikipédia en français.

Le Wikimédien de l'année — Le prix du wikipédien de l'année a été remis à Tofeiku, un contributeur originaire de Malaisie qui a commencé à contribuer à l'âge de 8 ans. Il s'est beaucoup investi dans le Wiktionnaire en malais (d) Voir avec Reasonator[13]. Le prix Wikimedia est remis à Siobhan Leachman et le prix du nouveau venu au japonais Eugene Ormandy.

La fondation Wikimédia modernise ses modèles d'apprentissage automatique — Depuis 2015, la fondation Wikimédia maintient un ensemble de modèles d'apprentissage automatique et une infrastructure appelés ORES. En tout, ORES comprend 110 modèles d'arbres de décision dans différentes langues qui permettent d'évaluer la qualité d'un article, la qualité d'une modification, la qualité d'un élément et le thème d'un article. Les modèles déployés par la fondation n'éditent pas directement Wikipédia mais permettent d'avertir les contributrices et les contributeurs. Par exemple, le modèle de détection de vandalisme permet de mettre des alertes dans la page modifications récentes de la Wikipédia en anglais.

Pour pouvoir déployer plus facilement une plus grande variété de modèles en passant rapidement à l'échelle, la fondation s'est lancé dans un grand chantier de modernisation de son infrastructure d'apprentissage automatique.

« Dans ce nouveau flux de travail, un ingénieur en apprentissage automatique de l'équipe machine learning travaille avec un créateur de modèle dès le premier jour du projet pour travailler avec lui sur le déploiement du modèle. L'objectif est que le modèle soit déployé dès le premier jour de sa création et à chaque nouvelle itération au cours de son processus de développement afin que les problèmes qui apparaissent en production soient identifiés et résolus dès le début du processus[14]. »

Cette approche du développement de modèles, dite MLOps, nécessite une nouvelle infrastructure qui s'appuie sur le logiciel Kubeflow (d) Voir avec Reasonator. L'infrastructure est divisée en deux parties, Train Wing pour l'entraînement et Lift Wing pour le déploiement. Les modèles déployés sur Lift Wing seront accessibles par API à travers le portail d'API de la fondation[15].

La seconde partie de l'infrastructure, Train Wing, permettra aux ingénieurs de la fondation mais aussi aux chercheurs d'entraîner leurs propres modèles.

Pour améliorer la documentation et la transparence des modèles d'apprentissage automatique, la fondation va mettre en place une documentation des modèles conformes à l'approche model cards développée par Mitchell et al. (2019) (voir l'exemple meta:User:AlgoAccountabilityBot/Enwiki Good Faith Model Card)[16].

8,8 millions d'articles orphelins dans les 319 versions de Wikipédia — Dans « Orphan Articles: The Dark Matter of Wikipedia (d) Voir avec Reasonator », les chercheurs Akhil Arora, Robert West (d) Voir avec Reasonator et Martin Gerlach (d) Voir avec Reasonator (meta:user:MGerlach (WMF)) se penchent sur l'accessibilité des articles et plus précisément sur les articles qui ne sont pas reliés au reste de l'encyclopédie par des liens internes. Ils estiment que sur les 319 versions linguistiques de Wikipédia, 15% (8,8 millions) des articles peuvent être considérés comme orphelins (aucun lien entrant). La Wikipédia en français se distingue avec seulement 1,7% d'articles orphelins (39 960 articles sur 2,363,875)[17]. A l'inverse, il y a très peu d'articles sans lien sortant. Les auteurs n'en trouvent que 300 000, soit 0,5%.

Les auteurs cherchent à caractériser les articles orphelins à travers plusieurs critères (article créé par un bot, article récent, article consacré à une femme, etc). Ils trouvent notamment que les articles consacrés à des femmes sont plus souvent orphelins que les autres. Par exemple, dans la Wikipédia en anglais, 29% des articles biographiques orphelins sont consacrés à des femmes, qui ne représentent pourtant que 19% des articles biographiques en général.

Les auteurs ont développé l'outil Wiki-Visibility pour aider à relier un article orphelin à partir de liens existants dans d'autres versions linguistiques de Wikipédia. Par exemple, pour l'article Ana Montès, Wiki-Visibility suggère d'ajouter un lien depuis Walter Kendall Myers parce que ce lien existe en anglais et en russe[18],[19].

Dans la Wikipédia en français, le Projet:Pages orphelines liste toutes les pages de la catégorie et cette requête petscan liste toutes les biographies de femmes orphelines (à la date du 4 juillet).

En très bref

Le zoom : Wikivoyage en français

Le zoom est une nouvelle rubrique pour faire le point sur un Wikiprojet. Premier de la série : wikivoyage en français.

Wikivoyage en français compte plus de 8 000 pages de contenu, c'est beaucoup moins que Wikivoyage en anglais (31 000 pages) ou en allemand (20 000 pages) mais beaucoup plus que wikivoyage en espagnol (3 000 pages)[21].

Le contenu de Wikivoyage des articles de Wikivoyage est très structuré avec des patrons d'articles très précis et l'utilisation importante de modèles pour structurer l'information comme modèle:Voir ou modèle:Manger. Wikivoyage s'appuie beaucoup sur Wikidata pour ses infobox ou ses bannières.

En juillet 2023, le site totalise 1 million de pages vues en juillet avec 16 utilisateurs actifs (plus de 5 contributions)[22].

En juillet 2023, les 5 articles les plus consultés sont Amérique du Sud, Palma de Majorque, Johannesburg, Europe et Singapour[23].

Le site compte 2 024 articles sur des éléments situés en France, 789 éléments au Canada et 353 en Belgique[24].

Wikivoyage en français comprend 44 articles étoilés (Catégorie:Article étoilé). Parmi ces articles étoilés, 19 concernent des éléments situés en Belgique, 8 en France, 4 au Canada, 4 au Kenya et 3 en Tanzanie (voir la carte)[25].

Événements

Edit-a-thon aux Archives nationales de France.
WikiConvention 2023
Conférence GLAM Wiki

Ailleurs dans le Wikiverse

La page Wikipédia:RAW/Découvrir recense les infolettres et blogs relatifs à Wikimedia.

Courrier du lectorat

(Il nous fera plaisir de lire les messages déposés ici et, si nécessaire, d'y répondre dans les plus brefs délais.)

Bonsoir, je viens de parcourir l'actualité que vous avez rédigé avec soin, j'ai trouvé intéressant la plupart des informations dont vous avez mentionnées, notamment sur la toute première partie avec les graphiques, bravo pour votre travail ! Hibrideacus (discuter) 31 août 2023 à 22:57 (CEST)

Merci beaucoup pour votre commentaire. ça fait plaisir. PAC2 (discuter) 1 septembre 2023 à 06:57 (CEST)

Bonsoir, merci pour cet important travail de mise à disposition de brèves ! À propos des articles orphelins : le projet francophone a fait le choix de considérer comme orphelin un article possédant moins de 3 liens entrants ; par ailleurs, j'ai testé l'outil indiqué, certes sur un échantillon réduit, et il donne les mêmes réponses que ce que propose déjà Dickensbot (voir par exemple : les Articles orphelins depuis février 2021) pourtant circonscrit à trois wikipédias. Ce faisant, la wikipédia francophone comporte un peu plus de 15 000 articles orphelins, en augmentation lente mais constante. Cela vaudrait sans doute le coup de relancer un concours Wiki-maintenance spécial Orphelins, non ?--Cbyd (discuter) 31 août 2023 à 23:33 (CEST)

Oui effectivement la définition d'un article orphelin peut varier. Dans l'article de recherche, ils considèrent les articles avec 0 liens entrants. PAC2 (discuter) 1 septembre 2023 à 07:00 (CEST)

VLOP

« une cinquantaine de bénévoles sont particulièrement vigilants.. » : sait-on qui sont ces 50 bénévoles ? (pas les noms, mais s'ils sont une catégorie d'utilisateurs bien identifiée) En quoi sont-ils plus particulièrement vigilants ? Quelqu'un sait-il ? C'est une phrase intrigante. --Jean-Christophe BENOIST (discuter) 1 septembre 2023 à 08:27 (CEST)

Je suis d'accord avec toi que c'est intriguant. J'ai parcouru la réponse de la fondation à l'ARCOM (https://www.arcom.fr/sites/default/files/2023-07/2023_anglais_Declaration_Fondation-Wikimedia_haine_en_ligne.pdf, question 7, page 3) mais je n'ai pas vu d'élément plus précis. PAC2 (discuter) 1 septembre 2023 à 08:48 (CEST)

Merci

Lecture instructive. Merci pour ce travail. TCY (discuter) 2 septembre 2023 à 10:44 (CEST)

Fort intéressant

Merci pour cette nouvelle édition très intéressante et très complète. Cela permet de faire un bon tour de l'article en général (Fondation, régulation, nouveaux projets, événements, etc...)
Concernant le problème du nombre de nouveaux administrateurs et administratrices, on pourrait effectivement faire une enquête sur Wikipédia en français.
De mon point de vue, c'est un rôle fondamental pour notre communauté... mais qui est aussi assez ingrat car il n'y a que des coups à prendre (à part si on s'occupe uniquement de la maintenance technique et de la lutte contre les vandalismes). Il y a également l'élection communautaire qui peut parfois virer au défouloir dans les avis. Peut-être qu'en modérant mieux les avis lors des élections, chaque candidature serait moins angoissante pour les candidats et candidates.--Pronoia (discuter) 2 septembre 2023 à 10:57 (CEST)


 –
Rédigé/traduit par PAC2
Citations originales
Notes
Références
  1. Repéré via https://mastodon.world/@OpenSexism/110817958836569741
  2. meta:Community_Insights#Languages
  3. https://foundation.wikimedia.org/wiki/Policy:Universal_Code_of_Conduct/fr
  4. Philippe Jacqué et Maria Udrescu, « Numérique : la loi européenne obligeant les géants d’Internet à réguler leurs contenus est entrée en vigueur », Le Monde,‎ (ISSN 1950-6244, lire en ligne).
  5. « Even as gap-closing efforts take place, there is fear that structured data projects like Wikidata are codifying the views, values, and histories of hegemonic communities into artificial intelligence, establishing them as truths in the robot epistemology, and likely trapping people of the Global Majority in laborious knowledge battles to extend into the eras to come. » traduit avec l'aide de DeepL
  6. « In our Wikidata effort, it seems that we are distanced from the outcomes of our labor. », traduit avec l'assistance de DeepL
  7. « If we don’t engage with these peer-production knowledge platforms, our histories, ideas, knowings, get left behind and the erasure continues. When we do, it profits far away multinationals with clandestine workings, bottomless pockets, and unchecked power over peoples’ lives and livelihoods. » traduit avec DeepL
  8. Finn Årup Nielsen (d) Voir avec Reasonator Synia: Displaying data from Wikibases (d) Voir avec Reasonator, https://arxiv.org/abs/2303.15133
  9. Découvert via le compte Mastodon de fnielsen : https://fosstodon.org/@fnielsen/110791751465369139
  10. https://scholia.toolforge.org/
  11. https://wikifunctions.wikiscan.org/ consulté le 28 août
  12. « My hope is that we can persuade some Wikipedians who joined the community in the 2010s to become admins; I'm sure there are many of you who would pass easily. »
  13. Découvert via https://wikis.world/@wikipedia/110900708319266865 et https://tech.lgbt/@wmlgbt/110898976230542024
  14. « In this new workflow, a machine learning engineer from the Machine Learning team works with a model creator from the first day of the project to work with them on model deployment. The goal is that the model is deployed on the first day it is created and at every new iteration during its development process so that issues that appear in production are identified and resolved early in the model creation process. »
  15. https://api.wikimedia.org/wiki/Lift_Wing_API
  16. (en) Margaret Mitchell, Simone Wu, Andrew Zaldivar, Parker Barnes, Lucy Vasserman, Ben Hutchinson, Elena Spitzer, Inioluwa Deborah Raji et Timnit Gebru, « Model Cards for Model Reporting », FAT* '19: Proceedings of the Conference on Fairness, Accountability, and Transparency,‎ (ISBN 978-1-4503-6125-5, DOI 10.1145/3287560.3287596, arXiv 1810.03993)Voir et modifier les données sur Wikidata
  17. meta:Research:Recommending links to increase visibility of articles/Link-translation
  18. https://linkrec.toolforge.org/
  19. Pour les utilisateurs de l'interface web mobile, le lien vers l'outil est intégré à Chouette.js
  20. Voir l'annonce : en:Wikipedia:Wikipedia Signpost/2023-08-31/From the editor
  21. https://www.wikivoyage.org/
  22. https://stats.wikimedia.org/#/fr.wikivoyage.org
  23. https://pageviews.wmcloud.org/topviews/?project=fr.wikivoyage.org&platform=all-access&date=last-month&excludes=
  24. Requête SPARQL : https://w.wiki/7GXf
  25. https://w.wiki/7GYT
  26. https://www.wikimedia.fr/inscrivez-vous-au-mooc-wikidata/ découvert via Projet:Wikifier la science/Infolettre/Août 2023

Sir Amugi, CC BY-SA 4.0 via Wikimedia Commons [traduit de l’anglais] Au milieu de défis environnementaux pressants, un événement remarquable s’est déroulé sur deux jours : la Wiki Green Conference 2023. Ce rassemblement inspirant, fièrement parrainé par la Wikimedia Foundation, a réuni des défenseurs passionnés, des experts de l’environnement et des bénévoles dévoués de Wikimedia […]

L’article Wiki Green Conférence 2023 : mettre les projets Wikimédia au service de la lutte contre le changement climatique est apparu en premier sur Wikimédia France.

C’est quoi le Wikiconcours ?

Monday, 31 July 2023 15:37 UTC

Avez-vous déjà entendu parler des Wikiconcours ? Le wikiconcours est un concours de rédaction collaboratif qui existe depuis 2006. L’objectif du concours est d’améliorer la qualité des articles de l’encyclopédie. Il y a habituellement deux éditions par an,  une au printemps et une autre en automne. Elles durent entre 15 jours et 2 mois. Sélection […]

L’article C’est quoi le Wikiconcours ? est apparu en premier sur Wikimédia France.

Vous avez envie d’apprendre à contribuer sur la plus grande base de connaissances libre du monde ? Les inscriptions au MOOC Wikidata ouvriront le 1er septembre et vous pourrez ensuite suivre le MOOC du 23 septembre au 31 décembre 2023. Au programme, un MOOC gratuit de 19 vidéos d’environ 1h15. Suivez la formation à votre […]

L’article Inscription au MOOC Wikidata : 1h15 pour apprendre à contribuer est apparu en premier sur Wikimédia France.

Du vendredi 7 au dimanche 9 juillet, plus de 60 bénévoles se sont retrouvés pour la 3ème édition du Wikicamp à Narbonne. Au programme de nombreux ateliers, des temps d’échanges sur l’engagement bénévole, la découverte du patrimoine local et aussi une wikicérémonie avec une remise de prix. Le Wikicamp : apprendre à se connaître en dehors […]

L’article Wikicamp 2023 à Narbonne : un temps de rencontres et d’échanges est apparu en premier sur Wikimédia France.

Et si vous vous serviez des articles Wikipédia pour faire du tourisme ? C’est le pari de la société Bivilink qui a développé l’application Wikiway avec le soutien de l’association Wikimédia France. Cette application open source et gratuite permet de découvrir, grâce aux articles de Wikipédia, des lieux autour de vous, en France ou à […]

L’article Wikiway : l’application pour faire du tourisme grâce à Wikipédia est apparu en premier sur Wikimédia France.

Le mardi 25 avril 2023 a été un jour important dans l’histoire de Wikipédia : la Commission européenne a désigné Wikipédia comme une “Very Large Online Platform” (VLOP) en vertu de la nouvelle loi sur les services numériques (EU DSA). La désignation VLOP, n’est pas basée sur leur risque intrinsèque, mais plutôt sur la taille […]

L’article Wikipédia est désormais un VLOP : quelles conséquences sur les Wikimédiens et les lecteurs ? est apparu en premier sur Wikimédia France.

Des pages vandalisées par des internautes malintentionnés, des articles publicitaires qui ne respectent pas la neutralité de Wikipédia, des demandes de modification ou restauration de pages, les bénévoles qui maintiennent l’encyclopédie Wikipédia peuvent vite s’épuiser. Quelles sont les solutions pour protéger les bénévoles face au syndrome de l’épuisement ? En avril dernier, l’admin conférence a […]

L’article Comment Wikimédia France lutte contre le syndrome d’épuisement des bénévoles ? est apparu en premier sur Wikimédia France.

Mardi 25 avril 2023 s’est déroulée la 4ème édition de la “Journée Wikimedia Culture et numérique” organisée par l’association Wikimédia France à l’Institut national d’histoire de l’art (INHA) en partenariat avec le Club Innovation & Culture CLIC et les Archives nationales.Chaque année, cette journée propose aux professionnels de la culture un moment d’échange et de […]

L’article Communiqué de presse : 16 institutions culturelles françaises obtiennent le Label Culture Libre est apparu en premier sur Wikimédia France.

En mai, fais ce qu’il te plaît ! Wikimédia France organise ou participe à différents évènements au mois de mai : des ateliers de contribution à Wikipédia, conférence sur le commun des numériques, atelier #1lib1ref, éditathon. Il y a bien un évènement fait pour vous ? Atelier histoire, cinéma, Bretagne, Vikidia et botanique Envie de […]

L’article Agenda du mois de mai 2023 de Wikimédia France est apparu en premier sur Wikimédia France.

La 3ème édition de l’évènement ContribuLing, aura lieu vendredi 12 mai à l’Institut National des Langues et Civilisations Orientales (INALCO) de 9h00 à 19h00 et en ligne (sur ZOOM). Depuis 3 ans, cet évènement réunit chaque année des chercheurs, étudiants ou contributeurs intéressés par la documentation des langues minoritaires autour des outils de collaboration libres. […]

L’article ContribuLing : l’évènement des outils numériques libres au service des langues minoritaires est apparu en premier sur Wikimédia France.

33 millions de fichiers sur Commons, et après ?

Saturday, 25 March 2023 10:46 UTC

Wikimedia Commons, c’est 33 millions de fichiers. Beaucoup de ressources sont consacrées à augmenter ce nombre : contributeurs prenant de nombreuses photos, développement d’outils de versement automatique depuis Flickr, financement d’appareils-photos, studios et déplacements, organisation de concours avec prix (Wiki Loves Africa, Wiki Loves Earth, Wiki Loves Monuments) ou non (Wiki Takes, Opérations Libres), partenariats de versement des collections d’institutions culturelles, etc.

Je crois que Wikimedia Commons est un projet à part entière et plus un simple dépôt commun aux différentes versions linguistiques de Wikipédia (et ses projets-frères). Toutefois, en l’état actuel de la navigation est assez pauvre. Le plus simple pour trouver une image est de passer par une recherche Google plutôt que par l’outil de recherche interne, et l’arborescence des catégories est parfois obscure dans sa logique, sans compter qu’elle est multilingue au mauvais sens du terme : à tout moment, vous pouvez tomber dans une sous-catégorie dans une langue que vous ne maîtrisez pas. S’il est, je crois, urgent de réfléchir et implémenter une vraie navigation dans Commons (via la vraie gestion du multilingue, la possibilité d’afficher à la fois les images d’une catégorie et de ses sous-catégories, etc), en attendant, la meilleure manière de valoriser les fichiers de Commons est encore de les utiliser dans les autres projets Wikimedia.

La réflexion autour de ce sujet est encore balbutiante. Les global metrics n’intègrent que « nombre de fichiers réutilisés », ne faisant pas la différence entre un fichier utilisé une fois et une centaine de fois. La plupart des rapports d’activité (FDC, This Month in GLAM, billets de blog) ne comptent que le nombre de fichiers versés, sans regarder le reste.

Très peu d’actions existent en faveur de la valorisation des fichiers de Commons :

  • les nombreux outils de réutilisation de l’image du jour comme fond d’écran
  • les edit-a-thons ont parfois un volet « photographie et illustration », mais cela se limite aux nouveaux fichiers, pas au fond existant
  • certains programmes avec versement de fichiers veillent à l’aspect internationalisation avec des métadonnées au moins traduites en anglais
  • de nombreux versements (mais pas tous !) de collections institutionnelles inclus un travail préparatoire ou a posteriori de catégorisation des fichiers, mais assez peu de réflexion existe sur leur réutilisation
  • un atelier spécifiquement dédié à l’illustration d’articles Wikipédia grâce à un versement
  • des outils permettant de suggérer des fichiers à utiliser dans une version linguistique de Wikipédia basé sur leurs utilisations dans une autre langue

Que pourrait-on faire de plus pour mieux valoriser ces fichiers ? Quels sont les manques (outils, information, temps) qui nous manquent ?

Wikipédia a 15 ans

Thursday, 16 February 2023 12:14 UTC

Vous en avez sans doute entendu parler. Cet événement est l’occasion de revenir sur quelques usages de Wikipédia… en lui souhaitant un très joyeux anniversaire !

dm_009_wikipedia_a_15_ans

Crédit : Simon Gee Giraudot (Creative Commons By-Sa)

Action politique et biens communs en Catalogne

Tuesday, 14 February 2023 15:29 UTC

Le mois dernier, les médias ont abondamment montré et commenté la victoire électorale des militants de la mouvance «  Indignés  ». Ils ont en revanche plus parcimonieusement évoqué le programme, l’esprit et les convictions des responsables qui vont bientôt être aux commandes de Barcelone.
Le témoignage de l’universitaire Mayo Fuster Morell suggère que les valeurs et les pratiques du Libre ne sont pas étrangères à cette victoire, ce qui pourrait — rêvons un peu — servir d’exemple à d’autres pays européens confrontés à l’austérité. Ce relatif investissement du Libre dans le champ de la politique a de quoi nous réjouir  : voilà longtemps que le Libre n’est pas seulement du code ou de l’art. Culture et objets libres gagnent aussi du terrain désormais. À Barcelone, on en est peut-être au libre citoyen.

Les communs à la conquête de Barcelone  !

Une victoire de David sur Goliath

Par Mayo Fuster Morell
Article original  : http://www.onlinecreation.info/archives/1135
Traduction Framalang  : Piup, Obny, sebastienc, line, goofy, r0u

mayoFustellLe 24 mai, les candidats de la liste «  Barcelone en commun  » (Barcelona en Comú) ont remporté les élections municipales en réunissant sur leur nom un quart des suffrages exprimés. «  Maintenant Madrid  », une candidature aussi liée à l’éthique des communs, est devenue une force clé pour la gouvernance de la ville de Madrid. Ce ne sont que deux des nombreuses surprises survenues hier lors des élections municipales et régionales en Espagne. Ces villes pourraient donner le signal d’un changement politique plus vaste. Les résultats électoraux ont ouvert la voie à un scénario optimiste pour une chance de victoire aux élections nationales à la fin de cette année, ou même à un mandat plus ambitieux encore, une coalition européenne des pays du Sud contre l’austérité.

Irruption de candidatures citoyennes

Le Parti populaire et le Parti socialiste restent les principaux partis politiques, comme c’est le cas depuis la transition démocratique de la fin des années 70, mais le pouvoir politique habituel a encaissé une grosse claque. La part de ces deux formations a chuté de 65 % lors des précédentes élections il y a 4 ans à 52 % au niveau national. Le renouvellement ou plutôt le changement des forces politiques en présence a été provoqué […] par la création de nouveaux partis  : tel est le cas pour les «  Citoyens  », qui se sont imposés avec force comme un nouveau protagoniste de poids dans la vie politique. Cette irruption des candidatures citoyennes a été aussi impressionnante que rapide. Elle a contribué à l’augmentation d’au moins 5 points de la participation au scrutin.

Seulement quatre ans après que les Indignés du mouvement du 15 mai se sont mobilisés pour «  une vraie démocratie maintenant  » en opposition aux hommes politiques «  qui ne nous représentent pas  » et à la «  dictature des marchés  », l’impact de leur mouvement est désormais si visible qu’il ne peut plus être démenti. Les listes de candidature sont pleines de personnes venant du réseau des mouvements sociaux. Pour en donner une idée, Ada Colau, militante connue pour ses actions contre l’expulsion des activistes et des squatters va être le prochain maire de Barcelone. C’est l’ironie de l’Histoire  : une militante anti-expulsion «  expulse  » les politiciens traditionnels de la mairie. Si l’on regarde la trajectoire des leaders du mouvement, on peut également dire que le cycle a démarré avec le mouvement anti-mondialisation (l’origine de Colau ou de Pablo Iglesias, le leader de Podemos/Yes we can), mais qu’il a réussi à mobiliser une fois encore la génération qui s’est battue contre le régime de Franco pour ramener la démocratie en Espagne (c’est de là que vient Manuela Carmena de «  Madrid maintenant  », une juge en retraite et très probable future maire de Madrid).

En ce qui concerne leurs programmes, la première chose à souligner est la place centrale réservée aux plans d’urgence pour secourir les citoyens qui étouffent sous les politiques d’austérité, tels que la mise en œuvre de différentes variantes d’un revenu de base, et la révision de la privatisation des services publics. Un code d’éthique existe pour contrôler les personnels politique en ce qui concerne la transparence, la fin de leurs privilèges (par ex. une limitation des indemnités à 29 000 € par an) et leur engagement à soutenir les initiatives citoyennes.

Au-delà du poids politique, c’est fascinant d’un point de vue organisationnel. En moins d’un an et sans aucun lien avec les mondes politique, économique, judiciaire ni avec le pouvoir médiatique existant, des citoyens ordinaires joignant leurs forces ont été capables de conquérir des positions importantes dans le système politique. Une victoire de David contre Goliath. Pour cela, ils ont associé le financement participatif, les programmes collaboratifs, les assemblées de voisinage, et le vote en ligne. Ils ont aussi, comme le leader de Podemos, bâti leur succès sur la popularité obtenue par leur propre programme télé.

Que disait la chanson  ? «  Prenons d’abord Barcelone, puis nous prendrons Manhattan ?  » En effet, certains travaillent là-dessus. Une délégation d’activistes de New-York a parcouru l’Espagne pendant la campagne afin d’apprendre de cette expérience et «  d’exporter  » un tel soulèvement du peuple dans leurs propres villes. Il y a de nombreuses leçons et idées à en tirer. Voici quelques sources d’inspiration que je vous suggère d’envisager, pour démarrer un processus similaire dans d’autres pays.

L’effet CC

Un des combats citoyens (surtout chez les jeunes) qui a précédé et ensuite nourri le mouvement du 15 mai a vu le jour en réaction contre une loi imposée par le gouvernement, réprimant le partage en ligne et la culture libre (Loi Sinde de décembre 2010). Dans une large mesure, ce mouvement de culture collaborative sur le Web a réagi comme le fit Lessig en 2008, qui est passé des «  Creative Commons  » à «  Change Congress  » («  Changeons le Congrès  ») . Au départ concentré sur les politiques sectorielles en lien avec la propriété intellectuelle et la régulation d’Internet, il a évolué pour appréhender le fait que défendre ces libertés est nécessaire pour transformer le système politique dans son ensemble. Au cours de cette évolution, les modèles de la culture libre et du travail collaboratif sont devenus une voie à suivre pour organiser la protestation politique.

[…]

En somme, les secteurs ayant de l’expertise dans les méthodes de co-création et coopérant grâce aux ressources en ligne ont un grand potentiel politique.

 

Le modèle «  d’innovation cachée  » de Wikipédia

Même s’il existe de grandes innovations dans les structures, il faut que le discours soit «  simple  » voire «  strict  ». Mako Hill a étudié comment Wikipédia a pu réussir en 2001 alors que d’autres tentatives de création d’encyclopédie en ligne avaient échoué. Une de ses conclusions est que Wikipédia a adopté un concept très simple à comprendre, tout en étant très innovant dans son fonctionnement. Il s’est fermement accroché à la notion traditionnelle d’encyclopédie  : une idée vieille de plusieurs siècles qui est simple à comprendre. De la même façon, on peut dire la même chose ici. Le discours qui a pu faire grossir les votes en faveur d’un profond changement politique en Espagne n’est ni avant-gardiste ni particulièrement innovant, mais il est populaire, compréhensible par chacun et relié aux besoins fondamentaux. Quelques points se rapprochent de la démocratie radicale proche de Laclau et Mouffe. C’est un «  combat  » de bon sens, pour obtenir une hégémonie. Pendant ce temps, des modèles plus avant-gardistes, comme les nouveaux partis ayant un discours «  innovant  » et une identité sur Internet tels le Parti pirate ou le Parti X, sont pertinents en terme de conception d’organisation mais ne parviennent pas à mobiliser les votes du grand public (aux dernières élections européennes, le parti X a recueilli 0,64 % des voix). En somme, il faut des méthodes innovantes associées à un discours pour le peuple, en lien avec un programme portant sur les besoins fondamentaux.

La base et le sommet

Ces principes d’organisation ne sont ni du sommet vers la base, ni de la base vers le sommet, ils sont «  de la base et du sommet  ». Pour être plus précis  : «  un sommet facilement identifiable travaillant pour une base disséminée  ». Ces forces s’appuient sur des leaders forts, mais aussi sur le développement d’une base collaborative et libre d’agir. Un concept-clé est le «  débordement  ». Il se réfère à la capacité de perdre le contrôle du processus, et à la liberté d’agir laissée à ceux qui s’engagent dans le processus. L’augmentation de la créativité des actions et des soutiens hors du contrôle du «  parti  » semble être un des points pertinents dans le succès de ces méthodes (c’est le cas pour le mouvement de création graphique autour des candidatures). De plus, il n’existe pas de frontière précise entre qui est membre du «  parti  » et qui ne l’est pas, il n’y a pas de rituels pour dire qui est dedans et qui n’y est pas, c’est l’implication personnelle au travers de l’action qui permet d’être membre. Les leaders ont tout de même une présence forte, leurs visages sont devenus des symboles-clé du processus (c’est-à-dire que sur le bulletin de vote ne figure pas le logo du parti mais la photo du leader). Des symboles visuels sur un Internet visuel mais, même avec Internet, la télévision reste toujours un moyen-clé de communication. En particulier, l’association des leaders et de la télévision est un moyen-clé de communication vers les milieux populaires, ceux qui ne sont pas touchés par les mouvements sociaux de la classe moyenne relayés par Internet. La crédibilité des leaders se construit sur leur capacité à communiquer et sur un engagement social de longue date. Les candidatures féminines – peu importe leur âge – (les femmes sont en tête de liste dans des villes comme Barcelone, Madrid et Valence) ont une plus grande capacité à augmenter les votes car elles transmettent l’idée de changement et dirigent de façon plus démocratique. Comme le dit le prochain maire de Barcelone, Ada Colau (une Zapatiste d’origine)  : «  conduite par l’obéissance aux ordres du peuple  ». La position du leader est construite «  pour  » la base et non «  au-dessus  » d’elle. En somme, un leader social et très reconnaissable, mais une participation disséminée et non contrôlée.

Une fois encore, ce ne sont que trois visions «  impressionnistes  » du processus d’émancipation du peuple en Espagne. Il reste encore beaucoup à venir. 2015 est l’année du changement, cela continuera donc. En attendant, il est temps de fêter cela. Je vous laisse avec la rumba «  run run  » chantée par le prochain maire de Barcelone  :

defendreBienCommun
Ci-dessus, Ada Colau, dans un clip de campagne très joyeux. Le refrain de la rumba dit  : «  défendre le bien commun  ». Pour voir et entendre la vidéo sur YouTube  : https://www.youtube.com/watch?v=wB6NDWKDyKg

 

Ce texte est diffusé avec la licence d’origine  : CC BY-NC-SA 2.5 IT

Menaces sur les œuvres du domaine public

Tuesday, 14 February 2023 15:27 UTC

La numérisation des collections patrimoniales des musées devrait constituer une chance pour la diffusion de la culture. Trop souvent hélas, ce n’est pas le cas, à cause du copyfraud auquel se livrent les institutions. Comme l’a dit très justement Pier-Carl Langlais, le copyfraud est l’inverse du piratage : une revendication abusive de droits sur le domaine public pour en restreindre la réutilisation.

Les exemples de copyfraud ne manquaient déjà pas, mais le Reiss Engelhorn Museum de Mannheim en Allemagne a franchi cette semaine une ligne rouge en la matière. L’établissement a en effet décidé d’attaquer en justice la Wikimedia Foundation et Wikimedia Deuschland, pour la diffusion de 17 images d’œuvres du domaine public sur Wikimedia Commons. Depuis 2008, la Wikimedia Foundation a défini une position très claire à propos du copyfraud, en indiquant qu’elle ne reconnaissait pas la légitimité des restrictions rajoutées sur la réutilisation d’images en deux dimensions d’œuvres du domaine public. L’année suivante, une alerte sérieuse s’était produite lorsque le wikimédien Derrick Coetzee avait téléversé sur Wikimedia Commons plusieurs milliers d’images extraites du site de la National Portrait Gallery de Londres. Son geste dénonçait le fait qu’elle portait un copyright alors qu’elles correspondaient à des œuvres du domaine public . La National Portait Gallery avait alors agité la menace d’un procès, sans la mettre à exécution à la différence cette fois du musée Reiss Engelhorn.

Si l’on peut déplorer un tel comportement de la part d’une institution patrimoniale, ce sera peut-être aussi l’occasion pour un tribunal de se prononcer sur la légalité des pratiques de copyfraud. Comme le dit la fondation Wikimedia dans sa réponse au musée, la reproduction fidèle de tableaux ne crée pas une « nouvelle œuvre » et il est improbable que ces photographies satisfassent au critère de l’originalité, impliquant que le créateur imprime « l’empreinte de sa personnalité » dans son œuvre pour bénéficier d’une protection.

En France également, nombreux sont les établissements culturels se livrant à des pratiques de copyfraud. Le site Images d’art, lancé récemment par la Réunion des Musées Nationaux, comporte plus de 500 000 œuvres numérisées provenant de nombreux musées français. Mais toutes ces images portent le copyright du photographe les ayant réalisées, ce qui en interdit la réutilisation. Quelques institutions choisissent pourtant au contraire de diffuser librement leurs images et certaines comme le Musée des Augustins à Toulouse ou le Musée des Beaux Arts de Lyon ont engagé des partenariats avec Wikimedia France pour diffuser leurs images sur Wikipédia . Mais elles restent encore minoritaires.

Le plus inquiétant, c’est que la loi française risque bientôt d’évoluer pour légaliser les pratiques de copyfraud. Le recours au droit d’auteur par le musée Reiss Engelhorn reste juridiquement très fragile et la fondation Wikimédia peut encore affronter un procès avec des chances sérieuses de l’emporter. Mais la loi Valter, actuellement en cours d’adoption, s’apprête à consacrer la possibilité pour les établissements culturels de fixer des redevances de réutilisation sur les reproductions d’œuvres qu’elles produisent — y compris à partir des œuvres du domaine public —  en les assimilant à des données publiques.

Là où devant la justice allemande, on peut encore revendiquer le droit de réutiliser le domaine public librement, ce ne sera peut-être bientôt plus possible en France.

Lionel Maurel (Calimaq)

*  *  *  *  *

Wikimedia Foundation et Wikimedia Deutschland invitent instamment le musée Reiss Engelhorn à abandonner ses poursuites concernant des œuvres d’art du domaine public.

source : cet article du blog de Wikimedia
Traduction Framalang : KoS, goofy, Bromind, sebastien, r0u

Le 28 octobre, le musée Reiss Engelhorn de Mannheim, en Allemagne, a intenté un procès à la Wikimedia Foundation et ensuite à Wikimedia Deutschland, la branche allemande du mouvement international Wikimedia. L’objet en est une plainte pour copyright concernant 17 images d’œuvres d’art du musée qui relèvent du domaine public et qui ont été mises en ligne sur Wikimedia Commons. Wikimedia Foundation et Wikimedia Deutschland examinent la plainte et feront une réponse commune avant l’échéance fixée en décembre.

La Wikimedia Foundation et Wikimedia Deutschland maintiennent fermement leur engagement à rendre les œuvres publiques gratuites et libres d’accès. Les institutions publiques telles que les galeries et musées ont la même mission, et ont été des alliées historiques pour rendre accessibles à tous les connaissances du monde entier. Avec ce procès, le musée Reiss Engelhorn limite l’accès public à d’importantes œuvres culturelles qui seraient inaccessibles autrement pour le reste du monde.

Les peintures, portraits et autres œuvres d’art concernés par ce procès sont exposés au sein du musée Reiss Engelhorn, mais sont déjà présents dans le domaine public. Quoi qu’il en soit, la loi allemande sur le droit d’auteur peut s’appliquer aux photographies des œuvres qui appartiennent au domaine public, selon différents critères incluant l’artiste créateur de l’œuvre lui-même, la compétence et les efforts qui ont été mis dans la photographie, la créativité et l’originalité, et enfin l’art en tant que tel. Le musée Reiss Engelhorn prétend que ces images sont soumises au droit d’auteur car le musée a rémunéré le photographe qui a pris certaines d’entre elles, ce qui lui a demandé du temps, de la compétence et des efforts pour les prendre. Le Musée Reiss Engelhorn affirme encore que, à  cause de ce droit d’auteur, les images des œuvres d’art ne peuvent pas être partagées au travers des Wikimedia Commons.

635px-Hendrick_Goltzius_Cadmus_Statens_Museum_for_Kunst_1183Les œuvres du domaine public affrontant l’hydre du droit d’auteur (allégorie)

(Hendrick Goltzius, Cadmus (Statens Museum for Kunst). Licence Domaine public via Commons)

La Wikimedia Foundation et Wikimedia Deutschland estiment que le point de vue du musée Reiss Engelhorn est erroné. Les lois sur le droit d’auteur ne doivent pas être utilisées à mauvais escient dans le but de contrôler la dissémination d’œuvres d’art appartenant au domaine public depuis longtemps, telles que les peintures exposées au musée Reiss Engelhorn. Le but du droit d’auteur est de récompenser la créativité et l’originalité, et non de créer de nouveaux droits limitant le partage en ligne d’images d’œuvres du domaine public. De plus, même si la loi allemande accorde quelques droits sur ces images, nous pensons qu’utiliser ces droits dans le but d’empêcher le partage des travaux du domaine public va à l’encontre de la mission du musée Reiss Engelhorn et de la ville de Mannheim et appauvrit l’héritage culturel mondial.

De nombreuses institutions se sont donné pour mission de rendre leurs collections le plus accessible possible pour le monde entier. En octobre, le musée des Arts et Métiers d’Hambourg, en Allemagne, a rendu sa collection accessible librement en ligne. Le Rijksmuseum d’Amsterdam a fourni un accès en ligne à toutes ses peintures, y compris la possibilité de les télécharger et d’utiliser les reproductions sous licence domaine public CC0. Au Danemark, SMK (Statens Museum for Kunst, la Galerie Nationale du Danemark) a rendu publiques ses images et vidéos numériques sous la licence CC-BY. La British Library [N.d.T : Bibliothèque de Grande-Bretagne, équivalent de la BNF] et le Japan Center for Asian Historical Records [N.d.T : le Centre japonais d’archives historiques asiatiques] ont conjointement libéré plus de 200 gravures japonaises et chinoises dans le domaine public.
Ces institutions culturelles conservent les valeurs du domaine public et protègent le droit de prendre part à notre héritage culturel. La tentative du musée Reiss Engelhorn de créer un nouveau copyright dans le domaine public va à l’encontre des principes européens sur le domaine public.

soldatsFrançaisL’armée française part en campagne contre le copyfraud

(image issue du catalogue en ligne de The British Library, aucune restriction de droit d’auteur connue – Voir tous les détails)

Dans un communiqué du 11 août 2008, la Commission européenne a écrit : « il faut souligner qu’il est essentiel que les œuvres qui sont dans le domaine public restent accessibles après un changement de format. En d’autres termes, les œuvres qui sont dans le domaine public devraient y rester une fois numérisées et être rendues accessibles par Internet ». Cela a été renforcé par la charte d’Europeana de 2010 qui stipule : « Aucun autre droit sur la propriété intellectuelle ne doit être utilisé pour rétablir une exclusivité sur des matériaux du domaine public. Le domaine public fait partie intégrante de l’équilibre interne du système de droit d’auteur. Cet équilibre interne ne doit pas être rompu par des tentatives pour obtenir ou rétablir un contrôle exclusif via des règles extérieures au droit d’auteur. »

Ces dernières années, le mouvement Wikimédia a bénéficié de partenariats fructueux avec des musées et des galeries à travers le monde grâce à l’initiative GLAM-Wiki, qui aide des institutions culturelles à partager leurs ressources avec le monde entier par le biais de projets de collaboration avec des éditeurs expérimentés de Wikipédia. Ces partenariats ont permis à des millions de personnes de découvrir et d’apprécier des collections situées dans des endroits qu’ils ne pourront jamais visiter. Wikimédia Deutschland, seule, a travaillé avec plus de 30 musées en Allemagne pour rendre leurs collections accessibles gratuitement à n’importe qui n’importe où, au travers des projets Wikimédia. Ces partenariats font partie d’un effort indispensable qui permet aux institutions culturelles et à Wikimédia d’accomplir leur mission de libération de la connaissance et de partage de la culture.

Partout dans le monde des gens utilisent Wikipédia pour découvrir et comprendre le monde qui les entoure. Grâce à Internet, de nombreux obstacles traditionnels à la connaissance et à l’apprentissage ont disparu. Refuser l’accès en ligne à des images du domaine public empêche les gens d’explorer et de partager notre patrimoine culturel mondial. Nous exhortons le musée Reiss Engelhorn à reconsidérer sa position et à travailler avec la communauté Wikimédia pour rendre encore plus accessibles leurs œuvres élevées dans le domaine public.

Michelle Paulson, Legal Director
Geoff Brigham, General Counsel
Wikimedia Foundation

Plus de 15 articles en deux mois et demi pour vous décrire nos actions, et nous avons encore une petite surprise pour vous !

Cet article fait partie des « Carnets de voyage de Contributopia ». D’octobre à décembre 2019, nous y ferons le bilan des nombreuses actions que nous menons, lesquelles sont financées par vos dons (qui peuvent donner lieu à une réduction d’impôts pour les contribuables français). Si vous le pouvez, pensez à nous soutenir.

Dernier interlude « Nos actions sont financées par vos dons »

Les carnets de voyages de Contributopia sont aussi bien une campagne d’informations qu’une campagne de dons. Nous venons de publier une quinzaine d’articles en moins de deux mois pour faire le bilan de deux années à suivre la feuille de route Contributopia. C’est à la fois pour vous dire « voici ce que nous avons fait grâce à vos dons » mais aussi pour vous faire comprendre que « si vous voulez que nous poursuivions nos actions, nous avons besoin de dons ».

Cliquez pour découvrir la page des Carnets de Contributopia, et sa carte qui s’adapte à votre écran… (par David Revoy)

 

Alors voilà, c’est notre dernier moment « pub » de l’année ! Avant que d’aller boire avec la modération qui vous sied, d’aller demander si ce bisou sous le gui est consenti, et surtout avant d’aller dire au revoir à 2019… Nous voulions – une dernière fois – rappeler aux contribuables français qu’il ne leur reste plus que quelques heures pour faire un don à Framasoft qui soit défiscalisable en 2019 ! Car même avec le prélèvement à la source, un don de 100 € à Framasoft revient, après déduction à 34 €. Vous connaissez le chemin pour nous soutenir : c’est là.

Des carnets magnifiquement illustrés

Ces Carnets de voyage de Contributopia n’auraient pas été les mêmes sans le travail, l’enthousiasme et le talent de David Revoy, qui a de nouveau accepté de les illustrer pour nous. Il a commencé cette nouvelle prestation en nous posant une question simple : quelle est la contrainte ? Nous voulions une espèce de carte aux trésors, de carte de jeu vidéo, à afficher sur une page web. Mais aujourd’hui, une page web peut aussi bien être vue sur un écran 4K, une tablette ou un ordiphone tout en longueur…

– Tu peux nous faire une carte responsive ? Ça te va, comme contrainte, David ?

– Chiche !

Allez, franchement, avouez : est-ce que vous aviez remarqué que la carte des Carnets de Voyage de Contributopia peut s’afficher tout en longueur, tout en hauteur, ou dans un joli rectangle proportionné… ? Allez tester, pour voir : c’est bluffant !

Surprise : ces carnets vous appartiennent

David Revoy est connu comme un artiste libriste : il contribue à Krita, a travaillé avec la Blender Fondation, et son web-comic Pepper & Carrott est publié sous licence CC-By. Il est donc logique que les quatre panneaux de la carte retraçant nos Carnets de Voyage, ainsi que les 15 œuvres illustrant les 15 pages de nos carnets soient sous la même licence !

La surprise, c’est que chacune de ces illustrations a été ajoutée en contribution à Wikimédia Commons, le commun créé par la Wikimedia Fondation pour rassembler les œuvres libres.

Cliquez sur ces joyeux drilles pour retrouver l’ensemble des illustrations des Carnets de Voyage de Contributopia sur Wikimedia Commons

 

Il sera donc tout facile de les retrouver pour les utiliser, les modifier et les diffuser… Et pour les personnes qui veulent les étudier, aller bidouiller les calques, etc., les fichiers source de ces illustrations (créées avec le logiciel libre Krita) sont à votre disposition sur le site de David Revoy !

Belle année 2020 à vous

« Contributopia » n’est pas qu’un joli mot mettant dans une même valise nos désirs d’Utopies et de Contribution. Nous venons de montrer, dans ces Carnets de Voyages, que c’est aussi un ensemble d’actions, de réflexions, et de liens que nous tissons.

Nous espérons que ces partages vous ont plu, en tous cas vos retours nous ont souvent fait chaud au cœur, et remplis de l’envie de faire au moins aussi bien en 2020 !

Nous vous souhaitons, avec quelques heures d’avance, une année 2020 riche de contributions, d’utopies et d’émancipations.

— Les membres de l’association Framasoft.

Illustrration de David Revoy Le jeu de méracartes vu par David Revoy

Rendez-vous sur la page des Carnets de Contributopia pour y découvrir d’autres articles, d’autres actions que nous avons menées grâce à vos dons. Si ce que vous venez de lire vous plaît, pensez à soutenir notre association, qui ne vit que par vos dons. Framasoft étant reconnue d’intérêt général, un don de 100 € d’un contribuable français reviendra, après déduction, à 34 €.

Soutenir Framasoft

Illustration d’entête : CC-By David Revoy

Retour sur le premier Confin’atelier

Tuesday, 14 February 2023 11:36 UTC

Le samedi 25 avril dernier s’est tenu le premier Confin’atelier, premier Contribatelier en ligne, et ça a été un succès. Afin de valoriser cette belle initiative, nous republions ici le compte-rendu publié sur https://contribateliers.org/ et nous sommes ravi⋅es de vous annoncer qu’un second opus est en préparation ! La date est même fixée : ce sera le samedi 6 juin 2020 de 14h à 17h.

Alors qu’est-ce qu’on a fait pendant ce Confin’atelier, premier Contribatelier en ligne, et qu’est-ce qu’on en retient ? Plein de choses ! Allez on y va, on commence par le global et on détaillera pôle par pôle ;-). Ready ? Go !

Globalement

Déjà les chiffres qui nous réchauffent le cœur : plus 80 participant·es, 11 salons en simultané (10 salons pour les pôles et 1 pour l’accueil), 13 animateur·rices, plus de 3 heures de Confin’atelier : Wouhou ! On ne s’était pas fixé d’objectifs à atteindre mais même si ç’avait été le cas, on est plus que largement satisfait·es !

Autre chose notable : aucun souci rencontré concernant la technique. C’était un peu la crainte, qu’il y ait beaucoup de participant·es et que l’instance Big Blue Button de FAImaison soit surchargée. On avait même prévu un plan B si besoin, dans lequel on était prêt à migrer les salons de certains pôles sur une autre instance Big Blue Button pour absorber la charge. Au final RAS comme on dit, aucun pôle n’a subi de bugs, ralentissements ou autre : bref, on était bien à l’aise ! (bon on a aussi demandé à tou·tes les participant·es de ne pas utiliser leur webcam et de se contenter de l’audio : ça aide !)

Pôle par pôle

Le retour de chaque pôle a été rédigé par le ou les animateur·rices du pôle concerné, sauf pour le pôle accueil où c’est un participant qui a voulu nous faire part de son retour. Merci fabulousfabs !

Pôle Accueil

Pôle animé par MeTaL_PoU, Numahell & QuentinD

Du monde tout l’après-midi, le pôle accueil avait la lourde responsabilité d’accueillir sur le Confin’atelier, d’expliquer le fonctionnement de l’outil BBB, de guider les participant·e·s vers les différents pôles, de répondre aux questions. Ce pôle « tampon » était nécessaire et a été remarquablement bien orchestré par nos 3 ami·e·s ! Ambiance franchement sympathique, accueil chaleureux et patience dans leurs explications, MeTal_PoU & Numahell se sont données sans retenue sur le pôle accueil ! QuentinD gérait la comm’ sur les réseaux sociaux (de ce que j’ai compris, pour la première fois), et venait faire un coucou aux rares moments où il avait 5 minutes. Pendant ce temps, MeTal_PoU & Numahell prenaient leur temps pour dire bonjour, expliquer inlassablement le système de salons multiples, comment basculer vers un autre pôle, comment aider à régler / couper son micro sur BBB, tout cela sans jamais perdre le sourire (qui s’entendait) ou patience. Elles ont eu à cœur de laisser présenter les pôles aux responsables de salons qui en avaient le temps, permettant à nos 80 bonnes âmes de choisir où aller donner un coup de pattes. Bravo à vous 3 !

Pôle Framalibre

Pôle animé par Gavy

Environ une dizaine de personnes pour ce pôle autour de l’annuaire historique de Framasoft. On a commencé par une petite présentation de Framalibre – ce qu’est l’annuaire, ce qu’on peut y trouver et ce qu’on peut y faire – avant de voir comment y contribuer.

Au final, plusieurs comptes Framalibre ont été créés, des notices existantes ont été modifiées et de nouvelles sont apparues :

Notices crées :

Notices modifiées :

Si contribuer à Framalibre vous donne envie, le meilleur moyen pour commencer, c’est de venir en parler sur Framacolibri (le forum de Framasoft), dans la section dédiée à l’annuaire !

Pôle Design & Libre

Pôle animé par Maiwann

Une dizaine de personnes qui étaient présentes pour cet atelier visant à regrouper les designers ayant envie de faire bouger les choses coté logiciel libre ! Petite surprise : Il y avait aussi des personnes qui étaient plutôt développeurs et qui étaient en demande pour savoir comment trouver quelqu’un avec qui collaborer. Après plusieurs petites discussions sur « Pourquoi y a-t-il aussi peu de designers dans le monde du libre ? » nous avons décidé de faire un petit site afin de pouvoir renvoyer les différentes personnes intéressées par le sujet dessus \o/ Ni une, ni deux, entre celleux qui s’occupaient du contenu et celleux qui étaient lancés sur la technique, nous avons déjà une page à vous présenter regroupant des façons de nous contacter et des ressources autour du design : Foire aux questions, articles, témoignages de collaboration… C’est par là ! ! 🎉 => https://design-et-libre.frama.io/ Merci à celles et ceux qui ont participé à cet atelier 🥳

Pôle Communiquer pour des projets libres

Pôle animé par Pouhiou

La proposition était de faire un tour de table des expériences et besoins dans la communication pour des projets libres, puis de prendre chaque besoin un par un et de partager nos retours d’expérience dessus. S’en est suivie une conversation de 3h avec plus de 10 personnes présentes absolument passionnante. Une des problématiques récurrentes fut de trouver comment communiquer sans reproduire les codes du capitalisme de surveillance.

Ces échanges ont été sketch-notés par Chloé :

Reproduction dans ce billet de blog avec l’autorisation de Chloé. Merci !

Pendant les échanges, David Revoy nous a écouté (et est parfois intervenu) tout en dessinant en direct une nouvelle illustration de Sépia, lae poulpe-mascotte de PeerTube, dont nous avons appris à cette occasion qu’iel n’avait pas de genre (découvrez-la plus bas !). Le seul regret de l’animateur (Pouhiou) c’est d’avoir du mal à jongler entre son animation et ses envies de partager une grosse expérience accumulée au sein de Framasoft (et donc de monopoliser la parole). Merci à toutes les personnes qui ont contribué !

Pôle PeerTube

Pôle animé par Angie

Une douzaine de personnes ont participé à cet atelier portant sur la sélection de contenus de qualité hébergés sur PeerTube. Angie a commencé par expliquer qu’il était important de valoriser ces contenus pour en montrer la diversité. Ce travail de curation permet d’alimenter le bloc « Découvrez notre sélection de contenus » de https://joinpeertube.org/ Plusieurs participant⋅es ayant des questions sur le fonctionnement du logiciel PeerTube, nous avons passé un peu de temps à y répondre. Angie a ensuite rappelé quelques critères pour la sélection (contenus sous licence libre ou dont on a l’assurance qu’ils sont publiés par leur créateur) et proposé des outils permettant la recherche au sein des différentes instances de PeerTube et les participant⋅es se sont lancés dans la recherche de contenus. Au final, 14 nouveaux contenus (vidéos, chaînes et instances) ont été sélectionnés. Pour chacune de ces sélections, un texte de présentation a été rédigé. Ces éléments seront prochainement visibles sur la page d’accueil de joinpeertube. Cet atelier était vraiment chouette car il a permis à l’ensemble des participant⋅es de découvrir ces contenus mais aussi d’échanger sur le fonctionnement du logiciel et sur les modalités d’inscription sur une instance. A reproduire pour découvrir de nouveaux contenus !

La nouvelle illustration de Sépia, mascotte de PeerTube, realisée par David Revoy pendant le Confin’atelier (licence CC-BY)

Pôle OpenStreetMap

Pôle animé par gibro

Le pôle OSM a débuté par une présentation rapide de la carte OpenStreetMap : son modèle, ses principes de fonctionnement et les principaux outils de contributions. Il y a ensuite eu une démonstration du fonctionnement de la carte ça reste ouvert :

  • Utilisation de la carte => affichage des informations, codes couleur utilisés, choix des langues, mode daltonien
  • Explication de la fonctionnalité « Signaler un changement » => formulaire permettant d’ajouter directement les informations sur un lieu sans avoir besoin d’un compte OpenStreetMap
  • Résolution des notes générées par le site => à partir du site NoteReview avec le tag #caresteouvert permettant aux contributeurs de suivre les signalements « ça reste ouvert » et de renseigner les informations dans la base OpenStreetMap
  • Documentation avec les ressources mises à la disposition sur le blog caresteouvert et le wiki OpenSteetMap.

Pendant et après la démonstration, nous avons échangé en fonction des besoins et interrogations des personnes présentes. Il y avait une douzaine de personnes en continu dans le salon et plusieurs contributeurs pour l’animer (merci Sebbaz et Eric B). Nous avons aussi discuté de la possibilité de mettre en place un site web facilitant la saisie des informations sur les commerces sans passer par un compte OpenSteetMap, sur le modèle https://caresteouvert.fr ou https://wheelmap.org/ Pour conclure, j’ai trouvé très agréable et efficace l’outil BigBlueButton pour les démonstrations et les interactions avec les participants. Il était également intéressant d’être à plusieurs pour animer pour gérer les échanges sur le chat et l’ajout d’informations dans les notes en parallèle des démonstrations en partage d’écran.

Retour d’un participant :

Très bon accueil de Gibro :) Belle découverte de caresteouvert, ce qui m'a permis d'actualiser les informations autour de chez moi. Concret et pratique. J'avais aussi des questions plus générales de mises à jour de OSM, que j'ai pu mettre en pratique immédiatement grâce aux conseils avisés de Gibro et Fred, merci à eux. Pratique, concret, convivial, j'ai passé un très bon moment et j'ai pu pratiquer immédiatement pour faire des mises à jour, merci <3

Pôle Wiktionnaire

Pôle animé par Noé

Première session de contribution en ligne et une bonne expérience. L’exploration d’un dictionnaire n’était probablement pas l’expérience la plus séduisante, d’où l’affluence limitée, mais l’animateur a pu néanmoins contribuer et montrer l’intérêt du Wiktionnaire avec de l’ajout d’illustrations et d’exemples, et même créer de nouvelles pages. Un participant, motivé par la présentation a pu téléverser une de ses photographies pour illustrer la page du Wiktionnaire de la ville de Gafsa. L’envie d’en refaire et la hâte de reprendre les permanences mensuelles lyonnaises !

Pôle Wikipédia

Pôle animé par Lyokoi

Une session de 3h bien remplie et qui aurait pu durer si le présentateur ne tombait pas de fatigue et ne perdait pas sa voix à la fin. La session oscillait entre 4 et 6 personnes avec un pic de présence à 8. La première moitié (1h30) fut une présentation globale de Wikipédia, son fonctionnement, sa communauté, ses règles et surtout une visite de l’interface de contribution. Ponctuée par les questions des visiteurs et visiteuses, nous avons apporté des sources à des articles, nous avons découvert plusieurs aspects de la contribution (images, structuration, wikification, etc.) et avons noté dans le pad interne des liens importants. La deuxième partie était surtout consacrée à l’échange avec les participants et les participantes, via message ou via micro. Un contributeur de Lorient a pu se faire aider à monter un groupe local et plusieurs nouveaux et nouvelles ont pu faire leurs premières modifications (ainsi qu’un ancien qui s’y est remis). L’expérience a été très enrichissante et a donné l’envie de recommencer.

Pôle Piaf

Pôle animé par Guillaume

Une super ambiance, avec une dizaine de curieux qui voulaient en savoir plus sur le projet. Nous avons discuté des intérêts de construire des ressources pour créer des intelligences artificielles francophones, et également des façons de procéder. Puis nous avons tous ensemble contribué, en écrivant des questions réponses sur des articles Wikipédia. Avec quelques dizaines de questions réponses produites, Piaf en est maintenant à 7000 depuis le début du projet il y a quelques mois ! Bravo et merci à tous ! Et continuons de contribuer quand nous en avons le temps :)

Pôle Culture libre / Khaganat

Pôle animé par Zatalyz et GPSqueeek

Après une demi-heure à – nous ronger le clavier de peur de n’avoir personne – papoter, nous décidons de revenir faire un tour à l’accueil pour signaler qu’on était là et que c’était chouette de venir dans notre salon. Et ça a marché ! On a en effet eu la joie d’avoir le retour d’une contributrice qui nous a aidé·es à voir comment serait fait le système solaire dans l’univers du Khanat, et c’est pas rien ! Le Khanat serait probablement une lune d’une géante gazeuse, et ensuite il y a des histoires d’angle des plans orbitaux, de masse et de taille des différents astres. On espère un jour avoir de quoi montrer ce ciel dans Godot pour l’intégrer au futur jeu ! Ensuite on a eu plusieurs visites de curieuses dont certaines sont restées pour nous aider à commencer un article au sujet d’une bestiole qui avait été dessinée sur papier en Contrib’atelier en présentiel en fin d’année dernière. Ce n’est pas encore terminé mais il y a une bonne base pour avoir quelque chose de publiable bientôt sur notre wiki on espère ! Merci aux visiteuses et autres contributrices qui ont été toutes plus oniriques les unes que les autres (et chez Khaganat, c’est signe d’un tas de guimauves, accompagnées d’un tas de câlins si ça fait plaisir !).

Pôle Contribuer au libre pour les développeur·ses

Pôle animé par ervin

https://asso.framasoft.org/pic/xPP0qymR/jBZ96zfE.png

Nous avons eu 11 personnes présentes. Globalement les nouveaux venus étaient satisfaits et ont trouvé des projets auxquels contribuer. La durée n’a pas forcément permis de mettre des choses en production, mais le contact a été établi et certains des participants comptent continuer à contribuer. Beaucoup d’appétence pour une autre session. Les notes complètes dont le tour de table final : https://mypads.framapad.org/p/confinatelier-framadate-3m1pcq7p7

En conclusion

Pour nous ce n’est que du positif donc un immense merci à tou·tes celleux qui ont pris part à ce Confin’atelier :

  • Animateur·rices : merci pour la diversité des pôles et leur nombre !)
  • Participant·es : merci d’avoir être été autant de monde à répondre présent·es pour donner de votre temps pour le libre
  • Bénévoles de FAImaison : bah oui, pas de bénévoles FAImaison, pas de Big Blue Button, donc pas de Confin’atelier. CQFD ;-).

À bientôt pour le prochain ?  ;-)

 

Wikipedia et les liens externes

Thursday, 12 January 2023 16:05 UTC

 

Pointeur de souris en forme de main au-dessus d'un hyperlien Wikipédia.
Bernard Ladenthin, CC0

Des acteurs de la presse française viennent d'annoncer la signature d'une charte de la traçabilité de l'information. La charte prévoit que les médias citent correctement leurs sources et qu'ils insèrent des liens hypertextes dans les articles. Aucun roman d'anticipation n'avait sans doute imaginé qu'en 2020 l'humanité serait capable de telles prouesses ! Au-delà de cette pic amicale, je suis content que les médias traditionnels adoptent les bonnes pratiques des pure players et de Wikipédia. La gestion des sources et des hyperliens est complexe et chronophage. Bon courage aux nouveaux titres de presse qui se lancent dans l'aventure.

S'ils leur restent du temps, ce serait bien également de correctement créditer les photos qu'ils prennent sur Wikipédia ou Wikimédia Commons. Bien souvent les médias ne citent pas la licence libre utilisée par le créateur ou utilisent les fameux Droits réservés (DR). Outre le fait que c'est illégal, il est de plus en plus important de pouvoir retracer l'origine des images afin de s'assurer de leurs exactitudes et que les légendes correspondent bien aux photos.

Hasard du calendrier, j'étais depuis plusieurs jours en train de me dépêtrer à faire des requêtes SQL pour mieux connaître les liens externes qui se trouvent sur la Wikipédia francophone.

Liens externes

Les hyperliens qui mènent vers d'autres sites web sont très fréquents sur Wikipédia. Une série de recommandations leurs sont consacrées sur la page Wikipédia:Liens externes. Dans les articles de Wikipédia, on peut en trouver à deux endroits différents. Tout d'abord dans la liste des sources permettant de vérifier ce qui est écrit dans l'article. Ce type de lien externe, aussi appelé source ou référence, est généralement regroupé dans une section intitulée Références ou bien Notes et références. La nature des références est fonction de l'article. Un article d'actualité va utiliser la presse alors qu'un article d'histoire utilisera des monographies.

Un deuxième endroit possible pour les liens externes est une section tout simplement appelée Liens externes en toute fin d’article. Le plus souvent cette section contient le site officiel ou de nombreux liens vers d'autres bases de données. Les wikimédiens consacrent beaucoup de temps pour relier Wikipédia ou Wikidata à des notices d'autorité (base Léonore de la Légion d’honneur, base Mérimée des monuments historiques, IMDb, etc.) ainsi qu'à d'autres sites de référence (Who's Who, Universalis, Maitron, etc.).
 
La Joconde

Requêtes SQL

L'outil Quarry permet d'interroger en live une copie de la base de données de Wikipédia à l'aide du langage SQL. N'y connaissant rien, je me suis contenté de réutiliser une requête faite par un collègue étranger. Les résultats ne sont pas directement utilisables car on y trouve quelques sites internes à Wikimédia et des sites identiques sous plusieurs urls (ex. books.google.com et books.google.fr ou wordlcat.org et www.worldcat.org). Il faut donc penser à agréger certains résultats.

Top 20

Voici les 1 173 sites avec plus de 1000 occurrences dans l'espace principal (= articles) de la Wikipédia francophone et le top 20 :
  1. Insee 624 477
  2. BnF  602 667
  3. Google Livres 405 050
  4. Virtual International Authority File (VIAF) 360 287
  5. Worldcat 253 081
  6. International Standard Name Identifier (ISNI) 213 875
  7. Internet Archive 210 916
  8. culture.gouv.fr 209 686
  9. Bibliothèque du Congrès 191 409
  10. Digital object identifier (DOI) 166 590
  11. Deutsche National Bibliothek (DNB) 161 763
  12. Identifiants et Référentiels pour l'Enseignement supérieur et la Recherche (IdRef) 146 490
  13. Internet Movie Database (IMDb) 128 210
  14. National Center for Biotechnology Information (NCBI) 124 115
  15. Bibliothèque royale du Pays-Bas 110 484
  16. Le Monde 85 010
  17. NASA 80 586
  18. Catalogue of Life 75 291
  19. Inventaire de l'Agence flamande du patrimoine 71 256
  20. Légifrance 75 278
  21. YouTube 70 973

Top 20 français

  1. Insee 624 477
  2. BnF 602 667
  3. culture.gouv.fr 209 686 
  4. IdRef (Identifiants et Référentiels pour l'Enseignement supérieur et la Recherche) 146 490
  5. Le Monde 85 010
  6. Légifrance 75 278
  7. Allociné 67 576 
  8. archive.wikiwix.com 56919
  9. Persée 56 107 
  10. Cassini 51 889 
  11. Le Figaro 46 372 
  12. L'Equipe 39 983 
  13. Le Parisien 30 547 
  14. Ministère de l'intérieur 30 464 
  15. Libération 28 997 
  16. Ouest France 25 578
  17. mondedufoot.fr 25 239 
  18. Cairn 24 096 
  19. Assemblée nationale 22 784
  20. L'Express 20 763 

Médias 

Voici les différents classements pour la presse d'information générale (sans le sport en gros).

Presse française

  1. Le Monde 85 010
  2. Le Figaro 46 372 
  3. Le Parisien 30 547
  4. Libération 34 461
  5. Ouest France 25 578
  6. L'Express 20 763 
  7. Le Point 19 082 
  8. Les Échos 15 409 
  9. Obs 12 733
  10. RFI 11 915 
  11. 20 Minutes 11 425 
  12. La Croix 9 637 
  13. France TV info 8 613 
  14. Sud Ouest 8 215 
  15. Télégramme  7 818
  16. Jeune Afrique 7 597
  17. L'Humanité 7 373 
  18. Télérama 6 900
  19. France Culture 6 633 
  20. Le Monde diplomatique 5 567 

Presse francophone

  1. Radio Canada 11 039
  2. La Presse 10 441
  3. Le Soir 8 942
  4. RTBF 8 384
  5. Le Temps 7 520
  6. Le Devoir  6 223
  7. RTS 5 436
  8. DH Les Sports+ 3 803
  9. Tribune de Genève 2 914
  10. L'Avenir 2 265

Presse étrangère

  1. BBC 41 395
  2. New-York Times 31 282
  3. Guardian 20 579
  4. Telegraph 7 972
  5. Washington Post 7 020
  6. Los Angeles Times 6 579
  7. Independent 5 991
  8. Daily mail 4 210
  9. Forbes 3 658
  10. CBC 3 528

Sites gouvernementaux

  1. www.culture.gouv.fr et www2.culture.gouv.fr 144 174
  2. www.legifrance.gouv.fr et legifrance.gouv.fr 75 278
  3. www.pop.culture.gouv.fr 61 290
  4. www.interieur.gouv.fr 30 464
  5. www.assemblee-nationale.fr 22 784
  6. elections.interieur.gouv.fr 16 018
  7. www.geoportail.gouv.fr 13 293
  8. www.senat.fr 10 353
  9. www.banatic.interieur.gouv.fr 7 824
  10. www.georisques.gouv.fr 5 432
  11. www.data.gouv.fr et entreprise.data.gouv.fr 7 436
  12. cites.application.developpement-durable.gouv.fr 4 876
  13. www.siv.archives-nationales.culture.gouv.fr 4 222
  14. www.education.gouv.fr 3 785
  15. www.defense.gouv.fr 3 681
  16. www.inao.gouv.fr 3 334
  17. www.diplomatie.gouv.fr 3 308
  18. www.loiret.gouv.fr 2 702
  19. www.collectivites-locales.gouv.fr 2 377
  20. www.memoiredeshommes.sga.defense.gouv.fr 2 338
  21. www.developpement-durable.gouv.fr 2 172
  22. alize2.finances.gouv.fr 1 693
  23. www.aisne.gouv.fr 1 681
  24. www.culturecommunication.gouv.fr 1 628
  25. www.gouvernement.fr 1 513
  26. www.annuaires.justice.gouv.fr 1 486
  27. agreste.agriculture.gouv.fr 1 259
  28. carmen.developpement-durable.gouv.fr 1 149
  29. www.statistiques.developpement-durable.gouv.fr 1 104

Sites Wikimedia

De nombreux liens renvoient vers des sites Wikimedia. Il y a tout d'abord les liens vers les autres versions linguistiques de Wikipedia. Il ne s'agit pas des interwikis permettant de passer d'une langue à l'autre mais de liens générés par des modèles tels que {{Traduction/Référence}} ou {{Lien}}.

Il y a également quasiment 200 000 liens vers la ferme de serveurs qui héberge des outils (tools.wmflabs.org) tels que GeoHack, KMLexport, Chemistral Abstracts Service number links, etc.

 Et Wikidata est massivement utilisé avec plus de 3 millions de liens.

Robots

CodexBot

Je terminerai en présentant les travaux des robots. Il y a tout d'abord les outils d'archivage. Les pages internet peuvent avoir une durée de vie assez courte. Afin de permettre l'accès à ces liens morts, la Wikipédia Francophone utilise deux services :
  • La Wayback Machine d'Internet Archive : 210 916 liens
  • Et un service similaire (Wikiwix) proposé par la société française Linterweb : archive.wikiwix.com 56 919

CodexBot sert à mettre en forme les hyperliens laissés par les rédacteurs bénévoles. La Wikipédia francophone utilise principalement trois modèles afin d'harmoniser la présentation des sources :

  • Ouvrage : utilisé 1 064 113 de fois sur 305 392 pages distinctes.
  • Article : utilisé 808 734 de fois sur 238 253 pages distinctes.
  • Lien web : utilisé 3 366 315 de fois sur 679 393 pages distinctes.

Ce robot analyse quotidiennement 2500 citations de livres et en améliore 1500. Il traite également 1000 articles de presse, articles académiques et pages web. Enfin, il signale une trentaine de cas nécessitant une vérification humaine.

 

[Mise à jour] Ajout de requêtes SQL listant les liens par projet

Recette 5 – croque monsieur

Saturday, 10 December 2022 06:23 UTC

Bien le bonjour, ça faisait un bail.

Il fait froid, le four est agréablement chaud… aujourd’hui, une recette simple de croque-monsieurs.

1) Tartinez la tranche du bas avec du beurre.

2) Ajoutez une demi tranche de jambon. Ou une entière si vous voulez, j’suis pas vot’chef.

3) Mélangez le fromage râpé avec un peu de lait et mettez ça sur la 2eme tranche de pain.

Le lait, comme le beurre plus haut, sert principalement à éviter que le pain (et ici le fromage) ne se dessèche pendant la cuisson et garde du moelleux, donc il en faut -un peu- mais pas détremper la tranche non plus. Ça peut prendre quelques essais pour apprendre à doser correctement :)

4) Au four ~180°C pendant une vingtaine de minutes

C’est prêt !

Rencontres Wikimedia 2010 : « GLAM-WIKI » à Paris

Thursday, 1 January 1970 00:00 UTC

Vue de l'hôtel des Invalides depuis le côté Seine, sous la neige

Il y a quelques jours, j’ai assisté à la conférence « GLAM-WIKI (FR) » à Paris, dont l’objectif était de bâtir des relations et des partenariats entre le mouvement Wikimedia et le secteur culturel, qui partagent une mission de diffusion de la connaissance.

Cette conférence, appelée « Rencontres Wikimedia 2010 » en français, était la deuxième édition d'un colloque Wikimedia annuel qui se cherche encore (ce qui est naturel pour un évènement si jeune) ; le colloque précédent de 2007 visait davantage le monde universitaire et les « experts ». « GLAM-WIKI » est le nom d'une séries de conférences, débutées en 2009 à Canberra (Australie), et suivie de celle de Londres il y a quelques semaines. Les institutions culturelles sont appelées « GLAM » dans le milieu, un acronyme pour galleries, libraries, archives and museums : galeries, bibliothèques, archives et musées. Je leur préfère le nom de « memory institutions », également utilisé en anglais.

Une conférence introductive efficace

Le programme était intéressant, en proposant de bonnes synthèses sur Wikipedia, Wikimedia, et quelques initiatives et partenariats réalisés pendant les dernières années. Il s'agissait de « panels » et de présentations (la traduction en français par  « tables rondes » est assez maladroite).

Même si, au final, le programme visait davantage les représentants des organismes culturels, certaines sessions m'ont également été utiles (en tant que bénévole Wikimédien, et d'employé de la Wikimedia Foundation), notamment celle sur les métadonnées. C'est un domaine que je n'ai pu qu'effleurer lors du Multimedia usability project, mais auquel j'espère pouvoir consacrer du temps en 2011.

D'autres présentations étaient d'excellente qualité, comme celle de Ian Padgham, du SFMOMA. Sa présentation originale mais efficace consistait d'une bande dessinée (par lui) et a été donnée un français impeccable, coloré et très drôle. Ce fut rafraîchissant après deux jours de présentations plus formelles.

La salle, dans les locaux de l'Assemblée Nationale, était particulièrement accueillante. Quelques détails logistiques, tels que l'absence de prises électriques, ou l'absence des horaires dans le « Programme » en téléchargement sur le site officiel, ont provoqué des frustrations. D'un autre côté, on nous a rachetés avec des macarons.

La traduction simultanée en anglais ou en français (selon que l'orateur parlait dans une langue ou dans l'autre) était apparemment de très bonne qualité et a permis à tous les participants de profiter de cette conférence bilingue.

Futures éditions : davantage de rencontres

Si j'avais un conseil à donner pour l'organisation d'un évènement similaire à l'avenir, ce serait de plus mettre l'accent sur l'aspect « rencontres ».

Je conçois parfaitement que ce type d'évènement ait été une première en France, et que par conséquent le but était davantage de « planter la graine » que de réellement tisser des liens et faire fructifier des partenariats. Il est donc normal qu'une approche « introductive » ait été choisie cette année. Les conseils qui suivent s'adressent donc principalement aux organisateurs des prochaines éditions.

Bien qu'ils aient semblé être en minorité, de nombreux Wikimédiens s'étaient déplacés pour assister à cette conférence, certains venus d'autres pays. Je trouve dommage qu'il n'y ait pas eu davantage d'opportunités de réelles rencontres et d'ateliers.

En comparaison, l'atelier Wikimedia de la conférence « Museums and the Web» en avril 2010 avait vraiment permis aux membres des deux communautés de se rencontrer, au travers de discussions en petits groupes sur des sujets particuliers.

L'absence de badges nominatifs n'a pas non plus facilité de réelles rencontres. Sans badge, difficile de démarrer une conversation avec un inconnu lors des pauses café, par exemple. Une liste des participants, comprenant leur affiliation et leur adresse e-mail (avec leur accord préalable) aurait également été bienvenue.

Par ailleurs, il n'est pas très pratique de devoir s'organiser soi-même pour déjeuner, surtout en une heure et quart (ramenés à moins d'une heure avec les retards accumulés), pendant que les « VIP » (organisateurs et intervenants) déjeunent à l'étage. Je pense qu'une large majorité des participants aurait accepté de participer financièrement en échange d'un déjeûner-buffet sur place, en particulier nos collègues non francophones.

En résumé, l'évènement était sympathique et assez utile, et j'espère voir de futures éditions avoir lieu qui permettront des rencontres plus concrètes.

Ce mercredi, je participais à une réunion de l'équipe technique de la Wikimedia Foundation quand Mark Bergsma, notre Networking Coordinator basé à Amsterdam, a subitement dû s'absenter ; ce n'est que quelques instants plus tard que l'équipe a réalisé la raison de son départ. Un incident de climatisation dans le data center d'Amsterdam a déclenché un mécanisme de protection des serveurs, qui se sont automatiquement arrêtés afin de se protéger de la chaleur. Le centre d'Amsterdam gère généralement le trafic des sites Wikimedia en Europe ; Wikimedia dispose de procédures automatiques afin de pallier rapidement ce type d'incident en redirigeant l'ensemble des requêtes européennes vers les serveurs situés en Floride.

Ce processus de redirection est basé sur le DNS, c'est à dire le système qui fait le lien entre un nom de domaine (par exemple, « wikipedia.org ») et l'adresse IP de la machine qui l'héberge (par exemple, « 208.80.152.2 »). Malheureusement, ce système de redirection était défaillant au moment de l'incident de climatisation. L'équipe a rapidement identifié et corrigé le problème, mais c'était trop tard : l'erreur s'était propagée sur Internet dans les bases de données DNS.

En tout et pour tout, l'incident de climatisation et l'incident de DNS interne n'ont duré que quelques minutes. Mais à cette chaîne d'incidents s'est ajouté un autre problème : les bases de données DNS sur le web ont conservé les valeurs erronées trop longtemps, malgré les consignes des serveurs de Wikimedia, qui indiquaient qu'elles devaient être corrigées rapidement. Ainsi, les utilisateurs ne pouvaient pas accéder à Wikipedia, même si Wikipedia était bien là, en parfaite santé.

Cette série d'incidents est assez semblable aux chaînes d'incidents utilisées dans l'analyse des catastrophes aériennes (modèle de Reason, aussi appelé « effet gruyère ») : pris séparément, ces problèmes ne sont pas graves, ni même visibles, mais leur combinaison a rendu Wikipedia inaccessible pendant plusieurs heures.

Cependant, ce n'est pas la fin de l'histoire.

Aussitôt le problème résolu, Mark a rapidement rédigé et publié un article sur le blog technique de Wikimedia. L'objectif était d'expliquer la cause du souci et de rassurer les utilisateurs. Mais la twittosphère était déjà en pleine ébullition, et certains utilisateurs ont eu la bonne idée d'indiquer que la passerelle sécurisée secure.wikimedia.org, elle, fonctionnait toujours. Cette passerelle, qui habituellement ne doit gérer qu'un faible trafic, a aussitôt été saturée. L'ironie, c'est que secure.wikimedia.org est hébergé sur le même serveur que le blog technique qui, du coup, n'était plus accessible. Et demander aux internautes de ne pas utiliser la passerelle sécurisée n'a eu aucun effet. Du coup, l'équipe technique a décidé de désactiver temporairement secure.wikimedia.org, afin de rendre de nouveau accessible le blog technique, et ainsi l'article qui expliquait l'origine du problème.

La situation est revenue à la normale après quelques heures, au fur et à mesure que les bases de données DNS ont mis à jour leurs entrées. secure.wikimedia.org a été réactivé peu de temps après, quand la charge serveur est redevenue raisonnable.

L'un des projets sur lesquels l'équipe technique de Wikimedia a prévu de travailler prochainement est la création d'un « indicateur de statut » (status board), qui indiquera aux utilisateurs la « santé » des sites Wikimedia à un moment donné, un peu à la manière du Google apps status dashboard. Cet indicateur, qui sera hébergé de façon indépendante, permettra de tenir les utilisateurs informés des éventuels soucis et du retour à la normale. D'autres projets sont également en cours de finalisation afin d'améliorer de façon générale les performances et la redondance de l'infrastructure opérationnelle de la Wikimedia Foundation, en accord avec les recommandations du plan stratégique. J'y reviendrai dans quelques semaines.