▲L'édito de secours —
Ceci aurait dû être un édito en bonne et due forme de la part d'un
des rédacteurs des RAW mais le principal animateur des RAW,
PAC2,
est en wikibreak et le numéro n'a pas été lancé dans la nuit du
30/31 au 1er
comme c'est l'habitude. Il aspire également à
passer moins de temps sur les RAW dans les prochains mois.
C'est l'occasion plus que jamais de rappeler que ce magazine ne
peut vivre que si vous participez à sa rédaction. Des sections sont
restées vides faute de disponibilité de celles et ceux qui s'y
attellent souvent. Il y a plusieurs manières de participer à la
rédaction : entre autres, chercher et présenter des brèves,
donner son avis sur un sujet dans la section Focus, faire
l'interview d'une pcW, présenter des tests qu'on a pu réaliser
comme Mr Tortue le fait dans ce numéro, corriger les fautes qui
s’immiscent. Plus grand est le nombre de participants à la
rédaction des numéros, mieux c'est.
J'adresse un grand merci à celles et ceux qui ont contribué à la
création de ce numéro. En espérant que d'autres pcW viendront remplir le numéro prochain, je
vous souhaite un bon mois de février. – L'embellie.
Les brèves
▲L'Heritage
Foundation cible Wikipédia en anglais — Le journal juif
américain The
Forward a publié le un article révélant que l'Heritage
Foundation, un puissant think thank américain
ultra-conservateur, fervent soutien de Donald Trump, avait un projet de programme
visant à identifier les contributeurs de Wikipédia qui, selon lui,
« abuseraient de leur position » pour diffuser des
contenus « antisémites ». Les guillemets sont importants
puisque cela intervient, explique le journaliste Arno Rosenfeld,
dans un contexte de critiques par certaines personnalités juives au
sujet du traitement de la guerre à Gaza par Wikipédia en anglais,
et au sujet de la qualification par la communauté wikipédienne
anglophone de l'Anti-Defamation League comme
généralement peu fiable au sujet du conflit israélo-palestinien
(voir (en) Wikipedia:Reliable
sources/Perennial sources pour le détail). Le Mondeécrit ainsi que la Heritage Foundation cible
« des contributeurs de Wikipédia jugés
trop hostiles à Israël ».
Pour identifier les wikipédiens (sous pseudonyme), la Heritage
Foundation prévoit — cf. ce document interne obtenu par The
Forward — d'utiliser divers moyens, y compris l'analyse de
données issues de brèches de sécurité, l'utilisation d'adresses URL
piégées (pour obtenir l'IP et d'autres informations sur les
contributeurs) et l'usage, sur Wikipédia, de faux-nez.
▲The Signpost
souffle ses 20 bougies — Douze articles, tous signés Michael Snow. C'est ce que
propose, le , le premier
numéro du Wikipedia
Signpost, qui deviendra, pour les vingt ans à suivre le
journal de la communauté wikipédienne anglophone. On y apprend
alors que l'encyclopédie
vient d'entrer dans le classement des cent sites web les plus
visités et que la page wikipedia.org, qui redirigeait
vers Wikipédia en anglais, joue désormais le rôle de portail
multilingue — c'est toujours le cas aujourd'hui.
À l'époque, Michael Snow a un peu plus d'un an d'ancienneté et
6 000 modifications au compteur. D'emblée, son
objectif est que le Wikipedia Signpost soit écrit à
plusieurs mains ; le second
numéro, publié une semaine plus tard — le journal est
alors hebdomadaire —, accueille des articles signés par
d'autres bénévoles. Dès , Michael Snow passe le relais de la
rédaction en chef à un autre contributeur, Ral315, qui sera lui-même suivi par plusieurs
autres, jusqu'à JPxG qui anime aujourd'hui la rédaction.
▲Un script pour la
recherche de liens externes — La page spéciale Spécial:Recherche de liens permet
d'afficher toutes les pages de l'encyclopédie qui contiennent un
nom de
domaine. Cette page est fréquemment utilisée dans le cadre de
la maintenance, en particulier pour la lutte contre le spam ou les
sites non fiables. Toutefois, elle ne permet pas le tri par
espace de noms ; une telle fonctionnalité est demandée
depuis 2007. En attendant que ce vœu soit
exaucé, LD a créé un script qui permet de
n'afficher les liens que sur un espace de noms — par exemple
l'espace principal.
▲Comment la
communauté Wikidata a modélisé le genre ? — Le projet de
recherche Wikidata Gender
Diversity s'intéresse à la modélisation du genre sur Wikidata.
Les autrices et auteurs ont reconstitué la chronologie et les
grandes étapes de cette modélisation.
▲Liste des noms de domaine les
plus cités — Pyb en résidence a mis à
jour la liste des noms de domaine les plus cités sur Wikipedia en
français. Il s'appuie sur une requête SQL sur les bases de données de
Wikipedia via l'outil Quarry. Le site de l'Institut
national de la statistique et des études économiques dépasse
désormais le million de liens. Parmi les noms de domaine associés à
des médias, c'est le site du Monde qui est le plus souvent utilisé avec 146
000 occurrences devant L'Équipe (73 000) et Le Figaro (67 000).
RAW encourage les membres de la communauté à s'exprimer sur
différents enjeux liés à l'écosystème Wikimedia. N'hésitez pas à
proposer vos textes pour cette section. N'hésitez pas non plus à
réagir dans la section du courrier
du lectorat.
Sur fr.wikiquote, un homme sur trois est désormais une
femme !
par Jorune
Le s'achevait la 5e campagne #Shesaid sur
Wikiquotes, cette campagne annuelle proposée par le projet
Wiki loves womens depuis
2020.
Selon les statistiques de Humaniki[1], le site francophone Wikiquote
comptait, à l'issue de cette campagne, 2 171 entrées consacrés
à des femmes, ce qui représente un peu plus de 35% du total des
articles basés sur une biographie. On est, certes, encore loin de
la parité, toutefois, on peut mesurer le travail réalisé en 5 ans
par les wikimédiens participants à cette opération. En effet, fin
, juste
avant la toute première campagne #Shesaid, Wikiquote en français ne
comptait que 519 femmes pour 3 117 hommes (soit 14% des entrées
basées sur une biographie).
L'année 2024 a été particulièrement prolifique avec plus de 200
articles améliorés et surtout 730 entrées ajoutées lors de la
campagne officielle. Grâce à ce niveau élevé de participation,
Wikiquote en français pourrait (enfin) quitter la catégorie des
petits wikis d'ici à 2026 !
Ce bilan numérique encourageant de 2024 est en partie lié aux
efforts d'animation réalisés par les Wikimédiens du continent
africain (ateliers, concours...) qui finit par bousculer le
classement des pages par nationalité ! A fin 2024, 6 pays
africains francophones figurent parmi les 10 nationalités les plus
représentées sur Wikiquote. Par comparaison, sur la Wikipédia en
français, les personnalités féminines européennes et américaines
apparaissent en tête de classement et le premier pays d'Afrique (l'Afrique du Sud)
pointe à la 33e place du classement par nationalité.
Il reste encore des marges de progrès, notamment en ce qui
concerne l'épaisseur et la visibilité des pages proposées. Ainsi,
sur les 2 000 entrées consacrées à des femmes, moins de 20%
d'entre elles dépassent les 4 000 octets : cela
représente moins de 5 citations par article. Autrement dit, 80% des
pages consacrées à des femmes sont de courtes ébauches à partir
desquelles il est difficile de se faire une idée de l'œuvre ou la
pensée d'une personnalité.
Par ailleurs, les articles créés sont en général peu liés aux
autres pages du recueil et on ne retrouve pas les paroles de ces
dames sur les thématiques transversales de Wikiquote : en
décembre 2024, la reine du crime
Agatha Christie (3900 octets en décembre 2024) ne figure pas
sur les pages crime, cadavre ou détective.
Aussi, on peut se réjouir de ce que #Shesaid apporte chaque fin
d'année un certain dynamisme à Wikiquote en français même si le
recueil de citations francophones pourrait encore gagner en qualité
et en profondeur pour que Madonna ne soit plus la seule femme à
dépasser 100 citations.
L'atelier
Dans cette section, un(e) wikimédien(ne) peut raconter un de
ses bricolages à la première personne.
Ce mois-ci, Monsieur Tortue vient nous parler de
son expérimentation sur les contributions par IP sur Wikipédia.
Étant membre de la patrouille RC depuis maintenant
quelques mois, j'observe régulièrement des vandalismes effectués
par des adresses IP. Toutefois, il était jusqu'à présent difficile
d'évaluer précisément leur impact sur l'encyclopédie.
Après de nombreuses recherches et discussions, j'ai constaté que
cette problématique est récurrente, tant sur la version francophone
que sur les autres versions linguistiques. Certaines wikis ont
d'ailleurs pris des mesures drastiques : Wikipédia en
portugais a bloqué de façon permanente les modifications par IP,
tandis que la version en farsi l'a fait temporairement.
Face à ce constat, j'ai développé il y a quelques mois un
système d'analyse des contributions IP sur le Wikipédia
francophone. L'objectif était d'étudier les caractéristiques de ces
modifications et d'identifier d'éventuels patterns récurrents. Pour
ce faire, j'ai mis en place une collecte automatique des
modifications par IP, suivie d'une annotation manuelle de leur
constructivité.
Le constat principal est qu'environ 20 % des
modifications par IP sur Wikipédia en français sont des
vandalismes. Ce chiffre est d'autant plus significatif qu'il ne
prend en compte que les modifications ayant passé les filtres anti-abus, qui bloquent
déjà une partie importante des vandalismes les plus évidents.
L'analyse par FAI révèle une distribution
globalement uniforme du vandalisme, à une exception notable
près : le
RENATER, qui équipe de nombreux établissements d'enseignement,
présente un taux de vandalisme deux fois supérieur à la
moyenne.
La taille des modifications s'avère être un indicateur
pertinent : 40 % des "grandes suppressions" (plus de 100
caractères) sont classées comme du vandalisme, contre seulement
15 % pour les modifications "moyennes" (entre -10 et +100
caractères).
Cette étude présente toutefois certains biais qu'il convient de
mentionner :
Les filtres anti-abus constituent un premier niveau de filtrage
qui masque une partie des tentatives de vandalisme, suggérant que
le taux réel de tentatives malveillantes est probablement supérieur
aux 20 % observés.
Certaines modifications peuvent être ambiguës et difficiles à
classifier de manière définitive. Dans l'optique d'améliorer les
résultats reconnus, une échelle de notation (0 = vandalisme
évident, 5 = modification totalement constructive) aurait été
intéressante
L'échantillon, bien que plus important que les précédentes
expérimentations, ne couvre qu'une période d'une dizaine de
jours.
Plus de résultats et la méthodologie complète sont disponibles
dans la présentation jointe.
Toutefois, tout n'est pas noir : l'arrivée des comptes temporaires va
possiblement transformer la situation. En effet, depuis quelques
mois maintenant, la Fondation Wikimédia teste un système permettant
aux contributeurs anonymes d'obtenir automatiquement un compte
temporaire, offrant ainsi un meilleur suivi des modifications.
Cette solution pourrait apporter un équilibre entre accessibilité
et lutte contre le vandalisme, comme l'ont montré les premiers
résultats encourageants sur les wikis test...
La grande interview
Dans cette section, nous donnons la parole à des
wikimédien(ne)s sur des thèmes donnés afin de recueillir leurs avis
ou les faire parler tout simplement de leurs expériences dans le
mouvement.
Pas d’entrevue ce mois-ci, mais ce format reviendra peut-être
dans un prochain numéro !
Il nous fera
plaisir de lire les messages déposés ici et, si nécessaire, d'y
répondre dans les plus brefs délais.
Merci à toute l'équipe pour ce nouveau numéro. La partie sur les
contributions des IPs est particulièrement intéressante. Merci
également à PAC2 pour tous ces mois à animer
infatigablement les publications du RAW et qui pourra profiter d'un
wikibreak bien mérité. Puisse d'autres personnes reprendre le
flambleau.--Pronoia (discuter)
1 février 2025 à 14:27 (CET)
Merci à
toi PAC2 pour tous ces mois de travail et à
l'édito de secours pour avoir réussi à sortir cette édition à
temps. Je pense rejoindre la rédaction pour tenir en vie cette
infolettre très utile Musstruss (discuter)
1 février 2025 à 14:50 (CET)
▲L'édito de secours —
Ceci aurait dû être un édito en bonne et due forme de la part d'un
des rédacteurs des RAW mais le principal animateur des RAW,
PAC2,
est en wikibreak et le numéro n'a pas été lancé dans la nuit du
30/31 au 1er
comme c'est l'habitude. Il aspire également à
passer moins de temps sur les RAW dans les prochains mois.
C'est l'occasion plus que jamais de rappeler que ce magazine ne
peut vivre que si vous participez à sa rédaction. Des sections sont
restées vides faute de disponibilité de celles et ceux qui s'y
attellent souvent. Il y a plusieurs manières de participer à la
rédaction : entre autres, chercher et présenter des brèves,
donner son avis sur un sujet dans la section Focus, faire
l'interview d'une pcW, présenter des tests qu'on a pu réaliser
comme Mr Tortue le fait dans ce numéro, corriger les fautes qui
s’immiscent. Plus grand est le nombre de participants à la
rédaction des numéros, mieux c'est.
J'adresse un grand merci à celles et ceux qui ont contribué à la
création de ce numéro. En espérant que d'autres pcW viendront remplir le numéro prochain, je
vous souhaite un bon mois de février. – L'embellie.
Les brèves
▲L'Heritage
Foundation cible Wikipédia en anglais — Le journal juif
américain The
Forward a publié le un article révélant que l'Heritage
Foundation, un puissant think thank américain
ultra-conservateur, fervent soutien de Donald Trump, avait un projet de programme
visant à identifier les contributeurs de Wikipédia qui, selon lui,
« abuseraient de leur position » pour diffuser des
contenus « antisémites ». Les guillemets sont importants
puisque cela intervient, explique le journaliste Arno Rosenfeld,
dans un contexte de critiques par certaines personnalités juives au
sujet du traitement de la guerre à Gaza par Wikipédia en anglais,
et au sujet de la qualification par la communauté wikipédienne
anglophone de l'Anti-Defamation League comme
généralement peu fiable au sujet du conflit israélo-palestinien
(voir (en) Wikipedia:Reliable
sources/Perennial sources pour le détail). Le Mondeécrit ainsi que la Heritage Foundation cible
« des contributeurs de Wikipédia jugés
trop hostiles à Israël ».
Pour identifier les wikipédiens (sous pseudonyme), la Heritage
Foundation prévoit — cf. ce document interne obtenu par The
Forward — d'utiliser divers moyens, y compris l'analyse de
données issues de brèches de sécurité, l'utilisation d'adresses URL
piégées (pour obtenir l'IP et d'autres informations sur les
contributeurs) et l'usage, sur Wikipédia, de faux-nez.
▲The Signpost
souffle ses 20 bougies — Douze articles, tous signés Michael Snow. C'est ce que
propose, le , le premier
numéro du Wikipedia
Signpost, qui deviendra, pour les vingt ans à suivre le
journal de la communauté wikipédienne anglophone. On y apprend
alors que l'encyclopédie
vient d'entrer dans le classement des cent sites web les plus
visités et que la page wikipedia.org, qui redirigeait
vers Wikipédia en anglais, joue désormais le rôle de portail
multilingue — c'est toujours le cas aujourd'hui.
À l'époque, Michael Snow a un peu plus d'un an d'ancienneté et
6 000 modifications au compteur. D'emblée, son
objectif est que le Wikipedia Signpost soit écrit à
plusieurs mains ; le second
numéro, publié une semaine plus tard — le journal est
alors hebdomadaire —, accueille des articles signés par
d'autres bénévoles. Dès , Michael Snow passe le relais de la
rédaction en chef à un autre contributeur, Ral315, qui sera lui-même suivi par plusieurs
autres, jusqu'à JPxG qui anime aujourd'hui la rédaction.
▲Un script pour la
recherche de liens externes — La page spéciale Spécial:Recherche de liens permet
d'afficher toutes les pages de l'encyclopédie qui contiennent un
nom de
domaine. Cette page est fréquemment utilisée dans le cadre de
la maintenance, en particulier pour la lutte contre le spam ou les
sites non fiables. Toutefois, elle ne permet pas le tri par
espace de noms ; une telle fonctionnalité est demandée
depuis 2007. En attendant que ce vœu soit
exaucé, LD a créé un script qui permet de
n'afficher les liens que sur un espace de noms — par exemple
l'espace principal.
▲Comment la
communauté Wikidata a modélisé le genre ? — Le projet de
recherche Wikidata Gender
Diversity s'intéresse à la modélisation du genre sur Wikidata.
Les autrices et auteurs ont reconstitué la chronologie et les
grandes étapes de cette modélisation.
▲Liste des noms de domaine les
plus cités — Pyb en résidence a mis à
jour la liste des noms de domaine les plus cités sur Wikipedia en
français. Il s'appuie sur une requête SQL sur les bases de données de
Wikipedia via l'outil Quarry. Le site de l'Institut
national de la statistique et des études économiques dépasse
désormais le million de liens. Parmi les noms de domaine associés à
des médias, c'est le site du Monde qui est le plus souvent utilisé avec 146
000 occurrences devant L'Équipe (73 000) et Le Figaro (67 000).
RAW encourage les membres de la communauté à s'exprimer sur
différents enjeux liés à l'écosystème Wikimedia. N'hésitez pas à
proposer vos textes pour cette section. N'hésitez pas non plus à
réagir dans la section du courrier
du lectorat.
Sur fr.wikiquote, un homme sur trois est désormais une
femme !
par Jorune
Le s'achevait la 5e campagne #Shesaid sur
Wikiquotes, cette campagne annuelle proposée par le projet
Wiki loves womens depuis
2020.
Selon les statistiques de Humaniki[1], le site francophone Wikiquote
comptait, à l'issue de cette campagne, 2 171 entrées consacrés
à des femmes, ce qui représente un peu plus de 35% du total des
articles basés sur une biographie. On est, certes, encore loin de
la parité, toutefois, on peut mesurer le travail réalisé en 5 ans
par les wikimédiens participants à cette opération. En effet, fin
, juste
avant la toute première campagne #Shesaid, Wikiquote en français ne
comptait que 519 femmes pour 3 117 hommes (soit 14% des entrées
basées sur une biographie).
L'année 2024 a été particulièrement prolifique avec plus de 200
articles améliorés et surtout 730 entrées ajoutées lors de la
campagne officielle. Grâce à ce niveau élevé de participation,
Wikiquote en français pourrait (enfin) quitter la catégorie des
petits wikis d'ici à 2026 !
Ce bilan numérique encourageant de 2024 est en partie lié aux
efforts d'animation réalisés par les Wikimédiens du continent
africain (ateliers, concours...) qui finit par bousculer le
classement des pages par nationalité ! A fin 2024, 6 pays
africains francophones figurent parmi les 10 nationalités les plus
représentées sur Wikiquote. Par comparaison, sur la Wikipédia en
français, les personnalités féminines européennes et américaines
apparaissent en tête de classement et le premier pays d'Afrique (l'Afrique du Sud)
pointe à la 33e place du classement par nationalité.
Il reste encore des marges de progrès, notamment en ce qui
concerne l'épaisseur et la visibilité des pages proposées. Ainsi,
sur les 2 000 entrées consacrées à des femmes, moins de 20%
d'entre elles dépassent les 4 000 octets : cela
représente moins de 5 citations par article. Autrement dit, 80% des
pages consacrées à des femmes sont de courtes ébauches à partir
desquelles il est difficile de se faire une idée de l'œuvre ou la
pensée d'une personnalité.
Par ailleurs, les articles créés sont en général peu liés aux
autres pages du recueil et on ne retrouve pas les paroles de ces
dames sur les thématiques transversales de Wikiquote : en
décembre 2024, la reine du crime
Agatha Christie (3900 octets en décembre 2024) ne figure pas
sur les pages crime, cadavre ou détective.
Aussi, on peut se réjouir de ce que #Shesaid apporte chaque fin
d'année un certain dynamisme à Wikiquote en français même si le
recueil de citations francophones pourrait encore gagner en qualité
et en profondeur pour que Madonna ne soit plus la seule femme à
dépasser 100 citations.
L'atelier
Dans cette section, un(e) wikimédien(ne) peut raconter un de
ses bricolages à la première personne.
Ce mois-ci, Monsieur Tortue vient nous parler de
son expérimentation sur les contributions par IP sur Wikipédia.
Étant membre de la patrouille RC depuis maintenant
quelques mois, j'observe régulièrement des vandalismes effectués
par des adresses IP. Toutefois, il était jusqu'à présent difficile
d'évaluer précisément leur impact sur l'encyclopédie.
Après de nombreuses recherches et discussions, j'ai constaté que
cette problématique est récurrente, tant sur la version francophone
que sur les autres versions linguistiques. Certaines wikis ont
d'ailleurs pris des mesures drastiques : Wikipédia en
portugais a bloqué de façon permanente les modifications par IP,
tandis que la version en farsi l'a fait temporairement.
Face à ce constat, j'ai développé il y a quelques mois un
système d'analyse des contributions IP sur le Wikipédia
francophone. L'objectif était d'étudier les caractéristiques de ces
modifications et d'identifier d'éventuels patterns récurrents. Pour
ce faire, j'ai mis en place une collecte automatique des
modifications par IP, suivie d'une annotation manuelle de leur
constructivité.
Le constat principal est qu'environ 20 % des
modifications par IP sur Wikipédia en français sont des
vandalismes. Ce chiffre est d'autant plus significatif qu'il ne
prend en compte que les modifications ayant passé les filtres anti-abus, qui bloquent
déjà une partie importante des vandalismes les plus évidents.
L'analyse par FAI révèle une distribution
globalement uniforme du vandalisme, à une exception notable
près : le
RENATER, qui équipe de nombreux établissements d'enseignement,
présente un taux de vandalisme deux fois supérieur à la
moyenne.
La taille des modifications s'avère être un indicateur
pertinent : 40 % des "grandes suppressions" (plus de 100
caractères) sont classées comme du vandalisme, contre seulement
15 % pour les modifications "moyennes" (entre -10 et +100
caractères).
Cette étude présente toutefois certains biais qu'il convient de
mentionner :
Les filtres anti-abus constituent un premier niveau de filtrage
qui masque une partie des tentatives de vandalisme, suggérant que
le taux réel de tentatives malveillantes est probablement supérieur
aux 20 % observés.
Certaines modifications peuvent être ambiguës et difficiles à
classifier de manière définitive. Dans l'optique d'améliorer les
résultats reconnus, une échelle de notation (0 = vandalisme
évident, 5 = modification totalement constructive) aurait été
intéressante
L'échantillon, bien que plus important que les précédentes
expérimentations, ne couvre qu'une période d'une dizaine de
jours.
Plus de résultats et la méthodologie complète sont disponibles
dans la présentation jointe.
Toutefois, tout n'est pas noir : l'arrivée des comptes temporaires va
possiblement transformer la situation. En effet, depuis quelques
mois maintenant, la Fondation Wikimédia teste un système permettant
aux contributeurs anonymes d'obtenir automatiquement un compte
temporaire, offrant ainsi un meilleur suivi des modifications.
Cette solution pourrait apporter un équilibre entre accessibilité
et lutte contre le vandalisme, comme l'ont montré les premiers
résultats encourageants sur les wikis test...
La grande interview
Dans cette section, nous donnons la parole à des
wikimédien(ne)s sur des thèmes donnés afin de recueillir leurs avis
ou les faire parler tout simplement de leurs expériences dans le
mouvement.
Pas d’entrevue ce mois-ci, mais ce format reviendra peut-être
dans un prochain numéro !
Il nous fera
plaisir de lire les messages déposés ici et, si nécessaire, d'y
répondre dans les plus brefs délais.
Merci à toute l'équipe pour ce nouveau numéro. La partie sur les
contributions des IPs est particulièrement intéressante. Merci
également à PAC2 pour tous ces mois à animer
infatigablement les publications du RAW et qui pourra profiter d'un
wikibreak bien mérité. Puisse d'autres personnes reprendre le
flambleau.--Pronoia (discuter)
1 février 2025 à 14:27 (CET)
Merci à
toi PAC2 pour tous ces mois de travail et à
l'édito de secours pour avoir réussi à sortir cette édition à
temps. Je pense rejoindre la rédaction pour tenir en vie cette
infolettre très utile Musstruss (discuter)
1 février 2025 à 14:50 (CET)
mikemacmarketing, CC BY 2.0 , via Wikimedia Commons Il est grand
temps de faire une vraie place à la société civile dans la
gouvernance de l’IA. Une tribune initiée et publiée par Renaissance
numérique, think tank indépendant et non partisan dédié à la
transformation numérique de la société, co-signée par Wikimédia
France et 43 signataires […]
▲L'édito de secours —
Ceci aurait dû être un édito en bonne et due forme de la part d'un
des rédacteurs des RAW mais le principal animateur des RAW,
PAC2,
est en wikibreak et le numéro n'a pas été lancé dans la nuit du
30/31 au 1er
comme c'est l'habitude. Il aspire également à
passer moins de temps sur les RAW dans les prochains mois.
C'est l'occasion plus que jamais de rappeler que ce magazine ne
peut vivre que si vous participez à sa rédaction. Des sections sont
restées vides faute de disponibilité de celles et ceux qui s'y
attellent souvent. Il y a plusieurs manières de participer à la
rédaction : entre autres, chercher et présenter des brèves,
donner son avis sur un sujet dans la section Focus, faire
l'interview d'une pcW, présenter des tests qu'on a pu réaliser
comme Mr Tortue le fait dans ce numéro, corriger les fautes qui
s’immiscent. Plus grand est le nombre de participants à la
rédaction des numéros, mieux c'est.
J'adresse un grand merci à celles et ceux qui ont contribué à la
création de ce numéro. En espérant que d'autres pcW viendront remplir le numéro prochain, je
vous souhaite un bon mois de février. – L'embellie.
Les brèves
▲L'Heritage
Foundation cible Wikipédia en anglais — Le journal juif
américain The
Forward a publié le un article révélant que l'Heritage
Foundation, un puissant think thank américain
ultra-conservateur, fervent soutien de Donald Trump, avait un projet de programme
visant à identifier les contributeurs de Wikipédia qui, selon lui,
« abuseraient de leur position » pour diffuser des
contenus « antisémites ». Les guillemets sont importants
puisque cela intervient, explique le journaliste Arno Rosenfeld,
dans un contexte de critiques par certaines personnalités juives au
sujet du traitement de la guerre à Gaza par Wikipédia en anglais,
et au sujet de la qualification par la communauté wikipédienne
anglophone de l'Anti-Defamation League comme
généralement peu fiable au sujet du conflit israélo-palestinien
(voir (en) Wikipedia:Reliable
sources/Perennial sources pour le détail). Le Mondeécrit ainsi que la Heritage Foundation cible
« des contributeurs de Wikipédia jugés
trop hostiles à Israël ».
Pour identifier les wikipédiens (sous pseudonyme), la Heritage
Foundation prévoit — cf. ce document interne obtenu par The
Forward — d'utiliser divers moyens, y compris l'analyse de
données issues de brèches de sécurité, l'utilisation d'adresses URL
piégées (pour obtenir l'IP et d'autres informations sur les
contributeurs) et l'usage, sur Wikipédia, de faux-nez.
▲The Signpost
souffle ses 20 bougies — Douze articles, tous signés Michael Snow. C'est ce que
propose, le , le premier
numéro du Wikipedia
Signpost, qui deviendra, pour les vingt ans à suivre le
journal de la communauté wikipédienne anglophone. On y apprend
alors que l'encyclopédie
vient d'entrer dans le classement des cent sites web les plus
visités et que la page wikipedia.org, qui redirigeait
vers Wikipédia en anglais, joue désormais le rôle de portail
multilingue — c'est toujours le cas aujourd'hui.
À l'époque, Michael Snow a un peu plus d'un an d'ancienneté et
6 000 modifications au compteur. D'emblée, son
objectif est que le Wikipedia Signpost soit écrit à
plusieurs mains ; le second
numéro, publié une semaine plus tard — le journal est
alors hebdomadaire —, accueille des articles signés par
d'autres bénévoles. Dès , Michael Snow passe le relais de la
rédaction en chef à un autre contributeur, Ral315, qui sera lui-même suivi par plusieurs
autres, jusqu'à JPxG qui anime aujourd'hui la rédaction.
▲Un script pour la
recherche de liens externes — La page spéciale Spécial:Recherche de liens permet
d'afficher toutes les pages de l'encyclopédie qui contiennent un
nom de
domaine. Cette page est fréquemment utilisée dans le cadre de
la maintenance, en particulier pour la lutte contre le spam ou les
sites non fiables. Toutefois, elle ne permet pas le tri par
espace de noms ; une telle fonctionnalité est demandée
depuis 2007. En attendant que ce vœu soit
exaucé, LD a créé un script qui permet de
n'afficher les liens que sur un espace de noms — par exemple
l'espace principal.
▲Comment la
communauté Wikidata a modélisé le genre ? — Le projet de
recherche Wikidata Gender
Diversity s'intéresse à la modélisation du genre sur Wikidata.
Les autrices et auteurs ont reconstitué la chronologie et les
grandes étapes de cette modélisation.
▲Liste des noms de domaine les
plus cités — Pyb en résidence a mis à
jour la liste des noms de domaine les plus cités sur Wikipedia en
français. Il s'appuie sur une requête SQL sur les bases de données de
Wikipedia via l'outil Quarry. Le site de l'Institut
national de la statistique et des études économiques dépasse
désormais le million de liens. Parmi les noms de domaine associés à
des médias, c'est le site du Monde qui est le plus souvent utilisé avec 146
000 occurrences devant L'Équipe (73 000) et Le Figaro (67 000).
RAW encourage les membres de la communauté à s'exprimer sur
différents enjeux liés à l'écosystème Wikimedia. N'hésitez pas à
proposer vos textes pour cette section. N'hésitez pas non plus à
réagir dans la section du courrier
du lectorat.
Sur fr.wikiquote, un homme sur trois est désormais une
femme !
par Jorune
Le s'achevait la 5e campagne #Shesaid sur
Wikiquotes, cette campagne annuelle proposée par le projet
Wiki loves womens depuis
2020.
Selon les statistiques de Humaniki[1], le site francophone Wikiquote
comptait, à l'issue de cette campagne, 2 171 entrées consacrés
à des femmes, ce qui représente un peu plus de 35% du total des
articles basés sur une biographie. On est, certes, encore loin de
la parité, toutefois, on peut mesurer le travail réalisé en 5 ans
par les wikimédiens participants à cette opération. En effet, fin
, juste
avant la toute première campagne #Shesaid, Wikiquote en français ne
comptait que 519 femmes pour 3 117 hommes (soit 14% des entrées
basées sur une biographie).
L'année 2024 a été particulièrement prolifique avec plus de 200
articles améliorés et surtout 730 entrées ajoutées lors de la
campagne officielle. Grâce à ce niveau élevé de participation,
Wikiquote en français pourrait (enfin) quitter la catégorie des
petits wikis d'ici à 2026 !
Ce bilan numérique encourageant de 2024 est en partie lié aux
efforts d'animation réalisés par les Wikimédiens du continent
africain (ateliers, concours...) qui finit par bousculer le
classement des pages par nationalité ! A fin 2024, 6 pays
africains francophones figurent parmi les 10 nationalités les plus
représentées sur Wikiquote. Par comparaison, sur la Wikipédia en
français, les personnalités féminines européennes et américaines
apparaissent en tête de classement et le premier pays d'Afrique (l'Afrique du Sud)
pointe à la 33e place du classement par nationalité.
Il reste encore des marges de progrès, notamment en ce qui
concerne l'épaisseur et la visibilité des pages proposées. Ainsi,
sur les 2 000 entrées consacrées à des femmes, moins de 20%
d'entre elles dépassent les 4 000 octets : cela
représente moins de 5 citations par article. Autrement dit, 80% des
pages consacrées à des femmes sont de courtes ébauches à partir
desquelles il est difficile de se faire une idée de l'œuvre ou la
pensée d'une personnalité.
Par ailleurs, les articles créés sont en général peu liés aux
autres pages du recueil et on ne retrouve pas les paroles de ces
dames sur les thématiques transversales de Wikiquote : en
décembre 2024, la reine du crime
Agatha Christie (3900 octets en décembre 2024) ne figure pas
sur les pages crime, cadavre ou détective.
Aussi, on peut se réjouir de ce que #Shesaid apporte chaque fin
d'année un certain dynamisme à Wikiquote en français même si le
recueil de citations francophones pourrait encore gagner en qualité
et en profondeur pour que Madonna ne soit plus la seule femme à
dépasser 100 citations.
L'atelier
Dans cette section, un(e) wikimédien(ne) peut raconter un de
ses bricolages à la première personne.
Ce mois-ci, Monsieur Tortue vient nous parler de
son expérimentation sur les contributions par IP sur Wikipédia.
Étant membre de la patrouille RC depuis maintenant
quelques mois, j'observe régulièrement des vandalismes effectués
par des adresses IP. Toutefois, il était jusqu'à présent difficile
d'évaluer précisément leur impact sur l'encyclopédie.
Après de nombreuses recherches et discussions, j'ai constaté que
cette problématique est récurrente, tant sur la version francophone
que sur les autres versions linguistiques. Certaines wikis ont
d'ailleurs pris des mesures drastiques : Wikipédia en
portugais a bloqué de façon permanente les modifications par IP,
tandis que la version en farsi l'a fait temporairement.
Face à ce constat, j'ai développé il y a quelques mois un
système d'analyse des contributions IP sur le Wikipédia
francophone. L'objectif était d'étudier les caractéristiques de ces
modifications et d'identifier d'éventuels patterns récurrents. Pour
ce faire, j'ai mis en place une collecte automatique des
modifications par IP, suivie d'une annotation manuelle de leur
constructivité.
Le constat principal est qu'environ 20 % des
modifications par IP sur Wikipédia en français sont des
vandalismes. Ce chiffre est d'autant plus significatif qu'il ne
prend en compte que les modifications ayant passé les filtres anti-abus, qui bloquent
déjà une partie importante des vandalismes les plus évidents.
L'analyse par FAI révèle une distribution
globalement uniforme du vandalisme, à une exception notable
près : le
RENATER, qui équipe de nombreux établissements d'enseignement,
présente un taux de vandalisme deux fois supérieur à la
moyenne.
La taille des modifications s'avère être un indicateur
pertinent : 40 % des "grandes suppressions" (plus de 100
caractères) sont classées comme du vandalisme, contre seulement
15 % pour les modifications "moyennes" (entre -10 et +100
caractères).
Cette étude présente toutefois certains biais qu'il convient de
mentionner :
Les filtres anti-abus constituent un premier niveau de filtrage
qui masque une partie des tentatives de vandalisme, suggérant que
le taux réel de tentatives malveillantes est probablement supérieur
aux 20 % observés.
Certaines modifications peuvent être ambiguës et difficiles à
classifier de manière définitive. Dans l'optique d'améliorer les
résultats reconnus, une échelle de notation (0 = vandalisme
évident, 5 = modification totalement constructive) aurait été
intéressante
L'échantillon, bien que plus important que les précédentes
expérimentations, ne couvre qu'une période d'une dizaine de
jours.
Plus de résultats et la méthodologie complète sont disponibles
dans la présentation jointe.
Toutefois, tout n'est pas noir : l'arrivée des comptes temporaires va
possiblement transformer la situation. En effet, depuis quelques
mois maintenant, la Fondation Wikimédia teste un système permettant
aux contributeurs anonymes d'obtenir automatiquement un compte
temporaire, offrant ainsi un meilleur suivi des modifications.
Cette solution pourrait apporter un équilibre entre accessibilité
et lutte contre le vandalisme, comme l'ont montré les premiers
résultats encourageants sur les wikis test...
La grande interview
Dans cette section, nous donnons la parole à des
wikimédien(ne)s sur des thèmes donnés afin de recueillir leurs avis
ou les faire parler tout simplement de leurs expériences dans le
mouvement.
Pas d’entrevue ce mois-ci, mais ce format reviendra peut-être
dans un prochain numéro !
Il nous fera
plaisir de lire les messages déposés ici et, si nécessaire, d'y
répondre dans les plus brefs délais.
Merci à toute l'équipe pour ce nouveau numéro. La partie sur les
contributions des IPs est particulièrement intéressante. Merci
également à PAC2 pour tous ces mois à animer
infatigablement les publications du RAW et qui pourra profiter d'un
wikibreak bien mérité. Puisse d'autres personnes reprendre le
flambleau.--Pronoia (discuter)
1 février 2025 à 14:27 (CET)
Merci à
toi PAC2 pour tous ces mois de travail et à
l'édito de secours pour avoir réussi à sortir cette édition à
temps. Je pense rejoindre la rédaction pour tenir en vie cette
infolettre très utile Musstruss (discuter)
1 février 2025 à 14:50 (CET)
▲L'édito de secours —
Ceci aurait dû être un édito en bonne et due forme de la part d'un
des rédacteurs des RAW mais le principal animateur des RAW,
PAC2,
est en wikibreak et le numéro n'a pas été lancé dans la nuit du
30/31 au 1er
comme c'est l'habitude. Il aspire également à
passer moins de temps sur les RAW dans les prochains mois.
C'est l'occasion plus que jamais de rappeler que ce magazine ne
peut vivre que si vous participez à sa rédaction. Des sections sont
restées vides faute de disponibilité de celles et ceux qui s'y
attellent souvent. Il y a plusieurs manières de participer à la
rédaction : entre autres, chercher et présenter des brèves,
donner son avis sur un sujet dans la section Focus, faire
l'interview d'une pcW, présenter des tests qu'on a pu réaliser
comme Mr Tortue le fait dans ce numéro, corriger les fautes qui
s’immiscent. Plus grand est le nombre de participants à la
rédaction des numéros, mieux c'est.
J'adresse un grand merci à celles et ceux qui ont contribué à la
création de ce numéro. En espérant que d'autres pcW viendront remplir le numéro prochain, je
vous souhaite un bon mois de février. – L'embellie.
Les brèves
▲L'Heritage
Foundation cible Wikipédia en anglais — Le journal juif
américain The
Forward a publié le un article révélant que l'Heritage
Foundation, un puissant think thank américain
ultra-conservateur, fervent soutien de Donald Trump, avait un projet de programme
visant à identifier les contributeurs de Wikipédia qui, selon lui,
« abuseraient de leur position » pour diffuser des
contenus « antisémites ». Les guillemets sont importants
puisque cela intervient, explique le journaliste Arno Rosenfeld,
dans un contexte de critiques par certaines personnalités juives au
sujet du traitement de la guerre à Gaza par Wikipédia en anglais,
et au sujet de la qualification par la communauté wikipédienne
anglophone de l'Anti-Defamation League comme
généralement peu fiable au sujet du conflit israélo-palestinien
(voir (en) Wikipedia:Reliable
sources/Perennial sources pour le détail). Le Mondeécrit ainsi que la Heritage Foundation cible
« des contributeurs de Wikipédia jugés
trop hostiles à Israël ».
Pour identifier les wikipédiens (sous pseudonyme), la Heritage
Foundation prévoit — cf. ce document interne obtenu par The
Forward — d'utiliser divers moyens, y compris l'analyse de
données issues de brèches de sécurité, l'utilisation d'adresses URL
piégées (pour obtenir l'IP et d'autres informations sur les
contributeurs) et l'usage, sur Wikipédia, de faux-nez.
▲The Signpost
souffle ses 20 bougies — Douze articles, tous signés Michael Snow. C'est ce que
propose, le , le premier
numéro du Wikipedia
Signpost, qui deviendra, pour les vingt ans à suivre le
journal de la communauté wikipédienne anglophone. On y apprend
alors que l'encyclopédie
vient d'entrer dans le classement des cent sites web les plus
visités et que la page wikipedia.org, qui redirigeait
vers Wikipédia en anglais, joue désormais le rôle de portail
multilingue — c'est toujours le cas aujourd'hui.
À l'époque, Michael Snow a un peu plus d'un an d'ancienneté et
6 000 modifications au compteur. D'emblée, son
objectif est que le Wikipedia Signpost soit écrit à
plusieurs mains ; le second
numéro, publié une semaine plus tard — le journal est
alors hebdomadaire —, accueille des articles signés par
d'autres bénévoles. Dès , Michael Snow passe le relais de la
rédaction en chef à un autre contributeur, Ral315, qui sera lui-même suivi par plusieurs
autres, jusqu'à JPxG qui anime aujourd'hui la rédaction.
▲Un script pour la
recherche de liens externes — La page spéciale Spécial:Recherche de liens permet
d'afficher toutes les pages de l'encyclopédie qui contiennent un
nom de
domaine. Cette page est fréquemment utilisée dans le cadre de
la maintenance, en particulier pour la lutte contre le spam ou les
sites non fiables. Toutefois, elle ne permet pas le tri par
espace de noms ; une telle fonctionnalité est demandée
depuis 2007. En attendant que ce vœu soit
exaucé, LD a créé un script qui permet de
n'afficher les liens que sur un espace de noms — par exemple
l'espace principal.
▲Comment la
communauté Wikidata a modélisé le genre ? — Le projet de
recherche Wikidata Gender
Diversity s'intéresse à la modélisation du genre sur Wikidata.
Les autrices et auteurs ont reconstitué la chronologie et les
grandes étapes de cette modélisation.
▲Liste des noms de domaine les
plus cités — Pyb en résidence a mis à
jour la liste des noms de domaine les plus cités sur Wikipedia en
français. Il s'appuie sur une requête SQL sur les bases de données de
Wikipedia via l'outil Quarry. Le site de l'Institut
national de la statistique et des études économiques dépasse
désormais le million de liens. Parmi les noms de domaine associés à
des médias, c'est le site du Monde qui est le plus souvent utilisé avec 146
000 occurrences devant L'Équipe (73 000) et Le Figaro (67 000).
RAW encourage les membres de la communauté à s'exprimer sur
différents enjeux liés à l'écosystème Wikimedia. N'hésitez pas à
proposer vos textes pour cette section. N'hésitez pas non plus à
réagir dans la section du courrier
du lectorat.
Sur fr.wikiquote, un homme sur trois est désormais une
femme !
par Jorune
Le s'achevait la 5e campagne #Shesaid sur
Wikiquotes, cette campagne annuelle proposée par le projet
Wiki loves womens depuis
2020.
Selon les statistiques de Humaniki[1], le site francophone Wikiquote
comptait, à l'issue de cette campagne, 2 171 entrées consacrés
à des femmes, ce qui représente un peu plus de 35% du total des
articles basés sur une biographie. On est, certes, encore loin de
la parité, toutefois, on peut mesurer le travail réalisé en 5 ans
par les wikimédiens participants à cette opération. En effet, fin
, juste
avant la toute première campagne #Shesaid, Wikiquote en français ne
comptait que 519 femmes pour 3 117 hommes (soit 14% des entrées
basées sur une biographie).
L'année 2024 a été particulièrement prolifique avec plus de 200
articles améliorés et surtout 730 entrées ajoutées lors de la
campagne officielle. Grâce à ce niveau élevé de participation,
Wikiquote en français pourrait (enfin) quitter la catégorie des
petits wikis d'ici à 2026 !
Ce bilan numérique encourageant de 2024 est en partie lié aux
efforts d'animation réalisés par les Wikimédiens du continent
africain (ateliers, concours...) qui finit par bousculer le
classement des pages par nationalité ! A fin 2024, 6 pays
africains francophones figurent parmi les 10 nationalités les plus
représentées sur Wikiquote. Par comparaison, sur la Wikipédia en
français, les personnalités féminines européennes et américaines
apparaissent en tête de classement et le premier pays d'Afrique (l'Afrique du Sud)
pointe à la 33e place du classement par nationalité.
Il reste encore des marges de progrès, notamment en ce qui
concerne l'épaisseur et la visibilité des pages proposées. Ainsi,
sur les 2 000 entrées consacrées à des femmes, moins de 20%
d'entre elles dépassent les 4 000 octets : cela
représente moins de 5 citations par article. Autrement dit, 80% des
pages consacrées à des femmes sont de courtes ébauches à partir
desquelles il est difficile de se faire une idée de l'œuvre ou la
pensée d'une personnalité.
Par ailleurs, les articles créés sont en général peu liés aux
autres pages du recueil et on ne retrouve pas les paroles de ces
dames sur les thématiques transversales de Wikiquote : en
décembre 2024, la reine du crime
Agatha Christie (3900 octets en décembre 2024) ne figure pas
sur les pages crime, cadavre ou détective.
Aussi, on peut se réjouir de ce que #Shesaid apporte chaque fin
d'année un certain dynamisme à Wikiquote en français même si le
recueil de citations francophones pourrait encore gagner en qualité
et en profondeur pour que Madonna ne soit plus la seule femme à
dépasser 100 citations.
L'atelier
Dans cette section, un(e) wikimédien(ne) peut raconter un de
ses bricolages à la première personne.
Ce mois-ci, Monsieur Tortue vient nous parler de
son expérimentation sur les contributions par IP sur Wikipédia.
Étant membre de la patrouille RC depuis maintenant
quelques mois, j'observe régulièrement des vandalismes effectués
par des adresses IP. Toutefois, il était jusqu'à présent difficile
d'évaluer précisément leur impact sur l'encyclopédie.
Après de nombreuses recherches et discussions, j'ai constaté que
cette problématique est récurrente, tant sur la version francophone
que sur les autres versions linguistiques. Certaines wikis ont
d'ailleurs pris des mesures drastiques : Wikipédia en
portugais a bloqué de façon permanente les modifications par IP,
tandis que la version en farsi l'a fait temporairement.
Face à ce constat, j'ai développé il y a quelques mois un
système d'analyse des contributions IP sur le Wikipédia
francophone. L'objectif était d'étudier les caractéristiques de ces
modifications et d'identifier d'éventuels patterns récurrents. Pour
ce faire, j'ai mis en place une collecte automatique des
modifications par IP, suivie d'une annotation manuelle de leur
constructivité.
Le constat principal est qu'environ 20 % des
modifications par IP sur Wikipédia en français sont des
vandalismes. Ce chiffre est d'autant plus significatif qu'il ne
prend en compte que les modifications ayant passé les filtres anti-abus, qui bloquent
déjà une partie importante des vandalismes les plus évidents.
L'analyse par FAI révèle une distribution
globalement uniforme du vandalisme, à une exception notable
près : le
RENATER, qui équipe de nombreux établissements d'enseignement,
présente un taux de vandalisme deux fois supérieur à la
moyenne.
La taille des modifications s'avère être un indicateur
pertinent : 40 % des "grandes suppressions" (plus de 100
caractères) sont classées comme du vandalisme, contre seulement
15 % pour les modifications "moyennes" (entre -10 et +100
caractères).
Cette étude présente toutefois certains biais qu'il convient de
mentionner :
Les filtres anti-abus constituent un premier niveau de filtrage
qui masque une partie des tentatives de vandalisme, suggérant que
le taux réel de tentatives malveillantes est probablement supérieur
aux 20 % observés.
Certaines modifications peuvent être ambiguës et difficiles à
classifier de manière définitive. Dans l'optique d'améliorer les
résultats reconnus, une échelle de notation (0 = vandalisme
évident, 5 = modification totalement constructive) aurait été
intéressante
L'échantillon, bien que plus important que les précédentes
expérimentations, ne couvre qu'une période d'une dizaine de
jours.
Plus de résultats et la méthodologie complète sont disponibles
dans la présentation jointe.
Toutefois, tout n'est pas noir : l'arrivée des comptes temporaires va
possiblement transformer la situation. En effet, depuis quelques
mois maintenant, la Fondation Wikimédia teste un système permettant
aux contributeurs anonymes d'obtenir automatiquement un compte
temporaire, offrant ainsi un meilleur suivi des modifications.
Cette solution pourrait apporter un équilibre entre accessibilité
et lutte contre le vandalisme, comme l'ont montré les premiers
résultats encourageants sur les wikis test...
La grande interview
Dans cette section, nous donnons la parole à des
wikimédien(ne)s sur des thèmes donnés afin de recueillir leurs avis
ou les faire parler tout simplement de leurs expériences dans le
mouvement.
Pas d’entrevue ce mois-ci, mais ce format reviendra peut-être
dans un prochain numéro !
Il nous fera
plaisir de lire les messages déposés ici et, si nécessaire, d'y
répondre dans les plus brefs délais.
Merci à toute l'équipe pour ce nouveau numéro. La partie sur les
contributions des IPs est particulièrement intéressante. Merci
également à PAC2 pour tous ces mois à animer
infatigablement les publications du RAW et qui pourra profiter d'un
wikibreak bien mérité. Puisse d'autres personnes reprendre le
flambleau.--Pronoia (discuter)
1 février 2025 à 14:27 (CET)
Merci à
toi PAC2 pour tous ces mois de travail et à
l'édito de secours pour avoir réussi à sortir cette édition à
temps. Je pense rejoindre la rédaction pour tenir en vie cette
infolettre très utile Musstruss (discuter)
1 février 2025 à 14:50 (CET)
▲L'édito de secours —
Ceci aurait dû être un édito en bonne et due forme de la part d'un
des rédacteurs des RAW mais le principal animateur des RAW,
PAC2,
est en wikibreak et le numéro n'a pas été lancé dans la nuit du
30/31 au 1er
comme c'est l'habitude. Il aspire également à
passer moins de temps sur les RAW dans les prochains mois.
C'est l'occasion plus que jamais de rappeler que ce magazine ne
peut vivre que si vous participez à sa rédaction. Des sections sont
restées vides faute de disponibilité de celles et ceux qui s'y
attellent souvent. Il y a plusieurs manières de participer à la
rédaction : entre autres, chercher et présenter des brèves,
donner son avis sur un sujet dans la section Focus, faire
l'interview d'une pcW, présenter des tests qu'on a pu réaliser
comme Mr Tortue le fait dans ce numéro, corriger les fautes qui
s’immiscent. Plus grand est le nombre de participants à la
rédaction des numéros, mieux c'est.
J'adresse un grand merci à celles et ceux qui ont contribué à la
création de ce numéro. En espérant que d'autres pcW viendront remplir le numéro prochain, je
vous souhaite un bon mois de février. – L'embellie.
Les brèves
▲L'Heritage
Foundation cible Wikipédia en anglais — Le journal juif
américain The
Forward a publié le un article révélant que l'Heritage
Foundation, un puissant think thank américain
ultra-conservateur, fervent soutien de Donald Trump, avait un projet de programme
visant à identifier les contributeurs de Wikipédia qui, selon lui,
« abuseraient de leur position » pour diffuser des
contenus « antisémites ». Les guillemets sont importants
puisque cela intervient, explique le journaliste Arno Rosenfeld,
dans un contexte de critiques par certaines personnalités juives au
sujet du traitement de la guerre à Gaza par Wikipédia en anglais,
et au sujet de la qualification par la communauté wikipédienne
anglophone de l'Anti-Defamation League comme
généralement peu fiable au sujet du conflit israélo-palestinien
(voir (en) Wikipedia:Reliable
sources/Perennial sources pour le détail). Le Mondeécrit ainsi que la Heritage Foundation cible
« des contributeurs de Wikipédia jugés
trop hostiles à Israël ».
Pour identifier les wikipédiens (sous pseudonyme), la Heritage
Foundation prévoit — cf. ce document interne obtenu par The
Forward — d'utiliser divers moyens, y compris l'analyse de
données issues de brèches de sécurité, l'utilisation d'adresses URL
piégées (pour obtenir l'IP et d'autres informations sur les
contributeurs) et l'usage, sur Wikipédia, de faux-nez.
▲The Signpost
souffle ses 20 bougies — Douze articles, tous signés Michael Snow. C'est ce que
propose, le , le premier
numéro du Wikipedia
Signpost, qui deviendra, pour les vingt ans à suivre le
journal de la communauté wikipédienne anglophone. On y apprend
alors que l'encyclopédie
vient d'entrer dans le classement des cent sites web les plus
visités et que la page wikipedia.org, qui redirigeait
vers Wikipédia en anglais, joue désormais le rôle de portail
multilingue — c'est toujours le cas aujourd'hui.
À l'époque, Michael Snow a un peu plus d'un an d'ancienneté et
6 000 modifications au compteur. D'emblée, son
objectif est que le Wikipedia Signpost soit écrit à
plusieurs mains ; le second
numéro, publié une semaine plus tard — le journal est
alors hebdomadaire —, accueille des articles signés par
d'autres bénévoles. Dès , Michael Snow passe le relais de la
rédaction en chef à un autre contributeur, Ral315, qui sera lui-même suivi par plusieurs
autres, jusqu'à JPxG qui anime aujourd'hui la rédaction.
▲Un script pour la
recherche de liens externes — La page spéciale Spécial:Recherche de liens permet
d'afficher toutes les pages de l'encyclopédie qui contiennent un
nom de
domaine. Cette page est fréquemment utilisée dans le cadre de
la maintenance, en particulier pour la lutte contre le spam ou les
sites non fiables. Toutefois, elle ne permet pas le tri par
espace de noms ; une telle fonctionnalité est demandée
depuis 2007. En attendant que ce vœu soit
exaucé, LD a créé un script qui permet de
n'afficher les liens que sur un espace de noms — par exemple
l'espace principal.
▲Comment la
communauté Wikidata a modélisé le genre ? — Le projet de
recherche Wikidata Gender
Diversity s'intéresse à la modélisation du genre sur Wikidata.
Les autrices et auteurs ont reconstitué la chronologie et les
grandes étapes de cette modélisation.
▲Liste des noms de domaine les
plus cités — Pyb en résidence a mis à
jour la liste des noms de domaine les plus cités sur Wikipedia en
français. Il s'appuie sur une requête SQL sur les bases de données de
Wikipedia via l'outil Quarry. Le site de l'Institut
national de la statistique et des études économiques dépasse
désormais le million de liens. Parmi les noms de domaine associés à
des médias, c'est le site du Monde qui est le plus souvent utilisé avec 146
000 occurrences devant L'Équipe (73 000) et Le Figaro (67 000).
RAW encourage les membres de la communauté à s'exprimer sur
différents enjeux liés à l'écosystème Wikimedia. N'hésitez pas à
proposer vos textes pour cette section. N'hésitez pas non plus à
réagir dans la section du courrier
du lectorat.
Sur fr.wikiquote, un homme sur trois est désormais une
femme !
par Jorune
Le s'achevait la 5e campagne #Shesaid sur
Wikiquotes, cette campagne annuelle proposée par le projet
Wiki loves womens depuis
2020.
Selon les statistiques de Humaniki[1], le site francophone Wikiquote
comptait, à l'issue de cette campagne, 2 171 entrées consacrés
à des femmes, ce qui représente un peu plus de 35% du total des
articles basés sur une biographie. On est, certes, encore loin de
la parité, toutefois, on peut mesurer le travail réalisé en 5 ans
par les wikimédiens participants à cette opération. En effet, fin
, juste
avant la toute première campagne #Shesaid, Wikiquote en français ne
comptait que 519 femmes pour 3 117 hommes (soit 14% des entrées
basées sur une biographie).
L'année 2024 a été particulièrement prolifique avec plus de 200
articles améliorés et surtout 730 entrées ajoutées lors de la
campagne officielle. Grâce à ce niveau élevé de participation,
Wikiquote en français pourrait (enfin) quitter la catégorie des
petits wikis d'ici à 2026 !
Ce bilan numérique encourageant de 2024 est en partie lié aux
efforts d'animation réalisés par les Wikimédiens du continent
africain (ateliers, concours...) qui finit par bousculer le
classement des pages par nationalité ! A fin 2024, 6 pays
africains francophones figurent parmi les 10 nationalités les plus
représentées sur Wikiquote. Par comparaison, sur la Wikipédia en
français, les personnalités féminines européennes et américaines
apparaissent en tête de classement et le premier pays d'Afrique (l'Afrique du Sud)
pointe à la 33e place du classement par nationalité.
Il reste encore des marges de progrès, notamment en ce qui
concerne l'épaisseur et la visibilité des pages proposées. Ainsi,
sur les 2 000 entrées consacrées à des femmes, moins de 20%
d'entre elles dépassent les 4 000 octets : cela
représente moins de 5 citations par article. Autrement dit, 80% des
pages consacrées à des femmes sont de courtes ébauches à partir
desquelles il est difficile de se faire une idée de l'œuvre ou la
pensée d'une personnalité.
Par ailleurs, les articles créés sont en général peu liés aux
autres pages du recueil et on ne retrouve pas les paroles de ces
dames sur les thématiques transversales de Wikiquote : en
décembre 2024, la reine du crime
Agatha Christie (3900 octets en décembre 2024) ne figure pas
sur les pages crime, cadavre ou détective.
Aussi, on peut se réjouir de ce que #Shesaid apporte chaque fin
d'année un certain dynamisme à Wikiquote en français même si le
recueil de citations francophones pourrait encore gagner en qualité
et en profondeur pour que Madonna ne soit plus la seule femme à
dépasser 100 citations.
L'atelier
Dans cette section, un(e) wikimédien(ne) peut raconter un de
ses bricolages à la première personne.
Ce mois-ci, Monsieur Tortue vient nous parler de
son expérimentation sur les contributions par IP sur Wikipédia.
Étant membre de la patrouille RC depuis maintenant
quelques mois, j'observe régulièrement des vandalismes effectués
par des adresses IP. Toutefois, il était jusqu'à présent difficile
d'évaluer précisément leur impact sur l'encyclopédie.
Après de nombreuses recherches et discussions, j'ai constaté que
cette problématique est récurrente, tant sur la version francophone
que sur les autres versions linguistiques. Certaines wikis ont
d'ailleurs pris des mesures drastiques : Wikipédia en
portugais a bloqué de façon permanente les modifications par IP,
tandis que la version en farsi l'a fait temporairement.
Face à ce constat, j'ai développé il y a quelques mois un
système d'analyse des contributions IP sur le Wikipédia
francophone. L'objectif était d'étudier les caractéristiques de ces
modifications et d'identifier d'éventuels patterns récurrents. Pour
ce faire, j'ai mis en place une collecte automatique des
modifications par IP, suivie d'une annotation manuelle de leur
constructivité.
Le constat principal est qu'environ 20 % des
modifications par IP sur Wikipédia en français sont des
vandalismes. Ce chiffre est d'autant plus significatif qu'il ne
prend en compte que les modifications ayant passé les filtres anti-abus, qui bloquent
déjà une partie importante des vandalismes les plus évidents.
L'analyse par FAI révèle une distribution
globalement uniforme du vandalisme, à une exception notable
près : le
RENATER, qui équipe de nombreux établissements d'enseignement,
présente un taux de vandalisme deux fois supérieur à la
moyenne.
La taille des modifications s'avère être un indicateur
pertinent : 40 % des "grandes suppressions" (plus de 100
caractères) sont classées comme du vandalisme, contre seulement
15 % pour les modifications "moyennes" (entre -10 et +100
caractères).
Cette étude présente toutefois certains biais qu'il convient de
mentionner :
Les filtres anti-abus constituent un premier niveau de filtrage
qui masque une partie des tentatives de vandalisme, suggérant que
le taux réel de tentatives malveillantes est probablement supérieur
aux 20 % observés.
Certaines modifications peuvent être ambiguës et difficiles à
classifier de manière définitive. Dans l'optique d'améliorer les
résultats reconnus, une échelle de notation (0 = vandalisme
évident, 5 = modification totalement constructive) aurait été
intéressante
L'échantillon, bien que plus important que les précédentes
expérimentations, ne couvre qu'une période d'une dizaine de
jours.
Plus de résultats et la méthodologie complète sont disponibles
dans la présentation jointe.
Toutefois, tout n'est pas noir : l'arrivée des comptes temporaires va
possiblement transformer la situation. En effet, depuis quelques
mois maintenant, la Fondation Wikimédia teste un système permettant
aux contributeurs anonymes d'obtenir automatiquement un compte
temporaire, offrant ainsi un meilleur suivi des modifications.
Cette solution pourrait apporter un équilibre entre accessibilité
et lutte contre le vandalisme, comme l'ont montré les premiers
résultats encourageants sur les wikis test...
La grande interview
Dans cette section, nous donnons la parole à des
wikimédien(ne)s sur des thèmes donnés afin de recueillir leurs avis
ou les faire parler tout simplement de leurs expériences dans le
mouvement.
Pas d’entrevue ce mois-ci, mais ce format reviendra peut-être
dans un prochain numéro !
Il nous fera
plaisir de lire les messages déposés ici et, si nécessaire, d'y
répondre dans les plus brefs délais.
Merci à toute l'équipe pour ce nouveau numéro. La partie sur les
contributions des IPs est particulièrement intéressante. Merci
également à PAC2 pour tous ces mois à animer
infatigablement les publications du RAW et qui pourra profiter d'un
wikibreak bien mérité. Puisse d'autres personnes reprendre le
flambleau.--Pronoia (discuter)
1 février 2025 à 14:27 (CET)
Merci à
toi PAC2 pour tous ces mois de travail et à
l'édito de secours pour avoir réussi à sortir cette édition à
temps. Je pense rejoindre la rédaction pour tenir en vie cette
infolettre très utile Musstruss (discuter)
1 février 2025 à 14:50 (CET)
Antoine Bardelli, CC-By-SA 4.0 Comme chaque année, l’association
Wikimédia France lance sa campagne d’adhésion. Utilisateurs ou
utilisatrices des projets Wikimédia, bénévoles, militants,
défenseurs pour un Internet libre, nous avons besoin de vous. Plus
nous serons nombreux et nombreuses, plus nous pourrons faire valoir
le modèle de Wikipédia basé sur un fonctionnement collaboratif,
gratuit et sous […]
▲L'édito de secours —
Ceci aurait dû être un édito en bonne et due forme de la part d'un
des rédacteurs des RAW mais le principal animateur des RAW,
PAC2,
est en wikibreak et le numéro n'a pas été lancé dans la nuit du
30/31 au 1er
comme c'est l'habitude. Il aspire également à
passer moins de temps sur les RAW dans les prochains mois.
C'est l'occasion plus que jamais de rappeler que ce magazine ne
peut vivre que si vous participez à sa rédaction. Des sections sont
restées vides faute de disponibilité de celles et ceux qui s'y
attellent souvent. Il y a plusieurs manières de participer à la
rédaction : entre autres, chercher et présenter des brèves,
donner son avis sur un sujet dans la section Focus, faire
l'interview d'une pcW, présenter des tests qu'on a pu réaliser
comme Mr Tortue le fait dans ce numéro, corriger les fautes qui
s’immiscent. Plus grand est le nombre de participants à la
rédaction des numéros, mieux c'est.
J'adresse un grand merci à celles et ceux qui ont contribué à la
création de ce numéro. En espérant que d'autres pcW viendront remplir le numéro prochain, je
vous souhaite un bon mois de février. – L'embellie.
Les brèves
▲L'Heritage
Foundation cible Wikipédia en anglais — Le journal juif
américain The
Forward a publié le un article révélant que l'Heritage
Foundation, un puissant think thank américain
ultra-conservateur, fervent soutien de Donald Trump, avait un projet de programme
visant à identifier les contributeurs de Wikipédia qui, selon lui,
« abuseraient de leur position » pour diffuser des
contenus « antisémites ». Les guillemets sont importants
puisque cela intervient, explique le journaliste Arno Rosenfeld,
dans un contexte de critiques par certaines personnalités juives au
sujet du traitement de la guerre à Gaza par Wikipédia en anglais,
et au sujet de la qualification par la communauté wikipédienne
anglophone de l'Anti-Defamation League comme
généralement peu fiable au sujet du conflit israélo-palestinien
(voir (en) Wikipedia:Reliable
sources/Perennial sources pour le détail). Le Mondeécrit ainsi que la Heritage Foundation cible
« des contributeurs de Wikipédia jugés
trop hostiles à Israël ».
Pour identifier les wikipédiens (sous pseudonyme), la Heritage
Foundation prévoit — cf. ce document interne obtenu par The
Forward — d'utiliser divers moyens, y compris l'analyse de
données issues de brèches de sécurité, l'utilisation d'adresses URL
piégées (pour obtenir l'IP et d'autres informations sur les
contributeurs) et l'usage, sur Wikipédia, de faux-nez.
▲The Signpost
souffle ses 20 bougies — Douze articles, tous signés Michael Snow. C'est ce que
propose, le , le premier
numéro du Wikipedia
Signpost, qui deviendra, pour les vingt ans à suivre le
journal de la communauté wikipédienne anglophone. On y apprend
alors que l'encyclopédie
vient d'entrer dans le classement des cent sites web les plus
visités et que la page wikipedia.org, qui redirigeait
vers Wikipédia en anglais, joue désormais le rôle de portail
multilingue — c'est toujours le cas aujourd'hui.
À l'époque, Michael Snow a un peu plus d'un an d'ancienneté et
6 000 modifications au compteur. D'emblée, son
objectif est que le Wikipedia Signpost soit écrit à
plusieurs mains ; le second
numéro, publié une semaine plus tard — le journal est
alors hebdomadaire —, accueille des articles signés par
d'autres bénévoles. Dès , Michael Snow passe le relais de la
rédaction en chef à un autre contributeur, Ral315, qui sera lui-même suivi par plusieurs
autres, jusqu'à JPxG qui anime aujourd'hui la rédaction.
▲Un script pour la
recherche de liens externes — La page spéciale Spécial:Recherche de liens permet
d'afficher toutes les pages de l'encyclopédie qui contiennent un
nom de
domaine. Cette page est fréquemment utilisée dans le cadre de
la maintenance, en particulier pour la lutte contre le spam ou les
sites non fiables. Toutefois, elle ne permet pas le tri par
espace de noms ; une telle fonctionnalité est demandée
depuis 2007. En attendant que ce vœu soit
exaucé, LD a créé un script qui permet de
n'afficher les liens que sur un espace de noms — par exemple
l'espace principal.
▲Comment la
communauté Wikidata a modélisé le genre ? — Le projet de
recherche Wikidata Gender
Diversity s'intéresse à la modélisation du genre sur Wikidata.
Les autrices et auteurs ont reconstitué la chronologie et les
grandes étapes de cette modélisation.
▲Liste des noms de domaine les
plus cités — Pyb en résidence a mis à
jour la liste des noms de domaine les plus cités sur Wikipedia en
français. Il s'appuie sur une requête SQL sur les bases de données de
Wikipedia via l'outil Quarry. Le site de l'Institut
national de la statistique et des études économiques dépasse
désormais le million de liens. Parmi les noms de domaine associés à
des médias, c'est le site du Monde qui est le plus souvent utilisé avec 146
000 occurrences devant L'Équipe (73 000) et Le Figaro (67 000).
RAW encourage les membres de la communauté à s'exprimer sur
différents enjeux liés à l'écosystème Wikimedia. N'hésitez pas à
proposer vos textes pour cette section. N'hésitez pas non plus à
réagir dans la section du courrier
du lectorat.
Sur fr.wikiquote, un homme sur trois est désormais une
femme !
par Jorune
Le s'achevait la 5e campagne #Shesaid sur
Wikiquotes, cette campagne annuelle proposée par le projet
Wiki loves womens depuis
2020.
Selon les statistiques de Humaniki[1], le site francophone Wikiquote
comptait, à l'issue de cette campagne, 2 171 entrées consacrés
à des femmes, ce qui représente un peu plus de 35% du total des
articles basés sur une biographie. On est, certes, encore loin de
la parité, toutefois, on peut mesurer le travail réalisé en 5 ans
par les wikimédiens participants à cette opération. En effet, fin
, juste
avant la toute première campagne #Shesaid, Wikiquote en français ne
comptait que 519 femmes pour 3 117 hommes (soit 14% des entrées
basées sur une biographie).
L'année 2024 a été particulièrement prolifique avec plus de 200
articles améliorés et surtout 730 entrées ajoutées lors de la
campagne officielle. Grâce à ce niveau élevé de participation,
Wikiquote en français pourrait (enfin) quitter la catégorie des
petits wikis d'ici à 2026 !
Ce bilan numérique encourageant de 2024 est en partie lié aux
efforts d'animation réalisés par les Wikimédiens du continent
africain (ateliers, concours...) qui finit par bousculer le
classement des pages par nationalité ! A fin 2024, 6 pays
africains francophones figurent parmi les 10 nationalités les plus
représentées sur Wikiquote. Par comparaison, sur la Wikipédia en
français, les personnalités féminines européennes et américaines
apparaissent en tête de classement et le premier pays d'Afrique (l'Afrique du Sud)
pointe à la 33e place du classement par nationalité.
Il reste encore des marges de progrès, notamment en ce qui
concerne l'épaisseur et la visibilité des pages proposées. Ainsi,
sur les 2 000 entrées consacrées à des femmes, moins de 20%
d'entre elles dépassent les 4 000 octets : cela
représente moins de 5 citations par article. Autrement dit, 80% des
pages consacrées à des femmes sont de courtes ébauches à partir
desquelles il est difficile de se faire une idée de l'œuvre ou la
pensée d'une personnalité.
Par ailleurs, les articles créés sont en général peu liés aux
autres pages du recueil et on ne retrouve pas les paroles de ces
dames sur les thématiques transversales de Wikiquote : en
décembre 2024, la reine du crime
Agatha Christie (3900 octets en décembre 2024) ne figure pas
sur les pages crime, cadavre ou détective.
Aussi, on peut se réjouir de ce que #Shesaid apporte chaque fin
d'année un certain dynamisme à Wikiquote en français même si le
recueil de citations francophones pourrait encore gagner en qualité
et en profondeur pour que Madonna ne soit plus la seule femme à
dépasser 100 citations.
L'atelier
Dans cette section, un(e) wikimédien(ne) peut raconter un de
ses bricolages à la première personne.
Ce mois-ci, Monsieur Tortue vient nous parler de
son expérimentation sur les contributions par IP sur Wikipédia.
Étant membre de la patrouille RC depuis maintenant
quelques mois, j'observe régulièrement des vandalismes effectués
par des adresses IP. Toutefois, il était jusqu'à présent difficile
d'évaluer précisément leur impact sur l'encyclopédie.
Après de nombreuses recherches et discussions, j'ai constaté que
cette problématique est récurrente, tant sur la version francophone
que sur les autres versions linguistiques. Certaines wikis ont
d'ailleurs pris des mesures drastiques : Wikipédia en
portugais a bloqué de façon permanente les modifications par IP,
tandis que la version en farsi l'a fait temporairement.
Face à ce constat, j'ai développé il y a quelques mois un
système d'analyse des contributions IP sur le Wikipédia
francophone. L'objectif était d'étudier les caractéristiques de ces
modifications et d'identifier d'éventuels patterns récurrents. Pour
ce faire, j'ai mis en place une collecte automatique des
modifications par IP, suivie d'une annotation manuelle de leur
constructivité.
Le constat principal est qu'environ 20 % des
modifications par IP sur Wikipédia en français sont des
vandalismes. Ce chiffre est d'autant plus significatif qu'il ne
prend en compte que les modifications ayant passé les filtres anti-abus, qui bloquent
déjà une partie importante des vandalismes les plus évidents.
L'analyse par FAI révèle une distribution
globalement uniforme du vandalisme, à une exception notable
près : le
RENATER, qui équipe de nombreux établissements d'enseignement,
présente un taux de vandalisme deux fois supérieur à la
moyenne.
La taille des modifications s'avère être un indicateur
pertinent : 40 % des "grandes suppressions" (plus de 100
caractères) sont classées comme du vandalisme, contre seulement
15 % pour les modifications "moyennes" (entre -10 et +100
caractères).
Cette étude présente toutefois certains biais qu'il convient de
mentionner :
Les filtres anti-abus constituent un premier niveau de filtrage
qui masque une partie des tentatives de vandalisme, suggérant que
le taux réel de tentatives malveillantes est probablement supérieur
aux 20 % observés.
Certaines modifications peuvent être ambiguës et difficiles à
classifier de manière définitive. Dans l'optique d'améliorer les
résultats reconnus, une échelle de notation (0 = vandalisme
évident, 5 = modification totalement constructive) aurait été
intéressante
L'échantillon, bien que plus important que les précédentes
expérimentations, ne couvre qu'une période d'une dizaine de
jours.
Plus de résultats et la méthodologie complète sont disponibles
dans la présentation jointe.
Toutefois, tout n'est pas noir : l'arrivée des comptes temporaires va
possiblement transformer la situation. En effet, depuis quelques
mois maintenant, la Fondation Wikimédia teste un système permettant
aux contributeurs anonymes d'obtenir automatiquement un compte
temporaire, offrant ainsi un meilleur suivi des modifications.
Cette solution pourrait apporter un équilibre entre accessibilité
et lutte contre le vandalisme, comme l'ont montré les premiers
résultats encourageants sur les wikis test...
La grande interview
Dans cette section, nous donnons la parole à des
wikimédien(ne)s sur des thèmes donnés afin de recueillir leurs avis
ou les faire parler tout simplement de leurs expériences dans le
mouvement.
Pas d’entrevue ce mois-ci, mais ce format reviendra peut-être
dans un prochain numéro !
Il nous fera
plaisir de lire les messages déposés ici et, si nécessaire, d'y
répondre dans les plus brefs délais.
Merci à toute l'équipe pour ce nouveau numéro. La partie sur les
contributions des IPs est particulièrement intéressante. Merci
également à PAC2 pour tous ces mois à animer
infatigablement les publications du RAW et qui pourra profiter d'un
wikibreak bien mérité. Puisse d'autres personnes reprendre le
flambleau.--Pronoia (discuter)
1 février 2025 à 14:27 (CET)
Merci à
toi PAC2 pour tous ces mois de travail et à
l'édito de secours pour avoir réussi à sortir cette édition à
temps. Je pense rejoindre la rédaction pour tenir en vie cette
infolettre très utile Musstruss (discuter)
1 février 2025 à 14:50 (CET)
▲L'édito de secours —
Ceci aurait dû être un édito en bonne et due forme de la part d'un
des rédacteurs des RAW mais le principal animateur des RAW,
PAC2,
est en wikibreak et le numéro n'a pas été lancé dans la nuit du
30/31 au 1er
comme c'est l'habitude. Il aspire également à
passer moins de temps sur les RAW dans les prochains mois.
C'est l'occasion plus que jamais de rappeler que ce magazine ne
peut vivre que si vous participez à sa rédaction. Des sections sont
restées vides faute de disponibilité de celles et ceux qui s'y
attellent souvent. Il y a plusieurs manières de participer à la
rédaction : entre autres, chercher et présenter des brèves,
donner son avis sur un sujet dans la section Focus, faire
l'interview d'une pcW, présenter des tests qu'on a pu réaliser
comme Mr Tortue le fait dans ce numéro, corriger les fautes qui
s’immiscent. Plus grand est le nombre de participants à la
rédaction des numéros, mieux c'est.
J'adresse un grand merci à celles et ceux qui ont contribué à la
création de ce numéro. En espérant que d'autres pcW viendront remplir le numéro prochain, je
vous souhaite un bon mois de février. – L'embellie.
Les brèves
▲L'Heritage
Foundation cible Wikipédia en anglais — Le journal juif
américain The
Forward a publié le un article révélant que l'Heritage
Foundation, un puissant think thank américain
ultra-conservateur, fervent soutien de Donald Trump, avait un projet de programme
visant à identifier les contributeurs de Wikipédia qui, selon lui,
« abuseraient de leur position » pour diffuser des
contenus « antisémites ». Les guillemets sont importants
puisque cela intervient, explique le journaliste Arno Rosenfeld,
dans un contexte de critiques par certaines personnalités juives au
sujet du traitement de la guerre à Gaza par Wikipédia en anglais,
et au sujet de la qualification par la communauté wikipédienne
anglophone de l'Anti-Defamation League comme
généralement peu fiable au sujet du conflit israélo-palestinien
(voir (en) Wikipedia:Reliable
sources/Perennial sources pour le détail). Le Mondeécrit ainsi que la Heritage Foundation cible
« des contributeurs de Wikipédia jugés
trop hostiles à Israël ».
Pour identifier les wikipédiens (sous pseudonyme), la Heritage
Foundation prévoit — cf. ce document interne obtenu par The
Forward — d'utiliser divers moyens, y compris l'analyse de
données issues de brèches de sécurité, l'utilisation d'adresses URL
piégées (pour obtenir l'IP et d'autres informations sur les
contributeurs) et l'usage, sur Wikipédia, de faux-nez.
▲The Signpost
souffle ses 20 bougies — Douze articles, tous signés Michael Snow. C'est ce que
propose, le , le premier
numéro du Wikipedia
Signpost, qui deviendra, pour les vingt ans à suivre le
journal de la communauté wikipédienne anglophone. On y apprend
alors que l'encyclopédie
vient d'entrer dans le classement des cent sites web les plus
visités et que la page wikipedia.org, qui redirigeait
vers Wikipédia en anglais, joue désormais le rôle de portail
multilingue — c'est toujours le cas aujourd'hui.
À l'époque, Michael Snow a un peu plus d'un an d'ancienneté et
6 000 modifications au compteur. D'emblée, son
objectif est que le Wikipedia Signpost soit écrit à
plusieurs mains ; le second
numéro, publié une semaine plus tard — le journal est
alors hebdomadaire —, accueille des articles signés par
d'autres bénévoles. Dès , Michael Snow passe le relais de la
rédaction en chef à un autre contributeur, Ral315, qui sera lui-même suivi par plusieurs
autres, jusqu'à JPxG qui anime aujourd'hui la rédaction.
▲Un script pour la
recherche de liens externes — La page spéciale Spécial:Recherche de liens permet
d'afficher toutes les pages de l'encyclopédie qui contiennent un
nom de
domaine. Cette page est fréquemment utilisée dans le cadre de
la maintenance, en particulier pour la lutte contre le spam ou les
sites non fiables. Toutefois, elle ne permet pas le tri par
espace de noms ; une telle fonctionnalité est demandée
depuis 2007. En attendant que ce vœu soit
exaucé, LD a créé un script qui permet de
n'afficher les liens que sur un espace de noms — par exemple
l'espace principal.
▲Comment la
communauté Wikidata a modélisé le genre ? — Le projet de
recherche Wikidata Gender
Diversity s'intéresse à la modélisation du genre sur Wikidata.
Les autrices et auteurs ont reconstitué la chronologie et les
grandes étapes de cette modélisation.
▲Liste des noms de domaine les
plus cités — Pyb en résidence a mis à
jour la liste des noms de domaine les plus cités sur Wikipedia en
français. Il s'appuie sur une requête SQL sur les bases de données de
Wikipedia via l'outil Quarry. Le site de l'Institut
national de la statistique et des études économiques dépasse
désormais le million de liens. Parmi les noms de domaine associés à
des médias, c'est le site du Monde qui est le plus souvent utilisé avec 146
000 occurrences devant L'Équipe (73 000) et Le Figaro (67 000).
RAW encourage les membres de la communauté à s'exprimer sur
différents enjeux liés à l'écosystème Wikimedia. N'hésitez pas à
proposer vos textes pour cette section. N'hésitez pas non plus à
réagir dans la section du courrier
du lectorat.
Sur fr.wikiquote, un homme sur trois est désormais une
femme !
par Jorune
Le s'achevait la 5e campagne #Shesaid sur
Wikiquotes, cette campagne annuelle proposée par le projet
Wiki loves womens depuis
2020.
Selon les statistiques de Humaniki[1], le site francophone Wikiquote
comptait, à l'issue de cette campagne, 2 171 entrées consacrés
à des femmes, ce qui représente un peu plus de 35% du total des
articles basés sur une biographie. On est, certes, encore loin de
la parité, toutefois, on peut mesurer le travail réalisé en 5 ans
par les wikimédiens participants à cette opération. En effet, fin
, juste
avant la toute première campagne #Shesaid, Wikiquote en français ne
comptait que 519 femmes pour 3 117 hommes (soit 14% des entrées
basées sur une biographie).
L'année 2024 a été particulièrement prolifique avec plus de 200
articles améliorés et surtout 730 entrées ajoutées lors de la
campagne officielle. Grâce à ce niveau élevé de participation,
Wikiquote en français pourrait (enfin) quitter la catégorie des
petits wikis d'ici à 2026 !
Ce bilan numérique encourageant de 2024 est en partie lié aux
efforts d'animation réalisés par les Wikimédiens du continent
africain (ateliers, concours...) qui finit par bousculer le
classement des pages par nationalité ! A fin 2024, 6 pays
africains francophones figurent parmi les 10 nationalités les plus
représentées sur Wikiquote. Par comparaison, sur la Wikipédia en
français, les personnalités féminines européennes et américaines
apparaissent en tête de classement et le premier pays d'Afrique (l'Afrique du Sud)
pointe à la 33e place du classement par nationalité.
Il reste encore des marges de progrès, notamment en ce qui
concerne l'épaisseur et la visibilité des pages proposées. Ainsi,
sur les 2 000 entrées consacrées à des femmes, moins de 20%
d'entre elles dépassent les 4 000 octets : cela
représente moins de 5 citations par article. Autrement dit, 80% des
pages consacrées à des femmes sont de courtes ébauches à partir
desquelles il est difficile de se faire une idée de l'œuvre ou la
pensée d'une personnalité.
Par ailleurs, les articles créés sont en général peu liés aux
autres pages du recueil et on ne retrouve pas les paroles de ces
dames sur les thématiques transversales de Wikiquote : en
décembre 2024, la reine du crime
Agatha Christie (3900 octets en décembre 2024) ne figure pas
sur les pages crime, cadavre ou détective.
Aussi, on peut se réjouir de ce que #Shesaid apporte chaque fin
d'année un certain dynamisme à Wikiquote en français même si le
recueil de citations francophones pourrait encore gagner en qualité
et en profondeur pour que Madonna ne soit plus la seule femme à
dépasser 100 citations.
L'atelier
Dans cette section, un(e) wikimédien(ne) peut raconter un de
ses bricolages à la première personne.
Ce mois-ci, Monsieur Tortue vient nous parler de
son expérimentation sur les contributions par IP sur Wikipédia.
Étant membre de la patrouille RC depuis maintenant
quelques mois, j'observe régulièrement des vandalismes effectués
par des adresses IP. Toutefois, il était jusqu'à présent difficile
d'évaluer précisément leur impact sur l'encyclopédie.
Après de nombreuses recherches et discussions, j'ai constaté que
cette problématique est récurrente, tant sur la version francophone
que sur les autres versions linguistiques. Certaines wikis ont
d'ailleurs pris des mesures drastiques : Wikipédia en
portugais a bloqué de façon permanente les modifications par IP,
tandis que la version en farsi l'a fait temporairement.
Face à ce constat, j'ai développé il y a quelques mois un
système d'analyse des contributions IP sur le Wikipédia
francophone. L'objectif était d'étudier les caractéristiques de ces
modifications et d'identifier d'éventuels patterns récurrents. Pour
ce faire, j'ai mis en place une collecte automatique des
modifications par IP, suivie d'une annotation manuelle de leur
constructivité.
Le constat principal est qu'environ 20 % des
modifications par IP sur Wikipédia en français sont des
vandalismes. Ce chiffre est d'autant plus significatif qu'il ne
prend en compte que les modifications ayant passé les filtres anti-abus, qui bloquent
déjà une partie importante des vandalismes les plus évidents.
L'analyse par FAI révèle une distribution
globalement uniforme du vandalisme, à une exception notable
près : le
RENATER, qui équipe de nombreux établissements d'enseignement,
présente un taux de vandalisme deux fois supérieur à la
moyenne.
La taille des modifications s'avère être un indicateur
pertinent : 40 % des "grandes suppressions" (plus de 100
caractères) sont classées comme du vandalisme, contre seulement
15 % pour les modifications "moyennes" (entre -10 et +100
caractères).
Cette étude présente toutefois certains biais qu'il convient de
mentionner :
Les filtres anti-abus constituent un premier niveau de filtrage
qui masque une partie des tentatives de vandalisme, suggérant que
le taux réel de tentatives malveillantes est probablement supérieur
aux 20 % observés.
Certaines modifications peuvent être ambiguës et difficiles à
classifier de manière définitive. Dans l'optique d'améliorer les
résultats reconnus, une échelle de notation (0 = vandalisme
évident, 5 = modification totalement constructive) aurait été
intéressante
L'échantillon, bien que plus important que les précédentes
expérimentations, ne couvre qu'une période d'une dizaine de
jours.
Plus de résultats et la méthodologie complète sont disponibles
dans la présentation jointe.
Toutefois, tout n'est pas noir : l'arrivée des comptes temporaires va
possiblement transformer la situation. En effet, depuis quelques
mois maintenant, la Fondation Wikimédia teste un système permettant
aux contributeurs anonymes d'obtenir automatiquement un compte
temporaire, offrant ainsi un meilleur suivi des modifications.
Cette solution pourrait apporter un équilibre entre accessibilité
et lutte contre le vandalisme, comme l'ont montré les premiers
résultats encourageants sur les wikis test...
La grande interview
Dans cette section, nous donnons la parole à des
wikimédien(ne)s sur des thèmes donnés afin de recueillir leurs avis
ou les faire parler tout simplement de leurs expériences dans le
mouvement.
Pas d’entrevue ce mois-ci, mais ce format reviendra peut-être
dans un prochain numéro !
Il nous fera
plaisir de lire les messages déposés ici et, si nécessaire, d'y
répondre dans les plus brefs délais.
Merci à toute l'équipe pour ce nouveau numéro. La partie sur les
contributions des IPs est particulièrement intéressante. Merci
également à PAC2 pour tous ces mois à animer
infatigablement les publications du RAW et qui pourra profiter d'un
wikibreak bien mérité. Puisse d'autres personnes reprendre le
flambleau.--Pronoia (discuter)
1 février 2025 à 14:27 (CET)
Merci à
toi PAC2 pour tous ces mois de travail et à
l'édito de secours pour avoir réussi à sortir cette édition à
temps. Je pense rejoindre la rédaction pour tenir en vie cette
infolettre très utile Musstruss (discuter)
1 février 2025 à 14:50 (CET)
▲L'édito de secours —
Ceci aurait dû être un édito en bonne et due forme de la part d'un
des rédacteurs des RAW mais le principal animateur des RAW,
PAC2,
est en wikibreak et le numéro n'a pas été lancé dans la nuit du
30/31 au 1er
comme c'est l'habitude. Il aspire également à
passer moins de temps sur les RAW dans les prochains mois.
C'est l'occasion plus que jamais de rappeler que ce magazine ne
peut vivre que si vous participez à sa rédaction. Des sections sont
restées vides faute de disponibilité de celles et ceux qui s'y
attellent souvent. Il y a plusieurs manières de participer à la
rédaction : entre autres, chercher et présenter des brèves,
donner son avis sur un sujet dans la section Focus, faire
l'interview d'une pcW, présenter des tests qu'on a pu réaliser
comme Mr Tortue le fait dans ce numéro, corriger les fautes qui
s’immiscent. Plus grand est le nombre de participants à la
rédaction des numéros, mieux c'est.
J'adresse un grand merci à celles et ceux qui ont contribué à la
création de ce numéro. En espérant que d'autres pcW viendront remplir le numéro prochain, je
vous souhaite un bon mois de février. – L'embellie.
Les brèves
▲L'Heritage
Foundation cible Wikipédia en anglais — Le journal juif
américain The
Forward a publié le un article révélant que l'Heritage
Foundation, un puissant think thank américain
ultra-conservateur, fervent soutien de Donald Trump, avait un projet de programme
visant à identifier les contributeurs de Wikipédia qui, selon lui,
« abuseraient de leur position » pour diffuser des
contenus « antisémites ». Les guillemets sont importants
puisque cela intervient, explique le journaliste Arno Rosenfeld,
dans un contexte de critiques par certaines personnalités juives au
sujet du traitement de la guerre à Gaza par Wikipédia en anglais,
et au sujet de la qualification par la communauté wikipédienne
anglophone de l'Anti-Defamation League comme
généralement peu fiable au sujet du conflit israélo-palestinien
(voir (en) Wikipedia:Reliable
sources/Perennial sources pour le détail). Le Mondeécrit ainsi que la Heritage Foundation cible
« des contributeurs de Wikipédia jugés
trop hostiles à Israël ».
Pour identifier les wikipédiens (sous pseudonyme), la Heritage
Foundation prévoit — cf. ce document interne obtenu par The
Forward — d'utiliser divers moyens, y compris l'analyse de
données issues de brèches de sécurité, l'utilisation d'adresses URL
piégées (pour obtenir l'IP et d'autres informations sur les
contributeurs) et l'usage, sur Wikipédia, de faux-nez.
▲The Signpost
souffle ses 20 bougies — Douze articles, tous signés Michael Snow. C'est ce que
propose, le , le premier
numéro du Wikipedia
Signpost, qui deviendra, pour les vingt ans à suivre le
journal de la communauté wikipédienne anglophone. On y apprend
alors que l'encyclopédie
vient d'entrer dans le classement des cent sites web les plus
visités et que la page wikipedia.org, qui redirigeait
vers Wikipédia en anglais, joue désormais le rôle de portail
multilingue — c'est toujours le cas aujourd'hui.
À l'époque, Michael Snow a un peu plus d'un an d'ancienneté et
6 000 modifications au compteur. D'emblée, son
objectif est que le Wikipedia Signpost soit écrit à
plusieurs mains ; le second
numéro, publié une semaine plus tard — le journal est
alors hebdomadaire —, accueille des articles signés par
d'autres bénévoles. Dès , Michael Snow passe le relais de la
rédaction en chef à un autre contributeur, Ral315, qui sera lui-même suivi par plusieurs
autres, jusqu'à JPxG qui anime aujourd'hui la rédaction.
▲Un script pour la
recherche de liens externes — La page spéciale Spécial:Recherche de liens permet
d'afficher toutes les pages de l'encyclopédie qui contiennent un
nom de
domaine. Cette page est fréquemment utilisée dans le cadre de
la maintenance, en particulier pour la lutte contre le spam ou les
sites non fiables. Toutefois, elle ne permet pas le tri par
espace de noms ; une telle fonctionnalité est demandée
depuis 2007. En attendant que ce vœu soit
exaucé, LD a créé un script qui permet de
n'afficher les liens que sur un espace de noms — par exemple
l'espace principal.
▲Comment la
communauté Wikidata a modélisé le genre ? — Le projet de
recherche Wikidata Gender
Diversity s'intéresse à la modélisation du genre sur Wikidata.
Les autrices et auteurs ont reconstitué la chronologie et les
grandes étapes de cette modélisation.
▲Liste des noms de domaine les
plus cités — Pyb en résidence a mis à
jour la liste des noms de domaine les plus cités sur Wikipedia en
français. Il s'appuie sur une requête SQL sur les bases de données de
Wikipedia via l'outil Quarry. Le site de l'Institut
national de la statistique et des études économiques dépasse
désormais le million de liens. Parmi les noms de domaine associés à
des médias, c'est le site du Monde qui est le plus souvent utilisé avec 146
000 occurrences devant L'Équipe (73 000) et Le Figaro (67 000).
RAW encourage les membres de la communauté à s'exprimer sur
différents enjeux liés à l'écosystème Wikimedia. N'hésitez pas à
proposer vos textes pour cette section. N'hésitez pas non plus à
réagir dans la section du courrier
du lectorat.
Sur fr.wikiquote, un homme sur trois est désormais une
femme !
par Jorune
Le s'achevait la 5e campagne #Shesaid sur
Wikiquotes, cette campagne annuelle proposée par le projet
Wiki loves womens depuis
2020.
Selon les statistiques de Humaniki[1], le site francophone Wikiquote
comptait, à l'issue de cette campagne, 2 171 entrées consacrés
à des femmes, ce qui représente un peu plus de 35% du total des
articles basés sur une biographie. On est, certes, encore loin de
la parité, toutefois, on peut mesurer le travail réalisé en 5 ans
par les wikimédiens participants à cette opération. En effet, fin
, juste
avant la toute première campagne #Shesaid, Wikiquote en français ne
comptait que 519 femmes pour 3 117 hommes (soit 14% des entrées
basées sur une biographie).
L'année 2024 a été particulièrement prolifique avec plus de 200
articles améliorés et surtout 730 entrées ajoutées lors de la
campagne officielle. Grâce à ce niveau élevé de participation,
Wikiquote en français pourrait (enfin) quitter la catégorie des
petits wikis d'ici à 2026 !
Ce bilan numérique encourageant de 2024 est en partie lié aux
efforts d'animation réalisés par les Wikimédiens du continent
africain (ateliers, concours...) qui finit par bousculer le
classement des pages par nationalité ! A fin 2024, 6 pays
africains francophones figurent parmi les 10 nationalités les plus
représentées sur Wikiquote. Par comparaison, sur la Wikipédia en
français, les personnalités féminines européennes et américaines
apparaissent en tête de classement et le premier pays d'Afrique (l'Afrique du Sud)
pointe à la 33e place du classement par nationalité.
Il reste encore des marges de progrès, notamment en ce qui
concerne l'épaisseur et la visibilité des pages proposées. Ainsi,
sur les 2 000 entrées consacrées à des femmes, moins de 20%
d'entre elles dépassent les 4 000 octets : cela
représente moins de 5 citations par article. Autrement dit, 80% des
pages consacrées à des femmes sont de courtes ébauches à partir
desquelles il est difficile de se faire une idée de l'œuvre ou la
pensée d'une personnalité.
Par ailleurs, les articles créés sont en général peu liés aux
autres pages du recueil et on ne retrouve pas les paroles de ces
dames sur les thématiques transversales de Wikiquote : en
décembre 2024, la reine du crime
Agatha Christie (3900 octets en décembre 2024) ne figure pas
sur les pages crime, cadavre ou détective.
Aussi, on peut se réjouir de ce que #Shesaid apporte chaque fin
d'année un certain dynamisme à Wikiquote en français même si le
recueil de citations francophones pourrait encore gagner en qualité
et en profondeur pour que Madonna ne soit plus la seule femme à
dépasser 100 citations.
L'atelier
Dans cette section, un(e) wikimédien(ne) peut raconter un de
ses bricolages à la première personne.
Ce mois-ci, Monsieur Tortue vient nous parler de
son expérimentation sur les contributions par IP sur Wikipédia.
Étant membre de la patrouille RC depuis maintenant
quelques mois, j'observe régulièrement des vandalismes effectués
par des adresses IP. Toutefois, il était jusqu'à présent difficile
d'évaluer précisément leur impact sur l'encyclopédie.
Après de nombreuses recherches et discussions, j'ai constaté que
cette problématique est récurrente, tant sur la version francophone
que sur les autres versions linguistiques. Certaines wikis ont
d'ailleurs pris des mesures drastiques : Wikipédia en
portugais a bloqué de façon permanente les modifications par IP,
tandis que la version en farsi l'a fait temporairement.
Face à ce constat, j'ai développé il y a quelques mois un
système d'analyse des contributions IP sur le Wikipédia
francophone. L'objectif était d'étudier les caractéristiques de ces
modifications et d'identifier d'éventuels patterns récurrents. Pour
ce faire, j'ai mis en place une collecte automatique des
modifications par IP, suivie d'une annotation manuelle de leur
constructivité.
Le constat principal est qu'environ 20 % des
modifications par IP sur Wikipédia en français sont des
vandalismes. Ce chiffre est d'autant plus significatif qu'il ne
prend en compte que les modifications ayant passé les filtres anti-abus, qui bloquent
déjà une partie importante des vandalismes les plus évidents.
L'analyse par FAI révèle une distribution
globalement uniforme du vandalisme, à une exception notable
près : le
RENATER, qui équipe de nombreux établissements d'enseignement,
présente un taux de vandalisme deux fois supérieur à la
moyenne.
La taille des modifications s'avère être un indicateur
pertinent : 40 % des "grandes suppressions" (plus de 100
caractères) sont classées comme du vandalisme, contre seulement
15 % pour les modifications "moyennes" (entre -10 et +100
caractères).
Cette étude présente toutefois certains biais qu'il convient de
mentionner :
Les filtres anti-abus constituent un premier niveau de filtrage
qui masque une partie des tentatives de vandalisme, suggérant que
le taux réel de tentatives malveillantes est probablement supérieur
aux 20 % observés.
Certaines modifications peuvent être ambiguës et difficiles à
classifier de manière définitive. Dans l'optique d'améliorer les
résultats reconnus, une échelle de notation (0 = vandalisme
évident, 5 = modification totalement constructive) aurait été
intéressante
L'échantillon, bien que plus important que les précédentes
expérimentations, ne couvre qu'une période d'une dizaine de
jours.
Plus de résultats et la méthodologie complète sont disponibles
dans la présentation jointe.
Toutefois, tout n'est pas noir : l'arrivée des comptes temporaires va
possiblement transformer la situation. En effet, depuis quelques
mois maintenant, la Fondation Wikimédia teste un système permettant
aux contributeurs anonymes d'obtenir automatiquement un compte
temporaire, offrant ainsi un meilleur suivi des modifications.
Cette solution pourrait apporter un équilibre entre accessibilité
et lutte contre le vandalisme, comme l'ont montré les premiers
résultats encourageants sur les wikis test...
La grande interview
Dans cette section, nous donnons la parole à des
wikimédien(ne)s sur des thèmes donnés afin de recueillir leurs avis
ou les faire parler tout simplement de leurs expériences dans le
mouvement.
Pas d’entrevue ce mois-ci, mais ce format reviendra peut-être
dans un prochain numéro !
Il nous fera
plaisir de lire les messages déposés ici et, si nécessaire, d'y
répondre dans les plus brefs délais.
Merci à toute l'équipe pour ce nouveau numéro. La partie sur les
contributions des IPs est particulièrement intéressante. Merci
également à PAC2 pour tous ces mois à animer
infatigablement les publications du RAW et qui pourra profiter d'un
wikibreak bien mérité. Puisse d'autres personnes reprendre le
flambleau.--Pronoia (discuter)
1 février 2025 à 14:27 (CET)
Merci à
toi PAC2 pour tous ces mois de travail et à
l'édito de secours pour avoir réussi à sortir cette édition à
temps. Je pense rejoindre la rédaction pour tenir en vie cette
infolettre très utile Musstruss (discuter)
1 février 2025 à 14:50 (CET)
▲L'édito de PAC2 —
L'année 2024 a été riche pour RAW avec l'introduction de nouveaux
contributrices et contributeurs, l'introduction de nouveaux
formats : premier focus au mois de février (Wikipédia:RAW/2024-02-01#Focus),
premier atelier en juillet (Wikipédia:RAW/2024-07-01#L'atelier)
et première interview en septembre (Wikipédia:RAW/2024-09-01#La_grande_interview).
S'il est difficile à interpréter, le nombre de pages vues va de 430
pour le numéro de janvier à plus de 1 200 pour les numéros de
février et mars[1].
Ce numéro du 1er janvier contient la
traditionnelle section des brèves, un focus proposé par l'illustre
Cantons-de-l'Est et une grande
interview.
Je souhaite une excellente année 2025 à toutes les lectrices et
tous les lecteurs. N'hésitez pas à vous saisir vous-même de RAW et
proposer de nouveaux sujets et de nouveaux formats.
Les brèves
▲La famille CAT🐈
s'agrandit — CAT🐈 est une collection de notebooks sur la
plate-forme Observable conçus pour explorer Wikidata. L'idée est de
partir d'un filtre simple sur Wikidata. Par exemple, tous les
éléments avec comme pays de nationalité (P27) la Côte d'Ivoire
(Q1008). A partir de ce filtre, on peut regarder la répartition de
différentes variables comme l'occupation (P106)[2] ou la langue maternelle
(P103)[3]. Toujours dans la même logique,
on peut à partir d'un simple filtre regarder les propriétés
Wikidata les plus fréquemment utilisées pour décrire ces éléments.
Par exemple, on peut comment sont décrits les éléments faisant
partie de la série (P179) Conférences des parties sur le climat
(Q7888355)[4]. Le notebook CAT🐈: metrics permet
de regarder la répartition du nombre de libellés, du nombre de
descriptions, du nombre de liens de site et du nombre
d'affirmations. Parmi les éléments de nationalité ivoirienne, on
voit ainsi que c'est Didier Drogba qui a le plus liens de site et le
plus d'affirmations le décrivant mais c'est Franck Emmanuel
Zolobe qui a le plus de libellés et Désiré Gadeau qui a le
plus de descriptions[5]. MAP🐈 permet de facilement
projeter sur une carte une requête simple comme la liste des gares
rattachées (P81) à la ligne à voie normale de
Mombasa à Nairobi (Q24088686)[6]. Enfin, Overview of
references permet d'avoir une vue globale sur les références
associés à un ensemble d'éléments Wikidata pour une propriété
donnée. Par exemple, on peut avoir la vue globale de l'ensemble des
références pour la propriété occupation (P106) pour les éléments
avec comme pays de citoyenneté (P27) le Liban (Q822)[7].
▲Wikipedia en basque
— France Bleu, réseau de radios locales publiques
françaises, analyse la dynamique de Wikipédia en basque.
« L'euskara, 33e langue au monde en nombre d'articles,
bénéficie d'une communauté de "wikilari" très active qui rédigent,
traduisent, corrigent et vérifient près de 450 000 pages en
basque. »
Wikipédia en basque s'appuie sur une communauté particulièrement
active :
« Appelés "wikilari", ils sont 167 743 à avoir participé à
la rédaction, correction ou amélioration d'articles ; 735 sont
des contributeurs dits "actifs" (ayant réalisé une modification il
y a moins de 30 jours). La plupart sont organisés via l'ONG Euskal
Wikilarien Kultura Elkartea (l'Association Culturelle des Wikilari
Basques). »
Galder Gonzalez Larrañaga, animateur de la communauté, souligne
aussi la diversité de genre parmi les biographies :
« Nous sommes heureux de constater que plus de 31% des
biographies en basque concernent des femmes, alors qu'au total,
Wikipédia n'en dénombre que 19%. »
▲Comment la Gender
Gap Task Force a légitimé les femmes sur Wikipédia et comment
le design de Wikipédia a permis en retour de laisser libre cours au
trolling et au harcèlement pour exclure les femmes de l'identité
wikipédienne — Dans un article publié dans la revue Internet
Histories. Digital Technology, Culture and Society, Steve
Jankowski analyse la Gender Gap Task Force entre sa création en
2013 et 2023.
▲Musk s'attaque à nouveau
à Wikipédia — Le 24 décembre, Elon Musk, considéré comme
l'homme le plus riche du monde, a publié un message sur la
plate-forme X pour appeler ses abonnés à ne plus financer la
fondation Wikimédia tant que celle ci
continuerait à dépenser de l'argent pour la sûreté, l'équité et
l'inclusion. Il reprend l'utilisation « wokepedia » pour
désigner l'encyclopédie[8],[9]. Pour le journaliste James
Gleick, cette attaque n'est pas simplement une attaque contre le
« wokisme » mais une attaque contre Wikipédia en tant
qu'antidote à la désinformation :
« Wikipédia est un problème pour Musk/Trump. Non pas, comme
le dit Musk, parce que c'est « woke ». Mais parce que
c'est l'une de nos dernières attaches fiables à une réalité
consensuelle. C'est donc un antidote à la désinformation.
Cela ne rapporte de l'argent à personne. Ça n'est pas
« enshittified ». Bien sûr, ça n'est pas
parfait — il s'agit d'une entreprise d'humains imparfaits qui
coopèrent. Mais Wikipédia a besoin d'être protégée et
soutenue[10],[11] »
Ça n'est pas la première fois que Musk s'en prend à Wikipédia.
En octobre 2023, il avait déjà mené une attaque violente contre
Wikipédia sur le même thème[12].
▲Audit annuel de
Wikipédia — Wikipédia est considéré comme une très grande
plate-forme (very large online
platform : VLOP) au sens du règlement sur les services
numériques européen (également connu sous le nom de
digital services
act : DSA)[13]. Dans ce cadre, la fondation
publie un audit annuel ainsi qu'un document sur les risques
systémiques.
▲Biais de genre dans
les sources — Sur Wikipédia, les débats sur le biais de genre
achoppent souvent sur la question du biais de genre dans les
sources. Les récents travaux de Gilles Bastin, Benoît de Courson et
Ange Richard permettent de mesurer le biais de genre dans un média
souvent utilisé comme source dans Wikipédia en français, Le Monde. Le taux de
mention de femmes est passé de 6% en 1944 à 26% en 2024[14].
Pour information, d'après les travaux de Pyb en résidence sur les noms de
domaine les plus fréquents dans les liens externes de Wikipédia en
français, Le Monde apparaît 139 000 fois (données d'août
2024). C'est le nom de domaine associé à un média qui apparaît le
plus souvent dans Wikipedia en français[15],[16].
Pour aller plus loin, on peut regarder le projet Gendered
News[17].
Benoît de Courson, Ange Richard, and Gilles Bastin,
« Gender Gaps and Stereotypes in the Long Run. A computational
approach to how Le Monde got (slightly) demasculinized
(1944-2024) », 2024, https://osf.io/preprints/socarxiv/j7ydu
▲Cartographie
sémantique de Wikipédia — L'entreprise d'intelligence
artificielle Nomic développe des outils pour faire des
cartographies sémantiques. Sur son blog, l'entreprise montre
l'exemple d'une cartographie sémantique d'un million de biographies
issues de la Wikipédia en anglais. Plus les
biographies se ressemblent, plus les points associés sont proches
dans l'espace[18].
Focus
RAW encourage les membres de la communauté à s'exprimer sur
différents enjeux liés à l'écosystème Wikimedia. N'hésitez pas à
proposer vos textes pour cette section. N'hésitez pas non plus à
réagir dans la section du courrier
du lectorat.
Allons-nous complexifier la contribution à Wikipédia
pour freiner les IA ?
par Cantons-de-l'Est
Un administrateur de la Wikipédia en français a
rapporté des vandalismes en décembre 2024 qui semblent très
probablement de la « main » d'une intelligence artificielle (IA). Les
recherches dans ce domaine, financées à coups de milliards de
dollars, permettent d'envisager que les IA seront bientôt capables
de contribuer à Wikipédia comme la plupart des meilleures
pcw et donc
très difficiles à démasquer. En effet, elles seront capables de
résoudre les meilleurs CAPTCHA[19],[20],[21], y compris ceux que MediaWiki affichent lors
des premières modifications d'un nouveau compte[note 1]. Toujours ÀMHA, les IA qui
contribuent/contribueront à Wikipédia sont/seront au service
d'agences de publicités, de vandales, de trolls et autres fâcheux.
Si une IA est bloquée, il sera facile de lui créer un autre compte
et elle pourra recommencer.
Pour cette raison, j'anticipe qu'on demandera, pour ne pas dire
exigera, à la Wikimedia
Foundation (WMF) de faire encore plus d'efforts pour
sécuriser/pérenniser les contenus de l'écosystème Wikimedia.
Toujours ÀMHA, la WMF exigera en conséquence que les pcw déjà inscrites
utilisent l'authentification à facteurs
multiples. Le service est déjà offert, mais il est réservé aux
membres de certains groupes ; pour plus de détails, lisez
Aide:Double
authentification. Ce n'est pas une mesure suffisante pour
bloquer toutes les IA, mais ça devrait aider la cause.
Les CAPTCHAs actuels
seront probablement remplacés par des tests plus difficiles à
résoudre par les humains. J'ai vu plusieurs propositions de
CAPTCHAs, mais je suis incapable de dire si l'une est meilleure que
l'autre pour l'écosystème Wikimedia. Je ne serais pas étonné que,
dans un avenir proche, des pcw, peu importe leur
ancienneté, doivent régulièrement résoudre des CAPTCHA dans le but
de déterminer si elles sont des IA.
J'envisage d'autres mesures, mais elles exigent de connaître
physiquement les personnes. Le nombre total de personnes
contribuant à un wiki ou un autre est très grand, au-delà de
100 000, elles seront probablement impossibles à mettre en
place. Peut-être que des évènements rassembleurs comme Wikimania pourront servir à
implanter ces mesures supplémentaires.
Ces mesures, lorsqu'elles seront implantées, rendront plus
difficile la contribution à Wikipédia et aux autres wikis. Des
pcw seront
incapables de s'adapter à ces nouvelles mesures. Plusieurs
contributeurs anonymes seront aussi rebutés par ces nouvelles
mesures. Malheureusement, l'écosystème Wikimedia n'existe pas hors
d'Internet. Pour continuer de soutenir la cause de la libre
connaissance, l'écosystème doit être adapté aux défis actuels et,
malheureusement, des pcw compétentes ne
pourront jamais y participer.
Notes
↑Les
contributeurs anonymes sont toujours obligés de
« Prévisualiser » ou de « Voir les
modifications » avant de pouvoir « Publier les
modifications ».
L'atelier
Dans cette section, un(e) wikimédien(ne) peut raconter un de
ses bricolages à la première personne.
La section est vide
pour cette édition.
Nous attendons votre texte avec impatience pour le prochain numéro
.
La grande interview
Dans cette section, nous donnons la parole à des
wikimédien(ne)s sur des thèmes donnés afin de recueillir leurs avis
ou les faire parler tout simplement de leurs expériences dans le
mouvement.
↑ 1. Bonjour Kropotkine 113. Merci d’avoir
accepté cet entretien après que Warp3 vous a suggéré comme invité.
Pour commencer, je vous laisse vous présenter.
Bonjour et merci pour cette invitation. Je suis physicien de
formation et enseignant de métier. J'ai une quarantaine d'années en
train de se terminer.
↑ 2. Comment êtes-vous arrivé dans le mouvement
Wikimédia ? Sur quel wiki en premier et comment avez-vous
découvert les autres projets ?
Je vais tenter une accroche sous forme de titre
promotionnel :
« Je suis arrivé sur Wikipédia par la critique, le
scepticisme et l'ennui ! »
Si avec ça le nombre de lectures des RAW n'augmente pas, c'est
que je ne comprends rien à la presse ! ;D
Je suis arrivé mi 2006 sur fr.wikipedia.org. Un peu avant
j'avais été marqué par un petit article de Guillaume
Lecointre, datant de 2005 je crois, peut-être début 2006, et
intitulé : « Encyclopédies libres : après le
« fast-food », le « fast-science » ». (Là
aussi un titre bien racoleur.) Tout y passait : l'anonymat
versus le rôle des experts, la neutralité de point de vue et
l'opinion majoritaire érigée comme vérité, l'ultra-libéralisme
supposé du projet, etc. Critiques classiques du milieu des années
2000 en France avec le rejet de Wikipédia comme lieu commun chez
les « sachants ». La charge était violente et sans nuance
mais Lecointre était quelqu'un que je lisais et appréciais, et
comme j'étais scientifique comme lui son propos a fortement résonné
en moi.
Pour me faire ma propre opinion, je suis quand même allé voir
sur place ; j'ai beaucoup lu les pages d'aide et de règles de
Wikipédia, parcouru pleins d'articles et j'ai commencé à douter
parce que ce que je découvrais n'était pas totalement raccord avec
l'idée que je m'en étais faite. Durant l'été, je tente quelques
micro contributions et je trouve quand même le concept de
modification et publication immédiates assez incroyable et
révolutionnaire. Petit à petit, je renverse mon opinion sur
Wikipédia pour finalement en voir le potentiel.
À la fin de l'été, je me blesse assez gravement à un genou, je
suis opéré, l'opération ne se passe pas très bien, je suis arrêté
trois mois et j'ai une mobilité réduite : mon cerveau qui
normalement a sa dose de fatigue liée au boulot et à la vie sociale
s'ennuie assez vite et je décide d'apprendre des trucs. Je me mets
à apprendre sérieusement à jouer aux échecs, par exemple. Et puis,
je commence à vraiment contribuer à Wikipédia... pour finalement me
faire littéralement happer. :)
La suite est venue « naturellement », en tout cas
c'est mon ressenti : wikipédiholisme précoce, admin moins d'un an plus
tard, etc. La découverte des autres projets s'est faite petit à
petit, Commons pour les illustrations évidemment, Wikipedia en
anglais parce que je traduis, puis tout le reste. (J'ai même déposé
un message sur le Bistro de wikispecies, c'est vous
dire !)
Avec le recul, je me rends compte que c'est étonnant d'arriver
avec autant de préjugés négatifs et d'être encore là dix-huit ans
plus tard, avec enthousiasme. Le contexte a sans doute joué un rôle
important car mon arrivée correspond à une période vraiment
incroyable de la vie du projet : la croissance de Wikipédia
explosait littéralement en termes d'articles et de contributions,
on comprenait qu'on avait dans les mains un projet au potentiel
fabuleux mais on avait l'impression que tout était à faire et à
l'extérieur les critiques institutionnelles et médiatiques
continuaient de pleuvoir. On luttait sur tous les fronts, c'était
exaltant ! Quelle aventure ! Quand on a vécu ça, c'est
difficile de décrocher. :)
↑ 3. Quelle est votre forme d'investissement au
sein des projets de la Wikimedia Foundation ?
Même si en 18 ans j'ai déjà touché à à peu près tout, je reste
un pur Wikipédien. Mes contributions sur les autres projets sont
liées à ça. Côté mouvement, j'ai une petite période de
participations sur meta.wikimedia.org mais je n'y ai jamais vraiment
trouvé mon compte. Je suis aussi agent OTRS depuis 16 ans et
Masqueur de modifications
depuis 15 ans (et dernier des Mohicans puisque de la première vague
de nomination, il ne reste que moi). Je fais un peu partie des
meubles ;D
En termes de contributions wikipédiennes, j'ai fait au départ
énormément de maintenance et de patrouille et des
créations/traductions assez diverses. Maintenant, je ne fais plus
de patrouille qu'à partir de mes différentes listes de suivi. De
temps en temps, je traite un peu de SI via les pages de requêtes et
des clôtures de PàS. J'ai une présence moins régulière et moins
forte qu'avant donc j'ai délaissé la maintenance. Côté créations,
je fais essentiellement des petites traductions.
Les autres activités connexes aux projets ce sont tout ce qui se
fait « IRL » : les formations à Wikipédia, les
divers ateliers, rencontres, etc. J'ai fait pas mal de formations à
une époque très très lointaine (X, ENS, Jussieu), moins récemment même si ça
m'arrive encore de temps en temps (AJSPI,
CNNum).
Et puis, via Wikimédia France, j'ai participé à quelques
instances et réunions institutionnelles : généralement, les
institutions s'adressent à l'association parce qu'elles cherchent
des personnes pour « représenter » Wikipédia. De fait, ce
n'est pas possible, puisque personne individuellement ne représente
Wikipédia, et Wikimédia France n'a pas cette fonction non
plus ; éventuellement la Fondation peut se faire représenter
en tant qu'hébergeur mais ce n'est pas forcément toujours ce qui
est souhaité, donc des personnes comme moi se retrouvent à
expliquer, par exemple à des députés ou à l'ARCOM, les rouages du
site, de la communauté, de notre système de modération en ligne.
C'est passionnant et indispensable, mais très exigeant parce qu'on
a beau prendre mille précautions et multiplier les efforts
pédagogiques, notre fonctionnement est exotique et on n'est pas
toujours très bien compris.
Enfin, il y a la vie communautaire hors-ligne : Wikiconventions,
Wikicamps, Wikimanias ou tout
simplement se retrouver à quelques personnes autour d'un café ou
d'une galette des rois (c'est bien le numéro de
janvier, hein ?) ! Pour moi, c'est
presque aussi important que de participer à la rédaction d'articles
parce que pour « faire communauté » se rencontrer est un
ingrédient extrêmement important. Cela ne convient pas à tous les
caractères mais j'encourage le lectorat des RAW à essayer au moins
une fois. Pour info, l'édition 2026 de Wikimania se tiendra à
Paris !
↑ 4. En parcourant vos contributions, on trouve
pêle-mêle musique, physique-chimie, militaire et cuisine. Nulle
conquête du pain à l'horizon ? Quels sont vos objectifs quand
vous choisissez vos sujets de contribution ?
Haha. Je recommande la lecture de ce livre écrit par mon
illustre homonyme ;)
Chez les Cent-treize on fait des trucs
sérieux…… et des trucs bêtes.
En terme de sujets de contributions, je suis hyper éclectique.
J'ai quelques domaines de compétence (dont la physique) mais sinon
je fais à l'instinct, suivant mon humeur et les trucs qui me
plaisent ou me font marrer (un âne géant par exemple) sans objectifs
particuliers. La clé pour moi, c'est le plaisir : Wikipédia
est un hobby, je suis là par envie, pas par devoir, je fais ce qui
m'amuse et si un sujet m'ennuie, j'arrête d'y contribuer. Par
exemple, la physique : je me suis vraiment éclaté à
écrire/traduire certains articles (par exemple Vecteur
de Runge-Lenz) ou certaines sections (je suis très fier de la
section Newton et l'alchimie qui est sans doute celle
qui m'a coûté le plus cher en sources et sur laquelle le ratio
(temps passé)/(nombre de caractères écrits) est le plus élevé de ma
vie wikipédienne) mais globalement ça a fini petit à petit par trop
me faire penser au boulot et je ne m'amusais plus. Il m'arrive
encore de corriger telle ou telle erreur dans les articles,
histoire d'éviter un écueil à mes élèves, mais en fait je ne touche
presque plus aux articles scientifiques. Je vadrouille.
Mes seules marottes au long cours sont écrire un article sur
chaque artiste ayant une fiche dans la Rolling Stone
Encyclopedia of Rock'n'roll et documenter le blues. J'avance
super lentement, par épisodes parfois très espacés, mais j'y
reviens toujours. Là, l'objectif, c'est clairement assouvir une
passion et la partager au plus grand nombre. Ce qui est bien avec
Wikipédia, c'est qu'on n'a pas de date d'échéance donc mon histoire
avec la Rolling Stone Encyclopedia of Rock'n'roll, qui n'en
est qu'à la lettre L, peut bien encore durer dix-huit ans de
plus !
↑ 5. Quelle est selon vous la forme que prend la
dimension collaborative dans votre contribution ? Warp3
écrivait que vous étiez discret dans les espaces de discussion,
est-ce votre sentiment ?
Il y a deux aspects : le collaboratif côté articles et
celui côté communautaire.
Côté articles, je ne demande pas mieux que d'avoir des échanges
mais généralement j'ai peu d'interactions, sans doute parce que les
sujets que je traite sont calmes et consensuels. Ou alors c'est que
personne ne veut embêter le vieil ours vieux wikipédien qui
contribue dans son coin ;D
Côté communautaire, c'est vrai que je suis maintenant plutôt en
retrait. Mais ça n'a pas toujours été le cas : j'ai au départ
été très impliqué dans la « gouvernance » du projet,
participé aux discussions les plus tumultueuses, les plus longues
et les plus difficiles, passé énormément de temps dans l'espace
Wikipédia, consacré des centaines d'heures aux pages d'aide et de
recommandations. Je continue à lire le Bistro, le Bulletin des
admins, quelques pages de maintenance, je donne de temps en temps
mon avis quand on me le demande ou lors de votes/sondages mais je
m'implique moins, je n'ai plus l'énergie pour ça ou plutôt je la
réserve à autre chose.
Pour moi, les personnes que les discussions communautaires
intéressent se trouvent sur plusieurs rangs : le premier rang,
c'est le rang des personnes sur-investies qui sont peu nombreuses
et abattent un boulot monstre ; le deuxième rang, c'est pour
les personnes qui suivent un peu tout et s'impliquent quand le
sujet est vraiment important ; et sur la rangée du fond, on
observe de loin et on cause peu mais on est toujours là. En
dix-huit ans, je suis passé tranquillement du premier au dernier
rang et ça me va bien. :)
↑ 6. Lorsque les sujets sur lesquels vous
contribuez sont peu documentés dans des médias de références
généralistes, comment gérez vous l'exigence à démontrer la
notoriété ?
Ça, c'est une question délicate et qui appellerait une réponse à
tiroirs et un peu longue. Rien que la formulation de la question
est discutable. :) Qui exige quoi, de qui, pour quoi ? On
parle de notoriété ou de notabilité ? Etc. Derrière cette
question, il y a aussi la notion d'admissibilité.
Pour résumer et faire court : la plupart du temps, je
contribue sur des sujets bien documentés mais, dans les situations
où ce n'est pas le cas, j'ai une philosophie personnelle que j'ai
mis pas mal de temps à structurer intellectuellement mais à
laquelle j'essaie de me tenir. Quand le sujet de l'article ne pose
pas de problème mais qu'il n'y a pas de sources clairement
exposées, l'admissibilité de l'article doit être réglée par un
pari communautaire sur l'existence de celles-ci. On a besoin
de faire un pari raisonnable parce que la non existence de quelque
chose (en l'occurrence les sources) n'est pas démontrable. Si on
pense collectivement que des sources existent (mais sont
difficilement accessibles par exemple) ou existeront, alors on
conserve, sinon on supprime. Indépendamment de ce que je viens de
dire, je tiens aussi à rappeler que l'exigence de vérifiabilité (et
incidemment de sourçage) est essentiellement destinée à assurer la
neutralité de point de vue. Quand toutes les informations sont
factuelles, neutres, non polémiques et non contestées, alors le
fait que Wikipédia soit une encyclopédie en construction devrait
laisser à l'article le temps de se développer et de trouver les
contributeurs compétents capables de l'améliorer et de le sourcer
(ces contributeurs n'étant pas toujours, loin de là, les créateurs
de l'article) ; s'il y a polémique ou si une personne conteste
une information et qu'on ne peut pas attribuer les propos et
exhiber des sources alors il faut supprimer cette
information ; si cela concerne l'intégralité de l'article
alors il faut supprimer l'article.
À l'heure actuelle, j'observe plutôt une autre façon d'envisager
le projet : s'il n'y a pas x sources secondaires de qualité à
la naissance de l'article, on supprime, même si personne ne remet
en cause aucune des informations contenues dans l'article. C'est à
mon avis dommage et contre-productif.
↑ 7. Vous contribuiez déjà avant l'arrivée de
Wikidata. Pourriez-vous parler de votre rapport à cette base de
connaissance liée à Wikipédia ?
Quand le projet m'a été présenté la première fois à une
Wikimania (à Gdansk en 2010 peut-être ?), j'avoue que j'étais
plus que circonspect voire hostile. Je ne voyais que les défauts,
pas vraiment la finalité et ce que ça pouvait apporter. La réalité,
c'est que je n'y connaissais rien et que j'avais le réflexe de
protection de l'ignorant ! Pour moi, on allait juste exporter
les guerres d'édition sur un autre site. J'avais une vision
étriquée, centrée sur ce que je percevais immédiatement. C'est la
pratique et les exemples d'utilisation qui m'ont ensuite convaincu
que j'avais tout faux quand Wikidata a été concrètement mis en
service quelques années plus tard. J'ai eu aussi la chance de
croiser des wikimédien.ne.s qui m'ont éduqué sur le sujet. Et je
finis par penser que c'est vraiment la meilleure chose qui soit
arrivée au mouvement Wikimedia ces dix dernières années, avec un
potentiel énorme (même si les difficultés technologiques sont
grandes). Et les implications en ce qui concerne la structuration
des informations disponibles en ligne sont gigantesques et vont
très au-delà des réutilisations dans nos articles.
Mais mon utilisation de Wikidata reste pour l'instant très
restreinte : des liens interlangues quand je traduis, quelques
données ajoutées pour le remplissage automatique d'infobox, bref,
pas grand chose. Mais j'ai commencé à me former aux outils type
OpenRefine et, qui sait, si un jour je me recasse le
genou je me mettrai peut-être à fond à Wikidata ;D
↑ 8. Vous avez initié plusieurs prises de
décision. Qu'est-ce qui vous a amené à vous impliquer dans ces
procédures, et comment considérez-vous les mécanismes
décisionnaires aujourd'hui ?
Ça c'était la période où j'étais assis au premier
rang. :)
Je m'y suis collé parce que j'y croyais et que j'avais le temps
et l'énergie pour ça, tout simplement. Par exemple, la prise de
décision sur AbuseFilter, je l'ai portée à bout de bras pendant des
semaines, parce que je pensais vraiment cet outil utile. Il a fallu
que je me forme pour maîtriser tous les aspects de cette extension
technique, qui n'existait à l'époque que sur la version en anglais
je crois, et pouvoir en expliquer tous les enjeux et répondre à
toutes les questions. La rédaction de toutes les pages en relation
avec la prise de décision a aussi été très longue. Heureusement,
j'ai eu quelques coups de mains (je me rappelle notamment les aides
de TigH et Arkanosis). À la fin, mon implication
dans la procédure était presque affectif : dans mon esprit,
c'est un peu mon bébé. :)
Pour les mécanismes décisionnaires en place aujourd'hui,
j'identifie deux dérives :
l'instrumentalisation des sondages, soit pour bloquer une
discussion, soit pour contourner une prise de décision. Comme la
mécanique de prise de décision est parfois grippée, certaines
personnes passent par des sondages qui, de fait, deviennent des
quasi-décisions parce qu'il n'y a rien d'autre. Il y a vraiment un
truc qui cloche.
les sujets abordés. À mon sens, on ne devrait jamais fixer par
une règle des éléments purement éditoriaux. On peut voter sur plein
de choses, mais on ne devrait jamais voter sur le contenu
rédactionnel des articles. Le premier exemple qui m'a choqué
« historiquement », c'est la prise de décision
sur l'usage du mot « états-unien » dans les articles
(ce n'était pas le seul souci de cette pdd d'ailleurs) ; c'est selon moi
une aberration de passer par une pdd pour cette question, qui
relève de l'éditorial pur, à gérer article par article, par la
discussion.
Et puis, on est nul en terme de communication et
publicisation : je trouve ça incroyable que pour une pdd
moyenne on tourne à quelques dizaines voire une centaine de
personnes qui participent au vote. Même avec une évaluation basse
de la taille de la « communauté », on devrait en avoir
trois ou quatre fois plus. J'ai toujours milité pour l'utilisation
large des bandeaux sitenotice pour remédier à ce problème,
que ce soit pour les pdd ou les élections. Il faut ouvrir les
fenêtres, aérer, faire venir aux votes et dans les discussions
beaucoup plus de personnes, pour éviter l'entre-soi et le
rabougrissement.
Enfin, on a une grosse difficulté avec nos pratiques
wikipédiennes : le vote public signé. Il est difficile
d'éviter les phénomènes de meutes ou au contraire d'auto-censure à
partir du moment où, quel que soit le sujet, les votes sont
publics. Ça pose des problèmes de fond, particulièrement quand il
s'agit d'une élection individuelle. Il y a quelques avantages à nos
pratiques, je ne dis pas que le vote public n'a que des mauvais
côtés. Mais à mon sens il n'est pas normal qu'on n'avance pas du
tout sur ce sujet avec le développement d'un outil d'urnes
numériques comme pour les élections au board de la Foundation, par exemple. J'ai essayé il y a
quelques années qu'un tel outil soit mis à la disposition des
communautés par la Foundation ; on m'a répondu, en gros,
« won't do, we're
understaffed »[note 1], ce que je trouve assez
incroyable dans tous les sens du terme.
Je suis agent
OTRS depuis 2008. J'ai eu une grosse activité de réponse aux
courriels sur les files générales francophones (info-fr notamment)
pendant quelques années et c'est un très bon souvenir. C'est une
interface avec l'extérieur hyper importante parce qu'elle humanise
le projet, au sens où ce sont des vrais êtres humains qui répondent
avec leurs vrais petits doigts aux questions, critiques, etc. Les
gens qui nous écrivent sont d'ailleurs très souvent surpris, soit
par la rapidité de la réponse, soit parce qu'elle est en français
et pas en anglais. C'est étonnant, mais il y a des gens qui pensent
qu'on est un GAFAM comme
les autres...
Au-delà des pénibles qui viennent se plaindre n'importe comment
de tout et n'importe quoi, il y a aussi des questions légitimes et
parfois de beaux échanges voire des rencontres : je me
rappelle avoir répondu à un écrivain qui clairement ne comprenait
pas comment était rédigé son article et le trouvait vraiment pauvre
en informations ; on a pas mal discuté et j'ai fini par le
rencontrer chez lui autour d'un café, et il m'a transmis un dossier
de presse sur toute sa carrière que j'ai utilisé pour compléter et
sourcer l'article qui lui était dédié. C'était touchant et
sympa.
Aujourd'hui, je ne suis plus la file info-fr depuis très
longtemps, et je n'utilise plus que la file privacy-fr-wp dédiée
aux masqueurs de modifications. Et c'est (heureusement) beaucoup
plus calme ! Au passage, l'équipe de masqueurs est pour moi un
des trucs qui marchent le mieux sur Wikipédia en français, et je
suis tombé de ma chaise en lisant récemment sur le Bistro la
demande de l’Ombuds commission. Rien que le
fait qu'il ait fallu autant d'octets et de temps pour qu'on
comprenne exactement quel était le souci n'est pas bon signe. Merci
à celles et ceux qui ont pris la discussion à bras le corps.
↑ 10. Vous vous êtes impliqué dans l'association
Wikimédia France, en participant au conseil d'administration.
Pourquoi ? Quelles étaient vos motivations et qu'en avez-vous
retiré ?
Je suis devenu membre de l'association en 2007 et c'était pour
moi un prolongement évident de mes activités de contributeur, une
façon de mettre des visages sur les pseudonymes et de faire de
Wikipédia une expérience sociale réelle et ne pas la maintenir
uniquement dans l'espace virtuel. Et il y avait un milliard de
choses à faire aussi côté associatif à cet époque : au-delà
des activités classiques de soutien à la contribution ou de
promotion ds projets, le mouvement Wikimedia grossissait et se
structurait petit à petit avec de multiples difficultés liées en
partie au caractère très autonome de chaque projet et de chaque
association, en partie au fait qu'on partait quasiment de zéro.
Les associations locales comme Wikimédia France étaient
absolument essentielles au mouvement : non seulement
l'association servait d'interlocutrice identifiée pour les médias
et les institutions qui voyaient à l'époque le mouvement au mieux
comme un OVNI au pire comme un ennemi, et on dépensait beaucoup
d'énergie en pédagogie et explications, mais l'association avait
aussi la responsabilité de lever les fonds en France pour le
mouvement. On pourrait croire que la situation actuelle (pour
simplifier, Wikimedia Foundation lève l'argent et redistribue aux
associations locales et user
groups) a toujours existé mais ce n'est pas le cas, au
départ c'était l'inverse pour un certain nombre
d'associations ! On faisait tout localement, selon une forme
de principe de subsidiarité : on créait le bandeaux de levée
de fonds nous-mêmes, on récoltait les fonds, etc. Pour les
bénévoles, c'était hyper valorisant.
Il y avait donc besoin de bras et de temps de cerveau disponible
et comme il n'y avait pas forcément foule pour se présenter au CA,
j'y suis allé une première fois en 2011. Côté structure c'était
aussi la première phase de professionnalisation de l'association et
je suis fier d'y avoir contribué. Et puis il y a les anecdotes
marrantes : comme on n'avait pas encore de locaux, certains
chèques de don arrivaient directement dans la boîte aux lettres du
secrétaire du CA (votre serviteur) ! Toujours plus sympa que
les mises en demeures ou convocations au tribunal qui suivaient le
même chemin ;D
J'ai quitté le CA en 2013 parce que c'était épuisant et que ma
vie personnelle avait pris un virage qui me laissait beaucoup moins
de temps.
J'y suis retourné quelques années plus tard, dans un contexte de
crise profonde de l'association. Là, il s'agissait surtout de
sauver la structure (que Wikimedia Foundation hésitait à fermer) et
donc les emplois de l'équipe salariée, et aussi de « faire le
ménage » après une période où la gouvernance avait été
défaillante et provoqué beaucoup de souffrances, notamment chez les
salarié.e.s mais aussi parmi les membres du CA et les membres tout
court. Quand la situation est redevenue saine avec une association
fonctionnelle et une équipe apaisée, j'ai quitté cette fois-ci le
CA essentiellement par ennui : je n'y trouvais plus d'intérêt
personnel, autant laisser la place à d'autres.
Maintenant, cela fait quelques années que je suis simple membre
de l'association... assis dans la rangée du fond ;D
La participation des institutions culturelles, scientifiques,
techniques, historiques, médiatiques, au sens large. L'association
Wikimédia France travaille beaucoup là-dessus et le développement
du programme de Wikimédien.ne.s
en résidence, par exemple, est une très bonne chose.
Il y aussi la formation des jeunes : Wikipédia reste un
outil extraordinaire pour développer le sens critique, faire de
l'éducation aux médias et développer l'idée que la jeunesse peut
aussi produire elle-même et ne pas être réduite à
« consommer ». Il y a un côté émancipateur et d'éducation
populaire dans la participation à Wikipédia. Vikidia joue ce rôle, mais
Wikipédia pourrait aussi en faire plus même si des projets pédagogiques existent déjà.
Et puis, il y a l'IA. Pas la méchante IA qui ne veut que nous
remplir nos articles de trucs bidons plus ou moins hallucinés. Mais
la gentille IA, celle qui peut aider à contribuer en réduisant à
presque néant certaines tâches fastidieuses de la pré-collecte de
sources jusqu'à certaines opérations de maintenance en passant
par... l'aide à la détection des contenus créés par IA ! On
est au début de cette histoire, il y a pas mal d'inquiétude mais
aussi de l'espoir.
Enfin, pour la Wikipédia en français spécifiquement, le futur,
c'est la Francophonie ! Non seulement le nombre de personnes
pouvant contribuer en français mais ne l'ayant jamais fait est
énorme mais, en plus, la démographie de la Francophonie fait que le
nombre de personnes parlant français devrait doubler d'ici 2050.
Comme il y a un boulot énorme à faire pour réduire le
franco-centrage de notre encyclopédie, cette évolution
démographique qui est essentiellement portée par les pays africains
sera une chance pour nous.
↑ 12. Quel(le) wikimédien(ne) souhaiteriez-vous
voir interviewé(e) dans un prochain numéro et sur quel
thème ?
J'aimerais beaucoup lire Chaoborus. Pas de thème en tête.
En revanche, j'ai une question : « Les catégories.
Pourquoi ? »
↑ 13. Y a-t-il un sujet particulier qui vous
tient à cœur et que nous n’avons pas abordé dans cet
entretien ? Vous avez carte blanche 🙂.
J'aimerais parler un peu de notre attitude collective en tant
que communauté face à l'accueil des personnes qui débutent quelles
qu'elles soient et quelles que soient leurs motivations. Nos
projets ont tous été fondés sur un pari extrêmement
audacieux : une ouverture totale, pas de censure a priori et
le fait qu'il y aura toujours une personne vertueuse de plus à
accueillir malgré l'entrée possible de moult pénibles. Bien sûr,
les défis et les problèmes sont importants (vandalismes de base,
IA, entrismes politiques, attaques médiatiques, tentatives de
déstabilisation, contributions rémunérées non déclarées, agences de
communications, etc.) mais il ne faut jamais oublier que notre
force c'est la multitude, le grand nombre, la sagesse de la foule
menant à l'intelligence collective.
Ce projet est la prunelle de nos yeux donc je peux comprendre
notre attitude de hérisson et notre méfiance, elles nous protègent.
Mais il faut trouver un équilibre. Cet énergumène vous agace parce
que ça fait dix fois qu'il tente d'écrire n'importe comment un
micro article sur sa marotte ? Non, il n'y a toujours pas de
sources suffisantes pour cette petite association bien
sympathique ? Ce joueur de foot n'a pas encore assez de matchs
en première division ? Cette rappeuse très prometteuse n'a
pour l'instant sorti qu'un seul album avec peu de recensions ?
Prenez le temps d'expliquer, faites le pari que derrière, parfois,
il y a une personne qui en fait est de bonne volonté et peut être
« convertie » en contributrice positive ; non
seulement les exemples sont nombreux de débuts catastrophiques
menant à des expériences réussies d'inclusion dans la communauté
mais en plus c'est extrêmement valorisant quand on y a participé.
Évidemment, cela marche une fois sur cent, c'est usant, voire
déprimant, la tâche est titanesque. Mais rappelez-vous qu'une
encyclopédie libre, gratuite, sans publicité, rédigée par des
« anonymes » sans contrôles d'expertise, c'est
normalement impossible sauf en ayant l'audace de maintenir toujours
vivant le pari originel, c'est-à-dire un projet ouvert et facile
d'accès, quoi qu'il en coûte.
↑ 14. Avez-vous un message particulier à
adresser au lectorat du RAW ? Quel serait votre mot de la
fin ?
Wikipédia est un loisir. Personne n'est irremplaçable ni
indispensable donc si un sujet vous énerve, si vous devenez
facilement irritable, il est toujours temps de fermer votre
ordinateur et d'aller prendre l'air ou de passer à un autre sujet.
Ne vous laissez gouverner que par votre envie de partager. Prenez
du plaisir à contribuer !
Merci d'avoir accepté cette interview. Bonne
continuation !
Notes
↑Littéralement, « On ne fera pas, nous sommes
en sous-effectifs ».
Si je
résume l'article, avoir un certain
contrôle sur Wikipédia implique une certaine maitrise technique ;
or, les hommes sont sur-représentés en informatique ; donc,
Wikipédia (comme d’autres plateformes en ligne) est intrinsèquement
sexiste.
Ce matérialisme de genre semble complètement mettre de côté le
matérialisme lui-même, c’est-à-dire
l’idée que les rapports de production déterminent les rapports
sociaux. En tant qu’espace de diffusion du savoir reposant sur une
certaine maitrise informatique, Wikipédia accueille probablement
beaucoup de personnes diplomées ayant une formation en
informatique. On pourrait ainsi tout autant dénoncer comment
Wikipédia valorise les personnes diplomées, ayant eu accès au
savoir et à la culture et ayant du temps et des moyens pour la
diffuser ; et donc possiblement ayant un certain niveau de
revenu.
Wikipédia n’est donc pas le problème ici. Le problème, c’est
qu’en effet les hommes sont sur-représentés dans la formation
informatique (comme les femmes le sont dans les métiers du service
à la personne) ; et l’offre de formation repose sur les besoins du
marché capitaliste — capitalisme qui a lui-même institué certains
rapports ethnoraciaux ou de genre.
↑Traduit
avec Deepl.com de « Wikipedia is a problem for
Musk/Trump. Not, as Musk says, because it's "woke." Because it's
one of our last reliable tethers to a consensus reality. Therefore,
an antidote to disinformation. It's not making anyone money. It's
not enshittified. Of course it's not perfect—it's an endeavor of
imperfect cooperating humans. But it needs protection and
support. »
▲L'édito de PAC2 —
L'année 2024 a été riche pour RAW avec l'introduction de nouveaux
contributrices et contributeurs, l'introduction de nouveaux
formats : premier focus au mois de février (Wikipédia:RAW/2024-02-01#Focus),
premier atelier en juillet (Wikipédia:RAW/2024-07-01#L'atelier)
et première interview en septembre (Wikipédia:RAW/2024-09-01#La_grande_interview).
S'il est difficile à interpréter, le nombre de pages vues va de 430
pour le numéro de janvier à plus de 1 200 pour les numéros de
février et mars[1].
Ce numéro du 1er janvier contient la
traditionnelle section des brèves, un focus proposé par l'illustre
Cantons-de-l'Est et une grande
interview.
Je souhaite une excellente année 2025 à toutes les lectrices et
tous les lecteurs. N'hésitez pas à vous saisir vous-même de RAW et
proposer de nouveaux sujets et de nouveaux formats.
Les brèves
▲La famille CAT🐈
s'agrandit — CAT🐈 est une collection de notebooks sur la
plate-forme Observable conçus pour explorer Wikidata. L'idée est de
partir d'un filtre simple sur Wikidata. Par exemple, tous les
éléments avec comme pays de nationalité (P27) la Côte d'Ivoire
(Q1008). A partir de ce filtre, on peut regarder la répartition de
différentes variables comme l'occupation (P106)[2] ou la langue maternelle
(P103)[3]. Toujours dans la même logique,
on peut à partir d'un simple filtre regarder les propriétés
Wikidata les plus fréquemment utilisées pour décrire ces éléments.
Par exemple, on peut comment sont décrits les éléments faisant
partie de la série (P179) Conférences des parties sur le climat
(Q7888355)[4]. Le notebook CAT🐈: metrics permet
de regarder la répartition du nombre de libellés, du nombre de
descriptions, du nombre de liens de site et du nombre
d'affirmations. Parmi les éléments de nationalité ivoirienne, on
voit ainsi que c'est Didier Drogba qui a le plus liens de site et le
plus d'affirmations le décrivant mais c'est Franck Emmanuel
Zolobe qui a le plus de libellés et Désiré Gadeau qui a le
plus de descriptions[5]. MAP🐈 permet de facilement
projeter sur une carte une requête simple comme la liste des gares
rattachées (P81) à la ligne à voie normale de
Mombasa à Nairobi (Q24088686)[6]. Enfin, Overview of
references permet d'avoir une vue globale sur les références
associés à un ensemble d'éléments Wikidata pour une propriété
donnée. Par exemple, on peut avoir la vue globale de l'ensemble des
références pour la propriété occupation (P106) pour les éléments
avec comme pays de citoyenneté (P27) le Liban (Q822)[7].
▲Wikipedia en basque
— France Bleu, réseau de radios locales publiques
françaises, analyse la dynamique de Wikipédia en basque.
« L'euskara, 33e langue au monde en nombre d'articles,
bénéficie d'une communauté de "wikilari" très active qui rédigent,
traduisent, corrigent et vérifient près de 450 000 pages en
basque. »
Wikipédia en basque s'appuie sur une communauté particulièrement
active :
« Appelés "wikilari", ils sont 167 743 à avoir participé à
la rédaction, correction ou amélioration d'articles ; 735 sont
des contributeurs dits "actifs" (ayant réalisé une modification il
y a moins de 30 jours). La plupart sont organisés via l'ONG Euskal
Wikilarien Kultura Elkartea (l'Association Culturelle des Wikilari
Basques). »
Galder Gonzalez Larrañaga, animateur de la communauté, souligne
aussi la diversité de genre parmi les biographies :
« Nous sommes heureux de constater que plus de 31% des
biographies en basque concernent des femmes, alors qu'au total,
Wikipédia n'en dénombre que 19%. »
▲Comment la Gender
Gap Task Force a légitimé les femmes sur Wikipédia et comment
le design de Wikipédia a permis en retour de laisser libre cours au
trolling et au harcèlement pour exclure les femmes de l'identité
wikipédienne — Dans un article publié dans la revue Internet
Histories. Digital Technology, Culture and Society, Steve
Jankowski analyse la Gender Gap Task Force entre sa création en
2013 et 2023.
▲Musk s'attaque à nouveau
à Wikipédia — Le 24 décembre, Elon Musk, considéré comme
l'homme le plus riche du monde, a publié un message sur la
plate-forme X pour appeler ses abonnés à ne plus financer la
fondation Wikimédia tant que celle ci
continuerait à dépenser de l'argent pour la sûreté, l'équité et
l'inclusion. Il reprend l'utilisation « wokepedia » pour
désigner l'encyclopédie[8],[9]. Pour le journaliste James
Gleick, cette attaque n'est pas simplement une attaque contre le
« wokisme » mais une attaque contre Wikipédia en tant
qu'antidote à la désinformation :
« Wikipédia est un problème pour Musk/Trump. Non pas, comme
le dit Musk, parce que c'est « woke ». Mais parce que
c'est l'une de nos dernières attaches fiables à une réalité
consensuelle. C'est donc un antidote à la désinformation.
Cela ne rapporte de l'argent à personne. Ça n'est pas
« enshittified ». Bien sûr, ça n'est pas
parfait — il s'agit d'une entreprise d'humains imparfaits qui
coopèrent. Mais Wikipédia a besoin d'être protégée et
soutenue[10],[11] »
Ça n'est pas la première fois que Musk s'en prend à Wikipédia.
En octobre 2023, il avait déjà mené une attaque violente contre
Wikipédia sur le même thème[12].
▲Audit annuel de
Wikipédia — Wikipédia est considéré comme une très grande
plate-forme (very large online
platform : VLOP) au sens du règlement sur les services
numériques européen (également connu sous le nom de
digital services
act : DSA)[13]. Dans ce cadre, la fondation
publie un audit annuel ainsi qu'un document sur les risques
systémiques.
▲Biais de genre dans
les sources — Sur Wikipédia, les débats sur le biais de genre
achoppent souvent sur la question du biais de genre dans les
sources. Les récents travaux de Gilles Bastin, Benoît de Courson et
Ange Richard permettent de mesurer le biais de genre dans un média
souvent utilisé comme source dans Wikipédia en français, Le Monde. Le taux de
mention de femmes est passé de 6% en 1944 à 26% en 2024[14].
Pour information, d'après les travaux de Pyb en résidence sur les noms de
domaine les plus fréquents dans les liens externes de Wikipédia en
français, Le Monde apparaît 139 000 fois (données d'août
2024). C'est le nom de domaine associé à un média qui apparaît le
plus souvent dans Wikipedia en français[15],[16].
Pour aller plus loin, on peut regarder le projet Gendered
News[17].
Benoît de Courson, Ange Richard, and Gilles Bastin,
« Gender Gaps and Stereotypes in the Long Run. A computational
approach to how Le Monde got (slightly) demasculinized
(1944-2024) », 2024, https://osf.io/preprints/socarxiv/j7ydu
▲Cartographie
sémantique de Wikipédia — L'entreprise d'intelligence
artificielle Nomic développe des outils pour faire des
cartographies sémantiques. Sur son blog, l'entreprise montre
l'exemple d'une cartographie sémantique d'un million de biographies
issues de la Wikipédia en anglais. Plus les
biographies se ressemblent, plus les points associés sont proches
dans l'espace[18].
Focus
RAW encourage les membres de la communauté à s'exprimer sur
différents enjeux liés à l'écosystème Wikimedia. N'hésitez pas à
proposer vos textes pour cette section. N'hésitez pas non plus à
réagir dans la section du courrier
du lectorat.
Allons-nous complexifier la contribution à Wikipédia
pour freiner les IA ?
par Cantons-de-l'Est
Un administrateur de la Wikipédia en français a
rapporté des vandalismes en décembre 2024 qui semblent très
probablement de la « main » d'une intelligence artificielle (IA). Les
recherches dans ce domaine, financées à coups de milliards de
dollars, permettent d'envisager que les IA seront bientôt capables
de contribuer à Wikipédia comme la plupart des meilleures
pcw et donc
très difficiles à démasquer. En effet, elles seront capables de
résoudre les meilleurs CAPTCHA[19],[20],[21], y compris ceux que MediaWiki affichent lors
des premières modifications d'un nouveau compte[note 1]. Toujours ÀMHA, les IA qui
contribuent/contribueront à Wikipédia sont/seront au service
d'agences de publicités, de vandales, de trolls et autres fâcheux.
Si une IA est bloquée, il sera facile de lui créer un autre compte
et elle pourra recommencer.
Pour cette raison, j'anticipe qu'on demandera, pour ne pas dire
exigera, à la Wikimedia
Foundation (WMF) de faire encore plus d'efforts pour
sécuriser/pérenniser les contenus de l'écosystème Wikimedia.
Toujours ÀMHA, la WMF exigera en conséquence que les pcw déjà inscrites
utilisent l'authentification à facteurs
multiples. Le service est déjà offert, mais il est réservé aux
membres de certains groupes ; pour plus de détails, lisez
Aide:Double
authentification. Ce n'est pas une mesure suffisante pour
bloquer toutes les IA, mais ça devrait aider la cause.
Les CAPTCHAs actuels
seront probablement remplacés par des tests plus difficiles à
résoudre par les humains. J'ai vu plusieurs propositions de
CAPTCHAs, mais je suis incapable de dire si l'une est meilleure que
l'autre pour l'écosystème Wikimedia. Je ne serais pas étonné que,
dans un avenir proche, des pcw, peu importe leur
ancienneté, doivent régulièrement résoudre des CAPTCHA dans le but
de déterminer si elles sont des IA.
J'envisage d'autres mesures, mais elles exigent de connaître
physiquement les personnes. Le nombre total de personnes
contribuant à un wiki ou un autre est très grand, au-delà de
100 000, elles seront probablement impossibles à mettre en
place. Peut-être que des évènements rassembleurs comme Wikimania pourront servir à
implanter ces mesures supplémentaires.
Ces mesures, lorsqu'elles seront implantées, rendront plus
difficile la contribution à Wikipédia et aux autres wikis. Des
pcw seront
incapables de s'adapter à ces nouvelles mesures. Plusieurs
contributeurs anonymes seront aussi rebutés par ces nouvelles
mesures. Malheureusement, l'écosystème Wikimedia n'existe pas hors
d'Internet. Pour continuer de soutenir la cause de la libre
connaissance, l'écosystème doit être adapté aux défis actuels et,
malheureusement, des pcw compétentes ne
pourront jamais y participer.
Notes
↑Les
contributeurs anonymes sont toujours obligés de
« Prévisualiser » ou de « Voir les
modifications » avant de pouvoir « Publier les
modifications ».
L'atelier
Dans cette section, un(e) wikimédien(ne) peut raconter un de
ses bricolages à la première personne.
La section est vide
pour cette édition.
Nous attendons votre texte avec impatience pour le prochain numéro
.
La grande interview
Dans cette section, nous donnons la parole à des
wikimédien(ne)s sur des thèmes donnés afin de recueillir leurs avis
ou les faire parler tout simplement de leurs expériences dans le
mouvement.
↑ 1. Bonjour Kropotkine 113. Merci d’avoir
accepté cet entretien après que Warp3 vous a suggéré comme invité.
Pour commencer, je vous laisse vous présenter.
Bonjour et merci pour cette invitation. Je suis physicien de
formation et enseignant de métier. J'ai une quarantaine d'années en
train de se terminer.
↑ 2. Comment êtes-vous arrivé dans le mouvement
Wikimédia ? Sur quel wiki en premier et comment avez-vous
découvert les autres projets ?
Je vais tenter une accroche sous forme de titre
promotionnel :
« Je suis arrivé sur Wikipédia par la critique, le
scepticisme et l'ennui ! »
Si avec ça le nombre de lectures des RAW n'augmente pas, c'est
que je ne comprends rien à la presse ! ;D
Je suis arrivé mi 2006 sur fr.wikipedia.org. Un peu avant
j'avais été marqué par un petit article de Guillaume
Lecointre, datant de 2005 je crois, peut-être début 2006, et
intitulé : « Encyclopédies libres : après le
« fast-food », le « fast-science » ». (Là
aussi un titre bien racoleur.) Tout y passait : l'anonymat
versus le rôle des experts, la neutralité de point de vue et
l'opinion majoritaire érigée comme vérité, l'ultra-libéralisme
supposé du projet, etc. Critiques classiques du milieu des années
2000 en France avec le rejet de Wikipédia comme lieu commun chez
les « sachants ». La charge était violente et sans nuance
mais Lecointre était quelqu'un que je lisais et appréciais, et
comme j'étais scientifique comme lui son propos a fortement résonné
en moi.
Pour me faire ma propre opinion, je suis quand même allé voir
sur place ; j'ai beaucoup lu les pages d'aide et de règles de
Wikipédia, parcouru pleins d'articles et j'ai commencé à douter
parce que ce que je découvrais n'était pas totalement raccord avec
l'idée que je m'en étais faite. Durant l'été, je tente quelques
micro contributions et je trouve quand même le concept de
modification et publication immédiates assez incroyable et
révolutionnaire. Petit à petit, je renverse mon opinion sur
Wikipédia pour finalement en voir le potentiel.
À la fin de l'été, je me blesse assez gravement à un genou, je
suis opéré, l'opération ne se passe pas très bien, je suis arrêté
trois mois et j'ai une mobilité réduite : mon cerveau qui
normalement a sa dose de fatigue liée au boulot et à la vie sociale
s'ennuie assez vite et je décide d'apprendre des trucs. Je me mets
à apprendre sérieusement à jouer aux échecs, par exemple. Et puis,
je commence à vraiment contribuer à Wikipédia... pour finalement me
faire littéralement happer. :)
La suite est venue « naturellement », en tout cas
c'est mon ressenti : wikipédiholisme précoce, admin moins d'un an plus
tard, etc. La découverte des autres projets s'est faite petit à
petit, Commons pour les illustrations évidemment, Wikipedia en
anglais parce que je traduis, puis tout le reste. (J'ai même déposé
un message sur le Bistro de wikispecies, c'est vous
dire !)
Avec le recul, je me rends compte que c'est étonnant d'arriver
avec autant de préjugés négatifs et d'être encore là dix-huit ans
plus tard, avec enthousiasme. Le contexte a sans doute joué un rôle
important car mon arrivée correspond à une période vraiment
incroyable de la vie du projet : la croissance de Wikipédia
explosait littéralement en termes d'articles et de contributions,
on comprenait qu'on avait dans les mains un projet au potentiel
fabuleux mais on avait l'impression que tout était à faire et à
l'extérieur les critiques institutionnelles et médiatiques
continuaient de pleuvoir. On luttait sur tous les fronts, c'était
exaltant ! Quelle aventure ! Quand on a vécu ça, c'est
difficile de décrocher. :)
↑ 3. Quelle est votre forme d'investissement au
sein des projets de la Wikimedia Foundation ?
Même si en 18 ans j'ai déjà touché à à peu près tout, je reste
un pur Wikipédien. Mes contributions sur les autres projets sont
liées à ça. Côté mouvement, j'ai une petite période de
participations sur meta.wikimedia.org mais je n'y ai jamais vraiment
trouvé mon compte. Je suis aussi agent OTRS depuis 16 ans et
Masqueur de modifications
depuis 15 ans (et dernier des Mohicans puisque de la première vague
de nomination, il ne reste que moi). Je fais un peu partie des
meubles ;D
En termes de contributions wikipédiennes, j'ai fait au départ
énormément de maintenance et de patrouille et des
créations/traductions assez diverses. Maintenant, je ne fais plus
de patrouille qu'à partir de mes différentes listes de suivi. De
temps en temps, je traite un peu de SI via les pages de requêtes et
des clôtures de PàS. J'ai une présence moins régulière et moins
forte qu'avant donc j'ai délaissé la maintenance. Côté créations,
je fais essentiellement des petites traductions.
Les autres activités connexes aux projets ce sont tout ce qui se
fait « IRL » : les formations à Wikipédia, les
divers ateliers, rencontres, etc. J'ai fait pas mal de formations à
une époque très très lointaine (X, ENS, Jussieu), moins récemment même si ça
m'arrive encore de temps en temps (AJSPI,
CNNum).
Et puis, via Wikimédia France, j'ai participé à quelques
instances et réunions institutionnelles : généralement, les
institutions s'adressent à l'association parce qu'elles cherchent
des personnes pour « représenter » Wikipédia. De fait, ce
n'est pas possible, puisque personne individuellement ne représente
Wikipédia, et Wikimédia France n'a pas cette fonction non
plus ; éventuellement la Fondation peut se faire représenter
en tant qu'hébergeur mais ce n'est pas forcément toujours ce qui
est souhaité, donc des personnes comme moi se retrouvent à
expliquer, par exemple à des députés ou à l'ARCOM, les rouages du
site, de la communauté, de notre système de modération en ligne.
C'est passionnant et indispensable, mais très exigeant parce qu'on
a beau prendre mille précautions et multiplier les efforts
pédagogiques, notre fonctionnement est exotique et on n'est pas
toujours très bien compris.
Enfin, il y a la vie communautaire hors-ligne : Wikiconventions,
Wikicamps, Wikimanias ou tout
simplement se retrouver à quelques personnes autour d'un café ou
d'une galette des rois (c'est bien le numéro de
janvier, hein ?) ! Pour moi, c'est
presque aussi important que de participer à la rédaction d'articles
parce que pour « faire communauté » se rencontrer est un
ingrédient extrêmement important. Cela ne convient pas à tous les
caractères mais j'encourage le lectorat des RAW à essayer au moins
une fois. Pour info, l'édition 2026 de Wikimania se tiendra à
Paris !
↑ 4. En parcourant vos contributions, on trouve
pêle-mêle musique, physique-chimie, militaire et cuisine. Nulle
conquête du pain à l'horizon ? Quels sont vos objectifs quand
vous choisissez vos sujets de contribution ?
Haha. Je recommande la lecture de ce livre écrit par mon
illustre homonyme ;)
Chez les Cent-treize on fait des trucs
sérieux…… et des trucs bêtes.
En terme de sujets de contributions, je suis hyper éclectique.
J'ai quelques domaines de compétence (dont la physique) mais sinon
je fais à l'instinct, suivant mon humeur et les trucs qui me
plaisent ou me font marrer (un âne géant par exemple) sans objectifs
particuliers. La clé pour moi, c'est le plaisir : Wikipédia
est un hobby, je suis là par envie, pas par devoir, je fais ce qui
m'amuse et si un sujet m'ennuie, j'arrête d'y contribuer. Par
exemple, la physique : je me suis vraiment éclaté à
écrire/traduire certains articles (par exemple Vecteur
de Runge-Lenz) ou certaines sections (je suis très fier de la
section Newton et l'alchimie qui est sans doute celle
qui m'a coûté le plus cher en sources et sur laquelle le ratio
(temps passé)/(nombre de caractères écrits) est le plus élevé de ma
vie wikipédienne) mais globalement ça a fini petit à petit par trop
me faire penser au boulot et je ne m'amusais plus. Il m'arrive
encore de corriger telle ou telle erreur dans les articles,
histoire d'éviter un écueil à mes élèves, mais en fait je ne touche
presque plus aux articles scientifiques. Je vadrouille.
Mes seules marottes au long cours sont écrire un article sur
chaque artiste ayant une fiche dans la Rolling Stone
Encyclopedia of Rock'n'roll et documenter le blues. J'avance
super lentement, par épisodes parfois très espacés, mais j'y
reviens toujours. Là, l'objectif, c'est clairement assouvir une
passion et la partager au plus grand nombre. Ce qui est bien avec
Wikipédia, c'est qu'on n'a pas de date d'échéance donc mon histoire
avec la Rolling Stone Encyclopedia of Rock'n'roll, qui n'en
est qu'à la lettre L, peut bien encore durer dix-huit ans de
plus !
↑ 5. Quelle est selon vous la forme que prend la
dimension collaborative dans votre contribution ? Warp3
écrivait que vous étiez discret dans les espaces de discussion,
est-ce votre sentiment ?
Il y a deux aspects : le collaboratif côté articles et
celui côté communautaire.
Côté articles, je ne demande pas mieux que d'avoir des échanges
mais généralement j'ai peu d'interactions, sans doute parce que les
sujets que je traite sont calmes et consensuels. Ou alors c'est que
personne ne veut embêter le vieil ours vieux wikipédien qui
contribue dans son coin ;D
Côté communautaire, c'est vrai que je suis maintenant plutôt en
retrait. Mais ça n'a pas toujours été le cas : j'ai au départ
été très impliqué dans la « gouvernance » du projet,
participé aux discussions les plus tumultueuses, les plus longues
et les plus difficiles, passé énormément de temps dans l'espace
Wikipédia, consacré des centaines d'heures aux pages d'aide et de
recommandations. Je continue à lire le Bistro, le Bulletin des
admins, quelques pages de maintenance, je donne de temps en temps
mon avis quand on me le demande ou lors de votes/sondages mais je
m'implique moins, je n'ai plus l'énergie pour ça ou plutôt je la
réserve à autre chose.
Pour moi, les personnes que les discussions communautaires
intéressent se trouvent sur plusieurs rangs : le premier rang,
c'est le rang des personnes sur-investies qui sont peu nombreuses
et abattent un boulot monstre ; le deuxième rang, c'est pour
les personnes qui suivent un peu tout et s'impliquent quand le
sujet est vraiment important ; et sur la rangée du fond, on
observe de loin et on cause peu mais on est toujours là. En
dix-huit ans, je suis passé tranquillement du premier au dernier
rang et ça me va bien. :)
↑ 6. Lorsque les sujets sur lesquels vous
contribuez sont peu documentés dans des médias de références
généralistes, comment gérez vous l'exigence à démontrer la
notoriété ?
Ça, c'est une question délicate et qui appellerait une réponse à
tiroirs et un peu longue. Rien que la formulation de la question
est discutable. :) Qui exige quoi, de qui, pour quoi ? On
parle de notoriété ou de notabilité ? Etc. Derrière cette
question, il y a aussi la notion d'admissibilité.
Pour résumer et faire court : la plupart du temps, je
contribue sur des sujets bien documentés mais, dans les situations
où ce n'est pas le cas, j'ai une philosophie personnelle que j'ai
mis pas mal de temps à structurer intellectuellement mais à
laquelle j'essaie de me tenir. Quand le sujet de l'article ne pose
pas de problème mais qu'il n'y a pas de sources clairement
exposées, l'admissibilité de l'article doit être réglée par un
pari communautaire sur l'existence de celles-ci. On a besoin
de faire un pari raisonnable parce que la non existence de quelque
chose (en l'occurrence les sources) n'est pas démontrable. Si on
pense collectivement que des sources existent (mais sont
difficilement accessibles par exemple) ou existeront, alors on
conserve, sinon on supprime. Indépendamment de ce que je viens de
dire, je tiens aussi à rappeler que l'exigence de vérifiabilité (et
incidemment de sourçage) est essentiellement destinée à assurer la
neutralité de point de vue. Quand toutes les informations sont
factuelles, neutres, non polémiques et non contestées, alors le
fait que Wikipédia soit une encyclopédie en construction devrait
laisser à l'article le temps de se développer et de trouver les
contributeurs compétents capables de l'améliorer et de le sourcer
(ces contributeurs n'étant pas toujours, loin de là, les créateurs
de l'article) ; s'il y a polémique ou si une personne conteste
une information et qu'on ne peut pas attribuer les propos et
exhiber des sources alors il faut supprimer cette
information ; si cela concerne l'intégralité de l'article
alors il faut supprimer l'article.
À l'heure actuelle, j'observe plutôt une autre façon d'envisager
le projet : s'il n'y a pas x sources secondaires de qualité à
la naissance de l'article, on supprime, même si personne ne remet
en cause aucune des informations contenues dans l'article. C'est à
mon avis dommage et contre-productif.
↑ 7. Vous contribuiez déjà avant l'arrivée de
Wikidata. Pourriez-vous parler de votre rapport à cette base de
connaissance liée à Wikipédia ?
Quand le projet m'a été présenté la première fois à une
Wikimania (à Gdansk en 2010 peut-être ?), j'avoue que j'étais
plus que circonspect voire hostile. Je ne voyais que les défauts,
pas vraiment la finalité et ce que ça pouvait apporter. La réalité,
c'est que je n'y connaissais rien et que j'avais le réflexe de
protection de l'ignorant ! Pour moi, on allait juste exporter
les guerres d'édition sur un autre site. J'avais une vision
étriquée, centrée sur ce que je percevais immédiatement. C'est la
pratique et les exemples d'utilisation qui m'ont ensuite convaincu
que j'avais tout faux quand Wikidata a été concrètement mis en
service quelques années plus tard. J'ai eu aussi la chance de
croiser des wikimédien.ne.s qui m'ont éduqué sur le sujet. Et je
finis par penser que c'est vraiment la meilleure chose qui soit
arrivée au mouvement Wikimedia ces dix dernières années, avec un
potentiel énorme (même si les difficultés technologiques sont
grandes). Et les implications en ce qui concerne la structuration
des informations disponibles en ligne sont gigantesques et vont
très au-delà des réutilisations dans nos articles.
Mais mon utilisation de Wikidata reste pour l'instant très
restreinte : des liens interlangues quand je traduis, quelques
données ajoutées pour le remplissage automatique d'infobox, bref,
pas grand chose. Mais j'ai commencé à me former aux outils type
OpenRefine et, qui sait, si un jour je me recasse le
genou je me mettrai peut-être à fond à Wikidata ;D
↑ 8. Vous avez initié plusieurs prises de
décision. Qu'est-ce qui vous a amené à vous impliquer dans ces
procédures, et comment considérez-vous les mécanismes
décisionnaires aujourd'hui ?
Ça c'était la période où j'étais assis au premier
rang. :)
Je m'y suis collé parce que j'y croyais et que j'avais le temps
et l'énergie pour ça, tout simplement. Par exemple, la prise de
décision sur AbuseFilter, je l'ai portée à bout de bras pendant des
semaines, parce que je pensais vraiment cet outil utile. Il a fallu
que je me forme pour maîtriser tous les aspects de cette extension
technique, qui n'existait à l'époque que sur la version en anglais
je crois, et pouvoir en expliquer tous les enjeux et répondre à
toutes les questions. La rédaction de toutes les pages en relation
avec la prise de décision a aussi été très longue. Heureusement,
j'ai eu quelques coups de mains (je me rappelle notamment les aides
de TigH et Arkanosis). À la fin, mon implication
dans la procédure était presque affectif : dans mon esprit,
c'est un peu mon bébé. :)
Pour les mécanismes décisionnaires en place aujourd'hui,
j'identifie deux dérives :
l'instrumentalisation des sondages, soit pour bloquer une
discussion, soit pour contourner une prise de décision. Comme la
mécanique de prise de décision est parfois grippée, certaines
personnes passent par des sondages qui, de fait, deviennent des
quasi-décisions parce qu'il n'y a rien d'autre. Il y a vraiment un
truc qui cloche.
les sujets abordés. À mon sens, on ne devrait jamais fixer par
une règle des éléments purement éditoriaux. On peut voter sur plein
de choses, mais on ne devrait jamais voter sur le contenu
rédactionnel des articles. Le premier exemple qui m'a choqué
« historiquement », c'est la prise de décision
sur l'usage du mot « états-unien » dans les articles
(ce n'était pas le seul souci de cette pdd d'ailleurs) ; c'est selon moi
une aberration de passer par une pdd pour cette question, qui
relève de l'éditorial pur, à gérer article par article, par la
discussion.
Et puis, on est nul en terme de communication et
publicisation : je trouve ça incroyable que pour une pdd
moyenne on tourne à quelques dizaines voire une centaine de
personnes qui participent au vote. Même avec une évaluation basse
de la taille de la « communauté », on devrait en avoir
trois ou quatre fois plus. J'ai toujours milité pour l'utilisation
large des bandeaux sitenotice pour remédier à ce problème,
que ce soit pour les pdd ou les élections. Il faut ouvrir les
fenêtres, aérer, faire venir aux votes et dans les discussions
beaucoup plus de personnes, pour éviter l'entre-soi et le
rabougrissement.
Enfin, on a une grosse difficulté avec nos pratiques
wikipédiennes : le vote public signé. Il est difficile
d'éviter les phénomènes de meutes ou au contraire d'auto-censure à
partir du moment où, quel que soit le sujet, les votes sont
publics. Ça pose des problèmes de fond, particulièrement quand il
s'agit d'une élection individuelle. Il y a quelques avantages à nos
pratiques, je ne dis pas que le vote public n'a que des mauvais
côtés. Mais à mon sens il n'est pas normal qu'on n'avance pas du
tout sur ce sujet avec le développement d'un outil d'urnes
numériques comme pour les élections au board de la Foundation, par exemple. J'ai essayé il y a
quelques années qu'un tel outil soit mis à la disposition des
communautés par la Foundation ; on m'a répondu, en gros,
« won't do, we're
understaffed »[note 1], ce que je trouve assez
incroyable dans tous les sens du terme.
Je suis agent
OTRS depuis 2008. J'ai eu une grosse activité de réponse aux
courriels sur les files générales francophones (info-fr notamment)
pendant quelques années et c'est un très bon souvenir. C'est une
interface avec l'extérieur hyper importante parce qu'elle humanise
le projet, au sens où ce sont des vrais êtres humains qui répondent
avec leurs vrais petits doigts aux questions, critiques, etc. Les
gens qui nous écrivent sont d'ailleurs très souvent surpris, soit
par la rapidité de la réponse, soit parce qu'elle est en français
et pas en anglais. C'est étonnant, mais il y a des gens qui pensent
qu'on est un GAFAM comme
les autres...
Au-delà des pénibles qui viennent se plaindre n'importe comment
de tout et n'importe quoi, il y a aussi des questions légitimes et
parfois de beaux échanges voire des rencontres : je me
rappelle avoir répondu à un écrivain qui clairement ne comprenait
pas comment était rédigé son article et le trouvait vraiment pauvre
en informations ; on a pas mal discuté et j'ai fini par le
rencontrer chez lui autour d'un café, et il m'a transmis un dossier
de presse sur toute sa carrière que j'ai utilisé pour compléter et
sourcer l'article qui lui était dédié. C'était touchant et
sympa.
Aujourd'hui, je ne suis plus la file info-fr depuis très
longtemps, et je n'utilise plus que la file privacy-fr-wp dédiée
aux masqueurs de modifications. Et c'est (heureusement) beaucoup
plus calme ! Au passage, l'équipe de masqueurs est pour moi un
des trucs qui marchent le mieux sur Wikipédia en français, et je
suis tombé de ma chaise en lisant récemment sur le Bistro la
demande de l’Ombuds commission. Rien que le
fait qu'il ait fallu autant d'octets et de temps pour qu'on
comprenne exactement quel était le souci n'est pas bon signe. Merci
à celles et ceux qui ont pris la discussion à bras le corps.
↑ 10. Vous vous êtes impliqué dans l'association
Wikimédia France, en participant au conseil d'administration.
Pourquoi ? Quelles étaient vos motivations et qu'en avez-vous
retiré ?
Je suis devenu membre de l'association en 2007 et c'était pour
moi un prolongement évident de mes activités de contributeur, une
façon de mettre des visages sur les pseudonymes et de faire de
Wikipédia une expérience sociale réelle et ne pas la maintenir
uniquement dans l'espace virtuel. Et il y avait un milliard de
choses à faire aussi côté associatif à cet époque : au-delà
des activités classiques de soutien à la contribution ou de
promotion ds projets, le mouvement Wikimedia grossissait et se
structurait petit à petit avec de multiples difficultés liées en
partie au caractère très autonome de chaque projet et de chaque
association, en partie au fait qu'on partait quasiment de zéro.
Les associations locales comme Wikimédia France étaient
absolument essentielles au mouvement : non seulement
l'association servait d'interlocutrice identifiée pour les médias
et les institutions qui voyaient à l'époque le mouvement au mieux
comme un OVNI au pire comme un ennemi, et on dépensait beaucoup
d'énergie en pédagogie et explications, mais l'association avait
aussi la responsabilité de lever les fonds en France pour le
mouvement. On pourrait croire que la situation actuelle (pour
simplifier, Wikimedia Foundation lève l'argent et redistribue aux
associations locales et user
groups) a toujours existé mais ce n'est pas le cas, au
départ c'était l'inverse pour un certain nombre
d'associations ! On faisait tout localement, selon une forme
de principe de subsidiarité : on créait le bandeaux de levée
de fonds nous-mêmes, on récoltait les fonds, etc. Pour les
bénévoles, c'était hyper valorisant.
Il y avait donc besoin de bras et de temps de cerveau disponible
et comme il n'y avait pas forcément foule pour se présenter au CA,
j'y suis allé une première fois en 2011. Côté structure c'était
aussi la première phase de professionnalisation de l'association et
je suis fier d'y avoir contribué. Et puis il y a les anecdotes
marrantes : comme on n'avait pas encore de locaux, certains
chèques de don arrivaient directement dans la boîte aux lettres du
secrétaire du CA (votre serviteur) ! Toujours plus sympa que
les mises en demeures ou convocations au tribunal qui suivaient le
même chemin ;D
J'ai quitté le CA en 2013 parce que c'était épuisant et que ma
vie personnelle avait pris un virage qui me laissait beaucoup moins
de temps.
J'y suis retourné quelques années plus tard, dans un contexte de
crise profonde de l'association. Là, il s'agissait surtout de
sauver la structure (que Wikimedia Foundation hésitait à fermer) et
donc les emplois de l'équipe salariée, et aussi de « faire le
ménage » après une période où la gouvernance avait été
défaillante et provoqué beaucoup de souffrances, notamment chez les
salarié.e.s mais aussi parmi les membres du CA et les membres tout
court. Quand la situation est redevenue saine avec une association
fonctionnelle et une équipe apaisée, j'ai quitté cette fois-ci le
CA essentiellement par ennui : je n'y trouvais plus d'intérêt
personnel, autant laisser la place à d'autres.
Maintenant, cela fait quelques années que je suis simple membre
de l'association... assis dans la rangée du fond ;D
La participation des institutions culturelles, scientifiques,
techniques, historiques, médiatiques, au sens large. L'association
Wikimédia France travaille beaucoup là-dessus et le développement
du programme de Wikimédien.ne.s
en résidence, par exemple, est une très bonne chose.
Il y aussi la formation des jeunes : Wikipédia reste un
outil extraordinaire pour développer le sens critique, faire de
l'éducation aux médias et développer l'idée que la jeunesse peut
aussi produire elle-même et ne pas être réduite à
« consommer ». Il y a un côté émancipateur et d'éducation
populaire dans la participation à Wikipédia. Vikidia joue ce rôle, mais
Wikipédia pourrait aussi en faire plus même si des projets pédagogiques existent déjà.
Et puis, il y a l'IA. Pas la méchante IA qui ne veut que nous
remplir nos articles de trucs bidons plus ou moins hallucinés. Mais
la gentille IA, celle qui peut aider à contribuer en réduisant à
presque néant certaines tâches fastidieuses de la pré-collecte de
sources jusqu'à certaines opérations de maintenance en passant
par... l'aide à la détection des contenus créés par IA ! On
est au début de cette histoire, il y a pas mal d'inquiétude mais
aussi de l'espoir.
Enfin, pour la Wikipédia en français spécifiquement, le futur,
c'est la Francophonie ! Non seulement le nombre de personnes
pouvant contribuer en français mais ne l'ayant jamais fait est
énorme mais, en plus, la démographie de la Francophonie fait que le
nombre de personnes parlant français devrait doubler d'ici 2050.
Comme il y a un boulot énorme à faire pour réduire le
franco-centrage de notre encyclopédie, cette évolution
démographique qui est essentiellement portée par les pays africains
sera une chance pour nous.
↑ 12. Quel(le) wikimédien(ne) souhaiteriez-vous
voir interviewé(e) dans un prochain numéro et sur quel
thème ?
J'aimerais beaucoup lire Chaoborus. Pas de thème en tête.
En revanche, j'ai une question : « Les catégories.
Pourquoi ? »
↑ 13. Y a-t-il un sujet particulier qui vous
tient à cœur et que nous n’avons pas abordé dans cet
entretien ? Vous avez carte blanche 🙂.
J'aimerais parler un peu de notre attitude collective en tant
que communauté face à l'accueil des personnes qui débutent quelles
qu'elles soient et quelles que soient leurs motivations. Nos
projets ont tous été fondés sur un pari extrêmement
audacieux : une ouverture totale, pas de censure a priori et
le fait qu'il y aura toujours une personne vertueuse de plus à
accueillir malgré l'entrée possible de moult pénibles. Bien sûr,
les défis et les problèmes sont importants (vandalismes de base,
IA, entrismes politiques, attaques médiatiques, tentatives de
déstabilisation, contributions rémunérées non déclarées, agences de
communications, etc.) mais il ne faut jamais oublier que notre
force c'est la multitude, le grand nombre, la sagesse de la foule
menant à l'intelligence collective.
Ce projet est la prunelle de nos yeux donc je peux comprendre
notre attitude de hérisson et notre méfiance, elles nous protègent.
Mais il faut trouver un équilibre. Cet énergumène vous agace parce
que ça fait dix fois qu'il tente d'écrire n'importe comment un
micro article sur sa marotte ? Non, il n'y a toujours pas de
sources suffisantes pour cette petite association bien
sympathique ? Ce joueur de foot n'a pas encore assez de matchs
en première division ? Cette rappeuse très prometteuse n'a
pour l'instant sorti qu'un seul album avec peu de recensions ?
Prenez le temps d'expliquer, faites le pari que derrière, parfois,
il y a une personne qui en fait est de bonne volonté et peut être
« convertie » en contributrice positive ; non
seulement les exemples sont nombreux de débuts catastrophiques
menant à des expériences réussies d'inclusion dans la communauté
mais en plus c'est extrêmement valorisant quand on y a participé.
Évidemment, cela marche une fois sur cent, c'est usant, voire
déprimant, la tâche est titanesque. Mais rappelez-vous qu'une
encyclopédie libre, gratuite, sans publicité, rédigée par des
« anonymes » sans contrôles d'expertise, c'est
normalement impossible sauf en ayant l'audace de maintenir toujours
vivant le pari originel, c'est-à-dire un projet ouvert et facile
d'accès, quoi qu'il en coûte.
↑ 14. Avez-vous un message particulier à
adresser au lectorat du RAW ? Quel serait votre mot de la
fin ?
Wikipédia est un loisir. Personne n'est irremplaçable ni
indispensable donc si un sujet vous énerve, si vous devenez
facilement irritable, il est toujours temps de fermer votre
ordinateur et d'aller prendre l'air ou de passer à un autre sujet.
Ne vous laissez gouverner que par votre envie de partager. Prenez
du plaisir à contribuer !
Merci d'avoir accepté cette interview. Bonne
continuation !
Notes
↑Littéralement, « On ne fera pas, nous sommes
en sous-effectifs ».
Si je
résume l'article, avoir un certain
contrôle sur Wikipédia implique une certaine maitrise technique ;
or, les hommes sont sur-représentés en informatique ; donc,
Wikipédia (comme d’autres plateformes en ligne) est intrinsèquement
sexiste.
Ce matérialisme de genre semble complètement mettre de côté le
matérialisme lui-même, c’est-à-dire
l’idée que les rapports de production déterminent les rapports
sociaux. En tant qu’espace de diffusion du savoir reposant sur une
certaine maitrise informatique, Wikipédia accueille probablement
beaucoup de personnes diplomées ayant une formation en
informatique. On pourrait ainsi tout autant dénoncer comment
Wikipédia valorise les personnes diplomées, ayant eu accès au
savoir et à la culture et ayant du temps et des moyens pour la
diffuser ; et donc possiblement ayant un certain niveau de
revenu.
Wikipédia n’est donc pas le problème ici. Le problème, c’est
qu’en effet les hommes sont sur-représentés dans la formation
informatique (comme les femmes le sont dans les métiers du service
à la personne) ; et l’offre de formation repose sur les besoins du
marché capitaliste — capitalisme qui a lui-même institué certains
rapports ethnoraciaux ou de genre.
↑Traduit
avec Deepl.com de « Wikipedia is a problem for
Musk/Trump. Not, as Musk says, because it's "woke." Because it's
one of our last reliable tethers to a consensus reality. Therefore,
an antidote to disinformation. It's not making anyone money. It's
not enshittified. Of course it's not perfect—it's an endeavor of
imperfect cooperating humans. But it needs protection and
support. »
Des acteurs de la presse française viennent d'annoncer la
signature d'une
charte de la traçabilité de l'information. La charte prévoit
que les médias citent correctement leurs sources et qu'ils insèrent
des liens hypertextes dans les articles. Aucun roman d'anticipation
n'avait sans doute imaginé qu'en 2020 l'humanité serait capable de
telles prouesses ! Au-delà de cette pic amicale, je suis content
que les médias traditionnels adoptent les bonnes pratiques des pure
players et de Wikipédia. La gestion des sources et des hyperliens
est complexe et chronophage. Bon courage aux nouveaux titres de
presse qui se lancent dans l'aventure.
S'ils leur restent du temps, ce serait bien également de
correctement créditer les photos qu'ils prennent sur Wikipédia ou
Wikimédia Commons. Bien souvent les médias ne citent pas la licence
libre utilisée par le créateur ou utilisent les fameux Droits
réservés (DR). Outre le fait que c'est illégal, il est de plus
en plus important de pouvoir retracer l'origine des images afin de
s'assurer de leurs exactitudes et que les légendes correspondent
bien aux photos.
Hasard du calendrier, j'étais depuis plusieurs jours en train de
me dépêtrer à faire des requêtes SQL pour mieux connaître les liens
externes qui se trouvent sur la Wikipédia francophone.
Liens externes
Les hyperliens qui mènent
vers d'autres sites web sont très fréquents sur Wikipédia. Une
série de recommandations leurs sont consacrées sur la page Wikipédia:Liens
externes. Dans les articles de Wikipédia, on peut en
trouver à deux endroits différents. Tout d'abord dans la liste des
sources permettant de vérifier ce qui est écrit dans l'article. Ce
type de lien externe, aussi appelé source ou référence, est
généralement regroupé dans une section intitulée Références
ou bien Notes et références. La nature des références est
fonction de l'article. Un article d'actualité va utiliser la presse
alors qu'un article d'histoire utilisera des monographies.
Un deuxième endroit possible pour
les liens externes est une section tout simplement appelée Liens
externes en toute fin d’article. Le plus souvent cette section
contient le site officiel ou de nombreux liens vers d'autres bases
de données. Les wikimédiens consacrent beaucoup de temps pour
relier Wikipédia ou Wikidata à des notices d'autorité (base Léonore
de la Légion d’honneur, base Mérimée des monuments historiques,
IMDb, etc.) ainsi qu'à d'autres sites de référence (Who's Who,
Universalis, Maitron, etc.).
L'outil Quarry
permet d'interroger en live une copie de la base de données de
Wikipédia à l'aide du langage SQL. N'y connaissant rien, je me suis
contenté de réutiliser une requête faite par un collègue étranger.
Les résultats ne sont pas directement utilisables car on ytrouve quelques sites internes à Wikimédia et des
sites identiques sous plusieurs urls (ex. books.google.com et
books.google.fr ou wordlcat.org et www.worldcat.org). Il faut donc
penser à agréger certains résultats.
De nombreux liens renvoient vers
des sites Wikimedia. Il y a tout d'abord les liens vers les autres
versions linguistiques de Wikipedia. Il ne s'agit pas des
interwikis permettant de passer d'une langue à l'autre mais de
liens générés par des modèles tels que {{Traduction/Référence}} ou
{{Lien}}.
Il y a également quasiment 200 000
liens vers la ferme de serveurs qui héberge des outils
(tools.wmflabs.org) tels que GeoHack, KMLexport, Chemistral
Abstracts Service number links, etc.
Et Wikidata est massivement
utilisé avec plus de 3 millions de liens.
Je terminerai en présentant les
travaux des robots. Il y a tout d'abord les outils d'archivage. Les
pages internet peuvent avoir une durée de vie assez courte. Afin de
permettre l'accès à ces liens morts, la Wikipédia Francophone
utilise deux services :
La Wayback Machine d'Internet Archive : 210 916 liens
Et un service similaire (Wikiwix) proposé par la société
française Linterweb : archive.wikiwix.com 56 919
CodexBot
sert à mettre en forme les hyperliens laissés par les rédacteurs
bénévoles. La Wikipédia francophone utilise principalement trois
modèles afin d'harmoniser la présentation des sources :
Ouvrage :
utilisé 1 064 113 de fois sur 305 392 pages distinctes.
Article :
utilisé 808 734 de fois sur 238 253 pages distinctes.
Lien web :
utilisé 3 366 315 de fois sur 679 393 pages distinctes.
Ce robot analyse quotidiennement
2500 citations de livres et en améliore 1500. Il traite également
1000 articles de presse, articles académiques et pages web. Enfin,
il signale une trentaine de cas nécessitant une vérification
humaine.
[Mise à jour] Ajout de
requêtes SQL listant les liens par projet
Courez le marathon 2025 pour Wikimédia France Pour la première
fois, l’association Wikimédia France participe au Marathon de Paris
2025 qui aura lieu le 13 avril prochain. Aidez-nous à collecter des
fonds en achetant un dossard solidaire, un moyen de relever un défi
sportif et caritatif au profit de l’accès au savoir libre et
gratuit. […]
Wikidata: A Revolution for Wikipedia, Between
Opportunities and Challenges
The deployment of Wikidata across all Wikipedias began on March
6, 2013, marking a significant milestone in the history of the
collaborative encyclopedia. This initiative represents excellent
news for multilingual Wikipedians, who no longer have to juggle
between different language versions to modify the same
information.
What is Wikidata?
In simple terms, without going into technical details, Wikidata
is a project initiated by Wikipedia Germany and taken over by the
Wikimedia Foundation thanks to charitable funds. Its main objective
is to create a centralized and unified database for all language
versions of Wikipedia.
Let's take a concrete example: for individuals, dates of birth
and death, as well as other important events in their lives, are
stored only once in Wikidata. Any modification made to this data is
automatically reflected in the approximately 280 existing language
versions of Wikipedia.
The Advantages of Wikidata:
Data Centralization and Consistency: Wikidata
ensures the consistency of information between the different
language versions of Wikipedia, avoiding contradictions and
translation errors.
Time Savings for Contributors: Modifications
no longer need to be made manually on each Wikipedia, which
represents a considerable time saving.
Improved Maintenance: Data maintenance is
simplified, as a single modification is sufficient to update all
language versions.
Data Use by External Tools: Wikidata's
structured data can be used by external tools and applications,
opening new perspectives for research and analysis.
Improved Interoperability: Wikidata
facilitates interoperability between Wikipedia and other knowledge
databases.
Challenges and Potential Sources of
Conflict:
The idea of shared data is appealing, but it also raises
significant challenges, particularly due to differences in
viewpoints and conflicts of interpretation that may exist between
contributors from different language versions.
Here are some examples of potential conflicts:
Differences in Calendars and Dating
Conventions: As mentioned in the original text,
disagreements can arise regarding dates, for example between the
Gregorian and Hijri calendars.
Differences in Historical and Political
Interpretation: Statistics concerning disputed
territories, such as Palestine/Israel, or controversial historical
events, such as the Algerian War, can be the subject of significant
disagreements. The number of deaths, the names of places (French
Algeria vs. Algeria), and the interpretation of facts can vary
considerably depending on the sources and perspectives.
Management of Non-Consensual Viewpoints: How
to manage information that does not reach consensus within the
community? Which version of the information should be displayed by
default? How to report different viewpoints neutrally and in a
balanced way?
Wikidata's Response to Conflicts:
Wikidata developers have anticipated these difficulties. A
fundamental principle is that each Wikipedia retains a certain
autonomy and the possibility of locally managing data for which a
consensus has been reached within its community. In particular, the
information displayed in infoboxes (the information tables on the
right of articles) can be managed locally. The English text of
Wikidata is clear on this point. This makes it possible to take
into account cultural specificities and local debates.
Conclusion:
Wikidata represents major progress for Wikipedia, by
centralizing data and facilitating collaboration between different
language versions. However, it also raises significant challenges
related to the management of conflicts and differences in
interpretation. Respecting the autonomy of local Wikipedias and
establishing conflict resolution mechanisms are essential to ensure
the success of this ambitious project. We can indeed expect a
period of adjustment and debate within the Wikipedia community, but
the potential benefits of Wikidata make it a promising
initiative.
more
info https://meta.wikimedia.org/wiki/Wikidata/Deployment_Questions
C’est quoi ? Eh bien, dans l’ère de l’information instantanée,
vous pouvez facilement trouver des réponses via les moteurs de
recherche. Mais laissez-moi vous faciliter la tâche avec un lien
direct ! Ce que vous ne trouverez pas sur ce lien, c’est que je
suis le premier Algérien à avoir assisté à la conférence
mondiale de Wikimania. Oui, c’est bien cela !
Wikimania, c’est le synonyme de
connaissances partagées, création
libre, et données ouvertes.
C’est le grand rassemblement de personnes dévouées à une cause
simple mais immense. Ces gens, souvent anonymes, n’ont pas tous de
prestigieux diplômes ou de rangs académiques. Aucun pouvoir pour
changer le monde, mais ensemble, on réussit à accomplir
l’incroyable : une ligne, une photo, un schéma, une modification,
une adjonction, une suppression… Et voilà, un résultat
inimaginable.
Jamais un être humain n’a pu rassembler un tel volume de
connaissances dans un seul conteneur. Et cela inclut toutes les
cultures, toutes les langues et toutes les croyances. Cela n’a
jamais été fait. Ni avant, ni depuis. Les institutions
traditionnelles de diffusion du savoir en sont à la fois fières et
jalouses. Certaines ont dû fermer leurs portes, d’autres ont changé
d’activité. C’est un changement révolutionnaire, le plus grand
depuis l’invention de la roue.
Faire partie de cette histoire qui influence chaque mois près
d’un demi-milliard de personnes, rencontrer et échanger avec ces
personnes passionnées, c’est plus qu’extraordinaire. C’est
hilarant. Je me suis senti un peu perdu, tout dispersé, tellement
je voulais communiquer avec tout ce monde-là. Y arriver n’était pas
facile, ni rapide. C’est un travail de longue haleine, dans la
rédaction encyclopédique, qui m’a pris plus d’une décennie.
Le chemin vers Wikimania :
La découverte de Wikipédia remonte à un temps assez lointain. À
l’époque, je n’étais pas vraiment branché sur le site, mais je
participais activement à la création de sites de rassemblement de
la connaissance. Nous utilisions Encarta, un
logiciel payant avec des mises à jour annuelles, mais bien sûr,
nous devions chercher des cracks pour l’utiliser. Microsoft n’avait
pas de boutique de logiciels en Algérie, et nous n’avions pas la
possibilité de payer en ligne. Cracker les logiciels était notre
manière de contourner cela.
Wikimédia a complètement changé la donne en offrant un accès
gratuit et illimité à la connaissance. Comme l’a dit Jimmy
Wales, le fondateur de Wikipédia : « Imaginez un monde
où chaque être humain peut librement partager dans l’ensemble de
toutes les connaissances ». Un monde où l’accès à la
connaissance est libre et gratuit pour tous.
Mon aventure a commencé à la fin de l’année 2006. Je me suis
inscrit sur Wikipédia en français pour rédiger un article sur ma
ville natale. L’article n’existait pas, il était référencé sous un
ancien nom datant de l’avant-indépendance de l’Algérie. C’était un
véritable défi d’écrire cet article en français, puis de le
traduire en arabe. Je me suis retrouvé confronté à une pénurie de
sources fiables, ce qui rendait la tâche encore plus difficile.
Depuis ce moment-là, je participe activement sur Wikipédia en
arabe, tout en continuant à développer des projets.
Une opportunité d’engagement :
En 2008, j’ai entendu parler d’un rassemblement à Alexandrie.
L’envie d’y participer était forte, mais l’éloignement et mon
travail m’ont empêché de concrétiser ce projet. J’ai continué à
participer sporadiquement à Wikipédia, sans m’investir
pleinement.
Puis, en 2012, j’ai reçu un message d’un certain
Abdelhak Fareh. Après quelques échanges sur Skype,
nous avons décidé de nous rencontrer pour discuter. À la fin de
l’année 2012, j’ai reçu une invitation à participer à un atelier au
Caire pour discuter de son expérience en tant que Wikipédien. En
moins de 15 jours, tout était prêt, et je me suis retrouvé à cet
atelier.
Cette expérience m’a motivé à prendre les choses en main en
Algérie, coûte que coûte. J’ai multiplié les contacts avec les
utilisateurs algériens de Wikipédia. Ensemble, avec Abdelhak, nous
avons créé un groupe sur Facebook pour échanger, et j’ai participé
au premier programme éducatif sur Wikipédia, une première en
Algérie.
Mes ressources bien cernées et mon envie d'y assister
grandissante, une bourse m’offre une opportunité précieuse de
participer. Les chances étant minimes (seulement 10 personnes de
toute la région MENA pouvant être sélectionnées), je dépose ma
demande pour la bourse afin d’assister à la grande conférence de
Londres.
Au début de l’année, en février 2014, mon objectif est clair :
découvrir les coulisses de Wikimédia et ses projets, ainsi que
trouver des moyens de relancer l’activité Wikimédia en Algérie. En
mars, je passe la première sélection, et c’est avec joie que
j’apprends que je suis définitivement accepté pour participer.
S’ensuit alors une course contre la montre pendant 3 mois. Bien
que la bourse couvre une grande partie du voyage, ce n’est pas
suffisant. Très méticuleux de nature, je n’improvise jamais mes
déplacements sans régler tous les détails, ce qui entraîne des
dépenses supplémentaires.
Pour voyager au Royaume-Uni, il faut un visa, et celui-ci est
réputé être l’un des plus difficiles à obtenir en Algérie. Il m’a
fallu 45 jours de préparation pour soumettre mon dossier, et après
un minimum de 21 jours d’attente, le stress est à son comble.
Un jour, je reçois un SMS me demandant de venir récupérer mon
dossier. Ne sachant pas encore si j’ai obtenu mon visa, je me rends
à nouveau à 400 km pour le récupérer. C’est une enveloppe scellée.
Après avoir signé le reçu, j’ouvre l’enveloppe… et c’est une énorme
bouffée de soulagement : j’ai mon visa !
Je dois maintenant m’activer pour finaliser mes préparatifs et
terminer ce que j’ai commencé il y a 6 mois. Je multiplie les
contacts avec le groupe des utilisateurs arabes pour savoir qui
viendra, et prépare mon programme à Londres.
La nuit du 5 août, je suis à l’aéroport d’Oran pour prendre mon
vol Alitalia vers Rome, puis vers Londres. Le passage à la
frontière n’est pas facile, avec des policiers algériens et
italiens qui doutent de l’authenticité de mon visa. La police
britannique, quant à elle, ne fait que scanner mes empreintes, et
après un "Welcome", me voilà à Londres !
Ne parlant pas la langue et n’ayant jamais mis les pieds en
Europe, je me trouve un peu perdu. Heureusement, le manuel de
l’équipe Wikimania et les conseils de forums comme Tripadvisor me
permettent de me repérer. Trouver la différence entre une Travel
Card et une Oyster Card fut un défi, mais j’ai opté pour
l’Oyster.
Le métro est facile à prendre, bien que la confusion vienne lors
du changement de lignes. Une fois à la gare de King’s Cross, le
sentiment de perte est total. Mais un agent du métro m’indique la
plateforme et je prends finalement la direction d’Old Street pour
arriver à mon hôtel.
Arrivé à l’hôtel, un soulagement immense : une incroyable
opportunité se réalise, celle de rencontrer la communauté Wikimédia
et de découvrir les projets en personne.
Mes objectifs atteints :
Découvrir la vraie Wikimédia mondiale et participer à
l’avenir des projets de la connaissance libre.
Représenter l'Algérie et le Maghreb comme une entité
spécifique nécessitant plus d’attention et promouvoir la culture à
travers les projets Wikimédia.
En savoir plus sur Wikimédia et ses langues locales,
rencontrer les dirigeants des projets et connaître leurs
expériences.
Rencontrer les équipes de Wiki Loves Monuments et
discuter de l'avenir du concours.
Rencontrer les responsables du programme mondial
d'éducation arabe.
Partager mon expérience des projets Wikimédia, à la
fois à l’intérieur et à l’extérieur de la communauté.
Échanger mon expérience avec de nombreux
Wikimédiens.
Ce que j’ai trouvé :
Première préoccupation : Trouver des gens qui
pourraient m’aider à développer un groupe d’utilisateurs en
Algérie. Grâce à l’équipe affcom, j’ai trouvé ce que je
cherchais. Avec le groupe des utilisateurs de la Tunisie, c’était
pareil.
Deuxième préoccupation : Trouver des moyens de
créer un nouveau wiki sur incubateur et réussir. Grâce à l’équipe
Wikimédia Language Engineering, j’ai trouvé les
réponses.
Troisième préoccupation : Comment récolter un
maximum d’informations sur les projets Wikimédia dans ma région.
Mission accomplie grâce à mes contacts en Afrique et en Europe, et
avec la carte de visite en poche.
Discussions abordées :
Le futur de Wikimédia Zéro en Algérie.
L'extension du développement de WikiTranslate et
d'autres projets pour préserver les langues locales menacées par la
mondialisation.
J’ai réussi à partager mon avis et ma vision sur le projet
Kylix (avec Emmanuel Engelhart) : les bases de données
hors ligne consomment moins d'énergie et de coûts, et préservent la
nature. J’ai proposé de développer cette idée en essayant de
combiner Wikimédia Zéro avec Kiwix pour rendre le
projet plus intéressant.
Le Stand "Pour Tous et par Tous" à Wikimania
Mexico
Les utilisateurs de WikiDZ ont eu la chance d’avoir un stand
dans le village social, offert par les organisateurs de Wikimania
Mexico. Cela a permis au représentant de WikiDZ de mettre en
lumière les activités en Algérie, tout en comparant nos actions
avec celles des autres groupes. C’était l'occasion de montrer que,
même dans un pays où l'activité autour de Wikipédia et de ses
projets frères est encore timide, nous sommes présents et
actifs.
Le stand offrait également un espace pour ceux qui n'avaient pas
de table, leur permettant de se réunir et de discuter avec les
visiteurs.
Échanges culturels et découverte des
saveurs
Pour encourager la discussion et faciliter les échanges
culturels, j'ai apporté des Caprices, des bonbons au
caramel, une spécialité made in Algérie. Emna, de Tunisie, a eu
l'excellente idée d'apporter des dattes "Deglet Nour" de première
qualité ainsi que des boîtes de "chamia" (halva), une douceur
d’origine orientale. Les visiteurs étaient très curieux de
découvrir nos traditions et de mieux nous connaître. C'était un
véritable petit village au sein du grand monde de la communauté
Wikimedia.
Wikimania Mexico : Un rassemblement sans
frontières
Wikimania Mexico a été, pour notre groupe d'utilisateurs, une
occasion de montrer qu’il est possible de dépasser les frontières,
non pas pour se réconcilier ou pour débuter un quelconque conflit,
mais pour partager des idées immatérielles. C'était l'occasion de
nous rassembler, avec les outils que nous avons, pour mieux
échanger et diffuser nos idées.
Un stand collaboratif et des connexions
fructueuses
Le stand a duré trois jours. Avant le début, nous avons eu la
chance d’être placés à côté du stand de l’Égypte. Cette proximité a
permis de créer un large stand représentant la communauté arabe,
avec la participation de nombreux utilisateurs : Oussama d’Arabie
saoudite, Ravan d’Irak, Habib et Emna de Tunisie, Florence de
France, ainsi que Walla, Mohammed, Samir et Mouchira d’Égypte.
Cela a facilité de nombreuses connexions, notamment une mise à
jour de nos projets pour l’Algérie. Ces échanges ont été précieux,
nous permettant de mieux comprendre nos actions passées et de
corriger nos orientations futures, tant pour l'Algérie que pour la
Fondation Wikimedia.
La fin d'une belle expérience
La fin du stand fut difficile, car chaque belle expérience a une
fin. Mais ce fut un moment inoubliable, et nous repartons enrichis
de nouvelles idées et de nouveaux liens.
Le 15e anniversaire de Wikipédia, accompagné de l’atteinte de 5
millions d’articles dans la version anglaise, marque un jalon
impressionnant pour la fondation Wikimedia, mais aussi un moment de
réflexion sur l’avenir. En effet, alors que Wikipédia est devenue
une référence incontournable en matière d’encyclopédies en ligne,
la fondation se trouve aujourd’hui face à un défi majeur : comment
continuer à évoluer et soutenir ses projets tout en restant fidèle
à sa mission initiale ?
Défis à relever pour la fondation Wikimedia
Évolution technologique et interface
utilisateur
Bien que Wikipédia et ses projets frères aient radicalement
transformé l’accès à l’information, l'interface de Wikipédia reste
étonnamment stable depuis sa création. La simplicité de la
plateforme a été une de ses forces, mais aujourd’hui, dans un monde
où la technologie évolue rapidement, il est légitime de se demander
si Wikimedia pourrait offrir une expérience plus moderne et plus
interactive, tout en conservant sa philosophie de base.
La question de la durabilité et de
l’innovation
La fondation doit réfléchir à son avenir face à des défis comme
l'émergence du Web 3, l'essor de l'intelligence artificielle, ou
encore la concentration des communications et des recherches via
des plateformes comme Facebook, Google, ou même TikTok. Ces outils
deviennent des espaces où les utilisateurs interagissent,
recherchent des informations et partagent des connaissances,
souvent en dehors des projets Wikimedia. L'enjeu pour la fondation
sera de s’adapter et de proposer de nouvelles solutions tout en
restant fidèle à son objectif de fournir un accès libre à la
connaissance.
Un moteur de recherche dédié ?
Le récent don de 250 000 $ pour développer un moteur de recherche
dédié à Wikimedia pourrait être un tournant majeur. Si la fondation
parvient à créer un moteur de recherche propre qui mette en valeur
les contenus de ses projets tout en respectant les principes de
neutralité et de transparence, cela pourrait marquer un changement
important. Un moteur de recherche qui fonctionne en symbiose avec
les autres projets Wikimedia permettrait aux utilisateurs d’accéder
encore plus facilement aux informations tout en restant dans
l'écosystème de la fondation.
Wikimedia comme acteur technologique à part
entière
Si la fondation souhaite se positionner comme un leader
technologique du Web, il est essentiel qu’elle explore de nouvelles
avenues. Le Web 3, qui inclut des technologies comme la blockchain,
la décentralisation des données et des espaces de collaboration en
ligne plus sophistiqués, pourrait être une réponse. L’idée serait
de proposer une alternative aux plateformes centralisées
dominantes, en conservant la philosophie du libre accès à
l’information. Si Wikimedia parvient à se réinventer tout en
préservant ses valeurs fondamentales, elle pourrait devenir un
acteur clé de cette évolution.
Une opportunité pour l'avenir
La fondation est effectivement à un carrefour. Si elle veut
conserver sa place parmi les sites les plus visités au monde et
continuer à être une référence en matière de partage de
connaissances, elle devra s’adapter aux nouvelles attentes des
utilisateurs tout en restant fidèle à sa mission. Cela pourrait
inclure l’intégration de nouvelles technologies, la refonte de
certaines de ses interfaces et outils, ainsi que la mise en place
de solutions pour combler les lacunes actuelles dans la recherche
et l’interaction avec les contenus.
En fin de compte, l’avenir de Wikimedia dépendra de sa capacité
à innover tout en préservant les principes qui ont fait son succès
: un accès libre, gratuit et de qualité à la connaissance pour
tous. Si la fondation réussit à relever ces défis, elle continuera
à jouer un rôle central dans le paysage numérique mondial.
Le vote dans les
projets Wikipédia soulève en effet plusieurs défis, surtout quand
il s'agit de garantir l'intégrité et la transparence des résultats.
L’un des principaux obstacles à la fraude est la vérification des
comptes via les adresses IP. Cela empêche les utilisateurs de voter
plusieurs fois sous des pseudonymes différents, car les comptes
sont étroitement surveillés pour éviter toute tentative de
manipulation. Il est également nécessaire que les comptes aient une
certaine ancienneté (plus de six mois) et une activité régulière
pour éviter que des comptes inactifs soient utilisés de manière
abusive.
De plus, les comptes
avec moins de 500 participations sont souvent écartés, ce qui
limite encore plus la possibilité de manipuler le système de vote.
Cette rigueur dans les critères de participation garantit que
seules les contributions sérieuses et soutenues comptent dans le
processus de décision, tout en excluant les comptes qui pourraient
être créés à la va-vite pour fausser les résultats.
Cependant, il faut
reconnaître que malgré ces règles strictes, certaines magnifiques
photos ont échappé à l’attention du jury, et le choix final n'est
jamais simple. En effet, lorsqu’on établit un règlement, il est
essentiel de s’y conformer, même si les résultats ne conviennent
pas toujours à tout le monde. Cela ne signifie pas que seules 10
photos sont les meilleures ou les plus belles. Au contraire, il y
en a beaucoup plus qui mériteraient d’être saluées. Parfois, on
hésite tellement entre deux ou trois images, chaque photo portant
une étincelle particulière qui fait hésiter.
Je tiens aussi à
souligner l’immense courage des photographes qui ont partagé leurs
œuvres. Ils ont choisi de léguer gratuitement et librement leurs
"petits bijoux", contribuant ainsi à enrichir notre patrimoine
visuel. Personnellement, je suis profondément touché par leur geste
et leur générosité, et je leur porte un immense respect pour ce
don.
Je me souviens de ma
visite à Lamine Bensaou, un photographe d'Alger, en 2013. J’y suis
allé juste pour lui dire merci pour les magnifiques photos qu’il a
versées sur Commons, et cela reste un souvenir précieux pour moi.
C'est un exemple de la reconnaissance qu’on peut offrir à ceux qui
participent à la richesse visuelle de notre culture.
Enfin, il est important
de se rappeler que toutes les photos, pas seulement les 10
premières, servent à illustrer et mettre en valeur notre cher pays,
l’Algérie, à travers des articles sur Wikipédia, ses projets frères
ou d'autres plateformes. Il est si beau de voir son travail
utilisé, avec son nom en bas de l’image, comme une véritable
reconnaissance de l’effort et du talent du photographe. C'est un
honneur de savoir que son travail est apprécié et qu'il contribue à
la mise en valeur de notre patrimoine collectif.
Si Oui, c’est bien mon
plus long voyage. J’ai traversé trois continents pour revenir en
Afrique.
J’ai quitté l’Afrique du Nord pour atteindre le point le plus au
sud de ce continent. L’espérance et les découvertes étaient
immenses et fantastiques pour moi. En fait, j’ai décollé trois fois
et atterri trois fois.
Je suis passé par six aéroports et visité deux belles villes sur
deux continents différents. J’ai même vu l’hiver en plein été.
La Mother City est une ville calme et pacifique, malgré
ce qu’on en dit ou ce qu’on entend. La cohabitation y est palpable,
le mélange des cultures y est naturel, et l’acceptation de l’autre
est profondément ancrée. J’ai vu des mosquées construites vingt ans
avant que la France n’occupe le nord de l’Afrique. J’ai rencontré
des Abdelkader dans le pays des Zoulous.
Ma venue avait un objectif précis : partager la connaissance,
apporter la mienne et repartir avec celle des autres. À mon départ,
je suis rentré chez moi lourdement chargé de nouvelles
connaissances, ayant donné ce que je pouvais donner, sans être sûr
que ce partage était totalement équitable.
Le Cap de Bonne-Espérance m’a offert ce Hope, cet
espoir dont nous avons tous besoin. C’est déjà quelque chose de
précieux.
Mon seul conseil aux habitants du Cap, et à Abdulkader, le
chauffeur de taxi : « Vous avez un diamant entre les mains,
préservez-le. C’est votre richesse et votre fierté. »
Je me souviens d'un atelier Wikipédia organisé par l'Institut
d'informatique de l'Université d'Oxford. Une question fondamentale
y a été posée : pourquoi, avec près de demi-milliard de locuteurs
arabes, le contenu en arabe représente-t-il moins de 5 % sur
Wikipédia, et, parmi ce faible pourcentage, un tiers seulement est
réellement utile ? Cette question, bien que partiellement répondue,
soulève des enjeux majeurs, et malgré des suggestions de solutions,
il reste encore beaucoup à faire pour enrichir le contenu arabe sur
le web.
Les arabophones, à la différence de nombreux Américains ou
Européens, maîtrisent souvent plusieurs langues. Par exemple,
l'Algérien parle couramment le français, tandis que l'Égyptien
parle l'anglais. Cette capacité multilingue est un atout, mais elle
a aussi ses revers : lorsque la langue maternelle se trouve
reléguée au second ou troisième plan, une partie importante du
temps est consacrée à l'apprentissage d'autres langues au lieu de
se concentrer sur des connaissances scientifiques. Ce manque de
maîtrise peut freiner les progrès dans de nombreux domaines, car la
langue est le véhicule indispensable pour comprendre et intégrer sa
culture.
Mais en réalité, combien de personnes vivent en Algérie ?
Combien de contributeurs algériens sont actifs sur Wikipédia ? Et
quel est l'impact réel des Algériens sur l'enrichissement du
contenu encyclopédique ?
Répondre à ces questions reste une tâche complexe. Cependant,
j'ai eu l'occasion de consulter un rapport de 140 pages d'une étude
menée par Oxford, dont les analyses sont extrêmement pertinentes et
que je recommande vivement.
En résumé, pour combler le fossé du contenu arabe, il est
impératif de se concentrer sur des objectifs clairs, d’organiser
les efforts de manière structurée et de les diriger avec
persévérance, adaptabilité et répétition. Bien que le chemin soit
long, je demeure optimiste quant à l’avenir.
Pour plus de détails, vous pouvez consulter le rapport complet
ici : Oxford Study Report.
(Cette conversation a eu lieu sur une page de médias sociaux
et a été compilée ici avec quelques ajustements pour une meilleure
fluidité.)
À l’occasion du Festival International de Géographie ayant eu
lieu du 3 au 5 octobre à Saint-Dié-des-Vosges, Delphine Montagne,
en résidence wikimédienne au sein de l’URFIST de Lyon, a proposé
avec Mickaël Schauli, wikimédien à l’URFIST de Strasbourg,
plusieurs actions visant à allier géographie et projet Wikimédia.
Delphine Montagne revient pour nous sur cet événement.
[…]
En juillet 2026 se déroulera la Wikimania, l’événement annuel
qui rassemble les wikimédiens et wikimédiennes, à Paris. Pour nous
aider à l’organiser, nous lançons un premier appel et recherchons
30 bénévoles pour le comité de bourse, le comité de programme et le
comité de hackhaton. Un second appel aura lieu au mois de mars
2026. […]
Le Festival International de Géographie (FIG) fête cette année
ses 35 ans. Une belle occasion de revenir sur plusieurs années de
collaboration entre wikimédiens et géographes qui œuvrent
conjointement pour partager la connaissance autour des figures
marquantes de la géographie. Le FIG : un rendez-vous incontournable
de géographie investi par les wikimédiens Le temps d’un […]
Du 16 septembre au 15 décembre 2024, vous pouvez participer au
prix Wikimédia France de la Recherche, organisé par l’association
Wikimédia France en partenariat avec le laboratoire Dicen-IdF de
l’Université Paris Nanterre et avec le soutien financier de la
fondation Berger-Levrault. Qu’est-ce que le prix Wikimédia France
de la recherche ? Le prix Wikimédia France […]
Atelier Wikeys Venez rencontrer l’association Wikimédia France
au village associatif de l’Open Source expérience qui se tiendra le
mercredi 4 et jeudi 5 décembre au Palais des congrès de Paris de 9h
à 18h au stand A10. Wikimedia France y sera présente aux cotés
d’associations comme Mozilla France, Linux ou Libervia. Venez nous
rencontrer le […]
Samedi 16 novembre se tenait l’assemblée générale de
l’association Wikimédia France. Un nouveau bureau a été élu et 5
membres ont rejoint le conseil d’administration (dont deux
renouvellements et 3 nouvelles membres). Découvrez les nouveaux
visages et parcours du conseil d’administration de Wikimédia
France. Le nouveau bureau Après 3 ans en tant que présidente de
[…]
“Le livre des petits enfans”, de l’autrice lyonnaise Marceline
Desbordes-Valmore, est à présent sur Wikisource en libre-accès. Une
mise à disposition permise grâce à la collaboration entre
l’association Le Deuxième texte et Les sans pagEs, la bibliothèque
Diderot de Lyon, la Maison des Sciences de l’Homme de Dijon et la
wikimédienne en résidence à l’URFIST […]
Depuis 2017, les archives des
Hauts-de-Seine mettent en ligne le fonds de cartes postales
anciennes (CPA). En octobre 2020, cela représente 9558 CPA
provenant de la sous-série 9Fi réunissant les CPA de 1900 à 1944.
Ces photos tombées dans le domaine public accompagnées de quelques
métadonnées sont publiées sur le
site d'Open Data des Hauts-de-Seine. Cela peut surprendre mais
il y a quelques fonds de cartes postales et fonds photographiques
sur les sites d'open data. C'est en fait une très bonne idée car
ces sites sont adaptés à une réutilisation massive des données,
contrairement aux sites des archives qui ne sont pas faits pour
récupérer des centaines ou milliers de documents d'un seul
coup.
Dans ce billet de blog, je souhaite
vous montrer ma méthode qui est adaptée aux personnes, comme moi,
qui ne savent pas se servir de l'API, coder en Python, etc. Je
commence par récupérer les données en format CSV ou EXCEL afin de
les visualiser dans un tableur.
1. Télécharger les images
La première étape consiste à
récupérer les images. Pour cela j'utilise l'extension Simple
mass downloader qui existe en version
Firefox et
Chrome. Il suffit de copier les urls du csv dans l'extension
:
copier les liens
lancer le logiciel
onglet Download list
menu Hamburger Import URLs from
clipboard
Lancer la sauvegarde en cliquant sur start
selected
Dans le cas des archives des
Hauts-de-Seine, j'atteins assez vite le quota quotidien de requêtes
qui permet de télécharger environ 3000 fichiers. Tous les fichiers
téléchargés iront dans le dossier Téléchargements si vous
utilisez Windows.
Les fichiers n'ont pas d'extension,
j'utilise le logiciel Advanced Renamer pour
rajouter l'extension jpg (<Name>.jpg).
Enfin dans le tableur, il faut
indiquer l'emplacement des fichiers en remplaçant https://opendata.hauts-de-seine.fr/api/v2/catalog/datasets/cartes-postales/files/
par le répertoire où sont stockés vos fichiers.
2. Mettre en forme les
données
Un travail de mise en forme des
données est nécessaire.
2.1 Coordonnées
géographiques
Pour les coordonnées, je crée une
colonne avec la formule de LibreOffice
Calc : CONCATENER("{{Object
location|";B2;"}}"). Puis je fais un collage spécial du
texte dans une autre colonne (Pattypan ne semblant pas comprendre
les cellules avec des formules) et enfin je remplace la virgule par
un pipe ( | ).
2.2 Identifiants
Il peut également être
nécessaire dans certains cas de retravailler les identifiants qui
sont de la forme 9FI/ANT_1,9FI/ANT_15,9FI/ANT_153, ce qui ne peut pas se trier correctement.
Dans une autre colonne je copie le contenu, puis supprime tout sauf
les chiffres à l'aide d'une expression régulière dans
Rechercher/Remplacer : (.......)_ par rien. Puis dans
Notepad++,
j'ajoute les zéros manquants : \n(..)\r par \n0$1\r puis \n(.)\r par \n00$1\r
2.3 Noms des
fichiers
Wikimedia Commons ne
souhaite pas de titres incompréhensibles du type2e8e8c525c2ae4c9f983c64e725ef047.jpg
ou9FI/ANT_15.jpg.
Il faut donc créer un titre si possible simple mais explicite et
précis. Avec la commande CONCATENER je créé les nouveaux titres
ainsi :
Carte postale - VILLE -
TITRE - IDENTIFIANT.jpg.
L'ajout de
l'identifiant permet d'éviter d'avoir des titres identiques, ce qui
n'est pas possible sur Wikimedia Commons.
Attention le titre ne
doit pas contenir de crochets et ne doit pas être trop long. Dans
le cas contraire, le logiciel d'import des données arrêtera le
téléchargement. La commande NBCAR permet de compter le nombre de
caractères d'unecellule et ainsi
rapidement détecter les titres très longs. La documentation de
MediaWiki n'indique pas le nombre de caractères limite mais parle
d'une limite
de 255 bytes. Des tests sont nécessaires pour savoir à quoi
cela correspond en caractères, mais de toute façon il est
préférable d'utiliser des noms de fichier pas trop longs dans
MediaWiki.
3. Importer les données
Pour cette phase j'utilise Pattypan.
La première étape du logiciel consiste à Générer un tableau.
Importez les photos, sélectionnez le modèle MediaWiki que vous
souhaitez utiliser (dans mon cas il s'agit de Template:Photograph)
puis indiquez les champs à remplir par défaut :
Photographer : {{unknown|author}}
Title : {{fr|Carte postale des
Hauts-de-Seine}}
Institution : {{institution:Archives départementales
des Hauts-de-Seine}}
Et je coche les champs
Description, Date, Accession number et
Partnership pour que Pattypan remplisse ces champs à l'aide
des données dans le tableur. Vous obtenez un tableau de ce type
avec des colonnes pré-remplies et d'autres à remplir à l'aide des
données provenant des archives départementales :
Partnership va servir à
indiquer la géolocalisation. Pour cela, il faut aller dans le 2e
onglet Template du tableau créé par Pattypan afin de
déplacer ce modèle. Cet onglet peut sembler vide mais en
agrandissant la taille des cellules on voit le code des modèles de
Wikimedia Commons. Le fonctionnement de cet onglet n'étant pas
documenté, je ne sais pas exactement comment il fonctionne et
pourquoi le contenu est dupliqué dans de nombreuses cellules.
Faites donc le changement dans toutes les cellules.
'=={{int:filedesc}}==
{{Photograph
|photographer = ${photographer}
|title = ${title}
|description = ${description}
|depicted people =
|depicted place =
|date = ${date}
|medium =
|dimensions =
|institution = ${institution}
|department =
|references =
|object history =
|exhibition history =
|credit line =
|inscriptions =
|notes =
|accession number = ${accession_number}
|source = ${source}
|permission =
|other_versions =
}} ${partnership}
=={{int:license-header}}==
${license}
Une fois le travail de mise en
forme des données terminé, vous pouvez passer à la 2e étape de
Pattypan qui s'intitule Valider et envoyer.
À l'heure actuelle, le logiciel
s'arrête de téléverser les photos sans afficher le moindre message
d'erreur s'il rencontre un problème. Par contre, il se contente de
zapper l'import dans deux cas : s'il détecte que le
fichier a déjà été importé et si le nom est déjà
utilisé.
Les cartes postales géolocalisées
peuvent être visualisées dans
Wikimedia maps.
4. Dernières retouches
Quatre outils peuvent servir pour
affiner la catégorisation et les données :
Cat-a-lot
afin de déplacer, d'ajouter et de supprimer des fichiers (ou des
sous-catégories) entre catégories, depuis une catégorie, ou vers
une catégorie,
À
la fin de l'import, il y avait sur Wikimedia Commons un
millier de cartes postales en moins que sur le site des
Hauts-de-Seine. Des fichiers ont dû se perdre lors du
téléchargement des milliers de photos. Pour identifier rapidement
les fichiers manquants, j'ai utilisé un outil de comparaison
de listes en lui demandant de comparer les noms de
fichiers.
4.2 Remplacer et déplacer un
modèle
Visual File Change va notamment me
permettre de corriger une erreur faite lors des premiers imports en
utilisant le modèle de coordonnées géographiques adéquat et en le
déplaçant. L'expression régulière consister à rechercher :
Visual File Change peut également
servir à catégoriser les CPA à partir de termes inclus dans le nom
du fichier. Il est possible de faire des recherches du type :
intitle:"train"
incategory:"Collections of Archives départementales des
Hauts-de-Seine"