Numéro du 21 novembre 2024

Thursday, 21 November 2024 00:00 UTC

Éloge de la lenteur / L'édito de PAC2 — Depuis 2 ans que je contribue activement à RAW, la question de l'intelligence artificielle revient régulièrement dans l'actualité de Wikimédia. Ce numéro n'échappe pas à la règle et on retrouve encore dans ce numéro des inquiétudes face à la tentation de l'IA. À rebours des « accélérationnistes » qui veulent utiliser l'IA pour contribuer plus vite et mettre toujours plus de contenu, Jean-Frédéric sur le blog The Commonist fait un éloge bienvenu de la lenteur et de la contribution artisanale.

Vous trouverez aussi ce mois-ci une interview de Warp3 et un format atelier pour réfléchir à la représentation des personnalités des différents continents dans les articles Wikipédia.

Les brèves

Wikipédia face au problème du contenu généré par intelligence artificielle — Sur la Wikipédia anglophone, la communauté a créé un projet spécifique pour lutter contre le problème des contenus générés par intelligence artificielle mal sourcés et mal écrits[1]. 404 média revient en détail sur les enjeux. Un article anglophone sur la forteresse Amberlihisar, qui n'a jamais existé, constitue un bon exemple de mauvais recours à l'IA. L'IA a notamment généré des références parfaitement mises en forme mais totalement fictives. Le projet AI Cleanup recense aussi les images synthétiques. Certaines sont légitimes et sont utilisées à bon escient mais d'autres sont manifestement trompeuses[2].

Dans son édition du 19 octobre, The Signpost revient sur un récent article académique cherchant à quantifier la part de nouveaux articles générés avec de grands modèles de langage[3]. L'article intitulé « The Rise of AI-Generated Content in Wikipedia » utilise deux détecteurs automatiques de grands modèles de langage, GPTZero et Binoculars[4] pour estimer la proportion d'articles contenant des morceaux générés par des grands modèles de langage parmi les articles créés en août 2024[5].

« À l'aide de deux outils, GPTZero et Binoculars, nous détectons que jusqu'à 5 % des 2 909 articles anglais de Wikipédia créés en août 2024 contiennent un contenu significatif généré par l'IA. Les seuils de classification des deux outils ont été calibrés pour maintenir un taux de faux positifs ne dépassant pas 1 % sur une base Wikipédia pré-GPT-3.5, comme indiqué par la ligne rouge[5]. »

Sur la Wikipédia francophone, Fabius Lector a créé le projet Projet:Observatoire des IA et Simonk a initié un essai sur l'intelligence artificielle.

Logo de la conférence

WikiIndaba2024 — La conférence WikiIndaba, consacrée à la présence de l'Afrique sur Wikipédia, a eu lieu du 4 au 6 octobre à Johannesbourg.

Camille Herron, championne d'ultra-marathon et wikipédienne sous les pseudos Rundbowie et Temporun73.

La coureuse Camille Herron accusée de manipuler Wikipedia — La coureuse Camille Herron et son mari et entraîneur Conor Holt sont accusés d'avoir manipulé Wikipédia en diminuant le palmarès de concurrentes de Camille Herron.

« Depuis 2017, les deux comptes de Herron ont apporté plus de 300 contributions à des pages de Wikipédia, dont plus de la moitié sont entièrement des embellissements de la page de Herron, mais il y a des suppressions notables de contenu positif des pages de Dauwalter, du champion du marathon de Boston 2018 Des Linden et de la légende grecque de l'ultrarunning Yiannis Kouros[6]. »

Patrick Hetzel est ministre de l'enseignement supérieur et de la recherche dans le gouvernement de la République française depuis septembre 2024.

Le cabinet du ministre de l'enseignement supérieur et de la recherche français manipule Wikipédia ! — Une enquête du magazine L'Express révèle que le cabinet du nouveau ministre de l'enseignement supérieur et de la recherche français, Patrick Hetzel, a tenté de manipuler la biographie Wikipedia du ministre[7].

Florence Devouard, ancienne présidente de la fondation Wikimédia, est à l'initiative de la campagne SheSaid.

Florence Devouard interviewée sur l'initiative SheSaidDiff, le blog de la communauté interviewe Florence Devouard sur l'initiative de la campagne SheSaid.

« J'ai remarqué très tôt que les femmes étaient peu nombreuses dans nos projets, mais je ne me suis vraiment impliquée dans la lutte contre l'écart entre les sexes que lorsque Isla Haddow-Flood et moi-même avons lancé l'initiative Wiki Loves Women en 2016. Nous avons exploré différentes stratégies pour recruter plus de femmes, fournir un environnement plus inclusif, former et soutenir, mettre en œuvre différentes stratégies. Le sujet est complexe. En 2020, en pleine pandémie, j'ai lancé l'idée de #SheSaid... et nous voilà 4 ans plus tard ! »

Boîte à livres à Amboise, France.

11 000 boîtes à livres recensées — Le site boîtes-à-livres.fr recense les boîtes à livres en France en s'appuyant sur OpenStreetMap et Wikimédia Commons. On y trouve maintenant plus de 11 000 boîtes à livres.

Tous les chemins entre deux éléments Wikidata — Des chercheurs ont développé un nouvel outil capable de trouver tous les chemins possibles entre deux entités Wikidata[8].

Articles les plus centraux — L'université de Milan publie la liste des articles les plus centraux de Wikipédia (à priori uniquement la version anglophone).

C'est la saison des Nobel — Chaque année les différents prix Nobel sont remis début octobre. C'est l'occasion de remettre à jour et de développer de nouveaux notebooks consacrés aux Nobel.

Comme pour les jeux olympiques, on peut calculer la concentration des prix par pays de nationalité à partir d'une requête Wikidata.

Les États-Unis sont en tête du classement pour le prix Nobel de médecine, le prix Nobel de physique, le prix Nobel de la paix et le prix Nobel de Chimie. La France est en tête pour le prix Nobel de littérature. Les États-Unis obtiennent près de 40% des prix en médecine et plus de 32% des prix en physique et en chimie ! Parmi les cinq prix Nobel historique, c'est le prix Nobel de littérature qui est le plus diversifié en terme de pays de nationalité.

Jean-Frédéric propose l'approche SNAIL, acronyme de « Slow, NArrow, In-depth, Local », ce qu'on peut traduire par « Lent, précis, en profondeur et local ».

L'approche escargot ou l'éloge de la lenteur — Sur le blog The Commonists, Jean-Frédéric propose une approche escargot à la contribution #Wikidata 🐌[9]!

Plutôt que de faire de l'édition en masse, il propose de prendre le temps de faire de la contribution manuelle.

« Comme le dit le proverbe, nous allons vite et nous cassons des choses : Wikidata devient trop gros, trop vite. Le graphique du service d'interrogation de Wikidata a pris une telle ampleur qu'il sera scindé, et la croissance de la base de données principale est jugée insoutenable[10]. »

Plutôt que d'utiliser QuickStatement ou OpenRefine, Jean-Frédéric propose l'approche lente en s'inspirant du mouvement lent :

« Faisons ça avec les données lentes. Faisons des modifications qui prennent des minutes au lieu d'en faire des dizaines par seconde. (Et bien sûr, "Ce n'est pas la quantité, c'est la qualité" est un vieux trope de Wikipedia, parfois mal utilisé, mais pas faux en soi)[11]. »

« Cela ne signifie pas qu'il ne faut pas créer de nouveaux articles. Mais cela signifie qu'il faut les créer plus intentionnellement. La vieille plaisanterie, quelque peu hyperbolique, est que Wikipédia est pleine d'articles que " personne ne lira jamais " (et j'en ai fait ma part !) ; mais sur Wikidata, nous avons certainement des articles qui n'ont même pas été créés par quelqu'un, mais simplement par quelque chose[12]. »

Une nouvelle interface pour contribuer aux données lexicographiques de Wikidata — Lexico est une nouvelle interface qui permet de faciliter la contribution aux données lexicographiques (lexemes) sur Wikidata. Le principe rappelle les Wikidata Games de Magnus Manske[13].

65 000 citations sur Wikiquote — Wikiquote en français compte désormais 65 000 citations réparties sur près de 9 000 pages.

L'atelier

Dans cette section, un(e) wikimédien(ne) peut raconter un de ses bricolages à la première personne.

Ce mois-ci c'est PAC2 qui raconte comment il a bricolé un outil pour mesurer les biais de Wikipedia.

Il y a quelques années, j'avais développé le Gender Diversity Explorer, un petit outil en ligne qui récupère tous les liens bleus d'un article Wikipédia (ie les mentions), récupère la valeur de la propriété P21 (Sexe ou genre) dans l'élément Wikidata associé et calculé des statistiques de genre sur la répartition des entités nommées dans l'article[14].

L'approche se généralise facilement à n'importe quelle propriété dans Wikidata. C'est ce que propose le Wikilinks inspector[15].

Pour réfléchir à la représentation de certains continents comme l'Afrique ou l'Amérique du Sud, j'avais besoin d'adapter l'outil et de trouver un bon moyen de faire la correspondance entre des pays et des continents. C'est mon travail sur la répartition des médailles aux jeux olympiques qui m'a permis de trouver le bon moyen d'obtenir une correspondance à peu près pertinente entre pays et continents[16].

Techniquement, la magie vient toujours de la possibilité d'appeler l'api Wikimédia depuis une requête SPARQL :

SELECT ?item ?itemLabel ?country ?countryLabel 
WHERE {
  SERVICE wikibase:mwapi {
     bd:serviceParam wikibase:endpoint "fr.wikipedia.org";
                     wikibase:api "Generator";
                     mwapi:generator "links";
                     mwapi:titles "Intelligence artificielle";.
     ?item wikibase:apiOutputItem mwapi:item.
  } 
  FILTER BOUND (?item)
  ?item wdt:P31 wd:Q5 . 
  ?item wdt:P27 ?country . 
  ?country rdfs:label ?countryLabel filter (lang(?countryLabel) = "en") .
  ?item rdfs:label ?itemLabel filter (lang(?itemLabel) = "en") .
}

Cliquez pour essayer !

On combine ça ensuite avec la requête sur les continents et le tour est joué :

SELECT DISTINCT ?continent ?continentLabel ?country  ?code WHERE {
VALUES ?continent {
wd:Q55643
wd:Q48
wd:Q15
wd:Q18
wd:Q49
wd:Q46
} 
 ?continent (wdt:P527*) ?country.
  ?country 
    wdt:P2082 ?code.
  SERVICE wikibase:label { bd:serviceParam wikibase:language "en". }
}

Cliquez pour essayer !

Venons en maintenant aux résultats. Si on prend un article sur un thème très général et si Wikipedia représente l'ensemble des connaissances sur un sujet, on devrait s'attendre à avoir une représentation de personnalités de tous les continents dans les entités mentionnées dans un article.

Maintenant, quand on regarde l'article Intelligence artificielle, on trouve 69 personnalités nord-américaines, 58 personnalités européennes, 9 personnalités non classées pour seulement 6 personnalités asiatiques, 5 personnalités africaines, 3 personnalités oceaniennes et 2 personnalités sud-americaines[17].

L'article Philosophie mentionne 158 personnalités européennes mais aucune personnalité africaine[18].

L'article Amour mentionne une personnalité africaine pour 58 personnalités européennes[19].

L'article Travail ne mentionne aucune personnalité africaine, aucune personnalité asiatique ou aucune personnalité sud-américaine contre 23 personnalités européennes.

Même bilan avec l'article Musique : 36 personnalités européennes, 6 nord américaines et 1 océanienne mais aucune personnalité asiatique, africaine ou sud-américaine[20].

On pourrait penser que l'article consacré à l'humanité mentionnerait des personnalités de tous les continents. Ça n'est pas le cas. On ne compte aucun représentant de l'Océanie, de l'Afrique et de l'Asie dans l'article[21].

On peut multiplier les exemples et on voit que les continents nord-americains et européens sont largement représentés alors que les autres continents et notamment l'Afrique et l'Amérique du Sud sont représentés de manière marginale dans les articles généraux de l'encyclopédie.

Il y a sans doute de multiples raisons à ce déséquilibre. L'outil peut nous aider à prendre conscience du déséquilibre et chercher, article par article, des idées pour mieux représenter les personnes des continents sous représentés. En creux, on en vient à se demander si Wikipedia représente la « somme de toutes les connaissances » ou simplement le point de vue européen et nord-américain. Le point de vue du « reste du monde » est aujourd'hui manifestement peu représenté dans Wikipedia[22].

La grande interview

Dans cette section, nous donnons la parole à des wikimédien(ne)s sur des thèmes donnés afin de recueillir leurs avis ou les faire parler tout simplement de leurs expériences dans le mouvement.

Entretien avec Warp3

Ses activités wikimédiennes.
Par écrit sur cette page.
L'embellie.
Merci à Noé et Cantons-de-l'Est pour les suggestions de questions.
 ↑ 1. Bonjour Warp3. Merci d'avoir accepté cet entretien après que Cantons-de-l'Est vous ait suggéré comme invité. Pour commencer, je vous laisse vous présenter.

Comme beaucoup de Wikipédistes anciens et français, j'ai connu les débuts d'Internet en France en entreprise puis à domicile, période riche en projets informatiques de toutes les sortes. Intéressé par les articles de vulgarisation dans plusieurs domaines, j'eus vent d'un projet de réalisation d'une encyclopédie à accès gratuit sur le Net, qui s'appelait Wikipédia. Il y avait alors quelques autres encyclopédies comme Encarta de Windows, sur disquettes ou CD, mais assez chères, et les rares encyclopédies gratuites étaient très limités dans leur étendue et d'usage pas bien pratique. Le premier contact avec ce projet balbutiant fut une relative déception : peu d'articles et pas grand-chose dedans.

J'y revins quelques années après... et c'était déjà beaucoup mieux ! Peu à peu, je trouvais le plus souvent un article de Wikipédia après une recherche avec Google, et je m'étonnais que, même si l'article était peu développé, il répondait au minimum à la question « qu'est-ce que c'est ? ». Je faisais alors quelques apports ou corrections minimes, à l'occasion. Quelque trois ans après, fort d'avoir parcouru des pages d'aides et de règles (pas faciles à trouver) ainsi que plusieurs discussions, je fus fin prêt à prendre un compte... mais j'ai attendu encore deux ans avant de m'incrire fin juin 2008, sur un coup de tête. Première constatation après : hors l'accueil (automatique), l'impression d'être complètement seul à se dépatouiller dans l'édition (les pages de discussions des articles sont très souvent vides), jusqu'à me demander où se retrouvaient les Wikipédistes. C'est sur quelques pages plus spécifiques qu'ils se « cachaient », dont un certain Bistro.

Ma page de présentation contient un peu de mon état d'esprit au moment de l'inscription (elle est succinte et un peu ancienne maintenant, mais elle reste encore d'actualité). J'appris qu'il fallait s'inscrire aussi à un autre projet : WM Commons, afin d'ajouter des images (y compris les siennes) à un article. C'était cependant une façon de découvrir que Wikipédia s'appuie sur d'autres projets. Et puis, par curiosité, je visitai d'autres projets encore... (suspense)

 ↑ 2. Comment êtes-vous arrivé dans le mouvement Wikimédia ? Sur quel wiki en premier et comment avez-vous découvert les autres projets ?

Après Wikipédia, puis Commons, j'ai examiné plusieurs autres projets et enfin Wikimédia.

Au début, Wikimédia n'était pas un vrai mouvement mais une entreprise qui mettait en place Wikipédia, l'encyclopédie libre, dans de nombreuses langues puis soutenait d'autres projets voisins de l'encyclopédie. Wikimedia, utilisant des logiciels libres et parfois sous domaine public, s'est mis à promouvoir aussi le développement du libre. C'est plus récemment que la fondation Wikimédia, d'abord à travers la diffusion des projets et par leur utilisation avec tous, en fournissant les moyens de se connecter jusque dans les régions dépourvues d'accès au Net, est devenue un mouvement de développement local et privilégie l'intégration sociale.

j'ai cherché à comprendre l'organisation des projets par rapport à Wikimédia, comme l'existence des chapitres pour chaque projet dans un pays donné. J'ai fait ainsi au passage un peu de traduction de pages en anglais sur Wikimédia (à partir de 2015), participé plus ou moins à divers projets dont Wikiquote (fr), Wikisource, Wiktionnaire, Wikilivres. Je me suis aussi intéressé au thème de l'humour et enrichi le contenu de son portail à partir de 2015.

 ↑ 3. En vous présentant, Cantons-de-l'Est écrit : « Il trouve régulièrement des images qu'il « décore » de légendes savoureuses. » C'est dans cette activité que je vous ai aussi connu notamment sur le Bistro ou dans d'autres sections de discussions. Quand et comment avez-vous commencé à illustrer Le Bistro ?

Ce doit être le 15 décembre 2009, avec le drapeau de l'Acadie. Le calendrier du Bistro est né le 14 septembre 2005 et a vite évolué : la première illustration date du 7 novembre, la première image commentée est du 25 novembre de la même année. L'habitude est prise de décorer assez régulièrement le calendrier dès 2006. Les images avec leurs commentaires sont dans le ton du bistro, souvent légères et comiques, alternant avec des rappels de faits historiques. D'autres images se trouvent parfois ailleurs dans les discussions. Elles décrivent un aspect ou l'autre de Wikipédia en français, de ses débats.

On retrouve alors souvent DocteurCosmos en illustrateur du calendrier. Il se chargeait de l'illustrer avec un tour souvent amusant quand personne d'autre ne l'avait fait. C'est cette façon ludique qui m'a conduit à oser une première illustration dans ce petit espace en haut à droite de chaque page quotidienne du Bistro. J'ai augmenté progressivement mon implication dans ce cadre, comme une sorte de détente après un tas de modification dans les articles. Comme on pourra vérifier, les histoires de cabales et de chats au Bistro existaient depuis au moins 2006, bien avant mon arrivée Émoticône !

 ↑ 4. Vos choix d'illustration, vos légendes ainsi que parfois (souvent ?) vos commentaires de modifications sont tantôt profondes, tantôt légères, mais revêtent toujours une certaine beauté selon moi. Où trouvez-vous l'inspiration ?
— Warp3 ? Mmm... Attendez que je zoome sur l'image... Non, connais pas.

Voilà une question qui doit certainement tarabuster Cantons-de-l'Est depuis des années Émoticône. Il y a de nombreuses façons pour moi de trouver une idée de Bistro, idée souvent de type comique. Le cas le plus courant : c'est au cours de mes périgrinations quasi aléatoires sur Wikipédia et Commons que se fait la découverte de photos ou de dessins qui sont déjà comiques ou étonnantes en elle-même, ou quand leur rapport me semble raconter une historiette ; une sorte de hasard heureux peut-on dire. Sinon, quand j'ai une idée précise, quelques fois inspirée par l'actualité de wpfr, je cherche dans la catégorie idoine celles qui peuvent faire l'affaire. Et il m'arrive aussi d'élaborer des gags un peu plus complexes au saut du lit Émoticône. Dans un premier temps, j'ajoutais un lien vers une vidéo Youtube pour illustrer avec de la musique ou avec un sketch. Mais quelqu'un(e) m'a fait savoir que Commons héberge aussi des fichiers de musiques, qui sont libres de droits, contrairement aux vidéos Youtube. Depuis, je fouine dans les diverses catégories, et en place quelques-unes aux emplacements qui me semblent les plus appropriés. Cette bibliothèque de musiques (et de vidéos), pas assez connue à mon avis ni assez utilisée, semble s'être fortement enrichie ces dernières années.

Chaque fois que je place une illustration assortie d'un commentaire, je ne sais pas vraiment comment cela va être reçu, car il n'y a presque jamais de commentaires sur place ou sur ma page. En général, sur WP, quand personne ne fait de commentaire sur votre modification sur un article, ça signifie qu'elle est plus ou moins acceptée et je me figure que c'est pareil avec une image. Mais c'est comme être sur un bout de scène avec un public derrière une cloison, invisible et muet, qui peut une fois dans la rue faire un petit signe discret de connivence ou au contraire flanquer une claque, sans que je sache trop pour quoi.

 ↑ 5. Utilisez-vous des outils en particulier pour retrouver des images, les archiver, s'en souvenir ? Comment effectuez-vous vos recherches ?

Sur les projets : très peu, en fait. J'ai même décoché tout un tas de gadgets mis par défaut dans mes préférences. J'utilise parfois un éditeur de texte autre que celui de base. Pour les recherches, il arrive que c'est par les images que je retrouve certaines pages ou informations. Mais dans mes recherches d'un fichier sur Commons, je n'utilise guère le gadget fourni, qui retourne n'importe quoi tant qu'il existe dans le nom du fichier une seule erreur, ou que le nom n'est pas assez complet. Utiliser un moteur de recherche extérieur donne plus de chance de trouver le fichier cherché. Et, non, je ne fais pas de recherche SPARQL à travers WikiData, malgré les nombreux exemples donnés par les RAW (!). Question visuels, j'utilise les pauvres logiciels de base de Windows : mspaint, photo, wordpad, bloc-notes. Oui, frugalité extrême... il y a de quoi rire !

 ↑ 6. Assidu du Bistro, qu'aimez-vous y trouver et quelle est la raison d'être que vous donnez à cet espace communautaire ?

Quand j'ai découvert le Bistro à l'époque de mon inscription, je pensais y trouver une sorte d'assemblée très sérieuse réglant avec précision l'avenir de l'Encyclopédie, alors que c'était plutôt une sorte d'auberge espagnole bruyante et un tantinet folle. Le Bistro actuel est en majorité le rendez-vous de toutes les personnes un peu anciennes désireuses de débattre, et parfois d'informer la Wikipédie. C'est le lieu pour poser ses questions avec de grandes chances d'avoir au moins une réponse, que l'on soit novice ou non. Certains débats sont cependant si extravagants que je finis par les trouver rigolos ! Je préfère cependant le discours plus léger tenu par d'autres personnes, comme il arrivait souvent dans les premières années de l'existence du Bistro.

 ↑ 7. Comment trouvez-vous la convivialité et l'ambiance en général au sein de la communauté ?

La communauté de Wikipédia en français est diverse, très partagée sur plusieurs thèmes (inclusionnisme/suppressionnisme, paternalisme/féminisme, fair-use, Comité d'arbitrage (CAr), etc.) depuis au moins 2006 sur les espaces de discussions. Ce n'est que par l'observance des règles établies et de la volonté de participer sereinement à la création et à la maintenance des articles que l'on peut dire qu'il existe une sorte de lien solidaire entre les membres. L'ambiance peut être bonne ou mauvaise selon l'importance que l'on porte à ces thèmes. Il est ainsi possible d'avoir de bons rapports en travaillant sans apriori avec des personnes dans un espace d'articles peu polémiques (potentiellement plusieurs millions Émoticône) .

 ↑ 8. Quel type de wikipédien êtes-vous ? Comment décririez-vous votre manière de contribuer sur l'encyclopédie ?

Si j'ai pris un compte sur Wikipédia, c'est aussi parce que je me sentais redevable de tant d'informations offertes sans contreparties de ma part. J'ai commencé par des corrections orthographiques et quelques reformulations, mais ne me destinais pas à faire beaucoup plus. C'est en voyant l'état de quasi ébauche de l'article Bugs Bunny que je me suis décidé à le développer, par traduction de l'article anglophone. Aussi, le goût me prit de continuer des articles initiés par d'autres, d'abord dans le domaine du dessin animé alors presque déserté hormis le champ disneyien, puis dans d'autres domaines.

Wikipédiste papillonnant, assez solitaire, je passe d'un sujet à l'autre selon mes goûts du moment. L'Amérique de la période située entre 1850 et 1950, le cinéma (Warner Bros. surtout) et la musique sont autant de sujets qui m'intéressent le plus. Malgré une bonne centaine d'articles créés et pas mal de traductions de l'anglais (je vous conseille DeepL comme base) depuis plus de 15 ans, je me considère encore comme un petit rédacteur-relecteur (et suis étonné de faire partie des mille premiers modificateurs actifs de WP). Je n'ai d'ailleurs développé aucun article jusqu'à un niveau de labellisation.

 ↑ 9. Créateur de plus de 110 articles, quand considérez-vous que le sujet d'un article est épuisé avant de passer à un autre ? Quels sentiments cela vous inspire de savoir qu'il reste tant à faire sur le wiki ?

Un article très pointu (dit « d'intéret faible » dans les évaluations), comme un certain type d'invertébré marin très peu connu, s'il est traité pleinement à travers toute la documentation existante, devient un article abouti. S'il n'a pas sa belle étoile doré d'article de qualité, c'est tant pis, mais cela n'enlève rien à son degré d'achèvement. Inversement, sur un article portant sur un sujet connu où la documentation abonde, ou alors un article généraliste, il faut non seulement traiter tous les angles de vue mais aussi rester synthétique (et faire des articles secondaires), et le travail de retrait devient aussi important que celui d'ajout.

Pour ma part, les articles en anglais que je traduis, qui me plaisent, ne sont que rarement des articles complets avec labels de qualité. Je vérifie les sources et complète certains détails, mais je les sais très perfectibles. Le minimum, au-delà des sources, est que la lectrice ou le lecteur puisse se faire au moins une bonne idée du sujet, typiquement un résumé introductif (RI).

Une majorité d'articles de Wikipédia sont (encore) des ébauches ou des articles à peine développés. Tant que des sources sûres justifient l'existence d'un article et qu'il dispose d'une sorte de RI, je considère celui-ci comme valable (en tant que lecteur). Contrairement à d'autres Wikipédistes, cette masse de mini articles ne me semble pas dommageable à l'image de l'encyclopédie, au contraire ! Mieux vaut un article minimum (mais bon) que rien du tout. C'est la multiplicité des articles qui fait l'une des forces de l'Encyclopédie. Les articles faux (canulars) sont, en revanche, une plaie et à éradiquer au plus vite (merci les admins et les vigilant(e)s).

 ↑ 10. En considérant votre expérience sur le wiki, qu'est-ce qui vous a procuré le plus grand plaisir sur Wikipédia ? Au contraire, qu'est-ce qui vous a le plus marqué négativement ?

Il n'y a pas beaucoup d'expériences à vivre sur Wikipédia si on reste à faire des modifications légères sur des articles sans controverses, voire peu lus. Mais dès que l'on prend un compte et que l'on s'attaque à certains gros articles, on rencontre fatalement une partie de la « communauté» hétéroclite wikipédienne.

Il y a eu plusieurs heureuses rencontres, mais je crois que l'une des plus heureuses fut celle de la création des RAW, journal à la fois très instructif et bien présenté par son créateur (mais non, je ne fais pas de la publicité éhontée !). Après réflexion, je dirais que la pire rencontre arriva deux mois après mon inscription, à propos d'une discussion sur ma page de discussion avec un Wikipédien dynamique, aujourd'hui admin actif. Juste après un de mes propos pourtant assez mesuré, déboula sur ma page un parfait inconnu qui se mit à me faire une leçon wikipédienne magistrale dans le plus pur style des « anciens » s'adressant à un complet ignorant. J'avais beau m'être mentalement préparé à des avis extrêmes ou divagants, ce genre d'attaque très limite fut fort désagréable, surtout quand elle fut appuyée par d'autres.

 ↑ 11. Quels seront selon vous les plus grands défis de Wikipédia en français dans les cinq prochaines années ?

Je ne suis pas dans le secret des dieux, mais je crois percevoir :

- L'arrivée de l'intelligence articielle (IA, donc) sur WP est un peu ce que depuis longtemps des Wiképidistes appelaient de leurs vœux pour traiter les millions d'articles de façon automatique. Est-ce la bonne formule ? On peut en douter, dans l'état actuel. Le bon usage de cette IA sur WP reste à définir, et à faire évoluer en même temps qu'elle. Peut-elle éclipser WP même ? La boule de cristal est floue, rappelez plus tard Sourire diabolique.

- Les nouvelles structures qui se mettent lentement en place sous l'égide de Wikimédia, et qui semblent être complètement ignorées du gros de la communauté wikipédienne francophone, mis à part l'application du Code de conduite universel dans les règles de wpfr.

- Maintenir une certaines cohésion entre les membres des Wikipédistes, faire évoluer certaines mentalités ; attirer de nouveaux membres actifs ; se prémunir contre les nouvelles formes d'atteintes aux articles : publicitaires, politiques ou autres ; trouver (et financer) un moyen pérenne de conserver les traces des sources sur Internet.

 ↑ 12. Que pensez-vous des médias qui sont stockés sur Wikimedia Commons et du wiki en général ?

(Wikimedia) Commons est un site énorme, qui recueille des documents (hors textes), pas seulement des photos mais aussi des vidéos et des fichiers sonores. Des musées et institutions prestigieux sont sollicités, ce qui fait que des images exceptionnelles, historiques, y sont copiés et cotoient le reste, inimaginable tant il y en a.

Je me suis incrit presque en même temps sur Commons, site qui héberge donc la plupart des fichiers libres de droits utilisés par Wikipédia, dans le but d'illustrer certains articles. Tout d'abord, j'ai posté quelques-unes de mes photos et me suis conformé aux règles (pas exactement fixées) des droits d'auteur. Mais au fur et à mesure des années, les administrateurs et autres personnes à statut m'ont semblé avoir un comportement de plus en plus incohérent face au soupçon de copyright : aveugles à des imports clairement douteux et sans source mais impitoyables, voire désinvoltes, avec d'autres pourtant accompagnés d'une preuve d'ancienneté suffisante ou/et d'autres garanties. Cela m'a ôté l'envie de discuter et d'y importer quoi que ce soit. Je me contente maintenant principalement de traduire le descriptif des fichiers ou de les catégoriser.

 ↑ 13. Si j'en crois ce diff, le concours de l'image de l'année POTY vous intéresse. Quels ont été vos coups de cœur ou les images qui vous ont profondément marquées depuis que vous suivez ce concours ?

Les concours d'images (principalement photographiques) Picture of the Year (POTY) organisés sur Commons chaque année depuis 2006 sont un plaisir des yeux. Depuis que je connais l'existence du concours, j'y participe régulièrement et leur fait une certaine publicité au Bistro. J'ai aidé à traduire des pages et à vérifier la validité de votes, quand tout était encore fait à la main et qu'il fallait tout refaire et repenser chaque année. Ces dernières années, une poignée de codeurs ont pris le taureau par les cornes et ont automatisé la création au maximum. Cela évite en bonne partie la triche et le recompte manuel mais il n'y a plus le charme des commentaires qui étaient aussi utiles aux photographes participants, et la tenue d'une nouvelle édition ne semble plus être décidée que par eux. Trop de photos m'ont ébloui par leur qualité ou leur sujet pour me décider de seulement quelques-unes ! J'ai découvert cependant que deux noms de photographes reviennent souvent dans les auteurs des photos que je trouve parmi les meilleures : Luc Viatour et Basile Morin (ce dernier étant aussi remarquable pour ses nombreux et excellents ambigrammes). La photo gagnante du concours 2023 est superbe en plus d'être étonnante, même si je ne l'ai pas choisie au dernier tour. Mais elle a eu droit auparavant à plein de prix et je l'avais utilisée dans le Bistro du 15 juillet 2023. Une photo remarquable plus ancienne mais découverte par moi il y a peu de temps m'a complètement désorienté au premier coup d'œil (voir mon commentaire ici).

 ↑ 14. Quel(le) wikimédien(ne) souhaiteriez-vous voir interviewé(e) dans un prochain numéro et sur quel thème ?

Il y a beaucoup de candidats possibles (et disponibles !) mais je serais curieux de Kropotkine 113, Wikipédiste chevronné toujours présent mais finalement assez discret sur les espaces de discussions grand public.

 ↑ 15. Y a-t-il un sujet particulier qui vous tient à cœur et qu’on n’a pas abordé dans cet entretien ? Vous avez carte blanche 🙂.

Je tiens à (re)dire à Cantons-de-l'Est mon plein soutien à la création d'un dictionnaire visuel (multilingue) !

 ↑ 16. Avez-vous un message particulier à adresser aux lectrices et lecteurs du RAW ? Quel serait votre mot de la fin ?

Pas particulèrement au lectorat des RAW mais plutôt aux Wikipédistes en général : si vous avez une idée, ou si une remarque vous tient à cœur, exprimez-la gentiment : on ne vous embastillera pas pour cela ! Si participer à Wikipédia devient une obsession ou un énorme boulet, prenez des vacances. Mais si rien de Wikipédia ne vous plait, alors peut-être que Wikipédia... n'est pas (ou plus) pour vous.

Merci d'avoir accepté cette interview. Bonne continuation !

L'agenda

Les autres infolettres

La page Wikipédia:RAW/Découvrir recense les infolettres et blogs relatifs à Wikimedia.

En plus de RAW, vous pouvez lire le Wikimag, newsletter hebdomadaire de la Wikipedia francophone (Voir le dernier numéro Wikipédia:Wikimag/2024/44), l'infolettre Wikifier la science (voir le dernier numéro Projet:Wikifier la science/Infolettre/Octobre 2024) et les Actualités du Wiktionnaire newsletter mensuelle du Wiktionnaire (wikt:Wiktionnaire:Actualités/114-septembre-2024).

Les anglophones peuvent aussi lire The Signpost, publié toutes les deux semaines, la newsletter hebdo de la communauté Wikidata (voir ici d:Wikidata:Status updates/2024 10 28) ou encore la newsletter du projet Wikifunction ("wikifunction:Wikifunctions:Status updates/2024-10-25).

Courrier du lectorat

(Il nous fera plaisir de lire les messages déposés ici et, si nécessaire, d'y répondre dans les plus brefs délais.)

Wikipédia face au problème du contenu généré par intelligence artificielle — L’intérêt des intelligences artificielles génératives comme ChatGPT réside, selon moi, dans leur capacité de rédaction. À partir du moment où on leur fournit une première version d’un texte sourcé, elles sont capables de le synthétiser ou de le compléter afin qu’il soit rédigé dans un style clair et encyclopédique. De ce point de vue, ce sont d’excellents assistants.
En revanche, comme dit Le chat perché, elles ne peuvent pas faire le travail à notre place, et ce pour une raison très simple : elles ne sont pas conçues pour. Ce sont des IA « probabilistes ». Elle donne le résultat « le plus probable », pas forcément le plus fiable. C’est ce qui explique qu’elles peuvent inventer un concept scientifique… qui n’existe pas, ou encore inventer des sources. Attention donc à ne pas les prendre pour ce qu’elles ne sont pas Émoticône. Merci aux rédacteurs et rédactrices du RAW, comme toujours très instructif.--Pronoia (discuter) 1 novembre 2024 à 10:10 (CET)

De mon côté, ce qui m'inquiète le plus est l'illusion de qualité avec des utilisateurs ne voyant même pas les problèmes. Pour l'exemple, question que j'ai posé hier sur quoi faire avec ce cas où il se pourrait que l'utilisateur soit de bonne foi. J'ai prévu de traduire cet essai anglais pour avoir une base pédagogique vers laquelle orienter mais si ce genre de chose se développe, faudra peut-être penser à un avertissement quelque part pour que toute personne venant contribuer sache qu'il y a des choses à ne pas faire.
Pour l'heure, le principe de signalement n'est pas encore en place côté francophone mais côté anglophone, ils ont eu 69 articles indiqués en octobre et si on en croit l'étude indiquée plus haut, il y a des chances qu'on en rate. Fabius Lector (discuter) 1 novembre 2024 à 11:50 (CET)
Je partage l'inquiétude sur l'illusion de qualité. Mais ça va au delà de l'IA.
Sinon je suis honnoré d'être cité Émoticône. Le chat perché (discuter) 1 novembre 2024 à 13:35 (CET)

Biais de surreprésentation des idées et auteurs occidentaux — Merci PAC2 pour ton outil de mesure des biais géographiques dans les articles ! Je trouve cela très parlant et assez préoccupant de voir que Wikipédia reflète avant tout les connaissances occidentales. Il y a probablement une explication historique à ça (naissance de la science moderne en Europe, développement de la plupart des disciplines universitaires en Occident + colonisation, effacement des savoirs autochtones et difficultés d'accès aux études supérieures dans beaucoup d'endroits). On a du boulot pour lutter contre ce biais ! Skimel (discuter) 2 novembre 2024 à 09:58 (CET)

Grande interview de Warp3 — Merci Warp3 pour cette interview, qui m'a diverti de mes soucis IRL. Comme d'habitude, j'ai lu des observations et des commentaires qui m'ont fait Émoticône ! — Cantons-de-l'Est p|d|d 🧹 4 novembre 2024 à 23:51 (CET)

Boîtes à livres — Merci pour la mention, je n'avais pas encore lu ce RAW, quelle bonne surprise de voir le site mentionné ! Symac (discuter) 7 novembre 2024 à 13:12 (CET) (développeur dudit site :p)

L'IA a une forte valeur ajoutée pour "aider à faire" mais jamais pour "faire à la place".
 – Le chat perché sur le Bistro.
Rédigé/traduit par L'embellie et PAC2.
Citations originales
Notes
Références
  1. Découvert via https://wikis.world/@festal@tldr.nettime.org/113243136048240433
  2. https://www.404media.co/the-editors-protecting-wikipedia-from-ai-hoaxes/
  3. en:Wikipedia:Wikipedia Signpost/2024-10-19/Recent research
  4. Pour les plus curieuses et les plus curieux, la méthode Binoculars est une méthode de détection des textes générés par des grands modèles de langage qui s'appuie sur la « perplexité croisée  » de deux grands modèles de langage. Pour en savoir plus : https://arxiv.org/html/2401.12070v3
  5. a et b (en) Creston Brooks, Samuel Eggert et Denis Peskoff, « The Rise of AI-Generated Content in Wikipedia », {{Article}} : paramètre « périodique » manquant,‎ (lire en ligne).
  6. « Since 2017, Herron’s two accounts have made more than 300 contributions to pages on Wikipedia, of which more than half are entirely embellishments to Herron’s page, but there are notable deletions of positive content from the pages of Dauwalter, 2018 Boston Marathon champion Des Linden and Greek ultrarunning legend Yiannis Kouros. »- Merci DeepL pour la traduction. C'est pas parfait mais c'est pratique :).
  7. Victor Garcia, « Patrick Hetzel, un ministre bien peu scientifique : enquête sur le discret nettoyage de sa page Wikipédia », L’Express, (consulté le )
  8. https://x.com/WikiResearch/status/1843699094579229068
  9. Découvert via d:Wikidata:Status_updates/2024_10_14
  10. « As the saying goes, we move fast and break things: Wikidata is getting too big, too fast. The Wikidata Query Service graph got so huge it will be split, and the growth of the core database is deemed unsustainable. »
  11. « Let’s have it for slow data. Let’s make edits that take minutes rather than racking tens per second. (And sure, “It’s not the quantity, it’s the quality” is an old Wikipedia trope, at times ill-used, but not wrong per se.) »
  12. Traduit avec DeepL.com (version gratuite) « This does not mean not creating new items. But it does mean creating them more intentionally. The old, somewhat hyperbolic jest is that Wikipedia is full of articles that « no-one will ever read » (and I have done my fair share of that!) ; but on Wikidata, we sure have items that were not even created by someone, merely by something. »
  13. https://wikidata-game.toolforge.org/#
  14. https://observablehq.com/@pac02/explore-gender-diversity-in-a-single-wikipedia-article
  15. https://observablehq.com/@pac02/articles-wikilinks-inspector
  16. https://observablehq.com/@pac02/olympic-medals-by-continent
  17. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Intelligence%20artificielle
  18. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Philosophie
  19. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Amour
  20. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Musique
  21. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Humanit%C3%A9
  22. J'emprunte l'expression reste du monde au média Rest of world : https://restofworld.org/about/
  23. https://www.wikimedia.fr/participer-au-prix-wikimedia-de-la-recherche/

Numéro du 20 novembre 2024

Wednesday, 20 November 2024 00:00 UTC

Éloge de la lenteur / L'édito de PAC2 — Depuis 2 ans que je contribue activement à RAW, la question de l'intelligence artificielle revient régulièrement dans l'actualité de Wikimédia. Ce numéro n'échappe pas à la règle et on retrouve encore dans ce numéro des inquiétudes face à la tentation de l'IA. À rebours des « accélérationnistes » qui veulent utiliser l'IA pour contribuer plus vite et mettre toujours plus de contenu, Jean-Frédéric sur le blog The Commonist fait un éloge bienvenu de la lenteur et de la contribution artisanale.

Vous trouverez aussi ce mois-ci une interview de Warp3 et un format atelier pour réfléchir à la représentation des personnalités des différents continents dans les articles Wikipédia.

Les brèves

Wikipédia face au problème du contenu généré par intelligence artificielle — Sur la Wikipédia anglophone, la communauté a créé un projet spécifique pour lutter contre le problème des contenus générés par intelligence artificielle mal sourcés et mal écrits[1]. 404 média revient en détail sur les enjeux. Un article anglophone sur la forteresse Amberlihisar, qui n'a jamais existé, constitue un bon exemple de mauvais recours à l'IA. L'IA a notamment généré des références parfaitement mises en forme mais totalement fictives. Le projet AI Cleanup recense aussi les images synthétiques. Certaines sont légitimes et sont utilisées à bon escient mais d'autres sont manifestement trompeuses[2].

Dans son édition du 19 octobre, The Signpost revient sur un récent article académique cherchant à quantifier la part de nouveaux articles générés avec de grands modèles de langage[3]. L'article intitulé « The Rise of AI-Generated Content in Wikipedia » utilise deux détecteurs automatiques de grands modèles de langage, GPTZero et Binoculars[4] pour estimer la proportion d'articles contenant des morceaux générés par des grands modèles de langage parmi les articles créés en août 2024[5].

« À l'aide de deux outils, GPTZero et Binoculars, nous détectons que jusqu'à 5 % des 2 909 articles anglais de Wikipédia créés en août 2024 contiennent un contenu significatif généré par l'IA. Les seuils de classification des deux outils ont été calibrés pour maintenir un taux de faux positifs ne dépassant pas 1 % sur une base Wikipédia pré-GPT-3.5, comme indiqué par la ligne rouge[5]. »

Sur la Wikipédia francophone, Fabius Lector a créé le projet Projet:Observatoire des IA et Simonk a initié un essai sur l'intelligence artificielle.

Logo de la conférence

WikiIndaba2024 — La conférence WikiIndaba, consacrée à la présence de l'Afrique sur Wikipédia, a eu lieu du 4 au 6 octobre à Johannesbourg.

Camille Herron, championne d'ultra-marathon et wikipédienne sous les pseudos Rundbowie et Temporun73.

La coureuse Camille Herron accusée de manipuler Wikipedia — La coureuse Camille Herron et son mari et entraîneur Conor Holt sont accusés d'avoir manipulé Wikipédia en diminuant le palmarès de concurrentes de Camille Herron.

« Depuis 2017, les deux comptes de Herron ont apporté plus de 300 contributions à des pages de Wikipédia, dont plus de la moitié sont entièrement des embellissements de la page de Herron, mais il y a des suppressions notables de contenu positif des pages de Dauwalter, du champion du marathon de Boston 2018 Des Linden et de la légende grecque de l'ultrarunning Yiannis Kouros[6]. »

Patrick Hetzel est ministre de l'enseignement supérieur et de la recherche dans le gouvernement de la République française depuis septembre 2024.

Le cabinet du ministre de l'enseignement supérieur et de la recherche français manipule Wikipédia ! — Une enquête du magazine L'Express révèle que le cabinet du nouveau ministre de l'enseignement supérieur et de la recherche français, Patrick Hetzel, a tenté de manipuler la biographie Wikipedia du ministre[7].

Florence Devouard, ancienne présidente de la fondation Wikimédia, est à l'initiative de la campagne SheSaid.

Florence Devouard interviewée sur l'initiative SheSaidDiff, le blog de la communauté interviewe Florence Devouard sur l'initiative de la campagne SheSaid.

« J'ai remarqué très tôt que les femmes étaient peu nombreuses dans nos projets, mais je ne me suis vraiment impliquée dans la lutte contre l'écart entre les sexes que lorsque Isla Haddow-Flood et moi-même avons lancé l'initiative Wiki Loves Women en 2016. Nous avons exploré différentes stratégies pour recruter plus de femmes, fournir un environnement plus inclusif, former et soutenir, mettre en œuvre différentes stratégies. Le sujet est complexe. En 2020, en pleine pandémie, j'ai lancé l'idée de #SheSaid... et nous voilà 4 ans plus tard ! »

Boîte à livres à Amboise, France.

11 000 boîtes à livres recensées — Le site boîtes-à-livres.fr recense les boîtes à livres en France en s'appuyant sur OpenStreetMap et Wikimédia Commons. On y trouve maintenant plus de 11 000 boîtes à livres.

Tous les chemins entre deux éléments Wikidata — Des chercheurs ont développé un nouvel outil capable de trouver tous les chemins possibles entre deux entités Wikidata[8].

Articles les plus centraux — L'université de Milan publie la liste des articles les plus centraux de Wikipédia (à priori uniquement la version anglophone).

C'est la saison des Nobel — Chaque année les différents prix Nobel sont remis début octobre. C'est l'occasion de remettre à jour et de développer de nouveaux notebooks consacrés aux Nobel.

Comme pour les jeux olympiques, on peut calculer la concentration des prix par pays de nationalité à partir d'une requête Wikidata.

Les États-Unis sont en tête du classement pour le prix Nobel de médecine, le prix Nobel de physique, le prix Nobel de la paix et le prix Nobel de Chimie. La France est en tête pour le prix Nobel de littérature. Les États-Unis obtiennent près de 40% des prix en médecine et plus de 32% des prix en physique et en chimie ! Parmi les cinq prix Nobel historique, c'est le prix Nobel de littérature qui est le plus diversifié en terme de pays de nationalité.

Jean-Frédéric propose l'approche SNAIL, acronyme de « Slow, NArrow, In-depth, Local », ce qu'on peut traduire par « Lent, précis, en profondeur et local ».

L'approche escargot ou l'éloge de la lenteur — Sur le blog The Commonists, Jean-Frédéric propose une approche escargot à la contribution #Wikidata 🐌[9]!

Plutôt que de faire de l'édition en masse, il propose de prendre le temps de faire de la contribution manuelle.

« Comme le dit le proverbe, nous allons vite et nous cassons des choses : Wikidata devient trop gros, trop vite. Le graphique du service d'interrogation de Wikidata a pris une telle ampleur qu'il sera scindé, et la croissance de la base de données principale est jugée insoutenable[10]. »

Plutôt que d'utiliser QuickStatement ou OpenRefine, Jean-Frédéric propose l'approche lente en s'inspirant du mouvement lent :

« Faisons ça avec les données lentes. Faisons des modifications qui prennent des minutes au lieu d'en faire des dizaines par seconde. (Et bien sûr, "Ce n'est pas la quantité, c'est la qualité" est un vieux trope de Wikipedia, parfois mal utilisé, mais pas faux en soi)[11]. »

« Cela ne signifie pas qu'il ne faut pas créer de nouveaux articles. Mais cela signifie qu'il faut les créer plus intentionnellement. La vieille plaisanterie, quelque peu hyperbolique, est que Wikipédia est pleine d'articles que " personne ne lira jamais " (et j'en ai fait ma part !) ; mais sur Wikidata, nous avons certainement des articles qui n'ont même pas été créés par quelqu'un, mais simplement par quelque chose[12]. »

Une nouvelle interface pour contribuer aux données lexicographiques de Wikidata — Lexico est une nouvelle interface qui permet de faciliter la contribution aux données lexicographiques (lexemes) sur Wikidata. Le principe rappelle les Wikidata Games de Magnus Manske[13].

65 000 citations sur Wikiquote — Wikiquote en français compte désormais 65 000 citations réparties sur près de 9 000 pages.

L'atelier

Dans cette section, un(e) wikimédien(ne) peut raconter un de ses bricolages à la première personne.

Ce mois-ci c'est PAC2 qui raconte comment il a bricolé un outil pour mesurer les biais de Wikipedia.

Il y a quelques années, j'avais développé le Gender Diversity Explorer, un petit outil en ligne qui récupère tous les liens bleus d'un article Wikipédia (ie les mentions), récupère la valeur de la propriété P21 (Sexe ou genre) dans l'élément Wikidata associé et calculé des statistiques de genre sur la répartition des entités nommées dans l'article[14].

L'approche se généralise facilement à n'importe quelle propriété dans Wikidata. C'est ce que propose le Wikilinks inspector[15].

Pour réfléchir à la représentation de certains continents comme l'Afrique ou l'Amérique du Sud, j'avais besoin d'adapter l'outil et de trouver un bon moyen de faire la correspondance entre des pays et des continents. C'est mon travail sur la répartition des médailles aux jeux olympiques qui m'a permis de trouver le bon moyen d'obtenir une correspondance à peu près pertinente entre pays et continents[16].

Techniquement, la magie vient toujours de la possibilité d'appeler l'api Wikimédia depuis une requête SPARQL :

SELECT ?item ?itemLabel ?country ?countryLabel 
WHERE {
  SERVICE wikibase:mwapi {
     bd:serviceParam wikibase:endpoint "fr.wikipedia.org";
                     wikibase:api "Generator";
                     mwapi:generator "links";
                     mwapi:titles "Intelligence artificielle";.
     ?item wikibase:apiOutputItem mwapi:item.
  } 
  FILTER BOUND (?item)
  ?item wdt:P31 wd:Q5 . 
  ?item wdt:P27 ?country . 
  ?country rdfs:label ?countryLabel filter (lang(?countryLabel) = "en") .
  ?item rdfs:label ?itemLabel filter (lang(?itemLabel) = "en") .
}

Cliquez pour essayer !

On combine ça ensuite avec la requête sur les continents et le tour est joué :

SELECT DISTINCT ?continent ?continentLabel ?country  ?code WHERE {
VALUES ?continent {
wd:Q55643
wd:Q48
wd:Q15
wd:Q18
wd:Q49
wd:Q46
} 
 ?continent (wdt:P527*) ?country.
  ?country 
    wdt:P2082 ?code.
  SERVICE wikibase:label { bd:serviceParam wikibase:language "en". }
}

Cliquez pour essayer !

Venons en maintenant aux résultats. Si on prend un article sur un thème très général et si Wikipedia représente l'ensemble des connaissances sur un sujet, on devrait s'attendre à avoir une représentation de personnalités de tous les continents dans les entités mentionnées dans un article.

Maintenant, quand on regarde l'article Intelligence artificielle, on trouve 69 personnalités nord-américaines, 58 personnalités européennes, 9 personnalités non classées pour seulement 6 personnalités asiatiques, 5 personnalités africaines, 3 personnalités oceaniennes et 2 personnalités sud-americaines[17].

L'article Philosophie mentionne 158 personnalités européennes mais aucune personnalité africaine[18].

L'article Amour mentionne une personnalité africaine pour 58 personnalités européennes[19].

L'article Travail ne mentionne aucune personnalité africaine, aucune personnalité asiatique ou aucune personnalité sud-américaine contre 23 personnalités européennes.

Même bilan avec l'article Musique : 36 personnalités européennes, 6 nord américaines et 1 océanienne mais aucune personnalité asiatique, africaine ou sud-américaine[20].

On pourrait penser que l'article consacré à l'humanité mentionnerait des personnalités de tous les continents. Ça n'est pas le cas. On ne compte aucun représentant de l'Océanie, de l'Afrique et de l'Asie dans l'article[21].

On peut multiplier les exemples et on voit que les continents nord-americains et européens sont largement représentés alors que les autres continents et notamment l'Afrique et l'Amérique du Sud sont représentés de manière marginale dans les articles généraux de l'encyclopédie.

Il y a sans doute de multiples raisons à ce déséquilibre. L'outil peut nous aider à prendre conscience du déséquilibre et chercher, article par article, des idées pour mieux représenter les personnes des continents sous représentés. En creux, on en vient à se demander si Wikipedia représente la « somme de toutes les connaissances » ou simplement le point de vue européen et nord-américain. Le point de vue du « reste du monde » est aujourd'hui manifestement peu représenté dans Wikipedia[22].

La grande interview

Dans cette section, nous donnons la parole à des wikimédien(ne)s sur des thèmes donnés afin de recueillir leurs avis ou les faire parler tout simplement de leurs expériences dans le mouvement.

Entretien avec Warp3

Ses activités wikimédiennes.
Par écrit sur cette page.
L'embellie.
Merci à Noé et Cantons-de-l'Est pour les suggestions de questions.
 ↑ 1. Bonjour Warp3. Merci d'avoir accepté cet entretien après que Cantons-de-l'Est vous ait suggéré comme invité. Pour commencer, je vous laisse vous présenter.

Comme beaucoup de Wikipédistes anciens et français, j'ai connu les débuts d'Internet en France en entreprise puis à domicile, période riche en projets informatiques de toutes les sortes. Intéressé par les articles de vulgarisation dans plusieurs domaines, j'eus vent d'un projet de réalisation d'une encyclopédie à accès gratuit sur le Net, qui s'appelait Wikipédia. Il y avait alors quelques autres encyclopédies comme Encarta de Windows, sur disquettes ou CD, mais assez chères, et les rares encyclopédies gratuites étaient très limités dans leur étendue et d'usage pas bien pratique. Le premier contact avec ce projet balbutiant fut une relative déception : peu d'articles et pas grand-chose dedans.

J'y revins quelques années après... et c'était déjà beaucoup mieux ! Peu à peu, je trouvais le plus souvent un article de Wikipédia après une recherche avec Google, et je m'étonnais que, même si l'article était peu développé, il répondait au minimum à la question « qu'est-ce que c'est ? ». Je faisais alors quelques apports ou corrections minimes, à l'occasion. Quelque trois ans après, fort d'avoir parcouru des pages d'aides et de règles (pas faciles à trouver) ainsi que plusieurs discussions, je fus fin prêt à prendre un compte... mais j'ai attendu encore deux ans avant de m'incrire fin juin 2008, sur un coup de tête. Première constatation après : hors l'accueil (automatique), l'impression d'être complètement seul à se dépatouiller dans l'édition (les pages de discussions des articles sont très souvent vides), jusqu'à me demander où se retrouvaient les Wikipédistes. C'est sur quelques pages plus spécifiques qu'ils se « cachaient », dont un certain Bistro.

Ma page de présentation contient un peu de mon état d'esprit au moment de l'inscription (elle est succinte et un peu ancienne maintenant, mais elle reste encore d'actualité). J'appris qu'il fallait s'inscrire aussi à un autre projet : WM Commons, afin d'ajouter des images (y compris les siennes) à un article. C'était cependant une façon de découvrir que Wikipédia s'appuie sur d'autres projets. Et puis, par curiosité, je visitai d'autres projets encore... (suspense)

 ↑ 2. Comment êtes-vous arrivé dans le mouvement Wikimédia ? Sur quel wiki en premier et comment avez-vous découvert les autres projets ?

Après Wikipédia, puis Commons, j'ai examiné plusieurs autres projets et enfin Wikimédia.

Au début, Wikimédia n'était pas un vrai mouvement mais une entreprise qui mettait en place Wikipédia, l'encyclopédie libre, dans de nombreuses langues puis soutenait d'autres projets voisins de l'encyclopédie. Wikimedia, utilisant des logiciels libres et parfois sous domaine public, s'est mis à promouvoir aussi le développement du libre. C'est plus récemment que la fondation Wikimédia, d'abord à travers la diffusion des projets et par leur utilisation avec tous, en fournissant les moyens de se connecter jusque dans les régions dépourvues d'accès au Net, est devenue un mouvement de développement local et privilégie l'intégration sociale.

j'ai cherché à comprendre l'organisation des projets par rapport à Wikimédia, comme l'existence des chapitres pour chaque projet dans un pays donné. J'ai fait ainsi au passage un peu de traduction de pages en anglais sur Wikimédia (à partir de 2015), participé plus ou moins à divers projets dont Wikiquote (fr), Wikisource, Wiktionnaire, Wikilivres. Je me suis aussi intéressé au thème de l'humour et enrichi le contenu de son portail à partir de 2015.

 ↑ 3. En vous présentant, Cantons-de-l'Est écrit : « Il trouve régulièrement des images qu'il « décore » de légendes savoureuses. » C'est dans cette activité que je vous ai aussi connu notamment sur le Bistro ou dans d'autres sections de discussions. Quand et comment avez-vous commencé à illustrer Le Bistro ?

Ce doit être le 15 décembre 2009, avec le drapeau de l'Acadie. Le calendrier du Bistro est né le 14 septembre 2005 et a vite évolué : la première illustration date du 7 novembre, la première image commentée est du 25 novembre de la même année. L'habitude est prise de décorer assez régulièrement le calendrier dès 2006. Les images avec leurs commentaires sont dans le ton du bistro, souvent légères et comiques, alternant avec des rappels de faits historiques. D'autres images se trouvent parfois ailleurs dans les discussions. Elles décrivent un aspect ou l'autre de Wikipédia en français, de ses débats.

On retrouve alors souvent DocteurCosmos en illustrateur du calendrier. Il se chargeait de l'illustrer avec un tour souvent amusant quand personne d'autre ne l'avait fait. C'est cette façon ludique qui m'a conduit à oser une première illustration dans ce petit espace en haut à droite de chaque page quotidienne du Bistro. J'ai augmenté progressivement mon implication dans ce cadre, comme une sorte de détente après un tas de modification dans les articles. Comme on pourra vérifier, les histoires de cabales et de chats au Bistro existaient depuis au moins 2006, bien avant mon arrivée Émoticône !

 ↑ 4. Vos choix d'illustration, vos légendes ainsi que parfois (souvent ?) vos commentaires de modifications sont tantôt profondes, tantôt légères, mais revêtent toujours une certaine beauté selon moi. Où trouvez-vous l'inspiration ?
— Warp3 ? Mmm... Attendez que je zoome sur l'image... Non, connais pas.

Voilà une question qui doit certainement tarabuster Cantons-de-l'Est depuis des années Émoticône. Il y a de nombreuses façons pour moi de trouver une idée de Bistro, idée souvent de type comique. Le cas le plus courant : c'est au cours de mes périgrinations quasi aléatoires sur Wikipédia et Commons que se fait la découverte de photos ou de dessins qui sont déjà comiques ou étonnantes en elle-même, ou quand leur rapport me semble raconter une historiette ; une sorte de hasard heureux peut-on dire. Sinon, quand j'ai une idée précise, quelques fois inspirée par l'actualité de wpfr, je cherche dans la catégorie idoine celles qui peuvent faire l'affaire. Et il m'arrive aussi d'élaborer des gags un peu plus complexes au saut du lit Émoticône. Dans un premier temps, j'ajoutais un lien vers une vidéo Youtube pour illustrer avec de la musique ou avec un sketch. Mais quelqu'un(e) m'a fait savoir que Commons héberge aussi des fichiers de musiques, qui sont libres de droits, contrairement aux vidéos Youtube. Depuis, je fouine dans les diverses catégories, et en place quelques-unes aux emplacements qui me semblent les plus appropriés. Cette bibliothèque de musiques (et de vidéos), pas assez connue à mon avis ni assez utilisée, semble s'être fortement enrichie ces dernières années.

Chaque fois que je place une illustration assortie d'un commentaire, je ne sais pas vraiment comment cela va être reçu, car il n'y a presque jamais de commentaires sur place ou sur ma page. En général, sur WP, quand personne ne fait de commentaire sur votre modification sur un article, ça signifie qu'elle est plus ou moins acceptée et je me figure que c'est pareil avec une image. Mais c'est comme être sur un bout de scène avec un public derrière une cloison, invisible et muet, qui peut une fois dans la rue faire un petit signe discret de connivence ou au contraire flanquer une claque, sans que je sache trop pour quoi.

 ↑ 5. Utilisez-vous des outils en particulier pour retrouver des images, les archiver, s'en souvenir ? Comment effectuez-vous vos recherches ?

Sur les projets : très peu, en fait. J'ai même décoché tout un tas de gadgets mis par défaut dans mes préférences. J'utilise parfois un éditeur de texte autre que celui de base. Pour les recherches, il arrive que c'est par les images que je retrouve certaines pages ou informations. Mais dans mes recherches d'un fichier sur Commons, je n'utilise guère le gadget fourni, qui retourne n'importe quoi tant qu'il existe dans le nom du fichier une seule erreur, ou que le nom n'est pas assez complet. Utiliser un moteur de recherche extérieur donne plus de chance de trouver le fichier cherché. Et, non, je ne fais pas de recherche SPARQL à travers WikiData, malgré les nombreux exemples donnés par les RAW (!). Question visuels, j'utilise les pauvres logiciels de base de Windows : mspaint, photo, wordpad, bloc-notes. Oui, frugalité extrême... il y a de quoi rire !

 ↑ 6. Assidu du Bistro, qu'aimez-vous y trouver et quelle est la raison d'être que vous donnez à cet espace communautaire ?

Quand j'ai découvert le Bistro à l'époque de mon inscription, je pensais y trouver une sorte d'assemblée très sérieuse réglant avec précision l'avenir de l'Encyclopédie, alors que c'était plutôt une sorte d'auberge espagnole bruyante et un tantinet folle. Le Bistro actuel est en majorité le rendez-vous de toutes les personnes un peu anciennes désireuses de débattre, et parfois d'informer la Wikipédie. C'est le lieu pour poser ses questions avec de grandes chances d'avoir au moins une réponse, que l'on soit novice ou non. Certains débats sont cependant si extravagants que je finis par les trouver rigolos ! Je préfère cependant le discours plus léger tenu par d'autres personnes, comme il arrivait souvent dans les premières années de l'existence du Bistro.

 ↑ 7. Comment trouvez-vous la convivialité et l'ambiance en général au sein de la communauté ?

La communauté de Wikipédia en français est diverse, très partagée sur plusieurs thèmes (inclusionnisme/suppressionnisme, paternalisme/féminisme, fair-use, Comité d'arbitrage (CAr), etc.) depuis au moins 2006 sur les espaces de discussions. Ce n'est que par l'observance des règles établies et de la volonté de participer sereinement à la création et à la maintenance des articles que l'on peut dire qu'il existe une sorte de lien solidaire entre les membres. L'ambiance peut être bonne ou mauvaise selon l'importance que l'on porte à ces thèmes. Il est ainsi possible d'avoir de bons rapports en travaillant sans apriori avec des personnes dans un espace d'articles peu polémiques (potentiellement plusieurs millions Émoticône) .

 ↑ 8. Quel type de wikipédien êtes-vous ? Comment décririez-vous votre manière de contribuer sur l'encyclopédie ?

Si j'ai pris un compte sur Wikipédia, c'est aussi parce que je me sentais redevable de tant d'informations offertes sans contreparties de ma part. J'ai commencé par des corrections orthographiques et quelques reformulations, mais ne me destinais pas à faire beaucoup plus. C'est en voyant l'état de quasi ébauche de l'article Bugs Bunny que je me suis décidé à le développer, par traduction de l'article anglophone. Aussi, le goût me prit de continuer des articles initiés par d'autres, d'abord dans le domaine du dessin animé alors presque déserté hormis le champ disneyien, puis dans d'autres domaines.

Wikipédiste papillonnant, assez solitaire, je passe d'un sujet à l'autre selon mes goûts du moment. L'Amérique de la période située entre 1850 et 1950, le cinéma (Warner Bros. surtout) et la musique sont autant de sujets qui m'intéressent le plus. Malgré une bonne centaine d'articles créés et pas mal de traductions de l'anglais (je vous conseille DeepL comme base) depuis plus de 15 ans, je me considère encore comme un petit rédacteur-relecteur (et suis étonné de faire partie des mille premiers modificateurs actifs de WP). Je n'ai d'ailleurs développé aucun article jusqu'à un niveau de labellisation.

 ↑ 9. Créateur de plus de 110 articles, quand considérez-vous que le sujet d'un article est épuisé avant de passer à un autre ? Quels sentiments cela vous inspire de savoir qu'il reste tant à faire sur le wiki ?

Un article très pointu (dit « d'intéret faible » dans les évaluations), comme un certain type d'invertébré marin très peu connu, s'il est traité pleinement à travers toute la documentation existante, devient un article abouti. S'il n'a pas sa belle étoile doré d'article de qualité, c'est tant pis, mais cela n'enlève rien à son degré d'achèvement. Inversement, sur un article portant sur un sujet connu où la documentation abonde, ou alors un article généraliste, il faut non seulement traiter tous les angles de vue mais aussi rester synthétique (et faire des articles secondaires), et le travail de retrait devient aussi important que celui d'ajout.

Pour ma part, les articles en anglais que je traduis, qui me plaisent, ne sont que rarement des articles complets avec labels de qualité. Je vérifie les sources et complète certains détails, mais je les sais très perfectibles. Le minimum, au-delà des sources, est que la lectrice ou le lecteur puisse se faire au moins une bonne idée du sujet, typiquement un résumé introductif (RI).

Une majorité d'articles de Wikipédia sont (encore) des ébauches ou des articles à peine développés. Tant que des sources sûres justifient l'existence d'un article et qu'il dispose d'une sorte de RI, je considère celui-ci comme valable (en tant que lecteur). Contrairement à d'autres Wikipédistes, cette masse de mini articles ne me semble pas dommageable à l'image de l'encyclopédie, au contraire ! Mieux vaut un article minimum (mais bon) que rien du tout. C'est la multiplicité des articles qui fait l'une des forces de l'Encyclopédie. Les articles faux (canulars) sont, en revanche, une plaie et à éradiquer au plus vite (merci les admins et les vigilant(e)s).

 ↑ 10. En considérant votre expérience sur le wiki, qu'est-ce qui vous a procuré le plus grand plaisir sur Wikipédia ? Au contraire, qu'est-ce qui vous a le plus marqué négativement ?

Il n'y a pas beaucoup d'expériences à vivre sur Wikipédia si on reste à faire des modifications légères sur des articles sans controverses, voire peu lus. Mais dès que l'on prend un compte et que l'on s'attaque à certains gros articles, on rencontre fatalement une partie de la « communauté» hétéroclite wikipédienne.

Il y a eu plusieurs heureuses rencontres, mais je crois que l'une des plus heureuses fut celle de la création des RAW, journal à la fois très instructif et bien présenté par son créateur (mais non, je ne fais pas de la publicité éhontée !). Après réflexion, je dirais que la pire rencontre arriva deux mois après mon inscription, à propos d'une discussion sur ma page de discussion avec un Wikipédien dynamique, aujourd'hui admin actif. Juste après un de mes propos pourtant assez mesuré, déboula sur ma page un parfait inconnu qui se mit à me faire une leçon wikipédienne magistrale dans le plus pur style des « anciens » s'adressant à un complet ignorant. J'avais beau m'être mentalement préparé à des avis extrêmes ou divagants, ce genre d'attaque très limite fut fort désagréable, surtout quand elle fut appuyée par d'autres.

 ↑ 11. Quels seront selon vous les plus grands défis de Wikipédia en français dans les cinq prochaines années ?

Je ne suis pas dans le secret des dieux, mais je crois percevoir :

- L'arrivée de l'intelligence articielle (IA, donc) sur WP est un peu ce que depuis longtemps des Wiképidistes appelaient de leurs vœux pour traiter les millions d'articles de façon automatique. Est-ce la bonne formule ? On peut en douter, dans l'état actuel. Le bon usage de cette IA sur WP reste à définir, et à faire évoluer en même temps qu'elle. Peut-elle éclipser WP même ? La boule de cristal est floue, rappelez plus tard Sourire diabolique.

- Les nouvelles structures qui se mettent lentement en place sous l'égide de Wikimédia, et qui semblent être complètement ignorées du gros de la communauté wikipédienne francophone, mis à part l'application du Code de conduite universel dans les règles de wpfr.

- Maintenir une certaines cohésion entre les membres des Wikipédistes, faire évoluer certaines mentalités ; attirer de nouveaux membres actifs ; se prémunir contre les nouvelles formes d'atteintes aux articles : publicitaires, politiques ou autres ; trouver (et financer) un moyen pérenne de conserver les traces des sources sur Internet.

 ↑ 12. Que pensez-vous des médias qui sont stockés sur Wikimedia Commons et du wiki en général ?

(Wikimedia) Commons est un site énorme, qui recueille des documents (hors textes), pas seulement des photos mais aussi des vidéos et des fichiers sonores. Des musées et institutions prestigieux sont sollicités, ce qui fait que des images exceptionnelles, historiques, y sont copiés et cotoient le reste, inimaginable tant il y en a.

Je me suis incrit presque en même temps sur Commons, site qui héberge donc la plupart des fichiers libres de droits utilisés par Wikipédia, dans le but d'illustrer certains articles. Tout d'abord, j'ai posté quelques-unes de mes photos et me suis conformé aux règles (pas exactement fixées) des droits d'auteur. Mais au fur et à mesure des années, les administrateurs et autres personnes à statut m'ont semblé avoir un comportement de plus en plus incohérent face au soupçon de copyright : aveugles à des imports clairement douteux et sans source mais impitoyables, voire désinvoltes, avec d'autres pourtant accompagnés d'une preuve d'ancienneté suffisante ou/et d'autres garanties. Cela m'a ôté l'envie de discuter et d'y importer quoi que ce soit. Je me contente maintenant principalement de traduire le descriptif des fichiers ou de les catégoriser.

 ↑ 13. Si j'en crois ce diff, le concours de l'image de l'année POTY vous intéresse. Quels ont été vos coups de cœur ou les images qui vous ont profondément marquées depuis que vous suivez ce concours ?

Les concours d'images (principalement photographiques) Picture of the Year (POTY) organisés sur Commons chaque année depuis 2006 sont un plaisir des yeux. Depuis que je connais l'existence du concours, j'y participe régulièrement et leur fait une certaine publicité au Bistro. J'ai aidé à traduire des pages et à vérifier la validité de votes, quand tout était encore fait à la main et qu'il fallait tout refaire et repenser chaque année. Ces dernières années, une poignée de codeurs ont pris le taureau par les cornes et ont automatisé la création au maximum. Cela évite en bonne partie la triche et le recompte manuel mais il n'y a plus le charme des commentaires qui étaient aussi utiles aux photographes participants, et la tenue d'une nouvelle édition ne semble plus être décidée que par eux. Trop de photos m'ont ébloui par leur qualité ou leur sujet pour me décider de seulement quelques-unes ! J'ai découvert cependant que deux noms de photographes reviennent souvent dans les auteurs des photos que je trouve parmi les meilleures : Luc Viatour et Basile Morin (ce dernier étant aussi remarquable pour ses nombreux et excellents ambigrammes). La photo gagnante du concours 2023 est superbe en plus d'être étonnante, même si je ne l'ai pas choisie au dernier tour. Mais elle a eu droit auparavant à plein de prix et je l'avais utilisée dans le Bistro du 15 juillet 2023. Une photo remarquable plus ancienne mais découverte par moi il y a peu de temps m'a complètement désorienté au premier coup d'œil (voir mon commentaire ici).

 ↑ 14. Quel(le) wikimédien(ne) souhaiteriez-vous voir interviewé(e) dans un prochain numéro et sur quel thème ?

Il y a beaucoup de candidats possibles (et disponibles !) mais je serais curieux de Kropotkine 113, Wikipédiste chevronné toujours présent mais finalement assez discret sur les espaces de discussions grand public.

 ↑ 15. Y a-t-il un sujet particulier qui vous tient à cœur et qu’on n’a pas abordé dans cet entretien ? Vous avez carte blanche 🙂.

Je tiens à (re)dire à Cantons-de-l'Est mon plein soutien à la création d'un dictionnaire visuel (multilingue) !

 ↑ 16. Avez-vous un message particulier à adresser aux lectrices et lecteurs du RAW ? Quel serait votre mot de la fin ?

Pas particulèrement au lectorat des RAW mais plutôt aux Wikipédistes en général : si vous avez une idée, ou si une remarque vous tient à cœur, exprimez-la gentiment : on ne vous embastillera pas pour cela ! Si participer à Wikipédia devient une obsession ou un énorme boulet, prenez des vacances. Mais si rien de Wikipédia ne vous plait, alors peut-être que Wikipédia... n'est pas (ou plus) pour vous.

Merci d'avoir accepté cette interview. Bonne continuation !

L'agenda

Les autres infolettres

La page Wikipédia:RAW/Découvrir recense les infolettres et blogs relatifs à Wikimedia.

En plus de RAW, vous pouvez lire le Wikimag, newsletter hebdomadaire de la Wikipedia francophone (Voir le dernier numéro Wikipédia:Wikimag/2024/44), l'infolettre Wikifier la science (voir le dernier numéro Projet:Wikifier la science/Infolettre/Octobre 2024) et les Actualités du Wiktionnaire newsletter mensuelle du Wiktionnaire (wikt:Wiktionnaire:Actualités/114-septembre-2024).

Les anglophones peuvent aussi lire The Signpost, publié toutes les deux semaines, la newsletter hebdo de la communauté Wikidata (voir ici d:Wikidata:Status updates/2024 10 28) ou encore la newsletter du projet Wikifunction ("wikifunction:Wikifunctions:Status updates/2024-10-25).

Courrier du lectorat

(Il nous fera plaisir de lire les messages déposés ici et, si nécessaire, d'y répondre dans les plus brefs délais.)

Wikipédia face au problème du contenu généré par intelligence artificielle — L’intérêt des intelligences artificielles génératives comme ChatGPT réside, selon moi, dans leur capacité de rédaction. À partir du moment où on leur fournit une première version d’un texte sourcé, elles sont capables de le synthétiser ou de le compléter afin qu’il soit rédigé dans un style clair et encyclopédique. De ce point de vue, ce sont d’excellents assistants.
En revanche, comme dit Le chat perché, elles ne peuvent pas faire le travail à notre place, et ce pour une raison très simple : elles ne sont pas conçues pour. Ce sont des IA « probabilistes ». Elle donne le résultat « le plus probable », pas forcément le plus fiable. C’est ce qui explique qu’elles peuvent inventer un concept scientifique… qui n’existe pas, ou encore inventer des sources. Attention donc à ne pas les prendre pour ce qu’elles ne sont pas Émoticône. Merci aux rédacteurs et rédactrices du RAW, comme toujours très instructif.--Pronoia (discuter) 1 novembre 2024 à 10:10 (CET)

De mon côté, ce qui m'inquiète le plus est l'illusion de qualité avec des utilisateurs ne voyant même pas les problèmes. Pour l'exemple, question que j'ai posé hier sur quoi faire avec ce cas où il se pourrait que l'utilisateur soit de bonne foi. J'ai prévu de traduire cet essai anglais pour avoir une base pédagogique vers laquelle orienter mais si ce genre de chose se développe, faudra peut-être penser à un avertissement quelque part pour que toute personne venant contribuer sache qu'il y a des choses à ne pas faire.
Pour l'heure, le principe de signalement n'est pas encore en place côté francophone mais côté anglophone, ils ont eu 69 articles indiqués en octobre et si on en croit l'étude indiquée plus haut, il y a des chances qu'on en rate. Fabius Lector (discuter) 1 novembre 2024 à 11:50 (CET)
Je partage l'inquiétude sur l'illusion de qualité. Mais ça va au delà de l'IA.
Sinon je suis honnoré d'être cité Émoticône. Le chat perché (discuter) 1 novembre 2024 à 13:35 (CET)

Biais de surreprésentation des idées et auteurs occidentaux — Merci PAC2 pour ton outil de mesure des biais géographiques dans les articles ! Je trouve cela très parlant et assez préoccupant de voir que Wikipédia reflète avant tout les connaissances occidentales. Il y a probablement une explication historique à ça (naissance de la science moderne en Europe, développement de la plupart des disciplines universitaires en Occident + colonisation, effacement des savoirs autochtones et difficultés d'accès aux études supérieures dans beaucoup d'endroits). On a du boulot pour lutter contre ce biais ! Skimel (discuter) 2 novembre 2024 à 09:58 (CET)

Grande interview de Warp3 — Merci Warp3 pour cette interview, qui m'a diverti de mes soucis IRL. Comme d'habitude, j'ai lu des observations et des commentaires qui m'ont fait Émoticône ! — Cantons-de-l'Est p|d|d 🧹 4 novembre 2024 à 23:51 (CET)

Boîtes à livres — Merci pour la mention, je n'avais pas encore lu ce RAW, quelle bonne surprise de voir le site mentionné ! Symac (discuter) 7 novembre 2024 à 13:12 (CET) (développeur dudit site :p)

L'IA a une forte valeur ajoutée pour "aider à faire" mais jamais pour "faire à la place".
 – Le chat perché sur le Bistro.
Rédigé/traduit par L'embellie et PAC2.
Citations originales
Notes
Références
  1. Découvert via https://wikis.world/@festal@tldr.nettime.org/113243136048240433
  2. https://www.404media.co/the-editors-protecting-wikipedia-from-ai-hoaxes/
  3. en:Wikipedia:Wikipedia Signpost/2024-10-19/Recent research
  4. Pour les plus curieuses et les plus curieux, la méthode Binoculars est une méthode de détection des textes générés par des grands modèles de langage qui s'appuie sur la « perplexité croisée  » de deux grands modèles de langage. Pour en savoir plus : https://arxiv.org/html/2401.12070v3
  5. a et b (en) Creston Brooks, Samuel Eggert et Denis Peskoff, « The Rise of AI-Generated Content in Wikipedia », {{Article}} : paramètre « périodique » manquant,‎ (lire en ligne).
  6. « Since 2017, Herron’s two accounts have made more than 300 contributions to pages on Wikipedia, of which more than half are entirely embellishments to Herron’s page, but there are notable deletions of positive content from the pages of Dauwalter, 2018 Boston Marathon champion Des Linden and Greek ultrarunning legend Yiannis Kouros. »- Merci DeepL pour la traduction. C'est pas parfait mais c'est pratique :).
  7. Victor Garcia, « Patrick Hetzel, un ministre bien peu scientifique : enquête sur le discret nettoyage de sa page Wikipédia », L’Express, (consulté le )
  8. https://x.com/WikiResearch/status/1843699094579229068
  9. Découvert via d:Wikidata:Status_updates/2024_10_14
  10. « As the saying goes, we move fast and break things: Wikidata is getting too big, too fast. The Wikidata Query Service graph got so huge it will be split, and the growth of the core database is deemed unsustainable. »
  11. « Let’s have it for slow data. Let’s make edits that take minutes rather than racking tens per second. (And sure, “It’s not the quantity, it’s the quality” is an old Wikipedia trope, at times ill-used, but not wrong per se.) »
  12. Traduit avec DeepL.com (version gratuite) « This does not mean not creating new items. But it does mean creating them more intentionally. The old, somewhat hyperbolic jest is that Wikipedia is full of articles that « no-one will ever read » (and I have done my fair share of that!) ; but on Wikidata, we sure have items that were not even created by someone, merely by something. »
  13. https://wikidata-game.toolforge.org/#
  14. https://observablehq.com/@pac02/explore-gender-diversity-in-a-single-wikipedia-article
  15. https://observablehq.com/@pac02/articles-wikilinks-inspector
  16. https://observablehq.com/@pac02/olympic-medals-by-continent
  17. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Intelligence%20artificielle
  18. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Philosophie
  19. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Amour
  20. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Musique
  21. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Humanit%C3%A9
  22. J'emprunte l'expression reste du monde au média Rest of world : https://restofworld.org/about/
  23. https://www.wikimedia.fr/participer-au-prix-wikimedia-de-la-recherche/

Numéro du 19 novembre 2024

Tuesday, 19 November 2024 00:00 UTC

Éloge de la lenteur / L'édito de PAC2 — Depuis 2 ans que je contribue activement à RAW, la question de l'intelligence artificielle revient régulièrement dans l'actualité de Wikimédia. Ce numéro n'échappe pas à la règle et on retrouve encore dans ce numéro des inquiétudes face à la tentation de l'IA. À rebours des « accélérationnistes » qui veulent utiliser l'IA pour contribuer plus vite et mettre toujours plus de contenu, Jean-Frédéric sur le blog The Commonist fait un éloge bienvenu de la lenteur et de la contribution artisanale.

Vous trouverez aussi ce mois-ci une interview de Warp3 et un format atelier pour réfléchir à la représentation des personnalités des différents continents dans les articles Wikipédia.

Les brèves

Wikipédia face au problème du contenu généré par intelligence artificielle — Sur la Wikipédia anglophone, la communauté a créé un projet spécifique pour lutter contre le problème des contenus générés par intelligence artificielle mal sourcés et mal écrits[1]. 404 média revient en détail sur les enjeux. Un article anglophone sur la forteresse Amberlihisar, qui n'a jamais existé, constitue un bon exemple de mauvais recours à l'IA. L'IA a notamment généré des références parfaitement mises en forme mais totalement fictives. Le projet AI Cleanup recense aussi les images synthétiques. Certaines sont légitimes et sont utilisées à bon escient mais d'autres sont manifestement trompeuses[2].

Dans son édition du 19 octobre, The Signpost revient sur un récent article académique cherchant à quantifier la part de nouveaux articles générés avec de grands modèles de langage[3]. L'article intitulé « The Rise of AI-Generated Content in Wikipedia » utilise deux détecteurs automatiques de grands modèles de langage, GPTZero et Binoculars[4] pour estimer la proportion d'articles contenant des morceaux générés par des grands modèles de langage parmi les articles créés en août 2024[5].

« À l'aide de deux outils, GPTZero et Binoculars, nous détectons que jusqu'à 5 % des 2 909 articles anglais de Wikipédia créés en août 2024 contiennent un contenu significatif généré par l'IA. Les seuils de classification des deux outils ont été calibrés pour maintenir un taux de faux positifs ne dépassant pas 1 % sur une base Wikipédia pré-GPT-3.5, comme indiqué par la ligne rouge[5]. »

Sur la Wikipédia francophone, Fabius Lector a créé le projet Projet:Observatoire des IA et Simonk a initié un essai sur l'intelligence artificielle.

Logo de la conférence

WikiIndaba2024 — La conférence WikiIndaba, consacrée à la présence de l'Afrique sur Wikipédia, a eu lieu du 4 au 6 octobre à Johannesbourg.

Camille Herron, championne d'ultra-marathon et wikipédienne sous les pseudos Rundbowie et Temporun73.

La coureuse Camille Herron accusée de manipuler Wikipedia — La coureuse Camille Herron et son mari et entraîneur Conor Holt sont accusés d'avoir manipulé Wikipédia en diminuant le palmarès de concurrentes de Camille Herron.

« Depuis 2017, les deux comptes de Herron ont apporté plus de 300 contributions à des pages de Wikipédia, dont plus de la moitié sont entièrement des embellissements de la page de Herron, mais il y a des suppressions notables de contenu positif des pages de Dauwalter, du champion du marathon de Boston 2018 Des Linden et de la légende grecque de l'ultrarunning Yiannis Kouros[6]. »

Patrick Hetzel est ministre de l'enseignement supérieur et de la recherche dans le gouvernement de la République française depuis septembre 2024.

Le cabinet du ministre de l'enseignement supérieur et de la recherche français manipule Wikipédia ! — Une enquête du magazine L'Express révèle que le cabinet du nouveau ministre de l'enseignement supérieur et de la recherche français, Patrick Hetzel, a tenté de manipuler la biographie Wikipedia du ministre[7].

Florence Devouard, ancienne présidente de la fondation Wikimédia, est à l'initiative de la campagne SheSaid.

Florence Devouard interviewée sur l'initiative SheSaidDiff, le blog de la communauté interviewe Florence Devouard sur l'initiative de la campagne SheSaid.

« J'ai remarqué très tôt que les femmes étaient peu nombreuses dans nos projets, mais je ne me suis vraiment impliquée dans la lutte contre l'écart entre les sexes que lorsque Isla Haddow-Flood et moi-même avons lancé l'initiative Wiki Loves Women en 2016. Nous avons exploré différentes stratégies pour recruter plus de femmes, fournir un environnement plus inclusif, former et soutenir, mettre en œuvre différentes stratégies. Le sujet est complexe. En 2020, en pleine pandémie, j'ai lancé l'idée de #SheSaid... et nous voilà 4 ans plus tard ! »

Boîte à livres à Amboise, France.

11 000 boîtes à livres recensées — Le site boîtes-à-livres.fr recense les boîtes à livres en France en s'appuyant sur OpenStreetMap et Wikimédia Commons. On y trouve maintenant plus de 11 000 boîtes à livres.

Tous les chemins entre deux éléments Wikidata — Des chercheurs ont développé un nouvel outil capable de trouver tous les chemins possibles entre deux entités Wikidata[8].

Articles les plus centraux — L'université de Milan publie la liste des articles les plus centraux de Wikipédia (à priori uniquement la version anglophone).

C'est la saison des Nobel — Chaque année les différents prix Nobel sont remis début octobre. C'est l'occasion de remettre à jour et de développer de nouveaux notebooks consacrés aux Nobel.

Comme pour les jeux olympiques, on peut calculer la concentration des prix par pays de nationalité à partir d'une requête Wikidata.

Les États-Unis sont en tête du classement pour le prix Nobel de médecine, le prix Nobel de physique, le prix Nobel de la paix et le prix Nobel de Chimie. La France est en tête pour le prix Nobel de littérature. Les États-Unis obtiennent près de 40% des prix en médecine et plus de 32% des prix en physique et en chimie ! Parmi les cinq prix Nobel historique, c'est le prix Nobel de littérature qui est le plus diversifié en terme de pays de nationalité.

Jean-Frédéric propose l'approche SNAIL, acronyme de « Slow, NArrow, In-depth, Local », ce qu'on peut traduire par « Lent, précis, en profondeur et local ».

L'approche escargot ou l'éloge de la lenteur — Sur le blog The Commonists, Jean-Frédéric propose une approche escargot à la contribution #Wikidata 🐌[9]!

Plutôt que de faire de l'édition en masse, il propose de prendre le temps de faire de la contribution manuelle.

« Comme le dit le proverbe, nous allons vite et nous cassons des choses : Wikidata devient trop gros, trop vite. Le graphique du service d'interrogation de Wikidata a pris une telle ampleur qu'il sera scindé, et la croissance de la base de données principale est jugée insoutenable[10]. »

Plutôt que d'utiliser QuickStatement ou OpenRefine, Jean-Frédéric propose l'approche lente en s'inspirant du mouvement lent :

« Faisons ça avec les données lentes. Faisons des modifications qui prennent des minutes au lieu d'en faire des dizaines par seconde. (Et bien sûr, "Ce n'est pas la quantité, c'est la qualité" est un vieux trope de Wikipedia, parfois mal utilisé, mais pas faux en soi)[11]. »

« Cela ne signifie pas qu'il ne faut pas créer de nouveaux articles. Mais cela signifie qu'il faut les créer plus intentionnellement. La vieille plaisanterie, quelque peu hyperbolique, est que Wikipédia est pleine d'articles que " personne ne lira jamais " (et j'en ai fait ma part !) ; mais sur Wikidata, nous avons certainement des articles qui n'ont même pas été créés par quelqu'un, mais simplement par quelque chose[12]. »

Une nouvelle interface pour contribuer aux données lexicographiques de Wikidata — Lexico est une nouvelle interface qui permet de faciliter la contribution aux données lexicographiques (lexemes) sur Wikidata. Le principe rappelle les Wikidata Games de Magnus Manske[13].

65 000 citations sur Wikiquote — Wikiquote en français compte désormais 65 000 citations réparties sur près de 9 000 pages.

L'atelier

Dans cette section, un(e) wikimédien(ne) peut raconter un de ses bricolages à la première personne.

Ce mois-ci c'est PAC2 qui raconte comment il a bricolé un outil pour mesurer les biais de Wikipedia.

Il y a quelques années, j'avais développé le Gender Diversity Explorer, un petit outil en ligne qui récupère tous les liens bleus d'un article Wikipédia (ie les mentions), récupère la valeur de la propriété P21 (Sexe ou genre) dans l'élément Wikidata associé et calculé des statistiques de genre sur la répartition des entités nommées dans l'article[14].

L'approche se généralise facilement à n'importe quelle propriété dans Wikidata. C'est ce que propose le Wikilinks inspector[15].

Pour réfléchir à la représentation de certains continents comme l'Afrique ou l'Amérique du Sud, j'avais besoin d'adapter l'outil et de trouver un bon moyen de faire la correspondance entre des pays et des continents. C'est mon travail sur la répartition des médailles aux jeux olympiques qui m'a permis de trouver le bon moyen d'obtenir une correspondance à peu près pertinente entre pays et continents[16].

Techniquement, la magie vient toujours de la possibilité d'appeler l'api Wikimédia depuis une requête SPARQL :

SELECT ?item ?itemLabel ?country ?countryLabel 
WHERE {
  SERVICE wikibase:mwapi {
     bd:serviceParam wikibase:endpoint "fr.wikipedia.org";
                     wikibase:api "Generator";
                     mwapi:generator "links";
                     mwapi:titles "Intelligence artificielle";.
     ?item wikibase:apiOutputItem mwapi:item.
  } 
  FILTER BOUND (?item)
  ?item wdt:P31 wd:Q5 . 
  ?item wdt:P27 ?country . 
  ?country rdfs:label ?countryLabel filter (lang(?countryLabel) = "en") .
  ?item rdfs:label ?itemLabel filter (lang(?itemLabel) = "en") .
}

Cliquez pour essayer !

On combine ça ensuite avec la requête sur les continents et le tour est joué :

SELECT DISTINCT ?continent ?continentLabel ?country  ?code WHERE {
VALUES ?continent {
wd:Q55643
wd:Q48
wd:Q15
wd:Q18
wd:Q49
wd:Q46
} 
 ?continent (wdt:P527*) ?country.
  ?country 
    wdt:P2082 ?code.
  SERVICE wikibase:label { bd:serviceParam wikibase:language "en". }
}

Cliquez pour essayer !

Venons en maintenant aux résultats. Si on prend un article sur un thème très général et si Wikipedia représente l'ensemble des connaissances sur un sujet, on devrait s'attendre à avoir une représentation de personnalités de tous les continents dans les entités mentionnées dans un article.

Maintenant, quand on regarde l'article Intelligence artificielle, on trouve 69 personnalités nord-américaines, 58 personnalités européennes, 9 personnalités non classées pour seulement 6 personnalités asiatiques, 5 personnalités africaines, 3 personnalités oceaniennes et 2 personnalités sud-americaines[17].

L'article Philosophie mentionne 158 personnalités européennes mais aucune personnalité africaine[18].

L'article Amour mentionne une personnalité africaine pour 58 personnalités européennes[19].

L'article Travail ne mentionne aucune personnalité africaine, aucune personnalité asiatique ou aucune personnalité sud-américaine contre 23 personnalités européennes.

Même bilan avec l'article Musique : 36 personnalités européennes, 6 nord américaines et 1 océanienne mais aucune personnalité asiatique, africaine ou sud-américaine[20].

On pourrait penser que l'article consacré à l'humanité mentionnerait des personnalités de tous les continents. Ça n'est pas le cas. On ne compte aucun représentant de l'Océanie, de l'Afrique et de l'Asie dans l'article[21].

On peut multiplier les exemples et on voit que les continents nord-americains et européens sont largement représentés alors que les autres continents et notamment l'Afrique et l'Amérique du Sud sont représentés de manière marginale dans les articles généraux de l'encyclopédie.

Il y a sans doute de multiples raisons à ce déséquilibre. L'outil peut nous aider à prendre conscience du déséquilibre et chercher, article par article, des idées pour mieux représenter les personnes des continents sous représentés. En creux, on en vient à se demander si Wikipedia représente la « somme de toutes les connaissances » ou simplement le point de vue européen et nord-américain. Le point de vue du « reste du monde » est aujourd'hui manifestement peu représenté dans Wikipedia[22].

La grande interview

Dans cette section, nous donnons la parole à des wikimédien(ne)s sur des thèmes donnés afin de recueillir leurs avis ou les faire parler tout simplement de leurs expériences dans le mouvement.

Entretien avec Warp3

Ses activités wikimédiennes.
Par écrit sur cette page.
L'embellie.
Merci à Noé et Cantons-de-l'Est pour les suggestions de questions.
 ↑ 1. Bonjour Warp3. Merci d'avoir accepté cet entretien après que Cantons-de-l'Est vous ait suggéré comme invité. Pour commencer, je vous laisse vous présenter.

Comme beaucoup de Wikipédistes anciens et français, j'ai connu les débuts d'Internet en France en entreprise puis à domicile, période riche en projets informatiques de toutes les sortes. Intéressé par les articles de vulgarisation dans plusieurs domaines, j'eus vent d'un projet de réalisation d'une encyclopédie à accès gratuit sur le Net, qui s'appelait Wikipédia. Il y avait alors quelques autres encyclopédies comme Encarta de Windows, sur disquettes ou CD, mais assez chères, et les rares encyclopédies gratuites étaient très limités dans leur étendue et d'usage pas bien pratique. Le premier contact avec ce projet balbutiant fut une relative déception : peu d'articles et pas grand-chose dedans.

J'y revins quelques années après... et c'était déjà beaucoup mieux ! Peu à peu, je trouvais le plus souvent un article de Wikipédia après une recherche avec Google, et je m'étonnais que, même si l'article était peu développé, il répondait au minimum à la question « qu'est-ce que c'est ? ». Je faisais alors quelques apports ou corrections minimes, à l'occasion. Quelque trois ans après, fort d'avoir parcouru des pages d'aides et de règles (pas faciles à trouver) ainsi que plusieurs discussions, je fus fin prêt à prendre un compte... mais j'ai attendu encore deux ans avant de m'incrire fin juin 2008, sur un coup de tête. Première constatation après : hors l'accueil (automatique), l'impression d'être complètement seul à se dépatouiller dans l'édition (les pages de discussions des articles sont très souvent vides), jusqu'à me demander où se retrouvaient les Wikipédistes. C'est sur quelques pages plus spécifiques qu'ils se « cachaient », dont un certain Bistro.

Ma page de présentation contient un peu de mon état d'esprit au moment de l'inscription (elle est succinte et un peu ancienne maintenant, mais elle reste encore d'actualité). J'appris qu'il fallait s'inscrire aussi à un autre projet : WM Commons, afin d'ajouter des images (y compris les siennes) à un article. C'était cependant une façon de découvrir que Wikipédia s'appuie sur d'autres projets. Et puis, par curiosité, je visitai d'autres projets encore... (suspense)

 ↑ 2. Comment êtes-vous arrivé dans le mouvement Wikimédia ? Sur quel wiki en premier et comment avez-vous découvert les autres projets ?

Après Wikipédia, puis Commons, j'ai examiné plusieurs autres projets et enfin Wikimédia.

Au début, Wikimédia n'était pas un vrai mouvement mais une entreprise qui mettait en place Wikipédia, l'encyclopédie libre, dans de nombreuses langues puis soutenait d'autres projets voisins de l'encyclopédie. Wikimedia, utilisant des logiciels libres et parfois sous domaine public, s'est mis à promouvoir aussi le développement du libre. C'est plus récemment que la fondation Wikimédia, d'abord à travers la diffusion des projets et par leur utilisation avec tous, en fournissant les moyens de se connecter jusque dans les régions dépourvues d'accès au Net, est devenue un mouvement de développement local et privilégie l'intégration sociale.

j'ai cherché à comprendre l'organisation des projets par rapport à Wikimédia, comme l'existence des chapitres pour chaque projet dans un pays donné. J'ai fait ainsi au passage un peu de traduction de pages en anglais sur Wikimédia (à partir de 2015), participé plus ou moins à divers projets dont Wikiquote (fr), Wikisource, Wiktionnaire, Wikilivres. Je me suis aussi intéressé au thème de l'humour et enrichi le contenu de son portail à partir de 2015.

 ↑ 3. En vous présentant, Cantons-de-l'Est écrit : « Il trouve régulièrement des images qu'il « décore » de légendes savoureuses. » C'est dans cette activité que je vous ai aussi connu notamment sur le Bistro ou dans d'autres sections de discussions. Quand et comment avez-vous commencé à illustrer Le Bistro ?

Ce doit être le 15 décembre 2009, avec le drapeau de l'Acadie. Le calendrier du Bistro est né le 14 septembre 2005 et a vite évolué : la première illustration date du 7 novembre, la première image commentée est du 25 novembre de la même année. L'habitude est prise de décorer assez régulièrement le calendrier dès 2006. Les images avec leurs commentaires sont dans le ton du bistro, souvent légères et comiques, alternant avec des rappels de faits historiques. D'autres images se trouvent parfois ailleurs dans les discussions. Elles décrivent un aspect ou l'autre de Wikipédia en français, de ses débats.

On retrouve alors souvent DocteurCosmos en illustrateur du calendrier. Il se chargeait de l'illustrer avec un tour souvent amusant quand personne d'autre ne l'avait fait. C'est cette façon ludique qui m'a conduit à oser une première illustration dans ce petit espace en haut à droite de chaque page quotidienne du Bistro. J'ai augmenté progressivement mon implication dans ce cadre, comme une sorte de détente après un tas de modification dans les articles. Comme on pourra vérifier, les histoires de cabales et de chats au Bistro existaient depuis au moins 2006, bien avant mon arrivée Émoticône !

 ↑ 4. Vos choix d'illustration, vos légendes ainsi que parfois (souvent ?) vos commentaires de modifications sont tantôt profondes, tantôt légères, mais revêtent toujours une certaine beauté selon moi. Où trouvez-vous l'inspiration ?
— Warp3 ? Mmm... Attendez que je zoome sur l'image... Non, connais pas.

Voilà une question qui doit certainement tarabuster Cantons-de-l'Est depuis des années Émoticône. Il y a de nombreuses façons pour moi de trouver une idée de Bistro, idée souvent de type comique. Le cas le plus courant : c'est au cours de mes périgrinations quasi aléatoires sur Wikipédia et Commons que se fait la découverte de photos ou de dessins qui sont déjà comiques ou étonnantes en elle-même, ou quand leur rapport me semble raconter une historiette ; une sorte de hasard heureux peut-on dire. Sinon, quand j'ai une idée précise, quelques fois inspirée par l'actualité de wpfr, je cherche dans la catégorie idoine celles qui peuvent faire l'affaire. Et il m'arrive aussi d'élaborer des gags un peu plus complexes au saut du lit Émoticône. Dans un premier temps, j'ajoutais un lien vers une vidéo Youtube pour illustrer avec de la musique ou avec un sketch. Mais quelqu'un(e) m'a fait savoir que Commons héberge aussi des fichiers de musiques, qui sont libres de droits, contrairement aux vidéos Youtube. Depuis, je fouine dans les diverses catégories, et en place quelques-unes aux emplacements qui me semblent les plus appropriés. Cette bibliothèque de musiques (et de vidéos), pas assez connue à mon avis ni assez utilisée, semble s'être fortement enrichie ces dernières années.

Chaque fois que je place une illustration assortie d'un commentaire, je ne sais pas vraiment comment cela va être reçu, car il n'y a presque jamais de commentaires sur place ou sur ma page. En général, sur WP, quand personne ne fait de commentaire sur votre modification sur un article, ça signifie qu'elle est plus ou moins acceptée et je me figure que c'est pareil avec une image. Mais c'est comme être sur un bout de scène avec un public derrière une cloison, invisible et muet, qui peut une fois dans la rue faire un petit signe discret de connivence ou au contraire flanquer une claque, sans que je sache trop pour quoi.

 ↑ 5. Utilisez-vous des outils en particulier pour retrouver des images, les archiver, s'en souvenir ? Comment effectuez-vous vos recherches ?

Sur les projets : très peu, en fait. J'ai même décoché tout un tas de gadgets mis par défaut dans mes préférences. J'utilise parfois un éditeur de texte autre que celui de base. Pour les recherches, il arrive que c'est par les images que je retrouve certaines pages ou informations. Mais dans mes recherches d'un fichier sur Commons, je n'utilise guère le gadget fourni, qui retourne n'importe quoi tant qu'il existe dans le nom du fichier une seule erreur, ou que le nom n'est pas assez complet. Utiliser un moteur de recherche extérieur donne plus de chance de trouver le fichier cherché. Et, non, je ne fais pas de recherche SPARQL à travers WikiData, malgré les nombreux exemples donnés par les RAW (!). Question visuels, j'utilise les pauvres logiciels de base de Windows : mspaint, photo, wordpad, bloc-notes. Oui, frugalité extrême... il y a de quoi rire !

 ↑ 6. Assidu du Bistro, qu'aimez-vous y trouver et quelle est la raison d'être que vous donnez à cet espace communautaire ?

Quand j'ai découvert le Bistro à l'époque de mon inscription, je pensais y trouver une sorte d'assemblée très sérieuse réglant avec précision l'avenir de l'Encyclopédie, alors que c'était plutôt une sorte d'auberge espagnole bruyante et un tantinet folle. Le Bistro actuel est en majorité le rendez-vous de toutes les personnes un peu anciennes désireuses de débattre, et parfois d'informer la Wikipédie. C'est le lieu pour poser ses questions avec de grandes chances d'avoir au moins une réponse, que l'on soit novice ou non. Certains débats sont cependant si extravagants que je finis par les trouver rigolos ! Je préfère cependant le discours plus léger tenu par d'autres personnes, comme il arrivait souvent dans les premières années de l'existence du Bistro.

 ↑ 7. Comment trouvez-vous la convivialité et l'ambiance en général au sein de la communauté ?

La communauté de Wikipédia en français est diverse, très partagée sur plusieurs thèmes (inclusionnisme/suppressionnisme, paternalisme/féminisme, fair-use, Comité d'arbitrage (CAr), etc.) depuis au moins 2006 sur les espaces de discussions. Ce n'est que par l'observance des règles établies et de la volonté de participer sereinement à la création et à la maintenance des articles que l'on peut dire qu'il existe une sorte de lien solidaire entre les membres. L'ambiance peut être bonne ou mauvaise selon l'importance que l'on porte à ces thèmes. Il est ainsi possible d'avoir de bons rapports en travaillant sans apriori avec des personnes dans un espace d'articles peu polémiques (potentiellement plusieurs millions Émoticône) .

 ↑ 8. Quel type de wikipédien êtes-vous ? Comment décririez-vous votre manière de contribuer sur l'encyclopédie ?

Si j'ai pris un compte sur Wikipédia, c'est aussi parce que je me sentais redevable de tant d'informations offertes sans contreparties de ma part. J'ai commencé par des corrections orthographiques et quelques reformulations, mais ne me destinais pas à faire beaucoup plus. C'est en voyant l'état de quasi ébauche de l'article Bugs Bunny que je me suis décidé à le développer, par traduction de l'article anglophone. Aussi, le goût me prit de continuer des articles initiés par d'autres, d'abord dans le domaine du dessin animé alors presque déserté hormis le champ disneyien, puis dans d'autres domaines.

Wikipédiste papillonnant, assez solitaire, je passe d'un sujet à l'autre selon mes goûts du moment. L'Amérique de la période située entre 1850 et 1950, le cinéma (Warner Bros. surtout) et la musique sont autant de sujets qui m'intéressent le plus. Malgré une bonne centaine d'articles créés et pas mal de traductions de l'anglais (je vous conseille DeepL comme base) depuis plus de 15 ans, je me considère encore comme un petit rédacteur-relecteur (et suis étonné de faire partie des mille premiers modificateurs actifs de WP). Je n'ai d'ailleurs développé aucun article jusqu'à un niveau de labellisation.

 ↑ 9. Créateur de plus de 110 articles, quand considérez-vous que le sujet d'un article est épuisé avant de passer à un autre ? Quels sentiments cela vous inspire de savoir qu'il reste tant à faire sur le wiki ?

Un article très pointu (dit « d'intéret faible » dans les évaluations), comme un certain type d'invertébré marin très peu connu, s'il est traité pleinement à travers toute la documentation existante, devient un article abouti. S'il n'a pas sa belle étoile doré d'article de qualité, c'est tant pis, mais cela n'enlève rien à son degré d'achèvement. Inversement, sur un article portant sur un sujet connu où la documentation abonde, ou alors un article généraliste, il faut non seulement traiter tous les angles de vue mais aussi rester synthétique (et faire des articles secondaires), et le travail de retrait devient aussi important que celui d'ajout.

Pour ma part, les articles en anglais que je traduis, qui me plaisent, ne sont que rarement des articles complets avec labels de qualité. Je vérifie les sources et complète certains détails, mais je les sais très perfectibles. Le minimum, au-delà des sources, est que la lectrice ou le lecteur puisse se faire au moins une bonne idée du sujet, typiquement un résumé introductif (RI).

Une majorité d'articles de Wikipédia sont (encore) des ébauches ou des articles à peine développés. Tant que des sources sûres justifient l'existence d'un article et qu'il dispose d'une sorte de RI, je considère celui-ci comme valable (en tant que lecteur). Contrairement à d'autres Wikipédistes, cette masse de mini articles ne me semble pas dommageable à l'image de l'encyclopédie, au contraire ! Mieux vaut un article minimum (mais bon) que rien du tout. C'est la multiplicité des articles qui fait l'une des forces de l'Encyclopédie. Les articles faux (canulars) sont, en revanche, une plaie et à éradiquer au plus vite (merci les admins et les vigilant(e)s).

 ↑ 10. En considérant votre expérience sur le wiki, qu'est-ce qui vous a procuré le plus grand plaisir sur Wikipédia ? Au contraire, qu'est-ce qui vous a le plus marqué négativement ?

Il n'y a pas beaucoup d'expériences à vivre sur Wikipédia si on reste à faire des modifications légères sur des articles sans controverses, voire peu lus. Mais dès que l'on prend un compte et que l'on s'attaque à certains gros articles, on rencontre fatalement une partie de la « communauté» hétéroclite wikipédienne.

Il y a eu plusieurs heureuses rencontres, mais je crois que l'une des plus heureuses fut celle de la création des RAW, journal à la fois très instructif et bien présenté par son créateur (mais non, je ne fais pas de la publicité éhontée !). Après réflexion, je dirais que la pire rencontre arriva deux mois après mon inscription, à propos d'une discussion sur ma page de discussion avec un Wikipédien dynamique, aujourd'hui admin actif. Juste après un de mes propos pourtant assez mesuré, déboula sur ma page un parfait inconnu qui se mit à me faire une leçon wikipédienne magistrale dans le plus pur style des « anciens » s'adressant à un complet ignorant. J'avais beau m'être mentalement préparé à des avis extrêmes ou divagants, ce genre d'attaque très limite fut fort désagréable, surtout quand elle fut appuyée par d'autres.

 ↑ 11. Quels seront selon vous les plus grands défis de Wikipédia en français dans les cinq prochaines années ?

Je ne suis pas dans le secret des dieux, mais je crois percevoir :

- L'arrivée de l'intelligence articielle (IA, donc) sur WP est un peu ce que depuis longtemps des Wiképidistes appelaient de leurs vœux pour traiter les millions d'articles de façon automatique. Est-ce la bonne formule ? On peut en douter, dans l'état actuel. Le bon usage de cette IA sur WP reste à définir, et à faire évoluer en même temps qu'elle. Peut-elle éclipser WP même ? La boule de cristal est floue, rappelez plus tard Sourire diabolique.

- Les nouvelles structures qui se mettent lentement en place sous l'égide de Wikimédia, et qui semblent être complètement ignorées du gros de la communauté wikipédienne francophone, mis à part l'application du Code de conduite universel dans les règles de wpfr.

- Maintenir une certaines cohésion entre les membres des Wikipédistes, faire évoluer certaines mentalités ; attirer de nouveaux membres actifs ; se prémunir contre les nouvelles formes d'atteintes aux articles : publicitaires, politiques ou autres ; trouver (et financer) un moyen pérenne de conserver les traces des sources sur Internet.

 ↑ 12. Que pensez-vous des médias qui sont stockés sur Wikimedia Commons et du wiki en général ?

(Wikimedia) Commons est un site énorme, qui recueille des documents (hors textes), pas seulement des photos mais aussi des vidéos et des fichiers sonores. Des musées et institutions prestigieux sont sollicités, ce qui fait que des images exceptionnelles, historiques, y sont copiés et cotoient le reste, inimaginable tant il y en a.

Je me suis incrit presque en même temps sur Commons, site qui héberge donc la plupart des fichiers libres de droits utilisés par Wikipédia, dans le but d'illustrer certains articles. Tout d'abord, j'ai posté quelques-unes de mes photos et me suis conformé aux règles (pas exactement fixées) des droits d'auteur. Mais au fur et à mesure des années, les administrateurs et autres personnes à statut m'ont semblé avoir un comportement de plus en plus incohérent face au soupçon de copyright : aveugles à des imports clairement douteux et sans source mais impitoyables, voire désinvoltes, avec d'autres pourtant accompagnés d'une preuve d'ancienneté suffisante ou/et d'autres garanties. Cela m'a ôté l'envie de discuter et d'y importer quoi que ce soit. Je me contente maintenant principalement de traduire le descriptif des fichiers ou de les catégoriser.

 ↑ 13. Si j'en crois ce diff, le concours de l'image de l'année POTY vous intéresse. Quels ont été vos coups de cœur ou les images qui vous ont profondément marquées depuis que vous suivez ce concours ?

Les concours d'images (principalement photographiques) Picture of the Year (POTY) organisés sur Commons chaque année depuis 2006 sont un plaisir des yeux. Depuis que je connais l'existence du concours, j'y participe régulièrement et leur fait une certaine publicité au Bistro. J'ai aidé à traduire des pages et à vérifier la validité de votes, quand tout était encore fait à la main et qu'il fallait tout refaire et repenser chaque année. Ces dernières années, une poignée de codeurs ont pris le taureau par les cornes et ont automatisé la création au maximum. Cela évite en bonne partie la triche et le recompte manuel mais il n'y a plus le charme des commentaires qui étaient aussi utiles aux photographes participants, et la tenue d'une nouvelle édition ne semble plus être décidée que par eux. Trop de photos m'ont ébloui par leur qualité ou leur sujet pour me décider de seulement quelques-unes ! J'ai découvert cependant que deux noms de photographes reviennent souvent dans les auteurs des photos que je trouve parmi les meilleures : Luc Viatour et Basile Morin (ce dernier étant aussi remarquable pour ses nombreux et excellents ambigrammes). La photo gagnante du concours 2023 est superbe en plus d'être étonnante, même si je ne l'ai pas choisie au dernier tour. Mais elle a eu droit auparavant à plein de prix et je l'avais utilisée dans le Bistro du 15 juillet 2023. Une photo remarquable plus ancienne mais découverte par moi il y a peu de temps m'a complètement désorienté au premier coup d'œil (voir mon commentaire ici).

 ↑ 14. Quel(le) wikimédien(ne) souhaiteriez-vous voir interviewé(e) dans un prochain numéro et sur quel thème ?

Il y a beaucoup de candidats possibles (et disponibles !) mais je serais curieux de Kropotkine 113, Wikipédiste chevronné toujours présent mais finalement assez discret sur les espaces de discussions grand public.

 ↑ 15. Y a-t-il un sujet particulier qui vous tient à cœur et qu’on n’a pas abordé dans cet entretien ? Vous avez carte blanche 🙂.

Je tiens à (re)dire à Cantons-de-l'Est mon plein soutien à la création d'un dictionnaire visuel (multilingue) !

 ↑ 16. Avez-vous un message particulier à adresser aux lectrices et lecteurs du RAW ? Quel serait votre mot de la fin ?

Pas particulèrement au lectorat des RAW mais plutôt aux Wikipédistes en général : si vous avez une idée, ou si une remarque vous tient à cœur, exprimez-la gentiment : on ne vous embastillera pas pour cela ! Si participer à Wikipédia devient une obsession ou un énorme boulet, prenez des vacances. Mais si rien de Wikipédia ne vous plait, alors peut-être que Wikipédia... n'est pas (ou plus) pour vous.

Merci d'avoir accepté cette interview. Bonne continuation !

L'agenda

Les autres infolettres

La page Wikipédia:RAW/Découvrir recense les infolettres et blogs relatifs à Wikimedia.

En plus de RAW, vous pouvez lire le Wikimag, newsletter hebdomadaire de la Wikipedia francophone (Voir le dernier numéro Wikipédia:Wikimag/2024/44), l'infolettre Wikifier la science (voir le dernier numéro Projet:Wikifier la science/Infolettre/Octobre 2024) et les Actualités du Wiktionnaire newsletter mensuelle du Wiktionnaire (wikt:Wiktionnaire:Actualités/114-septembre-2024).

Les anglophones peuvent aussi lire The Signpost, publié toutes les deux semaines, la newsletter hebdo de la communauté Wikidata (voir ici d:Wikidata:Status updates/2024 10 28) ou encore la newsletter du projet Wikifunction ("wikifunction:Wikifunctions:Status updates/2024-10-25).

Courrier du lectorat

(Il nous fera plaisir de lire les messages déposés ici et, si nécessaire, d'y répondre dans les plus brefs délais.)

Wikipédia face au problème du contenu généré par intelligence artificielle — L’intérêt des intelligences artificielles génératives comme ChatGPT réside, selon moi, dans leur capacité de rédaction. À partir du moment où on leur fournit une première version d’un texte sourcé, elles sont capables de le synthétiser ou de le compléter afin qu’il soit rédigé dans un style clair et encyclopédique. De ce point de vue, ce sont d’excellents assistants.
En revanche, comme dit Le chat perché, elles ne peuvent pas faire le travail à notre place, et ce pour une raison très simple : elles ne sont pas conçues pour. Ce sont des IA « probabilistes ». Elle donne le résultat « le plus probable », pas forcément le plus fiable. C’est ce qui explique qu’elles peuvent inventer un concept scientifique… qui n’existe pas, ou encore inventer des sources. Attention donc à ne pas les prendre pour ce qu’elles ne sont pas Émoticône. Merci aux rédacteurs et rédactrices du RAW, comme toujours très instructif.--Pronoia (discuter) 1 novembre 2024 à 10:10 (CET)

De mon côté, ce qui m'inquiète le plus est l'illusion de qualité avec des utilisateurs ne voyant même pas les problèmes. Pour l'exemple, question que j'ai posé hier sur quoi faire avec ce cas où il se pourrait que l'utilisateur soit de bonne foi. J'ai prévu de traduire cet essai anglais pour avoir une base pédagogique vers laquelle orienter mais si ce genre de chose se développe, faudra peut-être penser à un avertissement quelque part pour que toute personne venant contribuer sache qu'il y a des choses à ne pas faire.
Pour l'heure, le principe de signalement n'est pas encore en place côté francophone mais côté anglophone, ils ont eu 69 articles indiqués en octobre et si on en croit l'étude indiquée plus haut, il y a des chances qu'on en rate. Fabius Lector (discuter) 1 novembre 2024 à 11:50 (CET)
Je partage l'inquiétude sur l'illusion de qualité. Mais ça va au delà de l'IA.
Sinon je suis honnoré d'être cité Émoticône. Le chat perché (discuter) 1 novembre 2024 à 13:35 (CET)

Biais de surreprésentation des idées et auteurs occidentaux — Merci PAC2 pour ton outil de mesure des biais géographiques dans les articles ! Je trouve cela très parlant et assez préoccupant de voir que Wikipédia reflète avant tout les connaissances occidentales. Il y a probablement une explication historique à ça (naissance de la science moderne en Europe, développement de la plupart des disciplines universitaires en Occident + colonisation, effacement des savoirs autochtones et difficultés d'accès aux études supérieures dans beaucoup d'endroits). On a du boulot pour lutter contre ce biais ! Skimel (discuter) 2 novembre 2024 à 09:58 (CET)

Grande interview de Warp3 — Merci Warp3 pour cette interview, qui m'a diverti de mes soucis IRL. Comme d'habitude, j'ai lu des observations et des commentaires qui m'ont fait Émoticône ! — Cantons-de-l'Est p|d|d 🧹 4 novembre 2024 à 23:51 (CET)

Boîtes à livres — Merci pour la mention, je n'avais pas encore lu ce RAW, quelle bonne surprise de voir le site mentionné ! Symac (discuter) 7 novembre 2024 à 13:12 (CET) (développeur dudit site :p)

L'IA a une forte valeur ajoutée pour "aider à faire" mais jamais pour "faire à la place".
 – Le chat perché sur le Bistro.
Rédigé/traduit par L'embellie et PAC2.
Citations originales
Notes
Références
  1. Découvert via https://wikis.world/@festal@tldr.nettime.org/113243136048240433
  2. https://www.404media.co/the-editors-protecting-wikipedia-from-ai-hoaxes/
  3. en:Wikipedia:Wikipedia Signpost/2024-10-19/Recent research
  4. Pour les plus curieuses et les plus curieux, la méthode Binoculars est une méthode de détection des textes générés par des grands modèles de langage qui s'appuie sur la « perplexité croisée  » de deux grands modèles de langage. Pour en savoir plus : https://arxiv.org/html/2401.12070v3
  5. a et b (en) Creston Brooks, Samuel Eggert et Denis Peskoff, « The Rise of AI-Generated Content in Wikipedia », {{Article}} : paramètre « périodique » manquant,‎ (lire en ligne).
  6. « Since 2017, Herron’s two accounts have made more than 300 contributions to pages on Wikipedia, of which more than half are entirely embellishments to Herron’s page, but there are notable deletions of positive content from the pages of Dauwalter, 2018 Boston Marathon champion Des Linden and Greek ultrarunning legend Yiannis Kouros. »- Merci DeepL pour la traduction. C'est pas parfait mais c'est pratique :).
  7. Victor Garcia, « Patrick Hetzel, un ministre bien peu scientifique : enquête sur le discret nettoyage de sa page Wikipédia », L’Express, (consulté le )
  8. https://x.com/WikiResearch/status/1843699094579229068
  9. Découvert via d:Wikidata:Status_updates/2024_10_14
  10. « As the saying goes, we move fast and break things: Wikidata is getting too big, too fast. The Wikidata Query Service graph got so huge it will be split, and the growth of the core database is deemed unsustainable. »
  11. « Let’s have it for slow data. Let’s make edits that take minutes rather than racking tens per second. (And sure, “It’s not the quantity, it’s the quality” is an old Wikipedia trope, at times ill-used, but not wrong per se.) »
  12. Traduit avec DeepL.com (version gratuite) « This does not mean not creating new items. But it does mean creating them more intentionally. The old, somewhat hyperbolic jest is that Wikipedia is full of articles that « no-one will ever read » (and I have done my fair share of that!) ; but on Wikidata, we sure have items that were not even created by someone, merely by something. »
  13. https://wikidata-game.toolforge.org/#
  14. https://observablehq.com/@pac02/explore-gender-diversity-in-a-single-wikipedia-article
  15. https://observablehq.com/@pac02/articles-wikilinks-inspector
  16. https://observablehq.com/@pac02/olympic-medals-by-continent
  17. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Intelligence%20artificielle
  18. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Philosophie
  19. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Amour
  20. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Musique
  21. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Humanit%C3%A9
  22. J'emprunte l'expression reste du monde au média Rest of world : https://restofworld.org/about/
  23. https://www.wikimedia.fr/participer-au-prix-wikimedia-de-la-recherche/

Numéro du 18 novembre 2024

Monday, 18 November 2024 00:00 UTC

Éloge de la lenteur / L'édito de PAC2 — Depuis 2 ans que je contribue activement à RAW, la question de l'intelligence artificielle revient régulièrement dans l'actualité de Wikimédia. Ce numéro n'échappe pas à la règle et on retrouve encore dans ce numéro des inquiétudes face à la tentation de l'IA. À rebours des « accélérationnistes » qui veulent utiliser l'IA pour contribuer plus vite et mettre toujours plus de contenu, Jean-Frédéric sur le blog The Commonist fait un éloge bienvenu de la lenteur et de la contribution artisanale.

Vous trouverez aussi ce mois-ci une interview de Warp3 et un format atelier pour réfléchir à la représentation des personnalités des différents continents dans les articles Wikipédia.

Les brèves

Wikipédia face au problème du contenu généré par intelligence artificielle — Sur la Wikipédia anglophone, la communauté a créé un projet spécifique pour lutter contre le problème des contenus générés par intelligence artificielle mal sourcés et mal écrits[1]. 404 média revient en détail sur les enjeux. Un article anglophone sur la forteresse Amberlihisar, qui n'a jamais existé, constitue un bon exemple de mauvais recours à l'IA. L'IA a notamment généré des références parfaitement mises en forme mais totalement fictives. Le projet AI Cleanup recense aussi les images synthétiques. Certaines sont légitimes et sont utilisées à bon escient mais d'autres sont manifestement trompeuses[2].

Dans son édition du 19 octobre, The Signpost revient sur un récent article académique cherchant à quantifier la part de nouveaux articles générés avec de grands modèles de langage[3]. L'article intitulé « The Rise of AI-Generated Content in Wikipedia » utilise deux détecteurs automatiques de grands modèles de langage, GPTZero et Binoculars[4] pour estimer la proportion d'articles contenant des morceaux générés par des grands modèles de langage parmi les articles créés en août 2024[5].

« À l'aide de deux outils, GPTZero et Binoculars, nous détectons que jusqu'à 5 % des 2 909 articles anglais de Wikipédia créés en août 2024 contiennent un contenu significatif généré par l'IA. Les seuils de classification des deux outils ont été calibrés pour maintenir un taux de faux positifs ne dépassant pas 1 % sur une base Wikipédia pré-GPT-3.5, comme indiqué par la ligne rouge[5]. »

Sur la Wikipédia francophone, Fabius Lector a créé le projet Projet:Observatoire des IA et Simonk a initié un essai sur l'intelligence artificielle.

Logo de la conférence

WikiIndaba2024 — La conférence WikiIndaba, consacrée à la présence de l'Afrique sur Wikipédia, a eu lieu du 4 au 6 octobre à Johannesbourg.

Camille Herron, championne d'ultra-marathon et wikipédienne sous les pseudos Rundbowie et Temporun73.

La coureuse Camille Herron accusée de manipuler Wikipedia — La coureuse Camille Herron et son mari et entraîneur Conor Holt sont accusés d'avoir manipulé Wikipédia en diminuant le palmarès de concurrentes de Camille Herron.

« Depuis 2017, les deux comptes de Herron ont apporté plus de 300 contributions à des pages de Wikipédia, dont plus de la moitié sont entièrement des embellissements de la page de Herron, mais il y a des suppressions notables de contenu positif des pages de Dauwalter, du champion du marathon de Boston 2018 Des Linden et de la légende grecque de l'ultrarunning Yiannis Kouros[6]. »

Patrick Hetzel est ministre de l'enseignement supérieur et de la recherche dans le gouvernement de la République française depuis septembre 2024.

Le cabinet du ministre de l'enseignement supérieur et de la recherche français manipule Wikipédia ! — Une enquête du magazine L'Express révèle que le cabinet du nouveau ministre de l'enseignement supérieur et de la recherche français, Patrick Hetzel, a tenté de manipuler la biographie Wikipedia du ministre[7].

Florence Devouard, ancienne présidente de la fondation Wikimédia, est à l'initiative de la campagne SheSaid.

Florence Devouard interviewée sur l'initiative SheSaidDiff, le blog de la communauté interviewe Florence Devouard sur l'initiative de la campagne SheSaid.

« J'ai remarqué très tôt que les femmes étaient peu nombreuses dans nos projets, mais je ne me suis vraiment impliquée dans la lutte contre l'écart entre les sexes que lorsque Isla Haddow-Flood et moi-même avons lancé l'initiative Wiki Loves Women en 2016. Nous avons exploré différentes stratégies pour recruter plus de femmes, fournir un environnement plus inclusif, former et soutenir, mettre en œuvre différentes stratégies. Le sujet est complexe. En 2020, en pleine pandémie, j'ai lancé l'idée de #SheSaid... et nous voilà 4 ans plus tard ! »

Boîte à livres à Amboise, France.

11 000 boîtes à livres recensées — Le site boîtes-à-livres.fr recense les boîtes à livres en France en s'appuyant sur OpenStreetMap et Wikimédia Commons. On y trouve maintenant plus de 11 000 boîtes à livres.

Tous les chemins entre deux éléments Wikidata — Des chercheurs ont développé un nouvel outil capable de trouver tous les chemins possibles entre deux entités Wikidata[8].

Articles les plus centraux — L'université de Milan publie la liste des articles les plus centraux de Wikipédia (à priori uniquement la version anglophone).

C'est la saison des Nobel — Chaque année les différents prix Nobel sont remis début octobre. C'est l'occasion de remettre à jour et de développer de nouveaux notebooks consacrés aux Nobel.

Comme pour les jeux olympiques, on peut calculer la concentration des prix par pays de nationalité à partir d'une requête Wikidata.

Les États-Unis sont en tête du classement pour le prix Nobel de médecine, le prix Nobel de physique, le prix Nobel de la paix et le prix Nobel de Chimie. La France est en tête pour le prix Nobel de littérature. Les États-Unis obtiennent près de 40% des prix en médecine et plus de 32% des prix en physique et en chimie ! Parmi les cinq prix Nobel historique, c'est le prix Nobel de littérature qui est le plus diversifié en terme de pays de nationalité.

Jean-Frédéric propose l'approche SNAIL, acronyme de « Slow, NArrow, In-depth, Local », ce qu'on peut traduire par « Lent, précis, en profondeur et local ».

L'approche escargot ou l'éloge de la lenteur — Sur le blog The Commonists, Jean-Frédéric propose une approche escargot à la contribution #Wikidata 🐌[9]!

Plutôt que de faire de l'édition en masse, il propose de prendre le temps de faire de la contribution manuelle.

« Comme le dit le proverbe, nous allons vite et nous cassons des choses : Wikidata devient trop gros, trop vite. Le graphique du service d'interrogation de Wikidata a pris une telle ampleur qu'il sera scindé, et la croissance de la base de données principale est jugée insoutenable[10]. »

Plutôt que d'utiliser QuickStatement ou OpenRefine, Jean-Frédéric propose l'approche lente en s'inspirant du mouvement lent :

« Faisons ça avec les données lentes. Faisons des modifications qui prennent des minutes au lieu d'en faire des dizaines par seconde. (Et bien sûr, "Ce n'est pas la quantité, c'est la qualité" est un vieux trope de Wikipedia, parfois mal utilisé, mais pas faux en soi)[11]. »

« Cela ne signifie pas qu'il ne faut pas créer de nouveaux articles. Mais cela signifie qu'il faut les créer plus intentionnellement. La vieille plaisanterie, quelque peu hyperbolique, est que Wikipédia est pleine d'articles que " personne ne lira jamais " (et j'en ai fait ma part !) ; mais sur Wikidata, nous avons certainement des articles qui n'ont même pas été créés par quelqu'un, mais simplement par quelque chose[12]. »

Une nouvelle interface pour contribuer aux données lexicographiques de Wikidata — Lexico est une nouvelle interface qui permet de faciliter la contribution aux données lexicographiques (lexemes) sur Wikidata. Le principe rappelle les Wikidata Games de Magnus Manske[13].

65 000 citations sur Wikiquote — Wikiquote en français compte désormais 65 000 citations réparties sur près de 9 000 pages.

L'atelier

Dans cette section, un(e) wikimédien(ne) peut raconter un de ses bricolages à la première personne.

Ce mois-ci c'est PAC2 qui raconte comment il a bricolé un outil pour mesurer les biais de Wikipedia.

Il y a quelques années, j'avais développé le Gender Diversity Explorer, un petit outil en ligne qui récupère tous les liens bleus d'un article Wikipédia (ie les mentions), récupère la valeur de la propriété P21 (Sexe ou genre) dans l'élément Wikidata associé et calculé des statistiques de genre sur la répartition des entités nommées dans l'article[14].

L'approche se généralise facilement à n'importe quelle propriété dans Wikidata. C'est ce que propose le Wikilinks inspector[15].

Pour réfléchir à la représentation de certains continents comme l'Afrique ou l'Amérique du Sud, j'avais besoin d'adapter l'outil et de trouver un bon moyen de faire la correspondance entre des pays et des continents. C'est mon travail sur la répartition des médailles aux jeux olympiques qui m'a permis de trouver le bon moyen d'obtenir une correspondance à peu près pertinente entre pays et continents[16].

Techniquement, la magie vient toujours de la possibilité d'appeler l'api Wikimédia depuis une requête SPARQL :

SELECT ?item ?itemLabel ?country ?countryLabel 
WHERE {
  SERVICE wikibase:mwapi {
     bd:serviceParam wikibase:endpoint "fr.wikipedia.org";
                     wikibase:api "Generator";
                     mwapi:generator "links";
                     mwapi:titles "Intelligence artificielle";.
     ?item wikibase:apiOutputItem mwapi:item.
  } 
  FILTER BOUND (?item)
  ?item wdt:P31 wd:Q5 . 
  ?item wdt:P27 ?country . 
  ?country rdfs:label ?countryLabel filter (lang(?countryLabel) = "en") .
  ?item rdfs:label ?itemLabel filter (lang(?itemLabel) = "en") .
}

Cliquez pour essayer !

On combine ça ensuite avec la requête sur les continents et le tour est joué :

SELECT DISTINCT ?continent ?continentLabel ?country  ?code WHERE {
VALUES ?continent {
wd:Q55643
wd:Q48
wd:Q15
wd:Q18
wd:Q49
wd:Q46
} 
 ?continent (wdt:P527*) ?country.
  ?country 
    wdt:P2082 ?code.
  SERVICE wikibase:label { bd:serviceParam wikibase:language "en". }
}

Cliquez pour essayer !

Venons en maintenant aux résultats. Si on prend un article sur un thème très général et si Wikipedia représente l'ensemble des connaissances sur un sujet, on devrait s'attendre à avoir une représentation de personnalités de tous les continents dans les entités mentionnées dans un article.

Maintenant, quand on regarde l'article Intelligence artificielle, on trouve 69 personnalités nord-américaines, 58 personnalités européennes, 9 personnalités non classées pour seulement 6 personnalités asiatiques, 5 personnalités africaines, 3 personnalités oceaniennes et 2 personnalités sud-americaines[17].

L'article Philosophie mentionne 158 personnalités européennes mais aucune personnalité africaine[18].

L'article Amour mentionne une personnalité africaine pour 58 personnalités européennes[19].

L'article Travail ne mentionne aucune personnalité africaine, aucune personnalité asiatique ou aucune personnalité sud-américaine contre 23 personnalités européennes.

Même bilan avec l'article Musique : 36 personnalités européennes, 6 nord américaines et 1 océanienne mais aucune personnalité asiatique, africaine ou sud-américaine[20].

On pourrait penser que l'article consacré à l'humanité mentionnerait des personnalités de tous les continents. Ça n'est pas le cas. On ne compte aucun représentant de l'Océanie, de l'Afrique et de l'Asie dans l'article[21].

On peut multiplier les exemples et on voit que les continents nord-americains et européens sont largement représentés alors que les autres continents et notamment l'Afrique et l'Amérique du Sud sont représentés de manière marginale dans les articles généraux de l'encyclopédie.

Il y a sans doute de multiples raisons à ce déséquilibre. L'outil peut nous aider à prendre conscience du déséquilibre et chercher, article par article, des idées pour mieux représenter les personnes des continents sous représentés. En creux, on en vient à se demander si Wikipedia représente la « somme de toutes les connaissances » ou simplement le point de vue européen et nord-américain. Le point de vue du « reste du monde » est aujourd'hui manifestement peu représenté dans Wikipedia[22].

La grande interview

Dans cette section, nous donnons la parole à des wikimédien(ne)s sur des thèmes donnés afin de recueillir leurs avis ou les faire parler tout simplement de leurs expériences dans le mouvement.

Entretien avec Warp3

Ses activités wikimédiennes.
Par écrit sur cette page.
L'embellie.
Merci à Noé et Cantons-de-l'Est pour les suggestions de questions.
 ↑ 1. Bonjour Warp3. Merci d'avoir accepté cet entretien après que Cantons-de-l'Est vous ait suggéré comme invité. Pour commencer, je vous laisse vous présenter.

Comme beaucoup de Wikipédistes anciens et français, j'ai connu les débuts d'Internet en France en entreprise puis à domicile, période riche en projets informatiques de toutes les sortes. Intéressé par les articles de vulgarisation dans plusieurs domaines, j'eus vent d'un projet de réalisation d'une encyclopédie à accès gratuit sur le Net, qui s'appelait Wikipédia. Il y avait alors quelques autres encyclopédies comme Encarta de Windows, sur disquettes ou CD, mais assez chères, et les rares encyclopédies gratuites étaient très limités dans leur étendue et d'usage pas bien pratique. Le premier contact avec ce projet balbutiant fut une relative déception : peu d'articles et pas grand-chose dedans.

J'y revins quelques années après... et c'était déjà beaucoup mieux ! Peu à peu, je trouvais le plus souvent un article de Wikipédia après une recherche avec Google, et je m'étonnais que, même si l'article était peu développé, il répondait au minimum à la question « qu'est-ce que c'est ? ». Je faisais alors quelques apports ou corrections minimes, à l'occasion. Quelque trois ans après, fort d'avoir parcouru des pages d'aides et de règles (pas faciles à trouver) ainsi que plusieurs discussions, je fus fin prêt à prendre un compte... mais j'ai attendu encore deux ans avant de m'incrire fin juin 2008, sur un coup de tête. Première constatation après : hors l'accueil (automatique), l'impression d'être complètement seul à se dépatouiller dans l'édition (les pages de discussions des articles sont très souvent vides), jusqu'à me demander où se retrouvaient les Wikipédistes. C'est sur quelques pages plus spécifiques qu'ils se « cachaient », dont un certain Bistro.

Ma page de présentation contient un peu de mon état d'esprit au moment de l'inscription (elle est succinte et un peu ancienne maintenant, mais elle reste encore d'actualité). J'appris qu'il fallait s'inscrire aussi à un autre projet : WM Commons, afin d'ajouter des images (y compris les siennes) à un article. C'était cependant une façon de découvrir que Wikipédia s'appuie sur d'autres projets. Et puis, par curiosité, je visitai d'autres projets encore... (suspense)

 ↑ 2. Comment êtes-vous arrivé dans le mouvement Wikimédia ? Sur quel wiki en premier et comment avez-vous découvert les autres projets ?

Après Wikipédia, puis Commons, j'ai examiné plusieurs autres projets et enfin Wikimédia.

Au début, Wikimédia n'était pas un vrai mouvement mais une entreprise qui mettait en place Wikipédia, l'encyclopédie libre, dans de nombreuses langues puis soutenait d'autres projets voisins de l'encyclopédie. Wikimedia, utilisant des logiciels libres et parfois sous domaine public, s'est mis à promouvoir aussi le développement du libre. C'est plus récemment que la fondation Wikimédia, d'abord à travers la diffusion des projets et par leur utilisation avec tous, en fournissant les moyens de se connecter jusque dans les régions dépourvues d'accès au Net, est devenue un mouvement de développement local et privilégie l'intégration sociale.

j'ai cherché à comprendre l'organisation des projets par rapport à Wikimédia, comme l'existence des chapitres pour chaque projet dans un pays donné. J'ai fait ainsi au passage un peu de traduction de pages en anglais sur Wikimédia (à partir de 2015), participé plus ou moins à divers projets dont Wikiquote (fr), Wikisource, Wiktionnaire, Wikilivres. Je me suis aussi intéressé au thème de l'humour et enrichi le contenu de son portail à partir de 2015.

 ↑ 3. En vous présentant, Cantons-de-l'Est écrit : « Il trouve régulièrement des images qu'il « décore » de légendes savoureuses. » C'est dans cette activité que je vous ai aussi connu notamment sur le Bistro ou dans d'autres sections de discussions. Quand et comment avez-vous commencé à illustrer Le Bistro ?

Ce doit être le 15 décembre 2009, avec le drapeau de l'Acadie. Le calendrier du Bistro est né le 14 septembre 2005 et a vite évolué : la première illustration date du 7 novembre, la première image commentée est du 25 novembre de la même année. L'habitude est prise de décorer assez régulièrement le calendrier dès 2006. Les images avec leurs commentaires sont dans le ton du bistro, souvent légères et comiques, alternant avec des rappels de faits historiques. D'autres images se trouvent parfois ailleurs dans les discussions. Elles décrivent un aspect ou l'autre de Wikipédia en français, de ses débats.

On retrouve alors souvent DocteurCosmos en illustrateur du calendrier. Il se chargeait de l'illustrer avec un tour souvent amusant quand personne d'autre ne l'avait fait. C'est cette façon ludique qui m'a conduit à oser une première illustration dans ce petit espace en haut à droite de chaque page quotidienne du Bistro. J'ai augmenté progressivement mon implication dans ce cadre, comme une sorte de détente après un tas de modification dans les articles. Comme on pourra vérifier, les histoires de cabales et de chats au Bistro existaient depuis au moins 2006, bien avant mon arrivée Émoticône !

 ↑ 4. Vos choix d'illustration, vos légendes ainsi que parfois (souvent ?) vos commentaires de modifications sont tantôt profondes, tantôt légères, mais revêtent toujours une certaine beauté selon moi. Où trouvez-vous l'inspiration ?
— Warp3 ? Mmm... Attendez que je zoome sur l'image... Non, connais pas.

Voilà une question qui doit certainement tarabuster Cantons-de-l'Est depuis des années Émoticône. Il y a de nombreuses façons pour moi de trouver une idée de Bistro, idée souvent de type comique. Le cas le plus courant : c'est au cours de mes périgrinations quasi aléatoires sur Wikipédia et Commons que se fait la découverte de photos ou de dessins qui sont déjà comiques ou étonnantes en elle-même, ou quand leur rapport me semble raconter une historiette ; une sorte de hasard heureux peut-on dire. Sinon, quand j'ai une idée précise, quelques fois inspirée par l'actualité de wpfr, je cherche dans la catégorie idoine celles qui peuvent faire l'affaire. Et il m'arrive aussi d'élaborer des gags un peu plus complexes au saut du lit Émoticône. Dans un premier temps, j'ajoutais un lien vers une vidéo Youtube pour illustrer avec de la musique ou avec un sketch. Mais quelqu'un(e) m'a fait savoir que Commons héberge aussi des fichiers de musiques, qui sont libres de droits, contrairement aux vidéos Youtube. Depuis, je fouine dans les diverses catégories, et en place quelques-unes aux emplacements qui me semblent les plus appropriés. Cette bibliothèque de musiques (et de vidéos), pas assez connue à mon avis ni assez utilisée, semble s'être fortement enrichie ces dernières années.

Chaque fois que je place une illustration assortie d'un commentaire, je ne sais pas vraiment comment cela va être reçu, car il n'y a presque jamais de commentaires sur place ou sur ma page. En général, sur WP, quand personne ne fait de commentaire sur votre modification sur un article, ça signifie qu'elle est plus ou moins acceptée et je me figure que c'est pareil avec une image. Mais c'est comme être sur un bout de scène avec un public derrière une cloison, invisible et muet, qui peut une fois dans la rue faire un petit signe discret de connivence ou au contraire flanquer une claque, sans que je sache trop pour quoi.

 ↑ 5. Utilisez-vous des outils en particulier pour retrouver des images, les archiver, s'en souvenir ? Comment effectuez-vous vos recherches ?

Sur les projets : très peu, en fait. J'ai même décoché tout un tas de gadgets mis par défaut dans mes préférences. J'utilise parfois un éditeur de texte autre que celui de base. Pour les recherches, il arrive que c'est par les images que je retrouve certaines pages ou informations. Mais dans mes recherches d'un fichier sur Commons, je n'utilise guère le gadget fourni, qui retourne n'importe quoi tant qu'il existe dans le nom du fichier une seule erreur, ou que le nom n'est pas assez complet. Utiliser un moteur de recherche extérieur donne plus de chance de trouver le fichier cherché. Et, non, je ne fais pas de recherche SPARQL à travers WikiData, malgré les nombreux exemples donnés par les RAW (!). Question visuels, j'utilise les pauvres logiciels de base de Windows : mspaint, photo, wordpad, bloc-notes. Oui, frugalité extrême... il y a de quoi rire !

 ↑ 6. Assidu du Bistro, qu'aimez-vous y trouver et quelle est la raison d'être que vous donnez à cet espace communautaire ?

Quand j'ai découvert le Bistro à l'époque de mon inscription, je pensais y trouver une sorte d'assemblée très sérieuse réglant avec précision l'avenir de l'Encyclopédie, alors que c'était plutôt une sorte d'auberge espagnole bruyante et un tantinet folle. Le Bistro actuel est en majorité le rendez-vous de toutes les personnes un peu anciennes désireuses de débattre, et parfois d'informer la Wikipédie. C'est le lieu pour poser ses questions avec de grandes chances d'avoir au moins une réponse, que l'on soit novice ou non. Certains débats sont cependant si extravagants que je finis par les trouver rigolos ! Je préfère cependant le discours plus léger tenu par d'autres personnes, comme il arrivait souvent dans les premières années de l'existence du Bistro.

 ↑ 7. Comment trouvez-vous la convivialité et l'ambiance en général au sein de la communauté ?

La communauté de Wikipédia en français est diverse, très partagée sur plusieurs thèmes (inclusionnisme/suppressionnisme, paternalisme/féminisme, fair-use, Comité d'arbitrage (CAr), etc.) depuis au moins 2006 sur les espaces de discussions. Ce n'est que par l'observance des règles établies et de la volonté de participer sereinement à la création et à la maintenance des articles que l'on peut dire qu'il existe une sorte de lien solidaire entre les membres. L'ambiance peut être bonne ou mauvaise selon l'importance que l'on porte à ces thèmes. Il est ainsi possible d'avoir de bons rapports en travaillant sans apriori avec des personnes dans un espace d'articles peu polémiques (potentiellement plusieurs millions Émoticône) .

 ↑ 8. Quel type de wikipédien êtes-vous ? Comment décririez-vous votre manière de contribuer sur l'encyclopédie ?

Si j'ai pris un compte sur Wikipédia, c'est aussi parce que je me sentais redevable de tant d'informations offertes sans contreparties de ma part. J'ai commencé par des corrections orthographiques et quelques reformulations, mais ne me destinais pas à faire beaucoup plus. C'est en voyant l'état de quasi ébauche de l'article Bugs Bunny que je me suis décidé à le développer, par traduction de l'article anglophone. Aussi, le goût me prit de continuer des articles initiés par d'autres, d'abord dans le domaine du dessin animé alors presque déserté hormis le champ disneyien, puis dans d'autres domaines.

Wikipédiste papillonnant, assez solitaire, je passe d'un sujet à l'autre selon mes goûts du moment. L'Amérique de la période située entre 1850 et 1950, le cinéma (Warner Bros. surtout) et la musique sont autant de sujets qui m'intéressent le plus. Malgré une bonne centaine d'articles créés et pas mal de traductions de l'anglais (je vous conseille DeepL comme base) depuis plus de 15 ans, je me considère encore comme un petit rédacteur-relecteur (et suis étonné de faire partie des mille premiers modificateurs actifs de WP). Je n'ai d'ailleurs développé aucun article jusqu'à un niveau de labellisation.

 ↑ 9. Créateur de plus de 110 articles, quand considérez-vous que le sujet d'un article est épuisé avant de passer à un autre ? Quels sentiments cela vous inspire de savoir qu'il reste tant à faire sur le wiki ?

Un article très pointu (dit « d'intéret faible » dans les évaluations), comme un certain type d'invertébré marin très peu connu, s'il est traité pleinement à travers toute la documentation existante, devient un article abouti. S'il n'a pas sa belle étoile doré d'article de qualité, c'est tant pis, mais cela n'enlève rien à son degré d'achèvement. Inversement, sur un article portant sur un sujet connu où la documentation abonde, ou alors un article généraliste, il faut non seulement traiter tous les angles de vue mais aussi rester synthétique (et faire des articles secondaires), et le travail de retrait devient aussi important que celui d'ajout.

Pour ma part, les articles en anglais que je traduis, qui me plaisent, ne sont que rarement des articles complets avec labels de qualité. Je vérifie les sources et complète certains détails, mais je les sais très perfectibles. Le minimum, au-delà des sources, est que la lectrice ou le lecteur puisse se faire au moins une bonne idée du sujet, typiquement un résumé introductif (RI).

Une majorité d'articles de Wikipédia sont (encore) des ébauches ou des articles à peine développés. Tant que des sources sûres justifient l'existence d'un article et qu'il dispose d'une sorte de RI, je considère celui-ci comme valable (en tant que lecteur). Contrairement à d'autres Wikipédistes, cette masse de mini articles ne me semble pas dommageable à l'image de l'encyclopédie, au contraire ! Mieux vaut un article minimum (mais bon) que rien du tout. C'est la multiplicité des articles qui fait l'une des forces de l'Encyclopédie. Les articles faux (canulars) sont, en revanche, une plaie et à éradiquer au plus vite (merci les admins et les vigilant(e)s).

 ↑ 10. En considérant votre expérience sur le wiki, qu'est-ce qui vous a procuré le plus grand plaisir sur Wikipédia ? Au contraire, qu'est-ce qui vous a le plus marqué négativement ?

Il n'y a pas beaucoup d'expériences à vivre sur Wikipédia si on reste à faire des modifications légères sur des articles sans controverses, voire peu lus. Mais dès que l'on prend un compte et que l'on s'attaque à certains gros articles, on rencontre fatalement une partie de la « communauté» hétéroclite wikipédienne.

Il y a eu plusieurs heureuses rencontres, mais je crois que l'une des plus heureuses fut celle de la création des RAW, journal à la fois très instructif et bien présenté par son créateur (mais non, je ne fais pas de la publicité éhontée !). Après réflexion, je dirais que la pire rencontre arriva deux mois après mon inscription, à propos d'une discussion sur ma page de discussion avec un Wikipédien dynamique, aujourd'hui admin actif. Juste après un de mes propos pourtant assez mesuré, déboula sur ma page un parfait inconnu qui se mit à me faire une leçon wikipédienne magistrale dans le plus pur style des « anciens » s'adressant à un complet ignorant. J'avais beau m'être mentalement préparé à des avis extrêmes ou divagants, ce genre d'attaque très limite fut fort désagréable, surtout quand elle fut appuyée par d'autres.

 ↑ 11. Quels seront selon vous les plus grands défis de Wikipédia en français dans les cinq prochaines années ?

Je ne suis pas dans le secret des dieux, mais je crois percevoir :

- L'arrivée de l'intelligence articielle (IA, donc) sur WP est un peu ce que depuis longtemps des Wiképidistes appelaient de leurs vœux pour traiter les millions d'articles de façon automatique. Est-ce la bonne formule ? On peut en douter, dans l'état actuel. Le bon usage de cette IA sur WP reste à définir, et à faire évoluer en même temps qu'elle. Peut-elle éclipser WP même ? La boule de cristal est floue, rappelez plus tard Sourire diabolique.

- Les nouvelles structures qui se mettent lentement en place sous l'égide de Wikimédia, et qui semblent être complètement ignorées du gros de la communauté wikipédienne francophone, mis à part l'application du Code de conduite universel dans les règles de wpfr.

- Maintenir une certaines cohésion entre les membres des Wikipédistes, faire évoluer certaines mentalités ; attirer de nouveaux membres actifs ; se prémunir contre les nouvelles formes d'atteintes aux articles : publicitaires, politiques ou autres ; trouver (et financer) un moyen pérenne de conserver les traces des sources sur Internet.

 ↑ 12. Que pensez-vous des médias qui sont stockés sur Wikimedia Commons et du wiki en général ?

(Wikimedia) Commons est un site énorme, qui recueille des documents (hors textes), pas seulement des photos mais aussi des vidéos et des fichiers sonores. Des musées et institutions prestigieux sont sollicités, ce qui fait que des images exceptionnelles, historiques, y sont copiés et cotoient le reste, inimaginable tant il y en a.

Je me suis incrit presque en même temps sur Commons, site qui héberge donc la plupart des fichiers libres de droits utilisés par Wikipédia, dans le but d'illustrer certains articles. Tout d'abord, j'ai posté quelques-unes de mes photos et me suis conformé aux règles (pas exactement fixées) des droits d'auteur. Mais au fur et à mesure des années, les administrateurs et autres personnes à statut m'ont semblé avoir un comportement de plus en plus incohérent face au soupçon de copyright : aveugles à des imports clairement douteux et sans source mais impitoyables, voire désinvoltes, avec d'autres pourtant accompagnés d'une preuve d'ancienneté suffisante ou/et d'autres garanties. Cela m'a ôté l'envie de discuter et d'y importer quoi que ce soit. Je me contente maintenant principalement de traduire le descriptif des fichiers ou de les catégoriser.

 ↑ 13. Si j'en crois ce diff, le concours de l'image de l'année POTY vous intéresse. Quels ont été vos coups de cœur ou les images qui vous ont profondément marquées depuis que vous suivez ce concours ?

Les concours d'images (principalement photographiques) Picture of the Year (POTY) organisés sur Commons chaque année depuis 2006 sont un plaisir des yeux. Depuis que je connais l'existence du concours, j'y participe régulièrement et leur fait une certaine publicité au Bistro. J'ai aidé à traduire des pages et à vérifier la validité de votes, quand tout était encore fait à la main et qu'il fallait tout refaire et repenser chaque année. Ces dernières années, une poignée de codeurs ont pris le taureau par les cornes et ont automatisé la création au maximum. Cela évite en bonne partie la triche et le recompte manuel mais il n'y a plus le charme des commentaires qui étaient aussi utiles aux photographes participants, et la tenue d'une nouvelle édition ne semble plus être décidée que par eux. Trop de photos m'ont ébloui par leur qualité ou leur sujet pour me décider de seulement quelques-unes ! J'ai découvert cependant que deux noms de photographes reviennent souvent dans les auteurs des photos que je trouve parmi les meilleures : Luc Viatour et Basile Morin (ce dernier étant aussi remarquable pour ses nombreux et excellents ambigrammes). La photo gagnante du concours 2023 est superbe en plus d'être étonnante, même si je ne l'ai pas choisie au dernier tour. Mais elle a eu droit auparavant à plein de prix et je l'avais utilisée dans le Bistro du 15 juillet 2023. Une photo remarquable plus ancienne mais découverte par moi il y a peu de temps m'a complètement désorienté au premier coup d'œil (voir mon commentaire ici).

 ↑ 14. Quel(le) wikimédien(ne) souhaiteriez-vous voir interviewé(e) dans un prochain numéro et sur quel thème ?

Il y a beaucoup de candidats possibles (et disponibles !) mais je serais curieux de Kropotkine 113, Wikipédiste chevronné toujours présent mais finalement assez discret sur les espaces de discussions grand public.

 ↑ 15. Y a-t-il un sujet particulier qui vous tient à cœur et qu’on n’a pas abordé dans cet entretien ? Vous avez carte blanche 🙂.

Je tiens à (re)dire à Cantons-de-l'Est mon plein soutien à la création d'un dictionnaire visuel (multilingue) !

 ↑ 16. Avez-vous un message particulier à adresser aux lectrices et lecteurs du RAW ? Quel serait votre mot de la fin ?

Pas particulèrement au lectorat des RAW mais plutôt aux Wikipédistes en général : si vous avez une idée, ou si une remarque vous tient à cœur, exprimez-la gentiment : on ne vous embastillera pas pour cela ! Si participer à Wikipédia devient une obsession ou un énorme boulet, prenez des vacances. Mais si rien de Wikipédia ne vous plait, alors peut-être que Wikipédia... n'est pas (ou plus) pour vous.

Merci d'avoir accepté cette interview. Bonne continuation !

L'agenda

Les autres infolettres

La page Wikipédia:RAW/Découvrir recense les infolettres et blogs relatifs à Wikimedia.

En plus de RAW, vous pouvez lire le Wikimag, newsletter hebdomadaire de la Wikipedia francophone (Voir le dernier numéro Wikipédia:Wikimag/2024/44), l'infolettre Wikifier la science (voir le dernier numéro Projet:Wikifier la science/Infolettre/Octobre 2024) et les Actualités du Wiktionnaire newsletter mensuelle du Wiktionnaire (wikt:Wiktionnaire:Actualités/114-septembre-2024).

Les anglophones peuvent aussi lire The Signpost, publié toutes les deux semaines, la newsletter hebdo de la communauté Wikidata (voir ici d:Wikidata:Status updates/2024 10 28) ou encore la newsletter du projet Wikifunction ("wikifunction:Wikifunctions:Status updates/2024-10-25).

Courrier du lectorat

(Il nous fera plaisir de lire les messages déposés ici et, si nécessaire, d'y répondre dans les plus brefs délais.)

Wikipédia face au problème du contenu généré par intelligence artificielle — L’intérêt des intelligences artificielles génératives comme ChatGPT réside, selon moi, dans leur capacité de rédaction. À partir du moment où on leur fournit une première version d’un texte sourcé, elles sont capables de le synthétiser ou de le compléter afin qu’il soit rédigé dans un style clair et encyclopédique. De ce point de vue, ce sont d’excellents assistants.
En revanche, comme dit Le chat perché, elles ne peuvent pas faire le travail à notre place, et ce pour une raison très simple : elles ne sont pas conçues pour. Ce sont des IA « probabilistes ». Elle donne le résultat « le plus probable », pas forcément le plus fiable. C’est ce qui explique qu’elles peuvent inventer un concept scientifique… qui n’existe pas, ou encore inventer des sources. Attention donc à ne pas les prendre pour ce qu’elles ne sont pas Émoticône. Merci aux rédacteurs et rédactrices du RAW, comme toujours très instructif.--Pronoia (discuter) 1 novembre 2024 à 10:10 (CET)

De mon côté, ce qui m'inquiète le plus est l'illusion de qualité avec des utilisateurs ne voyant même pas les problèmes. Pour l'exemple, question que j'ai posé hier sur quoi faire avec ce cas où il se pourrait que l'utilisateur soit de bonne foi. J'ai prévu de traduire cet essai anglais pour avoir une base pédagogique vers laquelle orienter mais si ce genre de chose se développe, faudra peut-être penser à un avertissement quelque part pour que toute personne venant contribuer sache qu'il y a des choses à ne pas faire.
Pour l'heure, le principe de signalement n'est pas encore en place côté francophone mais côté anglophone, ils ont eu 69 articles indiqués en octobre et si on en croit l'étude indiquée plus haut, il y a des chances qu'on en rate. Fabius Lector (discuter) 1 novembre 2024 à 11:50 (CET)
Je partage l'inquiétude sur l'illusion de qualité. Mais ça va au delà de l'IA.
Sinon je suis honnoré d'être cité Émoticône. Le chat perché (discuter) 1 novembre 2024 à 13:35 (CET)

Biais de surreprésentation des idées et auteurs occidentaux — Merci PAC2 pour ton outil de mesure des biais géographiques dans les articles ! Je trouve cela très parlant et assez préoccupant de voir que Wikipédia reflète avant tout les connaissances occidentales. Il y a probablement une explication historique à ça (naissance de la science moderne en Europe, développement de la plupart des disciplines universitaires en Occident + colonisation, effacement des savoirs autochtones et difficultés d'accès aux études supérieures dans beaucoup d'endroits). On a du boulot pour lutter contre ce biais ! Skimel (discuter) 2 novembre 2024 à 09:58 (CET)

Grande interview de Warp3 — Merci Warp3 pour cette interview, qui m'a diverti de mes soucis IRL. Comme d'habitude, j'ai lu des observations et des commentaires qui m'ont fait Émoticône ! — Cantons-de-l'Est p|d|d 🧹 4 novembre 2024 à 23:51 (CET)

Boîtes à livres — Merci pour la mention, je n'avais pas encore lu ce RAW, quelle bonne surprise de voir le site mentionné ! Symac (discuter) 7 novembre 2024 à 13:12 (CET) (développeur dudit site :p)

L'IA a une forte valeur ajoutée pour "aider à faire" mais jamais pour "faire à la place".
 – Le chat perché sur le Bistro.
Rédigé/traduit par L'embellie et PAC2.
Citations originales
Notes
Références
  1. Découvert via https://wikis.world/@festal@tldr.nettime.org/113243136048240433
  2. https://www.404media.co/the-editors-protecting-wikipedia-from-ai-hoaxes/
  3. en:Wikipedia:Wikipedia Signpost/2024-10-19/Recent research
  4. Pour les plus curieuses et les plus curieux, la méthode Binoculars est une méthode de détection des textes générés par des grands modèles de langage qui s'appuie sur la « perplexité croisée  » de deux grands modèles de langage. Pour en savoir plus : https://arxiv.org/html/2401.12070v3
  5. a et b (en) Creston Brooks, Samuel Eggert et Denis Peskoff, « The Rise of AI-Generated Content in Wikipedia », {{Article}} : paramètre « périodique » manquant,‎ (lire en ligne).
  6. « Since 2017, Herron’s two accounts have made more than 300 contributions to pages on Wikipedia, of which more than half are entirely embellishments to Herron’s page, but there are notable deletions of positive content from the pages of Dauwalter, 2018 Boston Marathon champion Des Linden and Greek ultrarunning legend Yiannis Kouros. »- Merci DeepL pour la traduction. C'est pas parfait mais c'est pratique :).
  7. Victor Garcia, « Patrick Hetzel, un ministre bien peu scientifique : enquête sur le discret nettoyage de sa page Wikipédia », L’Express, (consulté le )
  8. https://x.com/WikiResearch/status/1843699094579229068
  9. Découvert via d:Wikidata:Status_updates/2024_10_14
  10. « As the saying goes, we move fast and break things: Wikidata is getting too big, too fast. The Wikidata Query Service graph got so huge it will be split, and the growth of the core database is deemed unsustainable. »
  11. « Let’s have it for slow data. Let’s make edits that take minutes rather than racking tens per second. (And sure, “It’s not the quantity, it’s the quality” is an old Wikipedia trope, at times ill-used, but not wrong per se.) »
  12. Traduit avec DeepL.com (version gratuite) « This does not mean not creating new items. But it does mean creating them more intentionally. The old, somewhat hyperbolic jest is that Wikipedia is full of articles that « no-one will ever read » (and I have done my fair share of that!) ; but on Wikidata, we sure have items that were not even created by someone, merely by something. »
  13. https://wikidata-game.toolforge.org/#
  14. https://observablehq.com/@pac02/explore-gender-diversity-in-a-single-wikipedia-article
  15. https://observablehq.com/@pac02/articles-wikilinks-inspector
  16. https://observablehq.com/@pac02/olympic-medals-by-continent
  17. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Intelligence%20artificielle
  18. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Philosophie
  19. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Amour
  20. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Musique
  21. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Humanit%C3%A9
  22. J'emprunte l'expression reste du monde au média Rest of world : https://restofworld.org/about/
  23. https://www.wikimedia.fr/participer-au-prix-wikimedia-de-la-recherche/

Numéro du 17 novembre 2024

Sunday, 17 November 2024 00:00 UTC

Éloge de la lenteur / L'édito de PAC2 — Depuis 2 ans que je contribue activement à RAW, la question de l'intelligence artificielle revient régulièrement dans l'actualité de Wikimédia. Ce numéro n'échappe pas à la règle et on retrouve encore dans ce numéro des inquiétudes face à la tentation de l'IA. À rebours des « accélérationnistes » qui veulent utiliser l'IA pour contribuer plus vite et mettre toujours plus de contenu, Jean-Frédéric sur le blog The Commonist fait un éloge bienvenu de la lenteur et de la contribution artisanale.

Vous trouverez aussi ce mois-ci une interview de Warp3 et un format atelier pour réfléchir à la représentation des personnalités des différents continents dans les articles Wikipédia.

Les brèves

Wikipédia face au problème du contenu généré par intelligence artificielle — Sur la Wikipédia anglophone, la communauté a créé un projet spécifique pour lutter contre le problème des contenus générés par intelligence artificielle mal sourcés et mal écrits[1]. 404 média revient en détail sur les enjeux. Un article anglophone sur la forteresse Amberlihisar, qui n'a jamais existé, constitue un bon exemple de mauvais recours à l'IA. L'IA a notamment généré des références parfaitement mises en forme mais totalement fictives. Le projet AI Cleanup recense aussi les images synthétiques. Certaines sont légitimes et sont utilisées à bon escient mais d'autres sont manifestement trompeuses[2].

Dans son édition du 19 octobre, The Signpost revient sur un récent article académique cherchant à quantifier la part de nouveaux articles générés avec de grands modèles de langage[3]. L'article intitulé « The Rise of AI-Generated Content in Wikipedia » utilise deux détecteurs automatiques de grands modèles de langage, GPTZero et Binoculars[4] pour estimer la proportion d'articles contenant des morceaux générés par des grands modèles de langage parmi les articles créés en août 2024[5].

« À l'aide de deux outils, GPTZero et Binoculars, nous détectons que jusqu'à 5 % des 2 909 articles anglais de Wikipédia créés en août 2024 contiennent un contenu significatif généré par l'IA. Les seuils de classification des deux outils ont été calibrés pour maintenir un taux de faux positifs ne dépassant pas 1 % sur une base Wikipédia pré-GPT-3.5, comme indiqué par la ligne rouge[5]. »

Sur la Wikipédia francophone, Fabius Lector a créé le projet Projet:Observatoire des IA et Simonk a initié un essai sur l'intelligence artificielle.

Logo de la conférence

WikiIndaba2024 — La conférence WikiIndaba, consacrée à la présence de l'Afrique sur Wikipédia, a eu lieu du 4 au 6 octobre à Johannesbourg.

Camille Herron, championne d'ultra-marathon et wikipédienne sous les pseudos Rundbowie et Temporun73.

La coureuse Camille Herron accusée de manipuler Wikipedia — La coureuse Camille Herron et son mari et entraîneur Conor Holt sont accusés d'avoir manipulé Wikipédia en diminuant le palmarès de concurrentes de Camille Herron.

« Depuis 2017, les deux comptes de Herron ont apporté plus de 300 contributions à des pages de Wikipédia, dont plus de la moitié sont entièrement des embellissements de la page de Herron, mais il y a des suppressions notables de contenu positif des pages de Dauwalter, du champion du marathon de Boston 2018 Des Linden et de la légende grecque de l'ultrarunning Yiannis Kouros[6]. »

Patrick Hetzel est ministre de l'enseignement supérieur et de la recherche dans le gouvernement de la République française depuis septembre 2024.

Le cabinet du ministre de l'enseignement supérieur et de la recherche français manipule Wikipédia ! — Une enquête du magazine L'Express révèle que le cabinet du nouveau ministre de l'enseignement supérieur et de la recherche français, Patrick Hetzel, a tenté de manipuler la biographie Wikipedia du ministre[7].

Florence Devouard, ancienne présidente de la fondation Wikimédia, est à l'initiative de la campagne SheSaid.

Florence Devouard interviewée sur l'initiative SheSaidDiff, le blog de la communauté interviewe Florence Devouard sur l'initiative de la campagne SheSaid.

« J'ai remarqué très tôt que les femmes étaient peu nombreuses dans nos projets, mais je ne me suis vraiment impliquée dans la lutte contre l'écart entre les sexes que lorsque Isla Haddow-Flood et moi-même avons lancé l'initiative Wiki Loves Women en 2016. Nous avons exploré différentes stratégies pour recruter plus de femmes, fournir un environnement plus inclusif, former et soutenir, mettre en œuvre différentes stratégies. Le sujet est complexe. En 2020, en pleine pandémie, j'ai lancé l'idée de #SheSaid... et nous voilà 4 ans plus tard ! »

Boîte à livres à Amboise, France.

11 000 boîtes à livres recensées — Le site boîtes-à-livres.fr recense les boîtes à livres en France en s'appuyant sur OpenStreetMap et Wikimédia Commons. On y trouve maintenant plus de 11 000 boîtes à livres.

Tous les chemins entre deux éléments Wikidata — Des chercheurs ont développé un nouvel outil capable de trouver tous les chemins possibles entre deux entités Wikidata[8].

Articles les plus centraux — L'université de Milan publie la liste des articles les plus centraux de Wikipédia (à priori uniquement la version anglophone).

C'est la saison des Nobel — Chaque année les différents prix Nobel sont remis début octobre. C'est l'occasion de remettre à jour et de développer de nouveaux notebooks consacrés aux Nobel.

Comme pour les jeux olympiques, on peut calculer la concentration des prix par pays de nationalité à partir d'une requête Wikidata.

Les États-Unis sont en tête du classement pour le prix Nobel de médecine, le prix Nobel de physique, le prix Nobel de la paix et le prix Nobel de Chimie. La France est en tête pour le prix Nobel de littérature. Les États-Unis obtiennent près de 40% des prix en médecine et plus de 32% des prix en physique et en chimie ! Parmi les cinq prix Nobel historique, c'est le prix Nobel de littérature qui est le plus diversifié en terme de pays de nationalité.

Jean-Frédéric propose l'approche SNAIL, acronyme de « Slow, NArrow, In-depth, Local », ce qu'on peut traduire par « Lent, précis, en profondeur et local ».

L'approche escargot ou l'éloge de la lenteur — Sur le blog The Commonists, Jean-Frédéric propose une approche escargot à la contribution #Wikidata 🐌[9]!

Plutôt que de faire de l'édition en masse, il propose de prendre le temps de faire de la contribution manuelle.

« Comme le dit le proverbe, nous allons vite et nous cassons des choses : Wikidata devient trop gros, trop vite. Le graphique du service d'interrogation de Wikidata a pris une telle ampleur qu'il sera scindé, et la croissance de la base de données principale est jugée insoutenable[10]. »

Plutôt que d'utiliser QuickStatement ou OpenRefine, Jean-Frédéric propose l'approche lente en s'inspirant du mouvement lent :

« Faisons ça avec les données lentes. Faisons des modifications qui prennent des minutes au lieu d'en faire des dizaines par seconde. (Et bien sûr, "Ce n'est pas la quantité, c'est la qualité" est un vieux trope de Wikipedia, parfois mal utilisé, mais pas faux en soi)[11]. »

« Cela ne signifie pas qu'il ne faut pas créer de nouveaux articles. Mais cela signifie qu'il faut les créer plus intentionnellement. La vieille plaisanterie, quelque peu hyperbolique, est que Wikipédia est pleine d'articles que " personne ne lira jamais " (et j'en ai fait ma part !) ; mais sur Wikidata, nous avons certainement des articles qui n'ont même pas été créés par quelqu'un, mais simplement par quelque chose[12]. »

Une nouvelle interface pour contribuer aux données lexicographiques de Wikidata — Lexico est une nouvelle interface qui permet de faciliter la contribution aux données lexicographiques (lexemes) sur Wikidata. Le principe rappelle les Wikidata Games de Magnus Manske[13].

65 000 citations sur Wikiquote — Wikiquote en français compte désormais 65 000 citations réparties sur près de 9 000 pages.

L'atelier

Dans cette section, un(e) wikimédien(ne) peut raconter un de ses bricolages à la première personne.

Ce mois-ci c'est PAC2 qui raconte comment il a bricolé un outil pour mesurer les biais de Wikipedia.

Il y a quelques années, j'avais développé le Gender Diversity Explorer, un petit outil en ligne qui récupère tous les liens bleus d'un article Wikipédia (ie les mentions), récupère la valeur de la propriété P21 (Sexe ou genre) dans l'élément Wikidata associé et calculé des statistiques de genre sur la répartition des entités nommées dans l'article[14].

L'approche se généralise facilement à n'importe quelle propriété dans Wikidata. C'est ce que propose le Wikilinks inspector[15].

Pour réfléchir à la représentation de certains continents comme l'Afrique ou l'Amérique du Sud, j'avais besoin d'adapter l'outil et de trouver un bon moyen de faire la correspondance entre des pays et des continents. C'est mon travail sur la répartition des médailles aux jeux olympiques qui m'a permis de trouver le bon moyen d'obtenir une correspondance à peu près pertinente entre pays et continents[16].

Techniquement, la magie vient toujours de la possibilité d'appeler l'api Wikimédia depuis une requête SPARQL :

SELECT ?item ?itemLabel ?country ?countryLabel 
WHERE {
  SERVICE wikibase:mwapi {
     bd:serviceParam wikibase:endpoint "fr.wikipedia.org";
                     wikibase:api "Generator";
                     mwapi:generator "links";
                     mwapi:titles "Intelligence artificielle";.
     ?item wikibase:apiOutputItem mwapi:item.
  } 
  FILTER BOUND (?item)
  ?item wdt:P31 wd:Q5 . 
  ?item wdt:P27 ?country . 
  ?country rdfs:label ?countryLabel filter (lang(?countryLabel) = "en") .
  ?item rdfs:label ?itemLabel filter (lang(?itemLabel) = "en") .
}

Cliquez pour essayer !

On combine ça ensuite avec la requête sur les continents et le tour est joué :

SELECT DISTINCT ?continent ?continentLabel ?country  ?code WHERE {
VALUES ?continent {
wd:Q55643
wd:Q48
wd:Q15
wd:Q18
wd:Q49
wd:Q46
} 
 ?continent (wdt:P527*) ?country.
  ?country 
    wdt:P2082 ?code.
  SERVICE wikibase:label { bd:serviceParam wikibase:language "en". }
}

Cliquez pour essayer !

Venons en maintenant aux résultats. Si on prend un article sur un thème très général et si Wikipedia représente l'ensemble des connaissances sur un sujet, on devrait s'attendre à avoir une représentation de personnalités de tous les continents dans les entités mentionnées dans un article.

Maintenant, quand on regarde l'article Intelligence artificielle, on trouve 69 personnalités nord-américaines, 58 personnalités européennes, 9 personnalités non classées pour seulement 6 personnalités asiatiques, 5 personnalités africaines, 3 personnalités oceaniennes et 2 personnalités sud-americaines[17].

L'article Philosophie mentionne 158 personnalités européennes mais aucune personnalité africaine[18].

L'article Amour mentionne une personnalité africaine pour 58 personnalités européennes[19].

L'article Travail ne mentionne aucune personnalité africaine, aucune personnalité asiatique ou aucune personnalité sud-américaine contre 23 personnalités européennes.

Même bilan avec l'article Musique : 36 personnalités européennes, 6 nord américaines et 1 océanienne mais aucune personnalité asiatique, africaine ou sud-américaine[20].

On pourrait penser que l'article consacré à l'humanité mentionnerait des personnalités de tous les continents. Ça n'est pas le cas. On ne compte aucun représentant de l'Océanie, de l'Afrique et de l'Asie dans l'article[21].

On peut multiplier les exemples et on voit que les continents nord-americains et européens sont largement représentés alors que les autres continents et notamment l'Afrique et l'Amérique du Sud sont représentés de manière marginale dans les articles généraux de l'encyclopédie.

Il y a sans doute de multiples raisons à ce déséquilibre. L'outil peut nous aider à prendre conscience du déséquilibre et chercher, article par article, des idées pour mieux représenter les personnes des continents sous représentés. En creux, on en vient à se demander si Wikipedia représente la « somme de toutes les connaissances » ou simplement le point de vue européen et nord-américain. Le point de vue du « reste du monde » est aujourd'hui manifestement peu représenté dans Wikipedia[22].

La grande interview

Dans cette section, nous donnons la parole à des wikimédien(ne)s sur des thèmes donnés afin de recueillir leurs avis ou les faire parler tout simplement de leurs expériences dans le mouvement.

Entretien avec Warp3

Ses activités wikimédiennes.
Par écrit sur cette page.
L'embellie.
Merci à Noé et Cantons-de-l'Est pour les suggestions de questions.
 ↑ 1. Bonjour Warp3. Merci d'avoir accepté cet entretien après que Cantons-de-l'Est vous ait suggéré comme invité. Pour commencer, je vous laisse vous présenter.

Comme beaucoup de Wikipédistes anciens et français, j'ai connu les débuts d'Internet en France en entreprise puis à domicile, période riche en projets informatiques de toutes les sortes. Intéressé par les articles de vulgarisation dans plusieurs domaines, j'eus vent d'un projet de réalisation d'une encyclopédie à accès gratuit sur le Net, qui s'appelait Wikipédia. Il y avait alors quelques autres encyclopédies comme Encarta de Windows, sur disquettes ou CD, mais assez chères, et les rares encyclopédies gratuites étaient très limités dans leur étendue et d'usage pas bien pratique. Le premier contact avec ce projet balbutiant fut une relative déception : peu d'articles et pas grand-chose dedans.

J'y revins quelques années après... et c'était déjà beaucoup mieux ! Peu à peu, je trouvais le plus souvent un article de Wikipédia après une recherche avec Google, et je m'étonnais que, même si l'article était peu développé, il répondait au minimum à la question « qu'est-ce que c'est ? ». Je faisais alors quelques apports ou corrections minimes, à l'occasion. Quelque trois ans après, fort d'avoir parcouru des pages d'aides et de règles (pas faciles à trouver) ainsi que plusieurs discussions, je fus fin prêt à prendre un compte... mais j'ai attendu encore deux ans avant de m'incrire fin juin 2008, sur un coup de tête. Première constatation après : hors l'accueil (automatique), l'impression d'être complètement seul à se dépatouiller dans l'édition (les pages de discussions des articles sont très souvent vides), jusqu'à me demander où se retrouvaient les Wikipédistes. C'est sur quelques pages plus spécifiques qu'ils se « cachaient », dont un certain Bistro.

Ma page de présentation contient un peu de mon état d'esprit au moment de l'inscription (elle est succinte et un peu ancienne maintenant, mais elle reste encore d'actualité). J'appris qu'il fallait s'inscrire aussi à un autre projet : WM Commons, afin d'ajouter des images (y compris les siennes) à un article. C'était cependant une façon de découvrir que Wikipédia s'appuie sur d'autres projets. Et puis, par curiosité, je visitai d'autres projets encore... (suspense)

 ↑ 2. Comment êtes-vous arrivé dans le mouvement Wikimédia ? Sur quel wiki en premier et comment avez-vous découvert les autres projets ?

Après Wikipédia, puis Commons, j'ai examiné plusieurs autres projets et enfin Wikimédia.

Au début, Wikimédia n'était pas un vrai mouvement mais une entreprise qui mettait en place Wikipédia, l'encyclopédie libre, dans de nombreuses langues puis soutenait d'autres projets voisins de l'encyclopédie. Wikimedia, utilisant des logiciels libres et parfois sous domaine public, s'est mis à promouvoir aussi le développement du libre. C'est plus récemment que la fondation Wikimédia, d'abord à travers la diffusion des projets et par leur utilisation avec tous, en fournissant les moyens de se connecter jusque dans les régions dépourvues d'accès au Net, est devenue un mouvement de développement local et privilégie l'intégration sociale.

j'ai cherché à comprendre l'organisation des projets par rapport à Wikimédia, comme l'existence des chapitres pour chaque projet dans un pays donné. J'ai fait ainsi au passage un peu de traduction de pages en anglais sur Wikimédia (à partir de 2015), participé plus ou moins à divers projets dont Wikiquote (fr), Wikisource, Wiktionnaire, Wikilivres. Je me suis aussi intéressé au thème de l'humour et enrichi le contenu de son portail à partir de 2015.

 ↑ 3. En vous présentant, Cantons-de-l'Est écrit : « Il trouve régulièrement des images qu'il « décore » de légendes savoureuses. » C'est dans cette activité que je vous ai aussi connu notamment sur le Bistro ou dans d'autres sections de discussions. Quand et comment avez-vous commencé à illustrer Le Bistro ?

Ce doit être le 15 décembre 2009, avec le drapeau de l'Acadie. Le calendrier du Bistro est né le 14 septembre 2005 et a vite évolué : la première illustration date du 7 novembre, la première image commentée est du 25 novembre de la même année. L'habitude est prise de décorer assez régulièrement le calendrier dès 2006. Les images avec leurs commentaires sont dans le ton du bistro, souvent légères et comiques, alternant avec des rappels de faits historiques. D'autres images se trouvent parfois ailleurs dans les discussions. Elles décrivent un aspect ou l'autre de Wikipédia en français, de ses débats.

On retrouve alors souvent DocteurCosmos en illustrateur du calendrier. Il se chargeait de l'illustrer avec un tour souvent amusant quand personne d'autre ne l'avait fait. C'est cette façon ludique qui m'a conduit à oser une première illustration dans ce petit espace en haut à droite de chaque page quotidienne du Bistro. J'ai augmenté progressivement mon implication dans ce cadre, comme une sorte de détente après un tas de modification dans les articles. Comme on pourra vérifier, les histoires de cabales et de chats au Bistro existaient depuis au moins 2006, bien avant mon arrivée Émoticône !

 ↑ 4. Vos choix d'illustration, vos légendes ainsi que parfois (souvent ?) vos commentaires de modifications sont tantôt profondes, tantôt légères, mais revêtent toujours une certaine beauté selon moi. Où trouvez-vous l'inspiration ?
— Warp3 ? Mmm... Attendez que je zoome sur l'image... Non, connais pas.

Voilà une question qui doit certainement tarabuster Cantons-de-l'Est depuis des années Émoticône. Il y a de nombreuses façons pour moi de trouver une idée de Bistro, idée souvent de type comique. Le cas le plus courant : c'est au cours de mes périgrinations quasi aléatoires sur Wikipédia et Commons que se fait la découverte de photos ou de dessins qui sont déjà comiques ou étonnantes en elle-même, ou quand leur rapport me semble raconter une historiette ; une sorte de hasard heureux peut-on dire. Sinon, quand j'ai une idée précise, quelques fois inspirée par l'actualité de wpfr, je cherche dans la catégorie idoine celles qui peuvent faire l'affaire. Et il m'arrive aussi d'élaborer des gags un peu plus complexes au saut du lit Émoticône. Dans un premier temps, j'ajoutais un lien vers une vidéo Youtube pour illustrer avec de la musique ou avec un sketch. Mais quelqu'un(e) m'a fait savoir que Commons héberge aussi des fichiers de musiques, qui sont libres de droits, contrairement aux vidéos Youtube. Depuis, je fouine dans les diverses catégories, et en place quelques-unes aux emplacements qui me semblent les plus appropriés. Cette bibliothèque de musiques (et de vidéos), pas assez connue à mon avis ni assez utilisée, semble s'être fortement enrichie ces dernières années.

Chaque fois que je place une illustration assortie d'un commentaire, je ne sais pas vraiment comment cela va être reçu, car il n'y a presque jamais de commentaires sur place ou sur ma page. En général, sur WP, quand personne ne fait de commentaire sur votre modification sur un article, ça signifie qu'elle est plus ou moins acceptée et je me figure que c'est pareil avec une image. Mais c'est comme être sur un bout de scène avec un public derrière une cloison, invisible et muet, qui peut une fois dans la rue faire un petit signe discret de connivence ou au contraire flanquer une claque, sans que je sache trop pour quoi.

 ↑ 5. Utilisez-vous des outils en particulier pour retrouver des images, les archiver, s'en souvenir ? Comment effectuez-vous vos recherches ?

Sur les projets : très peu, en fait. J'ai même décoché tout un tas de gadgets mis par défaut dans mes préférences. J'utilise parfois un éditeur de texte autre que celui de base. Pour les recherches, il arrive que c'est par les images que je retrouve certaines pages ou informations. Mais dans mes recherches d'un fichier sur Commons, je n'utilise guère le gadget fourni, qui retourne n'importe quoi tant qu'il existe dans le nom du fichier une seule erreur, ou que le nom n'est pas assez complet. Utiliser un moteur de recherche extérieur donne plus de chance de trouver le fichier cherché. Et, non, je ne fais pas de recherche SPARQL à travers WikiData, malgré les nombreux exemples donnés par les RAW (!). Question visuels, j'utilise les pauvres logiciels de base de Windows : mspaint, photo, wordpad, bloc-notes. Oui, frugalité extrême... il y a de quoi rire !

 ↑ 6. Assidu du Bistro, qu'aimez-vous y trouver et quelle est la raison d'être que vous donnez à cet espace communautaire ?

Quand j'ai découvert le Bistro à l'époque de mon inscription, je pensais y trouver une sorte d'assemblée très sérieuse réglant avec précision l'avenir de l'Encyclopédie, alors que c'était plutôt une sorte d'auberge espagnole bruyante et un tantinet folle. Le Bistro actuel est en majorité le rendez-vous de toutes les personnes un peu anciennes désireuses de débattre, et parfois d'informer la Wikipédie. C'est le lieu pour poser ses questions avec de grandes chances d'avoir au moins une réponse, que l'on soit novice ou non. Certains débats sont cependant si extravagants que je finis par les trouver rigolos ! Je préfère cependant le discours plus léger tenu par d'autres personnes, comme il arrivait souvent dans les premières années de l'existence du Bistro.

 ↑ 7. Comment trouvez-vous la convivialité et l'ambiance en général au sein de la communauté ?

La communauté de Wikipédia en français est diverse, très partagée sur plusieurs thèmes (inclusionnisme/suppressionnisme, paternalisme/féminisme, fair-use, Comité d'arbitrage (CAr), etc.) depuis au moins 2006 sur les espaces de discussions. Ce n'est que par l'observance des règles établies et de la volonté de participer sereinement à la création et à la maintenance des articles que l'on peut dire qu'il existe une sorte de lien solidaire entre les membres. L'ambiance peut être bonne ou mauvaise selon l'importance que l'on porte à ces thèmes. Il est ainsi possible d'avoir de bons rapports en travaillant sans apriori avec des personnes dans un espace d'articles peu polémiques (potentiellement plusieurs millions Émoticône) .

 ↑ 8. Quel type de wikipédien êtes-vous ? Comment décririez-vous votre manière de contribuer sur l'encyclopédie ?

Si j'ai pris un compte sur Wikipédia, c'est aussi parce que je me sentais redevable de tant d'informations offertes sans contreparties de ma part. J'ai commencé par des corrections orthographiques et quelques reformulations, mais ne me destinais pas à faire beaucoup plus. C'est en voyant l'état de quasi ébauche de l'article Bugs Bunny que je me suis décidé à le développer, par traduction de l'article anglophone. Aussi, le goût me prit de continuer des articles initiés par d'autres, d'abord dans le domaine du dessin animé alors presque déserté hormis le champ disneyien, puis dans d'autres domaines.

Wikipédiste papillonnant, assez solitaire, je passe d'un sujet à l'autre selon mes goûts du moment. L'Amérique de la période située entre 1850 et 1950, le cinéma (Warner Bros. surtout) et la musique sont autant de sujets qui m'intéressent le plus. Malgré une bonne centaine d'articles créés et pas mal de traductions de l'anglais (je vous conseille DeepL comme base) depuis plus de 15 ans, je me considère encore comme un petit rédacteur-relecteur (et suis étonné de faire partie des mille premiers modificateurs actifs de WP). Je n'ai d'ailleurs développé aucun article jusqu'à un niveau de labellisation.

 ↑ 9. Créateur de plus de 110 articles, quand considérez-vous que le sujet d'un article est épuisé avant de passer à un autre ? Quels sentiments cela vous inspire de savoir qu'il reste tant à faire sur le wiki ?

Un article très pointu (dit « d'intéret faible » dans les évaluations), comme un certain type d'invertébré marin très peu connu, s'il est traité pleinement à travers toute la documentation existante, devient un article abouti. S'il n'a pas sa belle étoile doré d'article de qualité, c'est tant pis, mais cela n'enlève rien à son degré d'achèvement. Inversement, sur un article portant sur un sujet connu où la documentation abonde, ou alors un article généraliste, il faut non seulement traiter tous les angles de vue mais aussi rester synthétique (et faire des articles secondaires), et le travail de retrait devient aussi important que celui d'ajout.

Pour ma part, les articles en anglais que je traduis, qui me plaisent, ne sont que rarement des articles complets avec labels de qualité. Je vérifie les sources et complète certains détails, mais je les sais très perfectibles. Le minimum, au-delà des sources, est que la lectrice ou le lecteur puisse se faire au moins une bonne idée du sujet, typiquement un résumé introductif (RI).

Une majorité d'articles de Wikipédia sont (encore) des ébauches ou des articles à peine développés. Tant que des sources sûres justifient l'existence d'un article et qu'il dispose d'une sorte de RI, je considère celui-ci comme valable (en tant que lecteur). Contrairement à d'autres Wikipédistes, cette masse de mini articles ne me semble pas dommageable à l'image de l'encyclopédie, au contraire ! Mieux vaut un article minimum (mais bon) que rien du tout. C'est la multiplicité des articles qui fait l'une des forces de l'Encyclopédie. Les articles faux (canulars) sont, en revanche, une plaie et à éradiquer au plus vite (merci les admins et les vigilant(e)s).

 ↑ 10. En considérant votre expérience sur le wiki, qu'est-ce qui vous a procuré le plus grand plaisir sur Wikipédia ? Au contraire, qu'est-ce qui vous a le plus marqué négativement ?

Il n'y a pas beaucoup d'expériences à vivre sur Wikipédia si on reste à faire des modifications légères sur des articles sans controverses, voire peu lus. Mais dès que l'on prend un compte et que l'on s'attaque à certains gros articles, on rencontre fatalement une partie de la « communauté» hétéroclite wikipédienne.

Il y a eu plusieurs heureuses rencontres, mais je crois que l'une des plus heureuses fut celle de la création des RAW, journal à la fois très instructif et bien présenté par son créateur (mais non, je ne fais pas de la publicité éhontée !). Après réflexion, je dirais que la pire rencontre arriva deux mois après mon inscription, à propos d'une discussion sur ma page de discussion avec un Wikipédien dynamique, aujourd'hui admin actif. Juste après un de mes propos pourtant assez mesuré, déboula sur ma page un parfait inconnu qui se mit à me faire une leçon wikipédienne magistrale dans le plus pur style des « anciens » s'adressant à un complet ignorant. J'avais beau m'être mentalement préparé à des avis extrêmes ou divagants, ce genre d'attaque très limite fut fort désagréable, surtout quand elle fut appuyée par d'autres.

 ↑ 11. Quels seront selon vous les plus grands défis de Wikipédia en français dans les cinq prochaines années ?

Je ne suis pas dans le secret des dieux, mais je crois percevoir :

- L'arrivée de l'intelligence articielle (IA, donc) sur WP est un peu ce que depuis longtemps des Wiképidistes appelaient de leurs vœux pour traiter les millions d'articles de façon automatique. Est-ce la bonne formule ? On peut en douter, dans l'état actuel. Le bon usage de cette IA sur WP reste à définir, et à faire évoluer en même temps qu'elle. Peut-elle éclipser WP même ? La boule de cristal est floue, rappelez plus tard Sourire diabolique.

- Les nouvelles structures qui se mettent lentement en place sous l'égide de Wikimédia, et qui semblent être complètement ignorées du gros de la communauté wikipédienne francophone, mis à part l'application du Code de conduite universel dans les règles de wpfr.

- Maintenir une certaines cohésion entre les membres des Wikipédistes, faire évoluer certaines mentalités ; attirer de nouveaux membres actifs ; se prémunir contre les nouvelles formes d'atteintes aux articles : publicitaires, politiques ou autres ; trouver (et financer) un moyen pérenne de conserver les traces des sources sur Internet.

 ↑ 12. Que pensez-vous des médias qui sont stockés sur Wikimedia Commons et du wiki en général ?

(Wikimedia) Commons est un site énorme, qui recueille des documents (hors textes), pas seulement des photos mais aussi des vidéos et des fichiers sonores. Des musées et institutions prestigieux sont sollicités, ce qui fait que des images exceptionnelles, historiques, y sont copiés et cotoient le reste, inimaginable tant il y en a.

Je me suis incrit presque en même temps sur Commons, site qui héberge donc la plupart des fichiers libres de droits utilisés par Wikipédia, dans le but d'illustrer certains articles. Tout d'abord, j'ai posté quelques-unes de mes photos et me suis conformé aux règles (pas exactement fixées) des droits d'auteur. Mais au fur et à mesure des années, les administrateurs et autres personnes à statut m'ont semblé avoir un comportement de plus en plus incohérent face au soupçon de copyright : aveugles à des imports clairement douteux et sans source mais impitoyables, voire désinvoltes, avec d'autres pourtant accompagnés d'une preuve d'ancienneté suffisante ou/et d'autres garanties. Cela m'a ôté l'envie de discuter et d'y importer quoi que ce soit. Je me contente maintenant principalement de traduire le descriptif des fichiers ou de les catégoriser.

 ↑ 13. Si j'en crois ce diff, le concours de l'image de l'année POTY vous intéresse. Quels ont été vos coups de cœur ou les images qui vous ont profondément marquées depuis que vous suivez ce concours ?

Les concours d'images (principalement photographiques) Picture of the Year (POTY) organisés sur Commons chaque année depuis 2006 sont un plaisir des yeux. Depuis que je connais l'existence du concours, j'y participe régulièrement et leur fait une certaine publicité au Bistro. J'ai aidé à traduire des pages et à vérifier la validité de votes, quand tout était encore fait à la main et qu'il fallait tout refaire et repenser chaque année. Ces dernières années, une poignée de codeurs ont pris le taureau par les cornes et ont automatisé la création au maximum. Cela évite en bonne partie la triche et le recompte manuel mais il n'y a plus le charme des commentaires qui étaient aussi utiles aux photographes participants, et la tenue d'une nouvelle édition ne semble plus être décidée que par eux. Trop de photos m'ont ébloui par leur qualité ou leur sujet pour me décider de seulement quelques-unes ! J'ai découvert cependant que deux noms de photographes reviennent souvent dans les auteurs des photos que je trouve parmi les meilleures : Luc Viatour et Basile Morin (ce dernier étant aussi remarquable pour ses nombreux et excellents ambigrammes). La photo gagnante du concours 2023 est superbe en plus d'être étonnante, même si je ne l'ai pas choisie au dernier tour. Mais elle a eu droit auparavant à plein de prix et je l'avais utilisée dans le Bistro du 15 juillet 2023. Une photo remarquable plus ancienne mais découverte par moi il y a peu de temps m'a complètement désorienté au premier coup d'œil (voir mon commentaire ici).

 ↑ 14. Quel(le) wikimédien(ne) souhaiteriez-vous voir interviewé(e) dans un prochain numéro et sur quel thème ?

Il y a beaucoup de candidats possibles (et disponibles !) mais je serais curieux de Kropotkine 113, Wikipédiste chevronné toujours présent mais finalement assez discret sur les espaces de discussions grand public.

 ↑ 15. Y a-t-il un sujet particulier qui vous tient à cœur et qu’on n’a pas abordé dans cet entretien ? Vous avez carte blanche 🙂.

Je tiens à (re)dire à Cantons-de-l'Est mon plein soutien à la création d'un dictionnaire visuel (multilingue) !

 ↑ 16. Avez-vous un message particulier à adresser aux lectrices et lecteurs du RAW ? Quel serait votre mot de la fin ?

Pas particulèrement au lectorat des RAW mais plutôt aux Wikipédistes en général : si vous avez une idée, ou si une remarque vous tient à cœur, exprimez-la gentiment : on ne vous embastillera pas pour cela ! Si participer à Wikipédia devient une obsession ou un énorme boulet, prenez des vacances. Mais si rien de Wikipédia ne vous plait, alors peut-être que Wikipédia... n'est pas (ou plus) pour vous.

Merci d'avoir accepté cette interview. Bonne continuation !

L'agenda

Les autres infolettres

La page Wikipédia:RAW/Découvrir recense les infolettres et blogs relatifs à Wikimedia.

En plus de RAW, vous pouvez lire le Wikimag, newsletter hebdomadaire de la Wikipedia francophone (Voir le dernier numéro Wikipédia:Wikimag/2024/44), l'infolettre Wikifier la science (voir le dernier numéro Projet:Wikifier la science/Infolettre/Octobre 2024) et les Actualités du Wiktionnaire newsletter mensuelle du Wiktionnaire (wikt:Wiktionnaire:Actualités/114-septembre-2024).

Les anglophones peuvent aussi lire The Signpost, publié toutes les deux semaines, la newsletter hebdo de la communauté Wikidata (voir ici d:Wikidata:Status updates/2024 10 28) ou encore la newsletter du projet Wikifunction ("wikifunction:Wikifunctions:Status updates/2024-10-25).

Courrier du lectorat

(Il nous fera plaisir de lire les messages déposés ici et, si nécessaire, d'y répondre dans les plus brefs délais.)

Wikipédia face au problème du contenu généré par intelligence artificielle — L’intérêt des intelligences artificielles génératives comme ChatGPT réside, selon moi, dans leur capacité de rédaction. À partir du moment où on leur fournit une première version d’un texte sourcé, elles sont capables de le synthétiser ou de le compléter afin qu’il soit rédigé dans un style clair et encyclopédique. De ce point de vue, ce sont d’excellents assistants.
En revanche, comme dit Le chat perché, elles ne peuvent pas faire le travail à notre place, et ce pour une raison très simple : elles ne sont pas conçues pour. Ce sont des IA « probabilistes ». Elle donne le résultat « le plus probable », pas forcément le plus fiable. C’est ce qui explique qu’elles peuvent inventer un concept scientifique… qui n’existe pas, ou encore inventer des sources. Attention donc à ne pas les prendre pour ce qu’elles ne sont pas Émoticône. Merci aux rédacteurs et rédactrices du RAW, comme toujours très instructif.--Pronoia (discuter) 1 novembre 2024 à 10:10 (CET)

De mon côté, ce qui m'inquiète le plus est l'illusion de qualité avec des utilisateurs ne voyant même pas les problèmes. Pour l'exemple, question que j'ai posé hier sur quoi faire avec ce cas où il se pourrait que l'utilisateur soit de bonne foi. J'ai prévu de traduire cet essai anglais pour avoir une base pédagogique vers laquelle orienter mais si ce genre de chose se développe, faudra peut-être penser à un avertissement quelque part pour que toute personne venant contribuer sache qu'il y a des choses à ne pas faire.
Pour l'heure, le principe de signalement n'est pas encore en place côté francophone mais côté anglophone, ils ont eu 69 articles indiqués en octobre et si on en croit l'étude indiquée plus haut, il y a des chances qu'on en rate. Fabius Lector (discuter) 1 novembre 2024 à 11:50 (CET)
Je partage l'inquiétude sur l'illusion de qualité. Mais ça va au delà de l'IA.
Sinon je suis honnoré d'être cité Émoticône. Le chat perché (discuter) 1 novembre 2024 à 13:35 (CET)

Biais de surreprésentation des idées et auteurs occidentaux — Merci PAC2 pour ton outil de mesure des biais géographiques dans les articles ! Je trouve cela très parlant et assez préoccupant de voir que Wikipédia reflète avant tout les connaissances occidentales. Il y a probablement une explication historique à ça (naissance de la science moderne en Europe, développement de la plupart des disciplines universitaires en Occident + colonisation, effacement des savoirs autochtones et difficultés d'accès aux études supérieures dans beaucoup d'endroits). On a du boulot pour lutter contre ce biais ! Skimel (discuter) 2 novembre 2024 à 09:58 (CET)

Grande interview de Warp3 — Merci Warp3 pour cette interview, qui m'a diverti de mes soucis IRL. Comme d'habitude, j'ai lu des observations et des commentaires qui m'ont fait Émoticône ! — Cantons-de-l'Est p|d|d 🧹 4 novembre 2024 à 23:51 (CET)

Boîtes à livres — Merci pour la mention, je n'avais pas encore lu ce RAW, quelle bonne surprise de voir le site mentionné ! Symac (discuter) 7 novembre 2024 à 13:12 (CET) (développeur dudit site :p)

L'IA a une forte valeur ajoutée pour "aider à faire" mais jamais pour "faire à la place".
 – Le chat perché sur le Bistro.
Rédigé/traduit par L'embellie et PAC2.
Citations originales
Notes
Références
  1. Découvert via https://wikis.world/@festal@tldr.nettime.org/113243136048240433
  2. https://www.404media.co/the-editors-protecting-wikipedia-from-ai-hoaxes/
  3. en:Wikipedia:Wikipedia Signpost/2024-10-19/Recent research
  4. Pour les plus curieuses et les plus curieux, la méthode Binoculars est une méthode de détection des textes générés par des grands modèles de langage qui s'appuie sur la « perplexité croisée  » de deux grands modèles de langage. Pour en savoir plus : https://arxiv.org/html/2401.12070v3
  5. a et b (en) Creston Brooks, Samuel Eggert et Denis Peskoff, « The Rise of AI-Generated Content in Wikipedia », {{Article}} : paramètre « périodique » manquant,‎ (lire en ligne).
  6. « Since 2017, Herron’s two accounts have made more than 300 contributions to pages on Wikipedia, of which more than half are entirely embellishments to Herron’s page, but there are notable deletions of positive content from the pages of Dauwalter, 2018 Boston Marathon champion Des Linden and Greek ultrarunning legend Yiannis Kouros. »- Merci DeepL pour la traduction. C'est pas parfait mais c'est pratique :).
  7. Victor Garcia, « Patrick Hetzel, un ministre bien peu scientifique : enquête sur le discret nettoyage de sa page Wikipédia », L’Express, (consulté le )
  8. https://x.com/WikiResearch/status/1843699094579229068
  9. Découvert via d:Wikidata:Status_updates/2024_10_14
  10. « As the saying goes, we move fast and break things: Wikidata is getting too big, too fast. The Wikidata Query Service graph got so huge it will be split, and the growth of the core database is deemed unsustainable. »
  11. « Let’s have it for slow data. Let’s make edits that take minutes rather than racking tens per second. (And sure, “It’s not the quantity, it’s the quality” is an old Wikipedia trope, at times ill-used, but not wrong per se.) »
  12. Traduit avec DeepL.com (version gratuite) « This does not mean not creating new items. But it does mean creating them more intentionally. The old, somewhat hyperbolic jest is that Wikipedia is full of articles that « no-one will ever read » (and I have done my fair share of that!) ; but on Wikidata, we sure have items that were not even created by someone, merely by something. »
  13. https://wikidata-game.toolforge.org/#
  14. https://observablehq.com/@pac02/explore-gender-diversity-in-a-single-wikipedia-article
  15. https://observablehq.com/@pac02/articles-wikilinks-inspector
  16. https://observablehq.com/@pac02/olympic-medals-by-continent
  17. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Intelligence%20artificielle
  18. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Philosophie
  19. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Amour
  20. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Musique
  21. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Humanit%C3%A9
  22. J'emprunte l'expression reste du monde au média Rest of world : https://restofworld.org/about/
  23. https://www.wikimedia.fr/participer-au-prix-wikimedia-de-la-recherche/

Numéro du 16 novembre 2024

Saturday, 16 November 2024 00:00 UTC

Éloge de la lenteur / L'édito de PAC2 — Depuis 2 ans que je contribue activement à RAW, la question de l'intelligence artificielle revient régulièrement dans l'actualité de Wikimédia. Ce numéro n'échappe pas à la règle et on retrouve encore dans ce numéro des inquiétudes face à la tentation de l'IA. À rebours des « accélérationnistes » qui veulent utiliser l'IA pour contribuer plus vite et mettre toujours plus de contenu, Jean-Frédéric sur le blog The Commonist fait un éloge bienvenu de la lenteur et de la contribution artisanale.

Vous trouverez aussi ce mois-ci une interview de Warp3 et un format atelier pour réfléchir à la représentation des personnalités des différents continents dans les articles Wikipédia.

Les brèves

Wikipédia face au problème du contenu généré par intelligence artificielle — Sur la Wikipédia anglophone, la communauté a créé un projet spécifique pour lutter contre le problème des contenus générés par intelligence artificielle mal sourcés et mal écrits[1]. 404 média revient en détail sur les enjeux. Un article anglophone sur la forteresse Amberlihisar, qui n'a jamais existé, constitue un bon exemple de mauvais recours à l'IA. L'IA a notamment généré des références parfaitement mises en forme mais totalement fictives. Le projet AI Cleanup recense aussi les images synthétiques. Certaines sont légitimes et sont utilisées à bon escient mais d'autres sont manifestement trompeuses[2].

Dans son édition du 19 octobre, The Signpost revient sur un récent article académique cherchant à quantifier la part de nouveaux articles générés avec de grands modèles de langage[3]. L'article intitulé « The Rise of AI-Generated Content in Wikipedia » utilise deux détecteurs automatiques de grands modèles de langage, GPTZero et Binoculars[4] pour estimer la proportion d'articles contenant des morceaux générés par des grands modèles de langage parmi les articles créés en août 2024[5].

« À l'aide de deux outils, GPTZero et Binoculars, nous détectons que jusqu'à 5 % des 2 909 articles anglais de Wikipédia créés en août 2024 contiennent un contenu significatif généré par l'IA. Les seuils de classification des deux outils ont été calibrés pour maintenir un taux de faux positifs ne dépassant pas 1 % sur une base Wikipédia pré-GPT-3.5, comme indiqué par la ligne rouge[5]. »

Sur la Wikipédia francophone, Fabius Lector a créé le projet Projet:Observatoire des IA et Simonk a initié un essai sur l'intelligence artificielle.

Logo de la conférence

WikiIndaba2024 — La conférence WikiIndaba, consacrée à la présence de l'Afrique sur Wikipédia, a eu lieu du 4 au 6 octobre à Johannesbourg.

Camille Herron, championne d'ultra-marathon et wikipédienne sous les pseudos Rundbowie et Temporun73.

La coureuse Camille Herron accusée de manipuler Wikipedia — La coureuse Camille Herron et son mari et entraîneur Conor Holt sont accusés d'avoir manipulé Wikipédia en diminuant le palmarès de concurrentes de Camille Herron.

« Depuis 2017, les deux comptes de Herron ont apporté plus de 300 contributions à des pages de Wikipédia, dont plus de la moitié sont entièrement des embellissements de la page de Herron, mais il y a des suppressions notables de contenu positif des pages de Dauwalter, du champion du marathon de Boston 2018 Des Linden et de la légende grecque de l'ultrarunning Yiannis Kouros[6]. »

Patrick Hetzel est ministre de l'enseignement supérieur et de la recherche dans le gouvernement de la République française depuis septembre 2024.

Le cabinet du ministre de l'enseignement supérieur et de la recherche français manipule Wikipédia ! — Une enquête du magazine L'Express révèle que le cabinet du nouveau ministre de l'enseignement supérieur et de la recherche français, Patrick Hetzel, a tenté de manipuler la biographie Wikipedia du ministre[7].

Florence Devouard, ancienne présidente de la fondation Wikimédia, est à l'initiative de la campagne SheSaid.

Florence Devouard interviewée sur l'initiative SheSaidDiff, le blog de la communauté interviewe Florence Devouard sur l'initiative de la campagne SheSaid.

« J'ai remarqué très tôt que les femmes étaient peu nombreuses dans nos projets, mais je ne me suis vraiment impliquée dans la lutte contre l'écart entre les sexes que lorsque Isla Haddow-Flood et moi-même avons lancé l'initiative Wiki Loves Women en 2016. Nous avons exploré différentes stratégies pour recruter plus de femmes, fournir un environnement plus inclusif, former et soutenir, mettre en œuvre différentes stratégies. Le sujet est complexe. En 2020, en pleine pandémie, j'ai lancé l'idée de #SheSaid... et nous voilà 4 ans plus tard ! »

Boîte à livres à Amboise, France.

11 000 boîtes à livres recensées — Le site boîtes-à-livres.fr recense les boîtes à livres en France en s'appuyant sur OpenStreetMap et Wikimédia Commons. On y trouve maintenant plus de 11 000 boîtes à livres.

Tous les chemins entre deux éléments Wikidata — Des chercheurs ont développé un nouvel outil capable de trouver tous les chemins possibles entre deux entités Wikidata[8].

Articles les plus centraux — L'université de Milan publie la liste des articles les plus centraux de Wikipédia (à priori uniquement la version anglophone).

C'est la saison des Nobel — Chaque année les différents prix Nobel sont remis début octobre. C'est l'occasion de remettre à jour et de développer de nouveaux notebooks consacrés aux Nobel.

Comme pour les jeux olympiques, on peut calculer la concentration des prix par pays de nationalité à partir d'une requête Wikidata.

Les États-Unis sont en tête du classement pour le prix Nobel de médecine, le prix Nobel de physique, le prix Nobel de la paix et le prix Nobel de Chimie. La France est en tête pour le prix Nobel de littérature. Les États-Unis obtiennent près de 40% des prix en médecine et plus de 32% des prix en physique et en chimie ! Parmi les cinq prix Nobel historique, c'est le prix Nobel de littérature qui est le plus diversifié en terme de pays de nationalité.

Jean-Frédéric propose l'approche SNAIL, acronyme de « Slow, NArrow, In-depth, Local », ce qu'on peut traduire par « Lent, précis, en profondeur et local ».

L'approche escargot ou l'éloge de la lenteur — Sur le blog The Commonists, Jean-Frédéric propose une approche escargot à la contribution #Wikidata 🐌[9]!

Plutôt que de faire de l'édition en masse, il propose de prendre le temps de faire de la contribution manuelle.

« Comme le dit le proverbe, nous allons vite et nous cassons des choses : Wikidata devient trop gros, trop vite. Le graphique du service d'interrogation de Wikidata a pris une telle ampleur qu'il sera scindé, et la croissance de la base de données principale est jugée insoutenable[10]. »

Plutôt que d'utiliser QuickStatement ou OpenRefine, Jean-Frédéric propose l'approche lente en s'inspirant du mouvement lent :

« Faisons ça avec les données lentes. Faisons des modifications qui prennent des minutes au lieu d'en faire des dizaines par seconde. (Et bien sûr, "Ce n'est pas la quantité, c'est la qualité" est un vieux trope de Wikipedia, parfois mal utilisé, mais pas faux en soi)[11]. »

« Cela ne signifie pas qu'il ne faut pas créer de nouveaux articles. Mais cela signifie qu'il faut les créer plus intentionnellement. La vieille plaisanterie, quelque peu hyperbolique, est que Wikipédia est pleine d'articles que " personne ne lira jamais " (et j'en ai fait ma part !) ; mais sur Wikidata, nous avons certainement des articles qui n'ont même pas été créés par quelqu'un, mais simplement par quelque chose[12]. »

Une nouvelle interface pour contribuer aux données lexicographiques de Wikidata — Lexico est une nouvelle interface qui permet de faciliter la contribution aux données lexicographiques (lexemes) sur Wikidata. Le principe rappelle les Wikidata Games de Magnus Manske[13].

65 000 citations sur Wikiquote — Wikiquote en français compte désormais 65 000 citations réparties sur près de 9 000 pages.

L'atelier

Dans cette section, un(e) wikimédien(ne) peut raconter un de ses bricolages à la première personne.

Ce mois-ci c'est PAC2 qui raconte comment il a bricolé un outil pour mesurer les biais de Wikipedia.

Il y a quelques années, j'avais développé le Gender Diversity Explorer, un petit outil en ligne qui récupère tous les liens bleus d'un article Wikipédia (ie les mentions), récupère la valeur de la propriété P21 (Sexe ou genre) dans l'élément Wikidata associé et calculé des statistiques de genre sur la répartition des entités nommées dans l'article[14].

L'approche se généralise facilement à n'importe quelle propriété dans Wikidata. C'est ce que propose le Wikilinks inspector[15].

Pour réfléchir à la représentation de certains continents comme l'Afrique ou l'Amérique du Sud, j'avais besoin d'adapter l'outil et de trouver un bon moyen de faire la correspondance entre des pays et des continents. C'est mon travail sur la répartition des médailles aux jeux olympiques qui m'a permis de trouver le bon moyen d'obtenir une correspondance à peu près pertinente entre pays et continents[16].

Techniquement, la magie vient toujours de la possibilité d'appeler l'api Wikimédia depuis une requête SPARQL :

SELECT ?item ?itemLabel ?country ?countryLabel 
WHERE {
  SERVICE wikibase:mwapi {
     bd:serviceParam wikibase:endpoint "fr.wikipedia.org";
                     wikibase:api "Generator";
                     mwapi:generator "links";
                     mwapi:titles "Intelligence artificielle";.
     ?item wikibase:apiOutputItem mwapi:item.
  } 
  FILTER BOUND (?item)
  ?item wdt:P31 wd:Q5 . 
  ?item wdt:P27 ?country . 
  ?country rdfs:label ?countryLabel filter (lang(?countryLabel) = "en") .
  ?item rdfs:label ?itemLabel filter (lang(?itemLabel) = "en") .
}

Cliquez pour essayer !

On combine ça ensuite avec la requête sur les continents et le tour est joué :

SELECT DISTINCT ?continent ?continentLabel ?country  ?code WHERE {
VALUES ?continent {
wd:Q55643
wd:Q48
wd:Q15
wd:Q18
wd:Q49
wd:Q46
} 
 ?continent (wdt:P527*) ?country.
  ?country 
    wdt:P2082 ?code.
  SERVICE wikibase:label { bd:serviceParam wikibase:language "en". }
}

Cliquez pour essayer !

Venons en maintenant aux résultats. Si on prend un article sur un thème très général et si Wikipedia représente l'ensemble des connaissances sur un sujet, on devrait s'attendre à avoir une représentation de personnalités de tous les continents dans les entités mentionnées dans un article.

Maintenant, quand on regarde l'article Intelligence artificielle, on trouve 69 personnalités nord-américaines, 58 personnalités européennes, 9 personnalités non classées pour seulement 6 personnalités asiatiques, 5 personnalités africaines, 3 personnalités oceaniennes et 2 personnalités sud-americaines[17].

L'article Philosophie mentionne 158 personnalités européennes mais aucune personnalité africaine[18].

L'article Amour mentionne une personnalité africaine pour 58 personnalités européennes[19].

L'article Travail ne mentionne aucune personnalité africaine, aucune personnalité asiatique ou aucune personnalité sud-américaine contre 23 personnalités européennes.

Même bilan avec l'article Musique : 36 personnalités européennes, 6 nord américaines et 1 océanienne mais aucune personnalité asiatique, africaine ou sud-américaine[20].

On pourrait penser que l'article consacré à l'humanité mentionnerait des personnalités de tous les continents. Ça n'est pas le cas. On ne compte aucun représentant de l'Océanie, de l'Afrique et de l'Asie dans l'article[21].

On peut multiplier les exemples et on voit que les continents nord-americains et européens sont largement représentés alors que les autres continents et notamment l'Afrique et l'Amérique du Sud sont représentés de manière marginale dans les articles généraux de l'encyclopédie.

Il y a sans doute de multiples raisons à ce déséquilibre. L'outil peut nous aider à prendre conscience du déséquilibre et chercher, article par article, des idées pour mieux représenter les personnes des continents sous représentés. En creux, on en vient à se demander si Wikipedia représente la « somme de toutes les connaissances » ou simplement le point de vue européen et nord-américain. Le point de vue du « reste du monde » est aujourd'hui manifestement peu représenté dans Wikipedia[22].

La grande interview

Dans cette section, nous donnons la parole à des wikimédien(ne)s sur des thèmes donnés afin de recueillir leurs avis ou les faire parler tout simplement de leurs expériences dans le mouvement.

Entretien avec Warp3

Ses activités wikimédiennes.
Par écrit sur cette page.
L'embellie.
Merci à Noé et Cantons-de-l'Est pour les suggestions de questions.
 ↑ 1. Bonjour Warp3. Merci d'avoir accepté cet entretien après que Cantons-de-l'Est vous ait suggéré comme invité. Pour commencer, je vous laisse vous présenter.

Comme beaucoup de Wikipédistes anciens et français, j'ai connu les débuts d'Internet en France en entreprise puis à domicile, période riche en projets informatiques de toutes les sortes. Intéressé par les articles de vulgarisation dans plusieurs domaines, j'eus vent d'un projet de réalisation d'une encyclopédie à accès gratuit sur le Net, qui s'appelait Wikipédia. Il y avait alors quelques autres encyclopédies comme Encarta de Windows, sur disquettes ou CD, mais assez chères, et les rares encyclopédies gratuites étaient très limités dans leur étendue et d'usage pas bien pratique. Le premier contact avec ce projet balbutiant fut une relative déception : peu d'articles et pas grand-chose dedans.

J'y revins quelques années après... et c'était déjà beaucoup mieux ! Peu à peu, je trouvais le plus souvent un article de Wikipédia après une recherche avec Google, et je m'étonnais que, même si l'article était peu développé, il répondait au minimum à la question « qu'est-ce que c'est ? ». Je faisais alors quelques apports ou corrections minimes, à l'occasion. Quelque trois ans après, fort d'avoir parcouru des pages d'aides et de règles (pas faciles à trouver) ainsi que plusieurs discussions, je fus fin prêt à prendre un compte... mais j'ai attendu encore deux ans avant de m'incrire fin juin 2008, sur un coup de tête. Première constatation après : hors l'accueil (automatique), l'impression d'être complètement seul à se dépatouiller dans l'édition (les pages de discussions des articles sont très souvent vides), jusqu'à me demander où se retrouvaient les Wikipédistes. C'est sur quelques pages plus spécifiques qu'ils se « cachaient », dont un certain Bistro.

Ma page de présentation contient un peu de mon état d'esprit au moment de l'inscription (elle est succinte et un peu ancienne maintenant, mais elle reste encore d'actualité). J'appris qu'il fallait s'inscrire aussi à un autre projet : WM Commons, afin d'ajouter des images (y compris les siennes) à un article. C'était cependant une façon de découvrir que Wikipédia s'appuie sur d'autres projets. Et puis, par curiosité, je visitai d'autres projets encore... (suspense)

 ↑ 2. Comment êtes-vous arrivé dans le mouvement Wikimédia ? Sur quel wiki en premier et comment avez-vous découvert les autres projets ?

Après Wikipédia, puis Commons, j'ai examiné plusieurs autres projets et enfin Wikimédia.

Au début, Wikimédia n'était pas un vrai mouvement mais une entreprise qui mettait en place Wikipédia, l'encyclopédie libre, dans de nombreuses langues puis soutenait d'autres projets voisins de l'encyclopédie. Wikimedia, utilisant des logiciels libres et parfois sous domaine public, s'est mis à promouvoir aussi le développement du libre. C'est plus récemment que la fondation Wikimédia, d'abord à travers la diffusion des projets et par leur utilisation avec tous, en fournissant les moyens de se connecter jusque dans les régions dépourvues d'accès au Net, est devenue un mouvement de développement local et privilégie l'intégration sociale.

j'ai cherché à comprendre l'organisation des projets par rapport à Wikimédia, comme l'existence des chapitres pour chaque projet dans un pays donné. J'ai fait ainsi au passage un peu de traduction de pages en anglais sur Wikimédia (à partir de 2015), participé plus ou moins à divers projets dont Wikiquote (fr), Wikisource, Wiktionnaire, Wikilivres. Je me suis aussi intéressé au thème de l'humour et enrichi le contenu de son portail à partir de 2015.

 ↑ 3. En vous présentant, Cantons-de-l'Est écrit : « Il trouve régulièrement des images qu'il « décore » de légendes savoureuses. » C'est dans cette activité que je vous ai aussi connu notamment sur le Bistro ou dans d'autres sections de discussions. Quand et comment avez-vous commencé à illustrer Le Bistro ?

Ce doit être le 15 décembre 2009, avec le drapeau de l'Acadie. Le calendrier du Bistro est né le 14 septembre 2005 et a vite évolué : la première illustration date du 7 novembre, la première image commentée est du 25 novembre de la même année. L'habitude est prise de décorer assez régulièrement le calendrier dès 2006. Les images avec leurs commentaires sont dans le ton du bistro, souvent légères et comiques, alternant avec des rappels de faits historiques. D'autres images se trouvent parfois ailleurs dans les discussions. Elles décrivent un aspect ou l'autre de Wikipédia en français, de ses débats.

On retrouve alors souvent DocteurCosmos en illustrateur du calendrier. Il se chargeait de l'illustrer avec un tour souvent amusant quand personne d'autre ne l'avait fait. C'est cette façon ludique qui m'a conduit à oser une première illustration dans ce petit espace en haut à droite de chaque page quotidienne du Bistro. J'ai augmenté progressivement mon implication dans ce cadre, comme une sorte de détente après un tas de modification dans les articles. Comme on pourra vérifier, les histoires de cabales et de chats au Bistro existaient depuis au moins 2006, bien avant mon arrivée Émoticône !

 ↑ 4. Vos choix d'illustration, vos légendes ainsi que parfois (souvent ?) vos commentaires de modifications sont tantôt profondes, tantôt légères, mais revêtent toujours une certaine beauté selon moi. Où trouvez-vous l'inspiration ?
— Warp3 ? Mmm... Attendez que je zoome sur l'image... Non, connais pas.

Voilà une question qui doit certainement tarabuster Cantons-de-l'Est depuis des années Émoticône. Il y a de nombreuses façons pour moi de trouver une idée de Bistro, idée souvent de type comique. Le cas le plus courant : c'est au cours de mes périgrinations quasi aléatoires sur Wikipédia et Commons que se fait la découverte de photos ou de dessins qui sont déjà comiques ou étonnantes en elle-même, ou quand leur rapport me semble raconter une historiette ; une sorte de hasard heureux peut-on dire. Sinon, quand j'ai une idée précise, quelques fois inspirée par l'actualité de wpfr, je cherche dans la catégorie idoine celles qui peuvent faire l'affaire. Et il m'arrive aussi d'élaborer des gags un peu plus complexes au saut du lit Émoticône. Dans un premier temps, j'ajoutais un lien vers une vidéo Youtube pour illustrer avec de la musique ou avec un sketch. Mais quelqu'un(e) m'a fait savoir que Commons héberge aussi des fichiers de musiques, qui sont libres de droits, contrairement aux vidéos Youtube. Depuis, je fouine dans les diverses catégories, et en place quelques-unes aux emplacements qui me semblent les plus appropriés. Cette bibliothèque de musiques (et de vidéos), pas assez connue à mon avis ni assez utilisée, semble s'être fortement enrichie ces dernières années.

Chaque fois que je place une illustration assortie d'un commentaire, je ne sais pas vraiment comment cela va être reçu, car il n'y a presque jamais de commentaires sur place ou sur ma page. En général, sur WP, quand personne ne fait de commentaire sur votre modification sur un article, ça signifie qu'elle est plus ou moins acceptée et je me figure que c'est pareil avec une image. Mais c'est comme être sur un bout de scène avec un public derrière une cloison, invisible et muet, qui peut une fois dans la rue faire un petit signe discret de connivence ou au contraire flanquer une claque, sans que je sache trop pour quoi.

 ↑ 5. Utilisez-vous des outils en particulier pour retrouver des images, les archiver, s'en souvenir ? Comment effectuez-vous vos recherches ?

Sur les projets : très peu, en fait. J'ai même décoché tout un tas de gadgets mis par défaut dans mes préférences. J'utilise parfois un éditeur de texte autre que celui de base. Pour les recherches, il arrive que c'est par les images que je retrouve certaines pages ou informations. Mais dans mes recherches d'un fichier sur Commons, je n'utilise guère le gadget fourni, qui retourne n'importe quoi tant qu'il existe dans le nom du fichier une seule erreur, ou que le nom n'est pas assez complet. Utiliser un moteur de recherche extérieur donne plus de chance de trouver le fichier cherché. Et, non, je ne fais pas de recherche SPARQL à travers WikiData, malgré les nombreux exemples donnés par les RAW (!). Question visuels, j'utilise les pauvres logiciels de base de Windows : mspaint, photo, wordpad, bloc-notes. Oui, frugalité extrême... il y a de quoi rire !

 ↑ 6. Assidu du Bistro, qu'aimez-vous y trouver et quelle est la raison d'être que vous donnez à cet espace communautaire ?

Quand j'ai découvert le Bistro à l'époque de mon inscription, je pensais y trouver une sorte d'assemblée très sérieuse réglant avec précision l'avenir de l'Encyclopédie, alors que c'était plutôt une sorte d'auberge espagnole bruyante et un tantinet folle. Le Bistro actuel est en majorité le rendez-vous de toutes les personnes un peu anciennes désireuses de débattre, et parfois d'informer la Wikipédie. C'est le lieu pour poser ses questions avec de grandes chances d'avoir au moins une réponse, que l'on soit novice ou non. Certains débats sont cependant si extravagants que je finis par les trouver rigolos ! Je préfère cependant le discours plus léger tenu par d'autres personnes, comme il arrivait souvent dans les premières années de l'existence du Bistro.

 ↑ 7. Comment trouvez-vous la convivialité et l'ambiance en général au sein de la communauté ?

La communauté de Wikipédia en français est diverse, très partagée sur plusieurs thèmes (inclusionnisme/suppressionnisme, paternalisme/féminisme, fair-use, Comité d'arbitrage (CAr), etc.) depuis au moins 2006 sur les espaces de discussions. Ce n'est que par l'observance des règles établies et de la volonté de participer sereinement à la création et à la maintenance des articles que l'on peut dire qu'il existe une sorte de lien solidaire entre les membres. L'ambiance peut être bonne ou mauvaise selon l'importance que l'on porte à ces thèmes. Il est ainsi possible d'avoir de bons rapports en travaillant sans apriori avec des personnes dans un espace d'articles peu polémiques (potentiellement plusieurs millions Émoticône) .

 ↑ 8. Quel type de wikipédien êtes-vous ? Comment décririez-vous votre manière de contribuer sur l'encyclopédie ?

Si j'ai pris un compte sur Wikipédia, c'est aussi parce que je me sentais redevable de tant d'informations offertes sans contreparties de ma part. J'ai commencé par des corrections orthographiques et quelques reformulations, mais ne me destinais pas à faire beaucoup plus. C'est en voyant l'état de quasi ébauche de l'article Bugs Bunny que je me suis décidé à le développer, par traduction de l'article anglophone. Aussi, le goût me prit de continuer des articles initiés par d'autres, d'abord dans le domaine du dessin animé alors presque déserté hormis le champ disneyien, puis dans d'autres domaines.

Wikipédiste papillonnant, assez solitaire, je passe d'un sujet à l'autre selon mes goûts du moment. L'Amérique de la période située entre 1850 et 1950, le cinéma (Warner Bros. surtout) et la musique sont autant de sujets qui m'intéressent le plus. Malgré une bonne centaine d'articles créés et pas mal de traductions de l'anglais (je vous conseille DeepL comme base) depuis plus de 15 ans, je me considère encore comme un petit rédacteur-relecteur (et suis étonné de faire partie des mille premiers modificateurs actifs de WP). Je n'ai d'ailleurs développé aucun article jusqu'à un niveau de labellisation.

 ↑ 9. Créateur de plus de 110 articles, quand considérez-vous que le sujet d'un article est épuisé avant de passer à un autre ? Quels sentiments cela vous inspire de savoir qu'il reste tant à faire sur le wiki ?

Un article très pointu (dit « d'intéret faible » dans les évaluations), comme un certain type d'invertébré marin très peu connu, s'il est traité pleinement à travers toute la documentation existante, devient un article abouti. S'il n'a pas sa belle étoile doré d'article de qualité, c'est tant pis, mais cela n'enlève rien à son degré d'achèvement. Inversement, sur un article portant sur un sujet connu où la documentation abonde, ou alors un article généraliste, il faut non seulement traiter tous les angles de vue mais aussi rester synthétique (et faire des articles secondaires), et le travail de retrait devient aussi important que celui d'ajout.

Pour ma part, les articles en anglais que je traduis, qui me plaisent, ne sont que rarement des articles complets avec labels de qualité. Je vérifie les sources et complète certains détails, mais je les sais très perfectibles. Le minimum, au-delà des sources, est que la lectrice ou le lecteur puisse se faire au moins une bonne idée du sujet, typiquement un résumé introductif (RI).

Une majorité d'articles de Wikipédia sont (encore) des ébauches ou des articles à peine développés. Tant que des sources sûres justifient l'existence d'un article et qu'il dispose d'une sorte de RI, je considère celui-ci comme valable (en tant que lecteur). Contrairement à d'autres Wikipédistes, cette masse de mini articles ne me semble pas dommageable à l'image de l'encyclopédie, au contraire ! Mieux vaut un article minimum (mais bon) que rien du tout. C'est la multiplicité des articles qui fait l'une des forces de l'Encyclopédie. Les articles faux (canulars) sont, en revanche, une plaie et à éradiquer au plus vite (merci les admins et les vigilant(e)s).

 ↑ 10. En considérant votre expérience sur le wiki, qu'est-ce qui vous a procuré le plus grand plaisir sur Wikipédia ? Au contraire, qu'est-ce qui vous a le plus marqué négativement ?

Il n'y a pas beaucoup d'expériences à vivre sur Wikipédia si on reste à faire des modifications légères sur des articles sans controverses, voire peu lus. Mais dès que l'on prend un compte et que l'on s'attaque à certains gros articles, on rencontre fatalement une partie de la « communauté» hétéroclite wikipédienne.

Il y a eu plusieurs heureuses rencontres, mais je crois que l'une des plus heureuses fut celle de la création des RAW, journal à la fois très instructif et bien présenté par son créateur (mais non, je ne fais pas de la publicité éhontée !). Après réflexion, je dirais que la pire rencontre arriva deux mois après mon inscription, à propos d'une discussion sur ma page de discussion avec un Wikipédien dynamique, aujourd'hui admin actif. Juste après un de mes propos pourtant assez mesuré, déboula sur ma page un parfait inconnu qui se mit à me faire une leçon wikipédienne magistrale dans le plus pur style des « anciens » s'adressant à un complet ignorant. J'avais beau m'être mentalement préparé à des avis extrêmes ou divagants, ce genre d'attaque très limite fut fort désagréable, surtout quand elle fut appuyée par d'autres.

 ↑ 11. Quels seront selon vous les plus grands défis de Wikipédia en français dans les cinq prochaines années ?

Je ne suis pas dans le secret des dieux, mais je crois percevoir :

- L'arrivée de l'intelligence articielle (IA, donc) sur WP est un peu ce que depuis longtemps des Wiképidistes appelaient de leurs vœux pour traiter les millions d'articles de façon automatique. Est-ce la bonne formule ? On peut en douter, dans l'état actuel. Le bon usage de cette IA sur WP reste à définir, et à faire évoluer en même temps qu'elle. Peut-elle éclipser WP même ? La boule de cristal est floue, rappelez plus tard Sourire diabolique.

- Les nouvelles structures qui se mettent lentement en place sous l'égide de Wikimédia, et qui semblent être complètement ignorées du gros de la communauté wikipédienne francophone, mis à part l'application du Code de conduite universel dans les règles de wpfr.

- Maintenir une certaines cohésion entre les membres des Wikipédistes, faire évoluer certaines mentalités ; attirer de nouveaux membres actifs ; se prémunir contre les nouvelles formes d'atteintes aux articles : publicitaires, politiques ou autres ; trouver (et financer) un moyen pérenne de conserver les traces des sources sur Internet.

 ↑ 12. Que pensez-vous des médias qui sont stockés sur Wikimedia Commons et du wiki en général ?

(Wikimedia) Commons est un site énorme, qui recueille des documents (hors textes), pas seulement des photos mais aussi des vidéos et des fichiers sonores. Des musées et institutions prestigieux sont sollicités, ce qui fait que des images exceptionnelles, historiques, y sont copiés et cotoient le reste, inimaginable tant il y en a.

Je me suis incrit presque en même temps sur Commons, site qui héberge donc la plupart des fichiers libres de droits utilisés par Wikipédia, dans le but d'illustrer certains articles. Tout d'abord, j'ai posté quelques-unes de mes photos et me suis conformé aux règles (pas exactement fixées) des droits d'auteur. Mais au fur et à mesure des années, les administrateurs et autres personnes à statut m'ont semblé avoir un comportement de plus en plus incohérent face au soupçon de copyright : aveugles à des imports clairement douteux et sans source mais impitoyables, voire désinvoltes, avec d'autres pourtant accompagnés d'une preuve d'ancienneté suffisante ou/et d'autres garanties. Cela m'a ôté l'envie de discuter et d'y importer quoi que ce soit. Je me contente maintenant principalement de traduire le descriptif des fichiers ou de les catégoriser.

 ↑ 13. Si j'en crois ce diff, le concours de l'image de l'année POTY vous intéresse. Quels ont été vos coups de cœur ou les images qui vous ont profondément marquées depuis que vous suivez ce concours ?

Les concours d'images (principalement photographiques) Picture of the Year (POTY) organisés sur Commons chaque année depuis 2006 sont un plaisir des yeux. Depuis que je connais l'existence du concours, j'y participe régulièrement et leur fait une certaine publicité au Bistro. J'ai aidé à traduire des pages et à vérifier la validité de votes, quand tout était encore fait à la main et qu'il fallait tout refaire et repenser chaque année. Ces dernières années, une poignée de codeurs ont pris le taureau par les cornes et ont automatisé la création au maximum. Cela évite en bonne partie la triche et le recompte manuel mais il n'y a plus le charme des commentaires qui étaient aussi utiles aux photographes participants, et la tenue d'une nouvelle édition ne semble plus être décidée que par eux. Trop de photos m'ont ébloui par leur qualité ou leur sujet pour me décider de seulement quelques-unes ! J'ai découvert cependant que deux noms de photographes reviennent souvent dans les auteurs des photos que je trouve parmi les meilleures : Luc Viatour et Basile Morin (ce dernier étant aussi remarquable pour ses nombreux et excellents ambigrammes). La photo gagnante du concours 2023 est superbe en plus d'être étonnante, même si je ne l'ai pas choisie au dernier tour. Mais elle a eu droit auparavant à plein de prix et je l'avais utilisée dans le Bistro du 15 juillet 2023. Une photo remarquable plus ancienne mais découverte par moi il y a peu de temps m'a complètement désorienté au premier coup d'œil (voir mon commentaire ici).

 ↑ 14. Quel(le) wikimédien(ne) souhaiteriez-vous voir interviewé(e) dans un prochain numéro et sur quel thème ?

Il y a beaucoup de candidats possibles (et disponibles !) mais je serais curieux de Kropotkine 113, Wikipédiste chevronné toujours présent mais finalement assez discret sur les espaces de discussions grand public.

 ↑ 15. Y a-t-il un sujet particulier qui vous tient à cœur et qu’on n’a pas abordé dans cet entretien ? Vous avez carte blanche 🙂.

Je tiens à (re)dire à Cantons-de-l'Est mon plein soutien à la création d'un dictionnaire visuel (multilingue) !

 ↑ 16. Avez-vous un message particulier à adresser aux lectrices et lecteurs du RAW ? Quel serait votre mot de la fin ?

Pas particulèrement au lectorat des RAW mais plutôt aux Wikipédistes en général : si vous avez une idée, ou si une remarque vous tient à cœur, exprimez-la gentiment : on ne vous embastillera pas pour cela ! Si participer à Wikipédia devient une obsession ou un énorme boulet, prenez des vacances. Mais si rien de Wikipédia ne vous plait, alors peut-être que Wikipédia... n'est pas (ou plus) pour vous.

Merci d'avoir accepté cette interview. Bonne continuation !

L'agenda

Les autres infolettres

La page Wikipédia:RAW/Découvrir recense les infolettres et blogs relatifs à Wikimedia.

En plus de RAW, vous pouvez lire le Wikimag, newsletter hebdomadaire de la Wikipedia francophone (Voir le dernier numéro Wikipédia:Wikimag/2024/44), l'infolettre Wikifier la science (voir le dernier numéro Projet:Wikifier la science/Infolettre/Octobre 2024) et les Actualités du Wiktionnaire newsletter mensuelle du Wiktionnaire (wikt:Wiktionnaire:Actualités/114-septembre-2024).

Les anglophones peuvent aussi lire The Signpost, publié toutes les deux semaines, la newsletter hebdo de la communauté Wikidata (voir ici d:Wikidata:Status updates/2024 10 28) ou encore la newsletter du projet Wikifunction ("wikifunction:Wikifunctions:Status updates/2024-10-25).

Courrier du lectorat

(Il nous fera plaisir de lire les messages déposés ici et, si nécessaire, d'y répondre dans les plus brefs délais.)

Wikipédia face au problème du contenu généré par intelligence artificielle — L’intérêt des intelligences artificielles génératives comme ChatGPT réside, selon moi, dans leur capacité de rédaction. À partir du moment où on leur fournit une première version d’un texte sourcé, elles sont capables de le synthétiser ou de le compléter afin qu’il soit rédigé dans un style clair et encyclopédique. De ce point de vue, ce sont d’excellents assistants.
En revanche, comme dit Le chat perché, elles ne peuvent pas faire le travail à notre place, et ce pour une raison très simple : elles ne sont pas conçues pour. Ce sont des IA « probabilistes ». Elle donne le résultat « le plus probable », pas forcément le plus fiable. C’est ce qui explique qu’elles peuvent inventer un concept scientifique… qui n’existe pas, ou encore inventer des sources. Attention donc à ne pas les prendre pour ce qu’elles ne sont pas Émoticône. Merci aux rédacteurs et rédactrices du RAW, comme toujours très instructif.--Pronoia (discuter) 1 novembre 2024 à 10:10 (CET)

De mon côté, ce qui m'inquiète le plus est l'illusion de qualité avec des utilisateurs ne voyant même pas les problèmes. Pour l'exemple, question que j'ai posé hier sur quoi faire avec ce cas où il se pourrait que l'utilisateur soit de bonne foi. J'ai prévu de traduire cet essai anglais pour avoir une base pédagogique vers laquelle orienter mais si ce genre de chose se développe, faudra peut-être penser à un avertissement quelque part pour que toute personne venant contribuer sache qu'il y a des choses à ne pas faire.
Pour l'heure, le principe de signalement n'est pas encore en place côté francophone mais côté anglophone, ils ont eu 69 articles indiqués en octobre et si on en croit l'étude indiquée plus haut, il y a des chances qu'on en rate. Fabius Lector (discuter) 1 novembre 2024 à 11:50 (CET)
Je partage l'inquiétude sur l'illusion de qualité. Mais ça va au delà de l'IA.
Sinon je suis honnoré d'être cité Émoticône. Le chat perché (discuter) 1 novembre 2024 à 13:35 (CET)

Biais de surreprésentation des idées et auteurs occidentaux — Merci PAC2 pour ton outil de mesure des biais géographiques dans les articles ! Je trouve cela très parlant et assez préoccupant de voir que Wikipédia reflète avant tout les connaissances occidentales. Il y a probablement une explication historique à ça (naissance de la science moderne en Europe, développement de la plupart des disciplines universitaires en Occident + colonisation, effacement des savoirs autochtones et difficultés d'accès aux études supérieures dans beaucoup d'endroits). On a du boulot pour lutter contre ce biais ! Skimel (discuter) 2 novembre 2024 à 09:58 (CET)

Grande interview de Warp3 — Merci Warp3 pour cette interview, qui m'a diverti de mes soucis IRL. Comme d'habitude, j'ai lu des observations et des commentaires qui m'ont fait Émoticône ! — Cantons-de-l'Est p|d|d 🧹 4 novembre 2024 à 23:51 (CET)

Boîtes à livres — Merci pour la mention, je n'avais pas encore lu ce RAW, quelle bonne surprise de voir le site mentionné ! Symac (discuter) 7 novembre 2024 à 13:12 (CET) (développeur dudit site :p)

L'IA a une forte valeur ajoutée pour "aider à faire" mais jamais pour "faire à la place".
 – Le chat perché sur le Bistro.
Rédigé/traduit par L'embellie et PAC2.
Citations originales
Notes
Références
  1. Découvert via https://wikis.world/@festal@tldr.nettime.org/113243136048240433
  2. https://www.404media.co/the-editors-protecting-wikipedia-from-ai-hoaxes/
  3. en:Wikipedia:Wikipedia Signpost/2024-10-19/Recent research
  4. Pour les plus curieuses et les plus curieux, la méthode Binoculars est une méthode de détection des textes générés par des grands modèles de langage qui s'appuie sur la « perplexité croisée  » de deux grands modèles de langage. Pour en savoir plus : https://arxiv.org/html/2401.12070v3
  5. a et b (en) Creston Brooks, Samuel Eggert et Denis Peskoff, « The Rise of AI-Generated Content in Wikipedia », {{Article}} : paramètre « périodique » manquant,‎ (lire en ligne).
  6. « Since 2017, Herron’s two accounts have made more than 300 contributions to pages on Wikipedia, of which more than half are entirely embellishments to Herron’s page, but there are notable deletions of positive content from the pages of Dauwalter, 2018 Boston Marathon champion Des Linden and Greek ultrarunning legend Yiannis Kouros. »- Merci DeepL pour la traduction. C'est pas parfait mais c'est pratique :).
  7. Victor Garcia, « Patrick Hetzel, un ministre bien peu scientifique : enquête sur le discret nettoyage de sa page Wikipédia », L’Express, (consulté le )
  8. https://x.com/WikiResearch/status/1843699094579229068
  9. Découvert via d:Wikidata:Status_updates/2024_10_14
  10. « As the saying goes, we move fast and break things: Wikidata is getting too big, too fast. The Wikidata Query Service graph got so huge it will be split, and the growth of the core database is deemed unsustainable. »
  11. « Let’s have it for slow data. Let’s make edits that take minutes rather than racking tens per second. (And sure, “It’s not the quantity, it’s the quality” is an old Wikipedia trope, at times ill-used, but not wrong per se.) »
  12. Traduit avec DeepL.com (version gratuite) « This does not mean not creating new items. But it does mean creating them more intentionally. The old, somewhat hyperbolic jest is that Wikipedia is full of articles that « no-one will ever read » (and I have done my fair share of that!) ; but on Wikidata, we sure have items that were not even created by someone, merely by something. »
  13. https://wikidata-game.toolforge.org/#
  14. https://observablehq.com/@pac02/explore-gender-diversity-in-a-single-wikipedia-article
  15. https://observablehq.com/@pac02/articles-wikilinks-inspector
  16. https://observablehq.com/@pac02/olympic-medals-by-continent
  17. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Intelligence%20artificielle
  18. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Philosophie
  19. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Amour
  20. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Musique
  21. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Humanit%C3%A9
  22. J'emprunte l'expression reste du monde au média Rest of world : https://restofworld.org/about/
  23. https://www.wikimedia.fr/participer-au-prix-wikimedia-de-la-recherche/

Numéro du 15 novembre 2024

Friday, 15 November 2024 00:00 UTC

Éloge de la lenteur / L'édito de PAC2 — Depuis 2 ans que je contribue activement à RAW, la question de l'intelligence artificielle revient régulièrement dans l'actualité de Wikimédia. Ce numéro n'échappe pas à la règle et on retrouve encore dans ce numéro des inquiétudes face à la tentation de l'IA. À rebours des « accélérationnistes » qui veulent utiliser l'IA pour contribuer plus vite et mettre toujours plus de contenu, Jean-Frédéric sur le blog The Commonist fait un éloge bienvenu de la lenteur et de la contribution artisanale.

Vous trouverez aussi ce mois-ci une interview de Warp3 et un format atelier pour réfléchir à la représentation des personnalités des différents continents dans les articles Wikipédia.

Les brèves

Wikipédia face au problème du contenu généré par intelligence artificielle — Sur la Wikipédia anglophone, la communauté a créé un projet spécifique pour lutter contre le problème des contenus générés par intelligence artificielle mal sourcés et mal écrits[1]. 404 média revient en détail sur les enjeux. Un article anglophone sur la forteresse Amberlihisar, qui n'a jamais existé, constitue un bon exemple de mauvais recours à l'IA. L'IA a notamment généré des références parfaitement mises en forme mais totalement fictives. Le projet AI Cleanup recense aussi les images synthétiques. Certaines sont légitimes et sont utilisées à bon escient mais d'autres sont manifestement trompeuses[2].

Dans son édition du 19 octobre, The Signpost revient sur un récent article académique cherchant à quantifier la part de nouveaux articles générés avec de grands modèles de langage[3]. L'article intitulé « The Rise of AI-Generated Content in Wikipedia » utilise deux détecteurs automatiques de grands modèles de langage, GPTZero et Binoculars[4] pour estimer la proportion d'articles contenant des morceaux générés par des grands modèles de langage parmi les articles créés en août 2024[5].

« À l'aide de deux outils, GPTZero et Binoculars, nous détectons que jusqu'à 5 % des 2 909 articles anglais de Wikipédia créés en août 2024 contiennent un contenu significatif généré par l'IA. Les seuils de classification des deux outils ont été calibrés pour maintenir un taux de faux positifs ne dépassant pas 1 % sur une base Wikipédia pré-GPT-3.5, comme indiqué par la ligne rouge[5]. »

Sur la Wikipédia francophone, Fabius Lector a créé le projet Projet:Observatoire des IA et Simonk a initié un essai sur l'intelligence artificielle.

Logo de la conférence

WikiIndaba2024 — La conférence WikiIndaba, consacrée à la présence de l'Afrique sur Wikipédia, a eu lieu du 4 au 6 octobre à Johannesbourg.

Camille Herron, championne d'ultra-marathon et wikipédienne sous les pseudos Rundbowie et Temporun73.

La coureuse Camille Herron accusée de manipuler Wikipedia — La coureuse Camille Herron et son mari et entraîneur Conor Holt sont accusés d'avoir manipulé Wikipédia en diminuant le palmarès de concurrentes de Camille Herron.

« Depuis 2017, les deux comptes de Herron ont apporté plus de 300 contributions à des pages de Wikipédia, dont plus de la moitié sont entièrement des embellissements de la page de Herron, mais il y a des suppressions notables de contenu positif des pages de Dauwalter, du champion du marathon de Boston 2018 Des Linden et de la légende grecque de l'ultrarunning Yiannis Kouros[6]. »

Patrick Hetzel est ministre de l'enseignement supérieur et de la recherche dans le gouvernement de la République française depuis septembre 2024.

Le cabinet du ministre de l'enseignement supérieur et de la recherche français manipule Wikipédia ! — Une enquête du magazine L'Express révèle que le cabinet du nouveau ministre de l'enseignement supérieur et de la recherche français, Patrick Hetzel, a tenté de manipuler la biographie Wikipedia du ministre[7].

Florence Devouard, ancienne présidente de la fondation Wikimédia, est à l'initiative de la campagne SheSaid.

Florence Devouard interviewée sur l'initiative SheSaidDiff, le blog de la communauté interviewe Florence Devouard sur l'initiative de la campagne SheSaid.

« J'ai remarqué très tôt que les femmes étaient peu nombreuses dans nos projets, mais je ne me suis vraiment impliquée dans la lutte contre l'écart entre les sexes que lorsque Isla Haddow-Flood et moi-même avons lancé l'initiative Wiki Loves Women en 2016. Nous avons exploré différentes stratégies pour recruter plus de femmes, fournir un environnement plus inclusif, former et soutenir, mettre en œuvre différentes stratégies. Le sujet est complexe. En 2020, en pleine pandémie, j'ai lancé l'idée de #SheSaid... et nous voilà 4 ans plus tard ! »

Boîte à livres à Amboise, France.

11 000 boîtes à livres recensées — Le site boîtes-à-livres.fr recense les boîtes à livres en France en s'appuyant sur OpenStreetMap et Wikimédia Commons. On y trouve maintenant plus de 11 000 boîtes à livres.

Tous les chemins entre deux éléments Wikidata — Des chercheurs ont développé un nouvel outil capable de trouver tous les chemins possibles entre deux entités Wikidata[8].

Articles les plus centraux — L'université de Milan publie la liste des articles les plus centraux de Wikipédia (à priori uniquement la version anglophone).

C'est la saison des Nobel — Chaque année les différents prix Nobel sont remis début octobre. C'est l'occasion de remettre à jour et de développer de nouveaux notebooks consacrés aux Nobel.

Comme pour les jeux olympiques, on peut calculer la concentration des prix par pays de nationalité à partir d'une requête Wikidata.

Les États-Unis sont en tête du classement pour le prix Nobel de médecine, le prix Nobel de physique, le prix Nobel de la paix et le prix Nobel de Chimie. La France est en tête pour le prix Nobel de littérature. Les États-Unis obtiennent près de 40% des prix en médecine et plus de 32% des prix en physique et en chimie ! Parmi les cinq prix Nobel historique, c'est le prix Nobel de littérature qui est le plus diversifié en terme de pays de nationalité.

Jean-Frédéric propose l'approche SNAIL, acronyme de « Slow, NArrow, In-depth, Local », ce qu'on peut traduire par « Lent, précis, en profondeur et local ».

L'approche escargot ou l'éloge de la lenteur — Sur le blog The Commonists, Jean-Frédéric propose une approche escargot à la contribution #Wikidata 🐌[9]!

Plutôt que de faire de l'édition en masse, il propose de prendre le temps de faire de la contribution manuelle.

« Comme le dit le proverbe, nous allons vite et nous cassons des choses : Wikidata devient trop gros, trop vite. Le graphique du service d'interrogation de Wikidata a pris une telle ampleur qu'il sera scindé, et la croissance de la base de données principale est jugée insoutenable[10]. »

Plutôt que d'utiliser QuickStatement ou OpenRefine, Jean-Frédéric propose l'approche lente en s'inspirant du mouvement lent :

« Faisons ça avec les données lentes. Faisons des modifications qui prennent des minutes au lieu d'en faire des dizaines par seconde. (Et bien sûr, "Ce n'est pas la quantité, c'est la qualité" est un vieux trope de Wikipedia, parfois mal utilisé, mais pas faux en soi)[11]. »

« Cela ne signifie pas qu'il ne faut pas créer de nouveaux articles. Mais cela signifie qu'il faut les créer plus intentionnellement. La vieille plaisanterie, quelque peu hyperbolique, est que Wikipédia est pleine d'articles que " personne ne lira jamais " (et j'en ai fait ma part !) ; mais sur Wikidata, nous avons certainement des articles qui n'ont même pas été créés par quelqu'un, mais simplement par quelque chose[12]. »

Une nouvelle interface pour contribuer aux données lexicographiques de Wikidata — Lexico est une nouvelle interface qui permet de faciliter la contribution aux données lexicographiques (lexemes) sur Wikidata. Le principe rappelle les Wikidata Games de Magnus Manske[13].

65 000 citations sur Wikiquote — Wikiquote en français compte désormais 65 000 citations réparties sur près de 9 000 pages.

L'atelier

Dans cette section, un(e) wikimédien(ne) peut raconter un de ses bricolages à la première personne.

Ce mois-ci c'est PAC2 qui raconte comment il a bricolé un outil pour mesurer les biais de Wikipedia.

Il y a quelques années, j'avais développé le Gender Diversity Explorer, un petit outil en ligne qui récupère tous les liens bleus d'un article Wikipédia (ie les mentions), récupère la valeur de la propriété P21 (Sexe ou genre) dans l'élément Wikidata associé et calculé des statistiques de genre sur la répartition des entités nommées dans l'article[14].

L'approche se généralise facilement à n'importe quelle propriété dans Wikidata. C'est ce que propose le Wikilinks inspector[15].

Pour réfléchir à la représentation de certains continents comme l'Afrique ou l'Amérique du Sud, j'avais besoin d'adapter l'outil et de trouver un bon moyen de faire la correspondance entre des pays et des continents. C'est mon travail sur la répartition des médailles aux jeux olympiques qui m'a permis de trouver le bon moyen d'obtenir une correspondance à peu près pertinente entre pays et continents[16].

Techniquement, la magie vient toujours de la possibilité d'appeler l'api Wikimédia depuis une requête SPARQL :

SELECT ?item ?itemLabel ?country ?countryLabel 
WHERE {
  SERVICE wikibase:mwapi {
     bd:serviceParam wikibase:endpoint "fr.wikipedia.org";
                     wikibase:api "Generator";
                     mwapi:generator "links";
                     mwapi:titles "Intelligence artificielle";.
     ?item wikibase:apiOutputItem mwapi:item.
  } 
  FILTER BOUND (?item)
  ?item wdt:P31 wd:Q5 . 
  ?item wdt:P27 ?country . 
  ?country rdfs:label ?countryLabel filter (lang(?countryLabel) = "en") .
  ?item rdfs:label ?itemLabel filter (lang(?itemLabel) = "en") .
}

Cliquez pour essayer !

On combine ça ensuite avec la requête sur les continents et le tour est joué :

SELECT DISTINCT ?continent ?continentLabel ?country  ?code WHERE {
VALUES ?continent {
wd:Q55643
wd:Q48
wd:Q15
wd:Q18
wd:Q49
wd:Q46
} 
 ?continent (wdt:P527*) ?country.
  ?country 
    wdt:P2082 ?code.
  SERVICE wikibase:label { bd:serviceParam wikibase:language "en". }
}

Cliquez pour essayer !

Venons en maintenant aux résultats. Si on prend un article sur un thème très général et si Wikipedia représente l'ensemble des connaissances sur un sujet, on devrait s'attendre à avoir une représentation de personnalités de tous les continents dans les entités mentionnées dans un article.

Maintenant, quand on regarde l'article Intelligence artificielle, on trouve 69 personnalités nord-américaines, 58 personnalités européennes, 9 personnalités non classées pour seulement 6 personnalités asiatiques, 5 personnalités africaines, 3 personnalités oceaniennes et 2 personnalités sud-americaines[17].

L'article Philosophie mentionne 158 personnalités européennes mais aucune personnalité africaine[18].

L'article Amour mentionne une personnalité africaine pour 58 personnalités européennes[19].

L'article Travail ne mentionne aucune personnalité africaine, aucune personnalité asiatique ou aucune personnalité sud-américaine contre 23 personnalités européennes.

Même bilan avec l'article Musique : 36 personnalités européennes, 6 nord américaines et 1 océanienne mais aucune personnalité asiatique, africaine ou sud-américaine[20].

On pourrait penser que l'article consacré à l'humanité mentionnerait des personnalités de tous les continents. Ça n'est pas le cas. On ne compte aucun représentant de l'Océanie, de l'Afrique et de l'Asie dans l'article[21].

On peut multiplier les exemples et on voit que les continents nord-americains et européens sont largement représentés alors que les autres continents et notamment l'Afrique et l'Amérique du Sud sont représentés de manière marginale dans les articles généraux de l'encyclopédie.

Il y a sans doute de multiples raisons à ce déséquilibre. L'outil peut nous aider à prendre conscience du déséquilibre et chercher, article par article, des idées pour mieux représenter les personnes des continents sous représentés. En creux, on en vient à se demander si Wikipedia représente la « somme de toutes les connaissances » ou simplement le point de vue européen et nord-américain. Le point de vue du « reste du monde » est aujourd'hui manifestement peu représenté dans Wikipedia[22].

La grande interview

Dans cette section, nous donnons la parole à des wikimédien(ne)s sur des thèmes donnés afin de recueillir leurs avis ou les faire parler tout simplement de leurs expériences dans le mouvement.

Entretien avec Warp3

Ses activités wikimédiennes.
Par écrit sur cette page.
L'embellie.
Merci à Noé et Cantons-de-l'Est pour les suggestions de questions.
 ↑ 1. Bonjour Warp3. Merci d'avoir accepté cet entretien après que Cantons-de-l'Est vous ait suggéré comme invité. Pour commencer, je vous laisse vous présenter.

Comme beaucoup de Wikipédistes anciens et français, j'ai connu les débuts d'Internet en France en entreprise puis à domicile, période riche en projets informatiques de toutes les sortes. Intéressé par les articles de vulgarisation dans plusieurs domaines, j'eus vent d'un projet de réalisation d'une encyclopédie à accès gratuit sur le Net, qui s'appelait Wikipédia. Il y avait alors quelques autres encyclopédies comme Encarta de Windows, sur disquettes ou CD, mais assez chères, et les rares encyclopédies gratuites étaient très limités dans leur étendue et d'usage pas bien pratique. Le premier contact avec ce projet balbutiant fut une relative déception : peu d'articles et pas grand-chose dedans.

J'y revins quelques années après... et c'était déjà beaucoup mieux ! Peu à peu, je trouvais le plus souvent un article de Wikipédia après une recherche avec Google, et je m'étonnais que, même si l'article était peu développé, il répondait au minimum à la question « qu'est-ce que c'est ? ». Je faisais alors quelques apports ou corrections minimes, à l'occasion. Quelque trois ans après, fort d'avoir parcouru des pages d'aides et de règles (pas faciles à trouver) ainsi que plusieurs discussions, je fus fin prêt à prendre un compte... mais j'ai attendu encore deux ans avant de m'incrire fin juin 2008, sur un coup de tête. Première constatation après : hors l'accueil (automatique), l'impression d'être complètement seul à se dépatouiller dans l'édition (les pages de discussions des articles sont très souvent vides), jusqu'à me demander où se retrouvaient les Wikipédistes. C'est sur quelques pages plus spécifiques qu'ils se « cachaient », dont un certain Bistro.

Ma page de présentation contient un peu de mon état d'esprit au moment de l'inscription (elle est succinte et un peu ancienne maintenant, mais elle reste encore d'actualité). J'appris qu'il fallait s'inscrire aussi à un autre projet : WM Commons, afin d'ajouter des images (y compris les siennes) à un article. C'était cependant une façon de découvrir que Wikipédia s'appuie sur d'autres projets. Et puis, par curiosité, je visitai d'autres projets encore... (suspense)

 ↑ 2. Comment êtes-vous arrivé dans le mouvement Wikimédia ? Sur quel wiki en premier et comment avez-vous découvert les autres projets ?

Après Wikipédia, puis Commons, j'ai examiné plusieurs autres projets et enfin Wikimédia.

Au début, Wikimédia n'était pas un vrai mouvement mais une entreprise qui mettait en place Wikipédia, l'encyclopédie libre, dans de nombreuses langues puis soutenait d'autres projets voisins de l'encyclopédie. Wikimedia, utilisant des logiciels libres et parfois sous domaine public, s'est mis à promouvoir aussi le développement du libre. C'est plus récemment que la fondation Wikimédia, d'abord à travers la diffusion des projets et par leur utilisation avec tous, en fournissant les moyens de se connecter jusque dans les régions dépourvues d'accès au Net, est devenue un mouvement de développement local et privilégie l'intégration sociale.

j'ai cherché à comprendre l'organisation des projets par rapport à Wikimédia, comme l'existence des chapitres pour chaque projet dans un pays donné. J'ai fait ainsi au passage un peu de traduction de pages en anglais sur Wikimédia (à partir de 2015), participé plus ou moins à divers projets dont Wikiquote (fr), Wikisource, Wiktionnaire, Wikilivres. Je me suis aussi intéressé au thème de l'humour et enrichi le contenu de son portail à partir de 2015.

 ↑ 3. En vous présentant, Cantons-de-l'Est écrit : « Il trouve régulièrement des images qu'il « décore » de légendes savoureuses. » C'est dans cette activité que je vous ai aussi connu notamment sur le Bistro ou dans d'autres sections de discussions. Quand et comment avez-vous commencé à illustrer Le Bistro ?

Ce doit être le 15 décembre 2009, avec le drapeau de l'Acadie. Le calendrier du Bistro est né le 14 septembre 2005 et a vite évolué : la première illustration date du 7 novembre, la première image commentée est du 25 novembre de la même année. L'habitude est prise de décorer assez régulièrement le calendrier dès 2006. Les images avec leurs commentaires sont dans le ton du bistro, souvent légères et comiques, alternant avec des rappels de faits historiques. D'autres images se trouvent parfois ailleurs dans les discussions. Elles décrivent un aspect ou l'autre de Wikipédia en français, de ses débats.

On retrouve alors souvent DocteurCosmos en illustrateur du calendrier. Il se chargeait de l'illustrer avec un tour souvent amusant quand personne d'autre ne l'avait fait. C'est cette façon ludique qui m'a conduit à oser une première illustration dans ce petit espace en haut à droite de chaque page quotidienne du Bistro. J'ai augmenté progressivement mon implication dans ce cadre, comme une sorte de détente après un tas de modification dans les articles. Comme on pourra vérifier, les histoires de cabales et de chats au Bistro existaient depuis au moins 2006, bien avant mon arrivée Émoticône !

 ↑ 4. Vos choix d'illustration, vos légendes ainsi que parfois (souvent ?) vos commentaires de modifications sont tantôt profondes, tantôt légères, mais revêtent toujours une certaine beauté selon moi. Où trouvez-vous l'inspiration ?
— Warp3 ? Mmm... Attendez que je zoome sur l'image... Non, connais pas.

Voilà une question qui doit certainement tarabuster Cantons-de-l'Est depuis des années Émoticône. Il y a de nombreuses façons pour moi de trouver une idée de Bistro, idée souvent de type comique. Le cas le plus courant : c'est au cours de mes périgrinations quasi aléatoires sur Wikipédia et Commons que se fait la découverte de photos ou de dessins qui sont déjà comiques ou étonnantes en elle-même, ou quand leur rapport me semble raconter une historiette ; une sorte de hasard heureux peut-on dire. Sinon, quand j'ai une idée précise, quelques fois inspirée par l'actualité de wpfr, je cherche dans la catégorie idoine celles qui peuvent faire l'affaire. Et il m'arrive aussi d'élaborer des gags un peu plus complexes au saut du lit Émoticône. Dans un premier temps, j'ajoutais un lien vers une vidéo Youtube pour illustrer avec de la musique ou avec un sketch. Mais quelqu'un(e) m'a fait savoir que Commons héberge aussi des fichiers de musiques, qui sont libres de droits, contrairement aux vidéos Youtube. Depuis, je fouine dans les diverses catégories, et en place quelques-unes aux emplacements qui me semblent les plus appropriés. Cette bibliothèque de musiques (et de vidéos), pas assez connue à mon avis ni assez utilisée, semble s'être fortement enrichie ces dernières années.

Chaque fois que je place une illustration assortie d'un commentaire, je ne sais pas vraiment comment cela va être reçu, car il n'y a presque jamais de commentaires sur place ou sur ma page. En général, sur WP, quand personne ne fait de commentaire sur votre modification sur un article, ça signifie qu'elle est plus ou moins acceptée et je me figure que c'est pareil avec une image. Mais c'est comme être sur un bout de scène avec un public derrière une cloison, invisible et muet, qui peut une fois dans la rue faire un petit signe discret de connivence ou au contraire flanquer une claque, sans que je sache trop pour quoi.

 ↑ 5. Utilisez-vous des outils en particulier pour retrouver des images, les archiver, s'en souvenir ? Comment effectuez-vous vos recherches ?

Sur les projets : très peu, en fait. J'ai même décoché tout un tas de gadgets mis par défaut dans mes préférences. J'utilise parfois un éditeur de texte autre que celui de base. Pour les recherches, il arrive que c'est par les images que je retrouve certaines pages ou informations. Mais dans mes recherches d'un fichier sur Commons, je n'utilise guère le gadget fourni, qui retourne n'importe quoi tant qu'il existe dans le nom du fichier une seule erreur, ou que le nom n'est pas assez complet. Utiliser un moteur de recherche extérieur donne plus de chance de trouver le fichier cherché. Et, non, je ne fais pas de recherche SPARQL à travers WikiData, malgré les nombreux exemples donnés par les RAW (!). Question visuels, j'utilise les pauvres logiciels de base de Windows : mspaint, photo, wordpad, bloc-notes. Oui, frugalité extrême... il y a de quoi rire !

 ↑ 6. Assidu du Bistro, qu'aimez-vous y trouver et quelle est la raison d'être que vous donnez à cet espace communautaire ?

Quand j'ai découvert le Bistro à l'époque de mon inscription, je pensais y trouver une sorte d'assemblée très sérieuse réglant avec précision l'avenir de l'Encyclopédie, alors que c'était plutôt une sorte d'auberge espagnole bruyante et un tantinet folle. Le Bistro actuel est en majorité le rendez-vous de toutes les personnes un peu anciennes désireuses de débattre, et parfois d'informer la Wikipédie. C'est le lieu pour poser ses questions avec de grandes chances d'avoir au moins une réponse, que l'on soit novice ou non. Certains débats sont cependant si extravagants que je finis par les trouver rigolos ! Je préfère cependant le discours plus léger tenu par d'autres personnes, comme il arrivait souvent dans les premières années de l'existence du Bistro.

 ↑ 7. Comment trouvez-vous la convivialité et l'ambiance en général au sein de la communauté ?

La communauté de Wikipédia en français est diverse, très partagée sur plusieurs thèmes (inclusionnisme/suppressionnisme, paternalisme/féminisme, fair-use, Comité d'arbitrage (CAr), etc.) depuis au moins 2006 sur les espaces de discussions. Ce n'est que par l'observance des règles établies et de la volonté de participer sereinement à la création et à la maintenance des articles que l'on peut dire qu'il existe une sorte de lien solidaire entre les membres. L'ambiance peut être bonne ou mauvaise selon l'importance que l'on porte à ces thèmes. Il est ainsi possible d'avoir de bons rapports en travaillant sans apriori avec des personnes dans un espace d'articles peu polémiques (potentiellement plusieurs millions Émoticône) .

 ↑ 8. Quel type de wikipédien êtes-vous ? Comment décririez-vous votre manière de contribuer sur l'encyclopédie ?

Si j'ai pris un compte sur Wikipédia, c'est aussi parce que je me sentais redevable de tant d'informations offertes sans contreparties de ma part. J'ai commencé par des corrections orthographiques et quelques reformulations, mais ne me destinais pas à faire beaucoup plus. C'est en voyant l'état de quasi ébauche de l'article Bugs Bunny que je me suis décidé à le développer, par traduction de l'article anglophone. Aussi, le goût me prit de continuer des articles initiés par d'autres, d'abord dans le domaine du dessin animé alors presque déserté hormis le champ disneyien, puis dans d'autres domaines.

Wikipédiste papillonnant, assez solitaire, je passe d'un sujet à l'autre selon mes goûts du moment. L'Amérique de la période située entre 1850 et 1950, le cinéma (Warner Bros. surtout) et la musique sont autant de sujets qui m'intéressent le plus. Malgré une bonne centaine d'articles créés et pas mal de traductions de l'anglais (je vous conseille DeepL comme base) depuis plus de 15 ans, je me considère encore comme un petit rédacteur-relecteur (et suis étonné de faire partie des mille premiers modificateurs actifs de WP). Je n'ai d'ailleurs développé aucun article jusqu'à un niveau de labellisation.

 ↑ 9. Créateur de plus de 110 articles, quand considérez-vous que le sujet d'un article est épuisé avant de passer à un autre ? Quels sentiments cela vous inspire de savoir qu'il reste tant à faire sur le wiki ?

Un article très pointu (dit « d'intéret faible » dans les évaluations), comme un certain type d'invertébré marin très peu connu, s'il est traité pleinement à travers toute la documentation existante, devient un article abouti. S'il n'a pas sa belle étoile doré d'article de qualité, c'est tant pis, mais cela n'enlève rien à son degré d'achèvement. Inversement, sur un article portant sur un sujet connu où la documentation abonde, ou alors un article généraliste, il faut non seulement traiter tous les angles de vue mais aussi rester synthétique (et faire des articles secondaires), et le travail de retrait devient aussi important que celui d'ajout.

Pour ma part, les articles en anglais que je traduis, qui me plaisent, ne sont que rarement des articles complets avec labels de qualité. Je vérifie les sources et complète certains détails, mais je les sais très perfectibles. Le minimum, au-delà des sources, est que la lectrice ou le lecteur puisse se faire au moins une bonne idée du sujet, typiquement un résumé introductif (RI).

Une majorité d'articles de Wikipédia sont (encore) des ébauches ou des articles à peine développés. Tant que des sources sûres justifient l'existence d'un article et qu'il dispose d'une sorte de RI, je considère celui-ci comme valable (en tant que lecteur). Contrairement à d'autres Wikipédistes, cette masse de mini articles ne me semble pas dommageable à l'image de l'encyclopédie, au contraire ! Mieux vaut un article minimum (mais bon) que rien du tout. C'est la multiplicité des articles qui fait l'une des forces de l'Encyclopédie. Les articles faux (canulars) sont, en revanche, une plaie et à éradiquer au plus vite (merci les admins et les vigilant(e)s).

 ↑ 10. En considérant votre expérience sur le wiki, qu'est-ce qui vous a procuré le plus grand plaisir sur Wikipédia ? Au contraire, qu'est-ce qui vous a le plus marqué négativement ?

Il n'y a pas beaucoup d'expériences à vivre sur Wikipédia si on reste à faire des modifications légères sur des articles sans controverses, voire peu lus. Mais dès que l'on prend un compte et que l'on s'attaque à certains gros articles, on rencontre fatalement une partie de la « communauté» hétéroclite wikipédienne.

Il y a eu plusieurs heureuses rencontres, mais je crois que l'une des plus heureuses fut celle de la création des RAW, journal à la fois très instructif et bien présenté par son créateur (mais non, je ne fais pas de la publicité éhontée !). Après réflexion, je dirais que la pire rencontre arriva deux mois après mon inscription, à propos d'une discussion sur ma page de discussion avec un Wikipédien dynamique, aujourd'hui admin actif. Juste après un de mes propos pourtant assez mesuré, déboula sur ma page un parfait inconnu qui se mit à me faire une leçon wikipédienne magistrale dans le plus pur style des « anciens » s'adressant à un complet ignorant. J'avais beau m'être mentalement préparé à des avis extrêmes ou divagants, ce genre d'attaque très limite fut fort désagréable, surtout quand elle fut appuyée par d'autres.

 ↑ 11. Quels seront selon vous les plus grands défis de Wikipédia en français dans les cinq prochaines années ?

Je ne suis pas dans le secret des dieux, mais je crois percevoir :

- L'arrivée de l'intelligence articielle (IA, donc) sur WP est un peu ce que depuis longtemps des Wiképidistes appelaient de leurs vœux pour traiter les millions d'articles de façon automatique. Est-ce la bonne formule ? On peut en douter, dans l'état actuel. Le bon usage de cette IA sur WP reste à définir, et à faire évoluer en même temps qu'elle. Peut-elle éclipser WP même ? La boule de cristal est floue, rappelez plus tard Sourire diabolique.

- Les nouvelles structures qui se mettent lentement en place sous l'égide de Wikimédia, et qui semblent être complètement ignorées du gros de la communauté wikipédienne francophone, mis à part l'application du Code de conduite universel dans les règles de wpfr.

- Maintenir une certaines cohésion entre les membres des Wikipédistes, faire évoluer certaines mentalités ; attirer de nouveaux membres actifs ; se prémunir contre les nouvelles formes d'atteintes aux articles : publicitaires, politiques ou autres ; trouver (et financer) un moyen pérenne de conserver les traces des sources sur Internet.

 ↑ 12. Que pensez-vous des médias qui sont stockés sur Wikimedia Commons et du wiki en général ?

(Wikimedia) Commons est un site énorme, qui recueille des documents (hors textes), pas seulement des photos mais aussi des vidéos et des fichiers sonores. Des musées et institutions prestigieux sont sollicités, ce qui fait que des images exceptionnelles, historiques, y sont copiés et cotoient le reste, inimaginable tant il y en a.

Je me suis incrit presque en même temps sur Commons, site qui héberge donc la plupart des fichiers libres de droits utilisés par Wikipédia, dans le but d'illustrer certains articles. Tout d'abord, j'ai posté quelques-unes de mes photos et me suis conformé aux règles (pas exactement fixées) des droits d'auteur. Mais au fur et à mesure des années, les administrateurs et autres personnes à statut m'ont semblé avoir un comportement de plus en plus incohérent face au soupçon de copyright : aveugles à des imports clairement douteux et sans source mais impitoyables, voire désinvoltes, avec d'autres pourtant accompagnés d'une preuve d'ancienneté suffisante ou/et d'autres garanties. Cela m'a ôté l'envie de discuter et d'y importer quoi que ce soit. Je me contente maintenant principalement de traduire le descriptif des fichiers ou de les catégoriser.

 ↑ 13. Si j'en crois ce diff, le concours de l'image de l'année POTY vous intéresse. Quels ont été vos coups de cœur ou les images qui vous ont profondément marquées depuis que vous suivez ce concours ?

Les concours d'images (principalement photographiques) Picture of the Year (POTY) organisés sur Commons chaque année depuis 2006 sont un plaisir des yeux. Depuis que je connais l'existence du concours, j'y participe régulièrement et leur fait une certaine publicité au Bistro. J'ai aidé à traduire des pages et à vérifier la validité de votes, quand tout était encore fait à la main et qu'il fallait tout refaire et repenser chaque année. Ces dernières années, une poignée de codeurs ont pris le taureau par les cornes et ont automatisé la création au maximum. Cela évite en bonne partie la triche et le recompte manuel mais il n'y a plus le charme des commentaires qui étaient aussi utiles aux photographes participants, et la tenue d'une nouvelle édition ne semble plus être décidée que par eux. Trop de photos m'ont ébloui par leur qualité ou leur sujet pour me décider de seulement quelques-unes ! J'ai découvert cependant que deux noms de photographes reviennent souvent dans les auteurs des photos que je trouve parmi les meilleures : Luc Viatour et Basile Morin (ce dernier étant aussi remarquable pour ses nombreux et excellents ambigrammes). La photo gagnante du concours 2023 est superbe en plus d'être étonnante, même si je ne l'ai pas choisie au dernier tour. Mais elle a eu droit auparavant à plein de prix et je l'avais utilisée dans le Bistro du 15 juillet 2023. Une photo remarquable plus ancienne mais découverte par moi il y a peu de temps m'a complètement désorienté au premier coup d'œil (voir mon commentaire ici).

 ↑ 14. Quel(le) wikimédien(ne) souhaiteriez-vous voir interviewé(e) dans un prochain numéro et sur quel thème ?

Il y a beaucoup de candidats possibles (et disponibles !) mais je serais curieux de Kropotkine 113, Wikipédiste chevronné toujours présent mais finalement assez discret sur les espaces de discussions grand public.

 ↑ 15. Y a-t-il un sujet particulier qui vous tient à cœur et qu’on n’a pas abordé dans cet entretien ? Vous avez carte blanche 🙂.

Je tiens à (re)dire à Cantons-de-l'Est mon plein soutien à la création d'un dictionnaire visuel (multilingue) !

 ↑ 16. Avez-vous un message particulier à adresser aux lectrices et lecteurs du RAW ? Quel serait votre mot de la fin ?

Pas particulèrement au lectorat des RAW mais plutôt aux Wikipédistes en général : si vous avez une idée, ou si une remarque vous tient à cœur, exprimez-la gentiment : on ne vous embastillera pas pour cela ! Si participer à Wikipédia devient une obsession ou un énorme boulet, prenez des vacances. Mais si rien de Wikipédia ne vous plait, alors peut-être que Wikipédia... n'est pas (ou plus) pour vous.

Merci d'avoir accepté cette interview. Bonne continuation !

L'agenda

Les autres infolettres

La page Wikipédia:RAW/Découvrir recense les infolettres et blogs relatifs à Wikimedia.

En plus de RAW, vous pouvez lire le Wikimag, newsletter hebdomadaire de la Wikipedia francophone (Voir le dernier numéro Wikipédia:Wikimag/2024/44), l'infolettre Wikifier la science (voir le dernier numéro Projet:Wikifier la science/Infolettre/Octobre 2024) et les Actualités du Wiktionnaire newsletter mensuelle du Wiktionnaire (wikt:Wiktionnaire:Actualités/114-septembre-2024).

Les anglophones peuvent aussi lire The Signpost, publié toutes les deux semaines, la newsletter hebdo de la communauté Wikidata (voir ici d:Wikidata:Status updates/2024 10 28) ou encore la newsletter du projet Wikifunction ("wikifunction:Wikifunctions:Status updates/2024-10-25).

Courrier du lectorat

(Il nous fera plaisir de lire les messages déposés ici et, si nécessaire, d'y répondre dans les plus brefs délais.)

Wikipédia face au problème du contenu généré par intelligence artificielle — L’intérêt des intelligences artificielles génératives comme ChatGPT réside, selon moi, dans leur capacité de rédaction. À partir du moment où on leur fournit une première version d’un texte sourcé, elles sont capables de le synthétiser ou de le compléter afin qu’il soit rédigé dans un style clair et encyclopédique. De ce point de vue, ce sont d’excellents assistants.
En revanche, comme dit Le chat perché, elles ne peuvent pas faire le travail à notre place, et ce pour une raison très simple : elles ne sont pas conçues pour. Ce sont des IA « probabilistes ». Elle donne le résultat « le plus probable », pas forcément le plus fiable. C’est ce qui explique qu’elles peuvent inventer un concept scientifique… qui n’existe pas, ou encore inventer des sources. Attention donc à ne pas les prendre pour ce qu’elles ne sont pas Émoticône. Merci aux rédacteurs et rédactrices du RAW, comme toujours très instructif.--Pronoia (discuter) 1 novembre 2024 à 10:10 (CET)

De mon côté, ce qui m'inquiète le plus est l'illusion de qualité avec des utilisateurs ne voyant même pas les problèmes. Pour l'exemple, question que j'ai posé hier sur quoi faire avec ce cas où il se pourrait que l'utilisateur soit de bonne foi. J'ai prévu de traduire cet essai anglais pour avoir une base pédagogique vers laquelle orienter mais si ce genre de chose se développe, faudra peut-être penser à un avertissement quelque part pour que toute personne venant contribuer sache qu'il y a des choses à ne pas faire.
Pour l'heure, le principe de signalement n'est pas encore en place côté francophone mais côté anglophone, ils ont eu 69 articles indiqués en octobre et si on en croit l'étude indiquée plus haut, il y a des chances qu'on en rate. Fabius Lector (discuter) 1 novembre 2024 à 11:50 (CET)
Je partage l'inquiétude sur l'illusion de qualité. Mais ça va au delà de l'IA.
Sinon je suis honnoré d'être cité Émoticône. Le chat perché (discuter) 1 novembre 2024 à 13:35 (CET)

Biais de surreprésentation des idées et auteurs occidentaux — Merci PAC2 pour ton outil de mesure des biais géographiques dans les articles ! Je trouve cela très parlant et assez préoccupant de voir que Wikipédia reflète avant tout les connaissances occidentales. Il y a probablement une explication historique à ça (naissance de la science moderne en Europe, développement de la plupart des disciplines universitaires en Occident + colonisation, effacement des savoirs autochtones et difficultés d'accès aux études supérieures dans beaucoup d'endroits). On a du boulot pour lutter contre ce biais ! Skimel (discuter) 2 novembre 2024 à 09:58 (CET)

Grande interview de Warp3 — Merci Warp3 pour cette interview, qui m'a diverti de mes soucis IRL. Comme d'habitude, j'ai lu des observations et des commentaires qui m'ont fait Émoticône ! — Cantons-de-l'Est p|d|d 🧹 4 novembre 2024 à 23:51 (CET)

Boîtes à livres — Merci pour la mention, je n'avais pas encore lu ce RAW, quelle bonne surprise de voir le site mentionné ! Symac (discuter) 7 novembre 2024 à 13:12 (CET) (développeur dudit site :p)

L'IA a une forte valeur ajoutée pour "aider à faire" mais jamais pour "faire à la place".
 – Le chat perché sur le Bistro.
Rédigé/traduit par L'embellie et PAC2.
Citations originales
Notes
Références
  1. Découvert via https://wikis.world/@festal@tldr.nettime.org/113243136048240433
  2. https://www.404media.co/the-editors-protecting-wikipedia-from-ai-hoaxes/
  3. en:Wikipedia:Wikipedia Signpost/2024-10-19/Recent research
  4. Pour les plus curieuses et les plus curieux, la méthode Binoculars est une méthode de détection des textes générés par des grands modèles de langage qui s'appuie sur la « perplexité croisée  » de deux grands modèles de langage. Pour en savoir plus : https://arxiv.org/html/2401.12070v3
  5. a et b (en) Creston Brooks, Samuel Eggert et Denis Peskoff, « The Rise of AI-Generated Content in Wikipedia », {{Article}} : paramètre « périodique » manquant,‎ (lire en ligne).
  6. « Since 2017, Herron’s two accounts have made more than 300 contributions to pages on Wikipedia, of which more than half are entirely embellishments to Herron’s page, but there are notable deletions of positive content from the pages of Dauwalter, 2018 Boston Marathon champion Des Linden and Greek ultrarunning legend Yiannis Kouros. »- Merci DeepL pour la traduction. C'est pas parfait mais c'est pratique :).
  7. Victor Garcia, « Patrick Hetzel, un ministre bien peu scientifique : enquête sur le discret nettoyage de sa page Wikipédia », L’Express, (consulté le )
  8. https://x.com/WikiResearch/status/1843699094579229068
  9. Découvert via d:Wikidata:Status_updates/2024_10_14
  10. « As the saying goes, we move fast and break things: Wikidata is getting too big, too fast. The Wikidata Query Service graph got so huge it will be split, and the growth of the core database is deemed unsustainable. »
  11. « Let’s have it for slow data. Let’s make edits that take minutes rather than racking tens per second. (And sure, “It’s not the quantity, it’s the quality” is an old Wikipedia trope, at times ill-used, but not wrong per se.) »
  12. Traduit avec DeepL.com (version gratuite) « This does not mean not creating new items. But it does mean creating them more intentionally. The old, somewhat hyperbolic jest is that Wikipedia is full of articles that « no-one will ever read » (and I have done my fair share of that!) ; but on Wikidata, we sure have items that were not even created by someone, merely by something. »
  13. https://wikidata-game.toolforge.org/#
  14. https://observablehq.com/@pac02/explore-gender-diversity-in-a-single-wikipedia-article
  15. https://observablehq.com/@pac02/articles-wikilinks-inspector
  16. https://observablehq.com/@pac02/olympic-medals-by-continent
  17. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Intelligence%20artificielle
  18. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Philosophie
  19. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Amour
  20. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Musique
  21. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Humanit%C3%A9
  22. J'emprunte l'expression reste du monde au média Rest of world : https://restofworld.org/about/
  23. https://www.wikimedia.fr/participer-au-prix-wikimedia-de-la-recherche/

Numéro du 14 novembre 2024

Thursday, 14 November 2024 00:00 UTC

Éloge de la lenteur / L'édito de PAC2 — Depuis 2 ans que je contribue activement à RAW, la question de l'intelligence artificielle revient régulièrement dans l'actualité de Wikimédia. Ce numéro n'échappe pas à la règle et on retrouve encore dans ce numéro des inquiétudes face à la tentation de l'IA. À rebours des « accélérationnistes » qui veulent utiliser l'IA pour contribuer plus vite et mettre toujours plus de contenu, Jean-Frédéric sur le blog The Commonist fait un éloge bienvenu de la lenteur et de la contribution artisanale.

Vous trouverez aussi ce mois-ci une interview de Warp3 et un format atelier pour réfléchir à la représentation des personnalités des différents continents dans les articles Wikipédia.

Les brèves

Wikipédia face au problème du contenu généré par intelligence artificielle — Sur la Wikipédia anglophone, la communauté a créé un projet spécifique pour lutter contre le problème des contenus générés par intelligence artificielle mal sourcés et mal écrits[1]. 404 média revient en détail sur les enjeux. Un article anglophone sur la forteresse Amberlihisar, qui n'a jamais existé, constitue un bon exemple de mauvais recours à l'IA. L'IA a notamment généré des références parfaitement mises en forme mais totalement fictives. Le projet AI Cleanup recense aussi les images synthétiques. Certaines sont légitimes et sont utilisées à bon escient mais d'autres sont manifestement trompeuses[2].

Dans son édition du 19 octobre, The Signpost revient sur un récent article académique cherchant à quantifier la part de nouveaux articles générés avec de grands modèles de langage[3]. L'article intitulé « The Rise of AI-Generated Content in Wikipedia » utilise deux détecteurs automatiques de grands modèles de langage, GPTZero et Binoculars[4] pour estimer la proportion d'articles contenant des morceaux générés par des grands modèles de langage parmi les articles créés en août 2024[5].

« À l'aide de deux outils, GPTZero et Binoculars, nous détectons que jusqu'à 5 % des 2 909 articles anglais de Wikipédia créés en août 2024 contiennent un contenu significatif généré par l'IA. Les seuils de classification des deux outils ont été calibrés pour maintenir un taux de faux positifs ne dépassant pas 1 % sur une base Wikipédia pré-GPT-3.5, comme indiqué par la ligne rouge[5]. »

Sur la Wikipédia francophone, Fabius Lector a créé le projet Projet:Observatoire des IA et Simonk a initié un essai sur l'intelligence artificielle.

Logo de la conférence

WikiIndaba2024 — La conférence WikiIndaba, consacrée à la présence de l'Afrique sur Wikipédia, a eu lieu du 4 au 6 octobre à Johannesbourg.

Camille Herron, championne d'ultra-marathon et wikipédienne sous les pseudos Rundbowie et Temporun73.

La coureuse Camille Herron accusée de manipuler Wikipedia — La coureuse Camille Herron et son mari et entraîneur Conor Holt sont accusés d'avoir manipulé Wikipédia en diminuant le palmarès de concurrentes de Camille Herron.

« Depuis 2017, les deux comptes de Herron ont apporté plus de 300 contributions à des pages de Wikipédia, dont plus de la moitié sont entièrement des embellissements de la page de Herron, mais il y a des suppressions notables de contenu positif des pages de Dauwalter, du champion du marathon de Boston 2018 Des Linden et de la légende grecque de l'ultrarunning Yiannis Kouros[6]. »

Patrick Hetzel est ministre de l'enseignement supérieur et de la recherche dans le gouvernement de la République française depuis septembre 2024.

Le cabinet du ministre de l'enseignement supérieur et de la recherche français manipule Wikipédia ! — Une enquête du magazine L'Express révèle que le cabinet du nouveau ministre de l'enseignement supérieur et de la recherche français, Patrick Hetzel, a tenté de manipuler la biographie Wikipedia du ministre[7].

Florence Devouard, ancienne présidente de la fondation Wikimédia, est à l'initiative de la campagne SheSaid.

Florence Devouard interviewée sur l'initiative SheSaidDiff, le blog de la communauté interviewe Florence Devouard sur l'initiative de la campagne SheSaid.

« J'ai remarqué très tôt que les femmes étaient peu nombreuses dans nos projets, mais je ne me suis vraiment impliquée dans la lutte contre l'écart entre les sexes que lorsque Isla Haddow-Flood et moi-même avons lancé l'initiative Wiki Loves Women en 2016. Nous avons exploré différentes stratégies pour recruter plus de femmes, fournir un environnement plus inclusif, former et soutenir, mettre en œuvre différentes stratégies. Le sujet est complexe. En 2020, en pleine pandémie, j'ai lancé l'idée de #SheSaid... et nous voilà 4 ans plus tard ! »

Boîte à livres à Amboise, France.

11 000 boîtes à livres recensées — Le site boîtes-à-livres.fr recense les boîtes à livres en France en s'appuyant sur OpenStreetMap et Wikimédia Commons. On y trouve maintenant plus de 11 000 boîtes à livres.

Tous les chemins entre deux éléments Wikidata — Des chercheurs ont développé un nouvel outil capable de trouver tous les chemins possibles entre deux entités Wikidata[8].

Articles les plus centraux — L'université de Milan publie la liste des articles les plus centraux de Wikipédia (à priori uniquement la version anglophone).

C'est la saison des Nobel — Chaque année les différents prix Nobel sont remis début octobre. C'est l'occasion de remettre à jour et de développer de nouveaux notebooks consacrés aux Nobel.

Comme pour les jeux olympiques, on peut calculer la concentration des prix par pays de nationalité à partir d'une requête Wikidata.

Les États-Unis sont en tête du classement pour le prix Nobel de médecine, le prix Nobel de physique, le prix Nobel de la paix et le prix Nobel de Chimie. La France est en tête pour le prix Nobel de littérature. Les États-Unis obtiennent près de 40% des prix en médecine et plus de 32% des prix en physique et en chimie ! Parmi les cinq prix Nobel historique, c'est le prix Nobel de littérature qui est le plus diversifié en terme de pays de nationalité.

Jean-Frédéric propose l'approche SNAIL, acronyme de « Slow, NArrow, In-depth, Local », ce qu'on peut traduire par « Lent, précis, en profondeur et local ».

L'approche escargot ou l'éloge de la lenteur — Sur le blog The Commonists, Jean-Frédéric propose une approche escargot à la contribution #Wikidata 🐌[9]!

Plutôt que de faire de l'édition en masse, il propose de prendre le temps de faire de la contribution manuelle.

« Comme le dit le proverbe, nous allons vite et nous cassons des choses : Wikidata devient trop gros, trop vite. Le graphique du service d'interrogation de Wikidata a pris une telle ampleur qu'il sera scindé, et la croissance de la base de données principale est jugée insoutenable[10]. »

Plutôt que d'utiliser QuickStatement ou OpenRefine, Jean-Frédéric propose l'approche lente en s'inspirant du mouvement lent :

« Faisons ça avec les données lentes. Faisons des modifications qui prennent des minutes au lieu d'en faire des dizaines par seconde. (Et bien sûr, "Ce n'est pas la quantité, c'est la qualité" est un vieux trope de Wikipedia, parfois mal utilisé, mais pas faux en soi)[11]. »

« Cela ne signifie pas qu'il ne faut pas créer de nouveaux articles. Mais cela signifie qu'il faut les créer plus intentionnellement. La vieille plaisanterie, quelque peu hyperbolique, est que Wikipédia est pleine d'articles que " personne ne lira jamais " (et j'en ai fait ma part !) ; mais sur Wikidata, nous avons certainement des articles qui n'ont même pas été créés par quelqu'un, mais simplement par quelque chose[12]. »

Une nouvelle interface pour contribuer aux données lexicographiques de Wikidata — Lexico est une nouvelle interface qui permet de faciliter la contribution aux données lexicographiques (lexemes) sur Wikidata. Le principe rappelle les Wikidata Games de Magnus Manske[13].

65 000 citations sur Wikiquote — Wikiquote en français compte désormais 65 000 citations réparties sur près de 9 000 pages.

L'atelier

Dans cette section, un(e) wikimédien(ne) peut raconter un de ses bricolages à la première personne.

Ce mois-ci c'est PAC2 qui raconte comment il a bricolé un outil pour mesurer les biais de Wikipedia.

Il y a quelques années, j'avais développé le Gender Diversity Explorer, un petit outil en ligne qui récupère tous les liens bleus d'un article Wikipédia (ie les mentions), récupère la valeur de la propriété P21 (Sexe ou genre) dans l'élément Wikidata associé et calculé des statistiques de genre sur la répartition des entités nommées dans l'article[14].

L'approche se généralise facilement à n'importe quelle propriété dans Wikidata. C'est ce que propose le Wikilinks inspector[15].

Pour réfléchir à la représentation de certains continents comme l'Afrique ou l'Amérique du Sud, j'avais besoin d'adapter l'outil et de trouver un bon moyen de faire la correspondance entre des pays et des continents. C'est mon travail sur la répartition des médailles aux jeux olympiques qui m'a permis de trouver le bon moyen d'obtenir une correspondance à peu près pertinente entre pays et continents[16].

Techniquement, la magie vient toujours de la possibilité d'appeler l'api Wikimédia depuis une requête SPARQL :

SELECT ?item ?itemLabel ?country ?countryLabel 
WHERE {
  SERVICE wikibase:mwapi {
     bd:serviceParam wikibase:endpoint "fr.wikipedia.org";
                     wikibase:api "Generator";
                     mwapi:generator "links";
                     mwapi:titles "Intelligence artificielle";.
     ?item wikibase:apiOutputItem mwapi:item.
  } 
  FILTER BOUND (?item)
  ?item wdt:P31 wd:Q5 . 
  ?item wdt:P27 ?country . 
  ?country rdfs:label ?countryLabel filter (lang(?countryLabel) = "en") .
  ?item rdfs:label ?itemLabel filter (lang(?itemLabel) = "en") .
}

Cliquez pour essayer !

On combine ça ensuite avec la requête sur les continents et le tour est joué :

SELECT DISTINCT ?continent ?continentLabel ?country  ?code WHERE {
VALUES ?continent {
wd:Q55643
wd:Q48
wd:Q15
wd:Q18
wd:Q49
wd:Q46
} 
 ?continent (wdt:P527*) ?country.
  ?country 
    wdt:P2082 ?code.
  SERVICE wikibase:label { bd:serviceParam wikibase:language "en". }
}

Cliquez pour essayer !

Venons en maintenant aux résultats. Si on prend un article sur un thème très général et si Wikipedia représente l'ensemble des connaissances sur un sujet, on devrait s'attendre à avoir une représentation de personnalités de tous les continents dans les entités mentionnées dans un article.

Maintenant, quand on regarde l'article Intelligence artificielle, on trouve 69 personnalités nord-américaines, 58 personnalités européennes, 9 personnalités non classées pour seulement 6 personnalités asiatiques, 5 personnalités africaines, 3 personnalités oceaniennes et 2 personnalités sud-americaines[17].

L'article Philosophie mentionne 158 personnalités européennes mais aucune personnalité africaine[18].

L'article Amour mentionne une personnalité africaine pour 58 personnalités européennes[19].

L'article Travail ne mentionne aucune personnalité africaine, aucune personnalité asiatique ou aucune personnalité sud-américaine contre 23 personnalités européennes.

Même bilan avec l'article Musique : 36 personnalités européennes, 6 nord américaines et 1 océanienne mais aucune personnalité asiatique, africaine ou sud-américaine[20].

On pourrait penser que l'article consacré à l'humanité mentionnerait des personnalités de tous les continents. Ça n'est pas le cas. On ne compte aucun représentant de l'Océanie, de l'Afrique et de l'Asie dans l'article[21].

On peut multiplier les exemples et on voit que les continents nord-americains et européens sont largement représentés alors que les autres continents et notamment l'Afrique et l'Amérique du Sud sont représentés de manière marginale dans les articles généraux de l'encyclopédie.

Il y a sans doute de multiples raisons à ce déséquilibre. L'outil peut nous aider à prendre conscience du déséquilibre et chercher, article par article, des idées pour mieux représenter les personnes des continents sous représentés. En creux, on en vient à se demander si Wikipedia représente la « somme de toutes les connaissances » ou simplement le point de vue européen et nord-américain. Le point de vue du « reste du monde » est aujourd'hui manifestement peu représenté dans Wikipedia[22].

La grande interview

Dans cette section, nous donnons la parole à des wikimédien(ne)s sur des thèmes donnés afin de recueillir leurs avis ou les faire parler tout simplement de leurs expériences dans le mouvement.

Entretien avec Warp3

Ses activités wikimédiennes.
Par écrit sur cette page.
L'embellie.
Merci à Noé et Cantons-de-l'Est pour les suggestions de questions.
 ↑ 1. Bonjour Warp3. Merci d'avoir accepté cet entretien après que Cantons-de-l'Est vous ait suggéré comme invité. Pour commencer, je vous laisse vous présenter.

Comme beaucoup de Wikipédistes anciens et français, j'ai connu les débuts d'Internet en France en entreprise puis à domicile, période riche en projets informatiques de toutes les sortes. Intéressé par les articles de vulgarisation dans plusieurs domaines, j'eus vent d'un projet de réalisation d'une encyclopédie à accès gratuit sur le Net, qui s'appelait Wikipédia. Il y avait alors quelques autres encyclopédies comme Encarta de Windows, sur disquettes ou CD, mais assez chères, et les rares encyclopédies gratuites étaient très limités dans leur étendue et d'usage pas bien pratique. Le premier contact avec ce projet balbutiant fut une relative déception : peu d'articles et pas grand-chose dedans.

J'y revins quelques années après... et c'était déjà beaucoup mieux ! Peu à peu, je trouvais le plus souvent un article de Wikipédia après une recherche avec Google, et je m'étonnais que, même si l'article était peu développé, il répondait au minimum à la question « qu'est-ce que c'est ? ». Je faisais alors quelques apports ou corrections minimes, à l'occasion. Quelque trois ans après, fort d'avoir parcouru des pages d'aides et de règles (pas faciles à trouver) ainsi que plusieurs discussions, je fus fin prêt à prendre un compte... mais j'ai attendu encore deux ans avant de m'incrire fin juin 2008, sur un coup de tête. Première constatation après : hors l'accueil (automatique), l'impression d'être complètement seul à se dépatouiller dans l'édition (les pages de discussions des articles sont très souvent vides), jusqu'à me demander où se retrouvaient les Wikipédistes. C'est sur quelques pages plus spécifiques qu'ils se « cachaient », dont un certain Bistro.

Ma page de présentation contient un peu de mon état d'esprit au moment de l'inscription (elle est succinte et un peu ancienne maintenant, mais elle reste encore d'actualité). J'appris qu'il fallait s'inscrire aussi à un autre projet : WM Commons, afin d'ajouter des images (y compris les siennes) à un article. C'était cependant une façon de découvrir que Wikipédia s'appuie sur d'autres projets. Et puis, par curiosité, je visitai d'autres projets encore... (suspense)

 ↑ 2. Comment êtes-vous arrivé dans le mouvement Wikimédia ? Sur quel wiki en premier et comment avez-vous découvert les autres projets ?

Après Wikipédia, puis Commons, j'ai examiné plusieurs autres projets et enfin Wikimédia.

Au début, Wikimédia n'était pas un vrai mouvement mais une entreprise qui mettait en place Wikipédia, l'encyclopédie libre, dans de nombreuses langues puis soutenait d'autres projets voisins de l'encyclopédie. Wikimedia, utilisant des logiciels libres et parfois sous domaine public, s'est mis à promouvoir aussi le développement du libre. C'est plus récemment que la fondation Wikimédia, d'abord à travers la diffusion des projets et par leur utilisation avec tous, en fournissant les moyens de se connecter jusque dans les régions dépourvues d'accès au Net, est devenue un mouvement de développement local et privilégie l'intégration sociale.

j'ai cherché à comprendre l'organisation des projets par rapport à Wikimédia, comme l'existence des chapitres pour chaque projet dans un pays donné. J'ai fait ainsi au passage un peu de traduction de pages en anglais sur Wikimédia (à partir de 2015), participé plus ou moins à divers projets dont Wikiquote (fr), Wikisource, Wiktionnaire, Wikilivres. Je me suis aussi intéressé au thème de l'humour et enrichi le contenu de son portail à partir de 2015.

 ↑ 3. En vous présentant, Cantons-de-l'Est écrit : « Il trouve régulièrement des images qu'il « décore » de légendes savoureuses. » C'est dans cette activité que je vous ai aussi connu notamment sur le Bistro ou dans d'autres sections de discussions. Quand et comment avez-vous commencé à illustrer Le Bistro ?

Ce doit être le 15 décembre 2009, avec le drapeau de l'Acadie. Le calendrier du Bistro est né le 14 septembre 2005 et a vite évolué : la première illustration date du 7 novembre, la première image commentée est du 25 novembre de la même année. L'habitude est prise de décorer assez régulièrement le calendrier dès 2006. Les images avec leurs commentaires sont dans le ton du bistro, souvent légères et comiques, alternant avec des rappels de faits historiques. D'autres images se trouvent parfois ailleurs dans les discussions. Elles décrivent un aspect ou l'autre de Wikipédia en français, de ses débats.

On retrouve alors souvent DocteurCosmos en illustrateur du calendrier. Il se chargeait de l'illustrer avec un tour souvent amusant quand personne d'autre ne l'avait fait. C'est cette façon ludique qui m'a conduit à oser une première illustration dans ce petit espace en haut à droite de chaque page quotidienne du Bistro. J'ai augmenté progressivement mon implication dans ce cadre, comme une sorte de détente après un tas de modification dans les articles. Comme on pourra vérifier, les histoires de cabales et de chats au Bistro existaient depuis au moins 2006, bien avant mon arrivée Émoticône !

 ↑ 4. Vos choix d'illustration, vos légendes ainsi que parfois (souvent ?) vos commentaires de modifications sont tantôt profondes, tantôt légères, mais revêtent toujours une certaine beauté selon moi. Où trouvez-vous l'inspiration ?
— Warp3 ? Mmm... Attendez que je zoome sur l'image... Non, connais pas.

Voilà une question qui doit certainement tarabuster Cantons-de-l'Est depuis des années Émoticône. Il y a de nombreuses façons pour moi de trouver une idée de Bistro, idée souvent de type comique. Le cas le plus courant : c'est au cours de mes périgrinations quasi aléatoires sur Wikipédia et Commons que se fait la découverte de photos ou de dessins qui sont déjà comiques ou étonnantes en elle-même, ou quand leur rapport me semble raconter une historiette ; une sorte de hasard heureux peut-on dire. Sinon, quand j'ai une idée précise, quelques fois inspirée par l'actualité de wpfr, je cherche dans la catégorie idoine celles qui peuvent faire l'affaire. Et il m'arrive aussi d'élaborer des gags un peu plus complexes au saut du lit Émoticône. Dans un premier temps, j'ajoutais un lien vers une vidéo Youtube pour illustrer avec de la musique ou avec un sketch. Mais quelqu'un(e) m'a fait savoir que Commons héberge aussi des fichiers de musiques, qui sont libres de droits, contrairement aux vidéos Youtube. Depuis, je fouine dans les diverses catégories, et en place quelques-unes aux emplacements qui me semblent les plus appropriés. Cette bibliothèque de musiques (et de vidéos), pas assez connue à mon avis ni assez utilisée, semble s'être fortement enrichie ces dernières années.

Chaque fois que je place une illustration assortie d'un commentaire, je ne sais pas vraiment comment cela va être reçu, car il n'y a presque jamais de commentaires sur place ou sur ma page. En général, sur WP, quand personne ne fait de commentaire sur votre modification sur un article, ça signifie qu'elle est plus ou moins acceptée et je me figure que c'est pareil avec une image. Mais c'est comme être sur un bout de scène avec un public derrière une cloison, invisible et muet, qui peut une fois dans la rue faire un petit signe discret de connivence ou au contraire flanquer une claque, sans que je sache trop pour quoi.

 ↑ 5. Utilisez-vous des outils en particulier pour retrouver des images, les archiver, s'en souvenir ? Comment effectuez-vous vos recherches ?

Sur les projets : très peu, en fait. J'ai même décoché tout un tas de gadgets mis par défaut dans mes préférences. J'utilise parfois un éditeur de texte autre que celui de base. Pour les recherches, il arrive que c'est par les images que je retrouve certaines pages ou informations. Mais dans mes recherches d'un fichier sur Commons, je n'utilise guère le gadget fourni, qui retourne n'importe quoi tant qu'il existe dans le nom du fichier une seule erreur, ou que le nom n'est pas assez complet. Utiliser un moteur de recherche extérieur donne plus de chance de trouver le fichier cherché. Et, non, je ne fais pas de recherche SPARQL à travers WikiData, malgré les nombreux exemples donnés par les RAW (!). Question visuels, j'utilise les pauvres logiciels de base de Windows : mspaint, photo, wordpad, bloc-notes. Oui, frugalité extrême... il y a de quoi rire !

 ↑ 6. Assidu du Bistro, qu'aimez-vous y trouver et quelle est la raison d'être que vous donnez à cet espace communautaire ?

Quand j'ai découvert le Bistro à l'époque de mon inscription, je pensais y trouver une sorte d'assemblée très sérieuse réglant avec précision l'avenir de l'Encyclopédie, alors que c'était plutôt une sorte d'auberge espagnole bruyante et un tantinet folle. Le Bistro actuel est en majorité le rendez-vous de toutes les personnes un peu anciennes désireuses de débattre, et parfois d'informer la Wikipédie. C'est le lieu pour poser ses questions avec de grandes chances d'avoir au moins une réponse, que l'on soit novice ou non. Certains débats sont cependant si extravagants que je finis par les trouver rigolos ! Je préfère cependant le discours plus léger tenu par d'autres personnes, comme il arrivait souvent dans les premières années de l'existence du Bistro.

 ↑ 7. Comment trouvez-vous la convivialité et l'ambiance en général au sein de la communauté ?

La communauté de Wikipédia en français est diverse, très partagée sur plusieurs thèmes (inclusionnisme/suppressionnisme, paternalisme/féminisme, fair-use, Comité d'arbitrage (CAr), etc.) depuis au moins 2006 sur les espaces de discussions. Ce n'est que par l'observance des règles établies et de la volonté de participer sereinement à la création et à la maintenance des articles que l'on peut dire qu'il existe une sorte de lien solidaire entre les membres. L'ambiance peut être bonne ou mauvaise selon l'importance que l'on porte à ces thèmes. Il est ainsi possible d'avoir de bons rapports en travaillant sans apriori avec des personnes dans un espace d'articles peu polémiques (potentiellement plusieurs millions Émoticône) .

 ↑ 8. Quel type de wikipédien êtes-vous ? Comment décririez-vous votre manière de contribuer sur l'encyclopédie ?

Si j'ai pris un compte sur Wikipédia, c'est aussi parce que je me sentais redevable de tant d'informations offertes sans contreparties de ma part. J'ai commencé par des corrections orthographiques et quelques reformulations, mais ne me destinais pas à faire beaucoup plus. C'est en voyant l'état de quasi ébauche de l'article Bugs Bunny que je me suis décidé à le développer, par traduction de l'article anglophone. Aussi, le goût me prit de continuer des articles initiés par d'autres, d'abord dans le domaine du dessin animé alors presque déserté hormis le champ disneyien, puis dans d'autres domaines.

Wikipédiste papillonnant, assez solitaire, je passe d'un sujet à l'autre selon mes goûts du moment. L'Amérique de la période située entre 1850 et 1950, le cinéma (Warner Bros. surtout) et la musique sont autant de sujets qui m'intéressent le plus. Malgré une bonne centaine d'articles créés et pas mal de traductions de l'anglais (je vous conseille DeepL comme base) depuis plus de 15 ans, je me considère encore comme un petit rédacteur-relecteur (et suis étonné de faire partie des mille premiers modificateurs actifs de WP). Je n'ai d'ailleurs développé aucun article jusqu'à un niveau de labellisation.

 ↑ 9. Créateur de plus de 110 articles, quand considérez-vous que le sujet d'un article est épuisé avant de passer à un autre ? Quels sentiments cela vous inspire de savoir qu'il reste tant à faire sur le wiki ?

Un article très pointu (dit « d'intéret faible » dans les évaluations), comme un certain type d'invertébré marin très peu connu, s'il est traité pleinement à travers toute la documentation existante, devient un article abouti. S'il n'a pas sa belle étoile doré d'article de qualité, c'est tant pis, mais cela n'enlève rien à son degré d'achèvement. Inversement, sur un article portant sur un sujet connu où la documentation abonde, ou alors un article généraliste, il faut non seulement traiter tous les angles de vue mais aussi rester synthétique (et faire des articles secondaires), et le travail de retrait devient aussi important que celui d'ajout.

Pour ma part, les articles en anglais que je traduis, qui me plaisent, ne sont que rarement des articles complets avec labels de qualité. Je vérifie les sources et complète certains détails, mais je les sais très perfectibles. Le minimum, au-delà des sources, est que la lectrice ou le lecteur puisse se faire au moins une bonne idée du sujet, typiquement un résumé introductif (RI).

Une majorité d'articles de Wikipédia sont (encore) des ébauches ou des articles à peine développés. Tant que des sources sûres justifient l'existence d'un article et qu'il dispose d'une sorte de RI, je considère celui-ci comme valable (en tant que lecteur). Contrairement à d'autres Wikipédistes, cette masse de mini articles ne me semble pas dommageable à l'image de l'encyclopédie, au contraire ! Mieux vaut un article minimum (mais bon) que rien du tout. C'est la multiplicité des articles qui fait l'une des forces de l'Encyclopédie. Les articles faux (canulars) sont, en revanche, une plaie et à éradiquer au plus vite (merci les admins et les vigilant(e)s).

 ↑ 10. En considérant votre expérience sur le wiki, qu'est-ce qui vous a procuré le plus grand plaisir sur Wikipédia ? Au contraire, qu'est-ce qui vous a le plus marqué négativement ?

Il n'y a pas beaucoup d'expériences à vivre sur Wikipédia si on reste à faire des modifications légères sur des articles sans controverses, voire peu lus. Mais dès que l'on prend un compte et que l'on s'attaque à certains gros articles, on rencontre fatalement une partie de la « communauté» hétéroclite wikipédienne.

Il y a eu plusieurs heureuses rencontres, mais je crois que l'une des plus heureuses fut celle de la création des RAW, journal à la fois très instructif et bien présenté par son créateur (mais non, je ne fais pas de la publicité éhontée !). Après réflexion, je dirais que la pire rencontre arriva deux mois après mon inscription, à propos d'une discussion sur ma page de discussion avec un Wikipédien dynamique, aujourd'hui admin actif. Juste après un de mes propos pourtant assez mesuré, déboula sur ma page un parfait inconnu qui se mit à me faire une leçon wikipédienne magistrale dans le plus pur style des « anciens » s'adressant à un complet ignorant. J'avais beau m'être mentalement préparé à des avis extrêmes ou divagants, ce genre d'attaque très limite fut fort désagréable, surtout quand elle fut appuyée par d'autres.

 ↑ 11. Quels seront selon vous les plus grands défis de Wikipédia en français dans les cinq prochaines années ?

Je ne suis pas dans le secret des dieux, mais je crois percevoir :

- L'arrivée de l'intelligence articielle (IA, donc) sur WP est un peu ce que depuis longtemps des Wiképidistes appelaient de leurs vœux pour traiter les millions d'articles de façon automatique. Est-ce la bonne formule ? On peut en douter, dans l'état actuel. Le bon usage de cette IA sur WP reste à définir, et à faire évoluer en même temps qu'elle. Peut-elle éclipser WP même ? La boule de cristal est floue, rappelez plus tard Sourire diabolique.

- Les nouvelles structures qui se mettent lentement en place sous l'égide de Wikimédia, et qui semblent être complètement ignorées du gros de la communauté wikipédienne francophone, mis à part l'application du Code de conduite universel dans les règles de wpfr.

- Maintenir une certaines cohésion entre les membres des Wikipédistes, faire évoluer certaines mentalités ; attirer de nouveaux membres actifs ; se prémunir contre les nouvelles formes d'atteintes aux articles : publicitaires, politiques ou autres ; trouver (et financer) un moyen pérenne de conserver les traces des sources sur Internet.

 ↑ 12. Que pensez-vous des médias qui sont stockés sur Wikimedia Commons et du wiki en général ?

(Wikimedia) Commons est un site énorme, qui recueille des documents (hors textes), pas seulement des photos mais aussi des vidéos et des fichiers sonores. Des musées et institutions prestigieux sont sollicités, ce qui fait que des images exceptionnelles, historiques, y sont copiés et cotoient le reste, inimaginable tant il y en a.

Je me suis incrit presque en même temps sur Commons, site qui héberge donc la plupart des fichiers libres de droits utilisés par Wikipédia, dans le but d'illustrer certains articles. Tout d'abord, j'ai posté quelques-unes de mes photos et me suis conformé aux règles (pas exactement fixées) des droits d'auteur. Mais au fur et à mesure des années, les administrateurs et autres personnes à statut m'ont semblé avoir un comportement de plus en plus incohérent face au soupçon de copyright : aveugles à des imports clairement douteux et sans source mais impitoyables, voire désinvoltes, avec d'autres pourtant accompagnés d'une preuve d'ancienneté suffisante ou/et d'autres garanties. Cela m'a ôté l'envie de discuter et d'y importer quoi que ce soit. Je me contente maintenant principalement de traduire le descriptif des fichiers ou de les catégoriser.

 ↑ 13. Si j'en crois ce diff, le concours de l'image de l'année POTY vous intéresse. Quels ont été vos coups de cœur ou les images qui vous ont profondément marquées depuis que vous suivez ce concours ?

Les concours d'images (principalement photographiques) Picture of the Year (POTY) organisés sur Commons chaque année depuis 2006 sont un plaisir des yeux. Depuis que je connais l'existence du concours, j'y participe régulièrement et leur fait une certaine publicité au Bistro. J'ai aidé à traduire des pages et à vérifier la validité de votes, quand tout était encore fait à la main et qu'il fallait tout refaire et repenser chaque année. Ces dernières années, une poignée de codeurs ont pris le taureau par les cornes et ont automatisé la création au maximum. Cela évite en bonne partie la triche et le recompte manuel mais il n'y a plus le charme des commentaires qui étaient aussi utiles aux photographes participants, et la tenue d'une nouvelle édition ne semble plus être décidée que par eux. Trop de photos m'ont ébloui par leur qualité ou leur sujet pour me décider de seulement quelques-unes ! J'ai découvert cependant que deux noms de photographes reviennent souvent dans les auteurs des photos que je trouve parmi les meilleures : Luc Viatour et Basile Morin (ce dernier étant aussi remarquable pour ses nombreux et excellents ambigrammes). La photo gagnante du concours 2023 est superbe en plus d'être étonnante, même si je ne l'ai pas choisie au dernier tour. Mais elle a eu droit auparavant à plein de prix et je l'avais utilisée dans le Bistro du 15 juillet 2023. Une photo remarquable plus ancienne mais découverte par moi il y a peu de temps m'a complètement désorienté au premier coup d'œil (voir mon commentaire ici).

 ↑ 14. Quel(le) wikimédien(ne) souhaiteriez-vous voir interviewé(e) dans un prochain numéro et sur quel thème ?

Il y a beaucoup de candidats possibles (et disponibles !) mais je serais curieux de Kropotkine 113, Wikipédiste chevronné toujours présent mais finalement assez discret sur les espaces de discussions grand public.

 ↑ 15. Y a-t-il un sujet particulier qui vous tient à cœur et qu’on n’a pas abordé dans cet entretien ? Vous avez carte blanche 🙂.

Je tiens à (re)dire à Cantons-de-l'Est mon plein soutien à la création d'un dictionnaire visuel (multilingue) !

 ↑ 16. Avez-vous un message particulier à adresser aux lectrices et lecteurs du RAW ? Quel serait votre mot de la fin ?

Pas particulèrement au lectorat des RAW mais plutôt aux Wikipédistes en général : si vous avez une idée, ou si une remarque vous tient à cœur, exprimez-la gentiment : on ne vous embastillera pas pour cela ! Si participer à Wikipédia devient une obsession ou un énorme boulet, prenez des vacances. Mais si rien de Wikipédia ne vous plait, alors peut-être que Wikipédia... n'est pas (ou plus) pour vous.

Merci d'avoir accepté cette interview. Bonne continuation !

L'agenda

Les autres infolettres

La page Wikipédia:RAW/Découvrir recense les infolettres et blogs relatifs à Wikimedia.

En plus de RAW, vous pouvez lire le Wikimag, newsletter hebdomadaire de la Wikipedia francophone (Voir le dernier numéro Wikipédia:Wikimag/2024/44), l'infolettre Wikifier la science (voir le dernier numéro Projet:Wikifier la science/Infolettre/Octobre 2024) et les Actualités du Wiktionnaire newsletter mensuelle du Wiktionnaire (wikt:Wiktionnaire:Actualités/114-septembre-2024).

Les anglophones peuvent aussi lire The Signpost, publié toutes les deux semaines, la newsletter hebdo de la communauté Wikidata (voir ici d:Wikidata:Status updates/2024 10 28) ou encore la newsletter du projet Wikifunction ("wikifunction:Wikifunctions:Status updates/2024-10-25).

Courrier du lectorat

(Il nous fera plaisir de lire les messages déposés ici et, si nécessaire, d'y répondre dans les plus brefs délais.)

Wikipédia face au problème du contenu généré par intelligence artificielle — L’intérêt des intelligences artificielles génératives comme ChatGPT réside, selon moi, dans leur capacité de rédaction. À partir du moment où on leur fournit une première version d’un texte sourcé, elles sont capables de le synthétiser ou de le compléter afin qu’il soit rédigé dans un style clair et encyclopédique. De ce point de vue, ce sont d’excellents assistants.
En revanche, comme dit Le chat perché, elles ne peuvent pas faire le travail à notre place, et ce pour une raison très simple : elles ne sont pas conçues pour. Ce sont des IA « probabilistes ». Elle donne le résultat « le plus probable », pas forcément le plus fiable. C’est ce qui explique qu’elles peuvent inventer un concept scientifique… qui n’existe pas, ou encore inventer des sources. Attention donc à ne pas les prendre pour ce qu’elles ne sont pas Émoticône. Merci aux rédacteurs et rédactrices du RAW, comme toujours très instructif.--Pronoia (discuter) 1 novembre 2024 à 10:10 (CET)

De mon côté, ce qui m'inquiète le plus est l'illusion de qualité avec des utilisateurs ne voyant même pas les problèmes. Pour l'exemple, question que j'ai posé hier sur quoi faire avec ce cas où il se pourrait que l'utilisateur soit de bonne foi. J'ai prévu de traduire cet essai anglais pour avoir une base pédagogique vers laquelle orienter mais si ce genre de chose se développe, faudra peut-être penser à un avertissement quelque part pour que toute personne venant contribuer sache qu'il y a des choses à ne pas faire.
Pour l'heure, le principe de signalement n'est pas encore en place côté francophone mais côté anglophone, ils ont eu 69 articles indiqués en octobre et si on en croit l'étude indiquée plus haut, il y a des chances qu'on en rate. Fabius Lector (discuter) 1 novembre 2024 à 11:50 (CET)
Je partage l'inquiétude sur l'illusion de qualité. Mais ça va au delà de l'IA.
Sinon je suis honnoré d'être cité Émoticône. Le chat perché (discuter) 1 novembre 2024 à 13:35 (CET)

Biais de surreprésentation des idées et auteurs occidentaux — Merci PAC2 pour ton outil de mesure des biais géographiques dans les articles ! Je trouve cela très parlant et assez préoccupant de voir que Wikipédia reflète avant tout les connaissances occidentales. Il y a probablement une explication historique à ça (naissance de la science moderne en Europe, développement de la plupart des disciplines universitaires en Occident + colonisation, effacement des savoirs autochtones et difficultés d'accès aux études supérieures dans beaucoup d'endroits). On a du boulot pour lutter contre ce biais ! Skimel (discuter) 2 novembre 2024 à 09:58 (CET)

Grande interview de Warp3 — Merci Warp3 pour cette interview, qui m'a diverti de mes soucis IRL. Comme d'habitude, j'ai lu des observations et des commentaires qui m'ont fait Émoticône ! — Cantons-de-l'Est p|d|d 🧹 4 novembre 2024 à 23:51 (CET)

Boîtes à livres — Merci pour la mention, je n'avais pas encore lu ce RAW, quelle bonne surprise de voir le site mentionné ! Symac (discuter) 7 novembre 2024 à 13:12 (CET) (développeur dudit site :p)

L'IA a une forte valeur ajoutée pour "aider à faire" mais jamais pour "faire à la place".
 – Le chat perché sur le Bistro.
Rédigé/traduit par L'embellie et PAC2.
Citations originales
Notes
Références
  1. Découvert via https://wikis.world/@festal@tldr.nettime.org/113243136048240433
  2. https://www.404media.co/the-editors-protecting-wikipedia-from-ai-hoaxes/
  3. en:Wikipedia:Wikipedia Signpost/2024-10-19/Recent research
  4. Pour les plus curieuses et les plus curieux, la méthode Binoculars est une méthode de détection des textes générés par des grands modèles de langage qui s'appuie sur la « perplexité croisée  » de deux grands modèles de langage. Pour en savoir plus : https://arxiv.org/html/2401.12070v3
  5. a et b (en) Creston Brooks, Samuel Eggert et Denis Peskoff, « The Rise of AI-Generated Content in Wikipedia », {{Article}} : paramètre « périodique » manquant,‎ (lire en ligne).
  6. « Since 2017, Herron’s two accounts have made more than 300 contributions to pages on Wikipedia, of which more than half are entirely embellishments to Herron’s page, but there are notable deletions of positive content from the pages of Dauwalter, 2018 Boston Marathon champion Des Linden and Greek ultrarunning legend Yiannis Kouros. »- Merci DeepL pour la traduction. C'est pas parfait mais c'est pratique :).
  7. Victor Garcia, « Patrick Hetzel, un ministre bien peu scientifique : enquête sur le discret nettoyage de sa page Wikipédia », L’Express, (consulté le )
  8. https://x.com/WikiResearch/status/1843699094579229068
  9. Découvert via d:Wikidata:Status_updates/2024_10_14
  10. « As the saying goes, we move fast and break things: Wikidata is getting too big, too fast. The Wikidata Query Service graph got so huge it will be split, and the growth of the core database is deemed unsustainable. »
  11. « Let’s have it for slow data. Let’s make edits that take minutes rather than racking tens per second. (And sure, “It’s not the quantity, it’s the quality” is an old Wikipedia trope, at times ill-used, but not wrong per se.) »
  12. Traduit avec DeepL.com (version gratuite) « This does not mean not creating new items. But it does mean creating them more intentionally. The old, somewhat hyperbolic jest is that Wikipedia is full of articles that « no-one will ever read » (and I have done my fair share of that!) ; but on Wikidata, we sure have items that were not even created by someone, merely by something. »
  13. https://wikidata-game.toolforge.org/#
  14. https://observablehq.com/@pac02/explore-gender-diversity-in-a-single-wikipedia-article
  15. https://observablehq.com/@pac02/articles-wikilinks-inspector
  16. https://observablehq.com/@pac02/olympic-medals-by-continent
  17. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Intelligence%20artificielle
  18. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Philosophie
  19. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Amour
  20. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Musique
  21. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Humanit%C3%A9
  22. J'emprunte l'expression reste du monde au média Rest of world : https://restofworld.org/about/
  23. https://www.wikimedia.fr/participer-au-prix-wikimedia-de-la-recherche/

“Le livre des petits enfans”, de l’autrice lyonnaise Marceline Desbordes-Valmore, est à présent sur Wikisource en libre-accès. Une mise à disposition permise grâce à la collaboration entre l’association Le Deuxième texte et Les sans pagEs, la bibliothèque Diderot de Lyon, la Maison des Sciences de l’Homme de Dijon et la wikimédienne en résidence à l’URFIST […]

L’article Les petits enfans de Marceline Desbordes-Valmore enfin sur Wikisource est apparu en premier sur Wikimédia France.

Numéro du 13 novembre 2024

Wednesday, 13 November 2024 00:00 UTC

Éloge de la lenteur / L'édito de PAC2 — Depuis 2 ans que je contribue activement à RAW, la question de l'intelligence artificielle revient régulièrement dans l'actualité de Wikimédia. Ce numéro n'échappe pas à la règle et on retrouve encore dans ce numéro des inquiétudes face à la tentation de l'IA. À rebours des « accélérationnistes » qui veulent utiliser l'IA pour contribuer plus vite et mettre toujours plus de contenu, Jean-Frédéric sur le blog The Commonist fait un éloge bienvenu de la lenteur et de la contribution artisanale.

Vous trouverez aussi ce mois-ci une interview de Warp3 et un format atelier pour réfléchir à la représentation des personnalités des différents continents dans les articles Wikipédia.

Les brèves

Wikipédia face au problème du contenu généré par intelligence artificielle — Sur la Wikipédia anglophone, la communauté a créé un projet spécifique pour lutter contre le problème des contenus générés par intelligence artificielle mal sourcés et mal écrits[1]. 404 média revient en détail sur les enjeux. Un article anglophone sur la forteresse Amberlihisar, qui n'a jamais existé, constitue un bon exemple de mauvais recours à l'IA. L'IA a notamment généré des références parfaitement mises en forme mais totalement fictives. Le projet AI Cleanup recense aussi les images synthétiques. Certaines sont légitimes et sont utilisées à bon escient mais d'autres sont manifestement trompeuses[2].

Dans son édition du 19 octobre, The Signpost revient sur un récent article académique cherchant à quantifier la part de nouveaux articles générés avec de grands modèles de langage[3]. L'article intitulé « The Rise of AI-Generated Content in Wikipedia » utilise deux détecteurs automatiques de grands modèles de langage, GPTZero et Binoculars[4] pour estimer la proportion d'articles contenant des morceaux générés par des grands modèles de langage parmi les articles créés en août 2024[5].

« À l'aide de deux outils, GPTZero et Binoculars, nous détectons que jusqu'à 5 % des 2 909 articles anglais de Wikipédia créés en août 2024 contiennent un contenu significatif généré par l'IA. Les seuils de classification des deux outils ont été calibrés pour maintenir un taux de faux positifs ne dépassant pas 1 % sur une base Wikipédia pré-GPT-3.5, comme indiqué par la ligne rouge[5]. »

Sur la Wikipédia francophone, Fabius Lector a créé le projet Projet:Observatoire des IA et Simonk a initié un essai sur l'intelligence artificielle.

Logo de la conférence

WikiIndaba2024 — La conférence WikiIndaba, consacrée à la présence de l'Afrique sur Wikipédia, a eu lieu du 4 au 6 octobre à Johannesbourg.

Camille Herron, championne d'ultra-marathon et wikipédienne sous les pseudos Rundbowie et Temporun73.

La coureuse Camille Herron accusée de manipuler Wikipedia — La coureuse Camille Herron et son mari et entraîneur Conor Holt sont accusés d'avoir manipulé Wikipédia en diminuant le palmarès de concurrentes de Camille Herron.

« Depuis 2017, les deux comptes de Herron ont apporté plus de 300 contributions à des pages de Wikipédia, dont plus de la moitié sont entièrement des embellissements de la page de Herron, mais il y a des suppressions notables de contenu positif des pages de Dauwalter, du champion du marathon de Boston 2018 Des Linden et de la légende grecque de l'ultrarunning Yiannis Kouros[6]. »

Patrick Hetzel est ministre de l'enseignement supérieur et de la recherche dans le gouvernement de la République française depuis septembre 2024.

Le cabinet du ministre de l'enseignement supérieur et de la recherche français manipule Wikipédia ! — Une enquête du magazine L'Express révèle que le cabinet du nouveau ministre de l'enseignement supérieur et de la recherche français, Patrick Hetzel, a tenté de manipuler la biographie Wikipedia du ministre[7].

Florence Devouard, ancienne présidente de la fondation Wikimédia, est à l'initiative de la campagne SheSaid.

Florence Devouard interviewée sur l'initiative SheSaidDiff, le blog de la communauté interviewe Florence Devouard sur l'initiative de la campagne SheSaid.

« J'ai remarqué très tôt que les femmes étaient peu nombreuses dans nos projets, mais je ne me suis vraiment impliquée dans la lutte contre l'écart entre les sexes que lorsque Isla Haddow-Flood et moi-même avons lancé l'initiative Wiki Loves Women en 2016. Nous avons exploré différentes stratégies pour recruter plus de femmes, fournir un environnement plus inclusif, former et soutenir, mettre en œuvre différentes stratégies. Le sujet est complexe. En 2020, en pleine pandémie, j'ai lancé l'idée de #SheSaid... et nous voilà 4 ans plus tard ! »

Boîte à livres à Amboise, France.

11 000 boîtes à livres recensées — Le site boîtes-à-livres.fr recense les boîtes à livres en France en s'appuyant sur OpenStreetMap et Wikimédia Commons. On y trouve maintenant plus de 11 000 boîtes à livres.

Tous les chemins entre deux éléments Wikidata — Des chercheurs ont développé un nouvel outil capable de trouver tous les chemins possibles entre deux entités Wikidata[8].

Articles les plus centraux — L'université de Milan publie la liste des articles les plus centraux de Wikipédia (à priori uniquement la version anglophone).

C'est la saison des Nobel — Chaque année les différents prix Nobel sont remis début octobre. C'est l'occasion de remettre à jour et de développer de nouveaux notebooks consacrés aux Nobel.

Comme pour les jeux olympiques, on peut calculer la concentration des prix par pays de nationalité à partir d'une requête Wikidata.

Les États-Unis sont en tête du classement pour le prix Nobel de médecine, le prix Nobel de physique, le prix Nobel de la paix et le prix Nobel de Chimie. La France est en tête pour le prix Nobel de littérature. Les États-Unis obtiennent près de 40% des prix en médecine et plus de 32% des prix en physique et en chimie ! Parmi les cinq prix Nobel historique, c'est le prix Nobel de littérature qui est le plus diversifié en terme de pays de nationalité.

Jean-Frédéric propose l'approche SNAIL, acronyme de « Slow, NArrow, In-depth, Local », ce qu'on peut traduire par « Lent, précis, en profondeur et local ».

L'approche escargot ou l'éloge de la lenteur — Sur le blog The Commonists, Jean-Frédéric propose une approche escargot à la contribution #Wikidata 🐌[9]!

Plutôt que de faire de l'édition en masse, il propose de prendre le temps de faire de la contribution manuelle.

« Comme le dit le proverbe, nous allons vite et nous cassons des choses : Wikidata devient trop gros, trop vite. Le graphique du service d'interrogation de Wikidata a pris une telle ampleur qu'il sera scindé, et la croissance de la base de données principale est jugée insoutenable[10]. »

Plutôt que d'utiliser QuickStatement ou OpenRefine, Jean-Frédéric propose l'approche lente en s'inspirant du mouvement lent :

« Faisons ça avec les données lentes. Faisons des modifications qui prennent des minutes au lieu d'en faire des dizaines par seconde. (Et bien sûr, "Ce n'est pas la quantité, c'est la qualité" est un vieux trope de Wikipedia, parfois mal utilisé, mais pas faux en soi)[11]. »

« Cela ne signifie pas qu'il ne faut pas créer de nouveaux articles. Mais cela signifie qu'il faut les créer plus intentionnellement. La vieille plaisanterie, quelque peu hyperbolique, est que Wikipédia est pleine d'articles que " personne ne lira jamais " (et j'en ai fait ma part !) ; mais sur Wikidata, nous avons certainement des articles qui n'ont même pas été créés par quelqu'un, mais simplement par quelque chose[12]. »

Une nouvelle interface pour contribuer aux données lexicographiques de Wikidata — Lexico est une nouvelle interface qui permet de faciliter la contribution aux données lexicographiques (lexemes) sur Wikidata. Le principe rappelle les Wikidata Games de Magnus Manske[13].

65 000 citations sur Wikiquote — Wikiquote en français compte désormais 65 000 citations réparties sur près de 9 000 pages.

L'atelier

Dans cette section, un(e) wikimédien(ne) peut raconter un de ses bricolages à la première personne.

Ce mois-ci c'est PAC2 qui raconte comment il a bricolé un outil pour mesurer les biais de Wikipedia.

Il y a quelques années, j'avais développé le Gender Diversity Explorer, un petit outil en ligne qui récupère tous les liens bleus d'un article Wikipédia (ie les mentions), récupère la valeur de la propriété P21 (Sexe ou genre) dans l'élément Wikidata associé et calculé des statistiques de genre sur la répartition des entités nommées dans l'article[14].

L'approche se généralise facilement à n'importe quelle propriété dans Wikidata. C'est ce que propose le Wikilinks inspector[15].

Pour réfléchir à la représentation de certains continents comme l'Afrique ou l'Amérique du Sud, j'avais besoin d'adapter l'outil et de trouver un bon moyen de faire la correspondance entre des pays et des continents. C'est mon travail sur la répartition des médailles aux jeux olympiques qui m'a permis de trouver le bon moyen d'obtenir une correspondance à peu près pertinente entre pays et continents[16].

Techniquement, la magie vient toujours de la possibilité d'appeler l'api Wikimédia depuis une requête SPARQL :

SELECT ?item ?itemLabel ?country ?countryLabel 
WHERE {
  SERVICE wikibase:mwapi {
     bd:serviceParam wikibase:endpoint "fr.wikipedia.org";
                     wikibase:api "Generator";
                     mwapi:generator "links";
                     mwapi:titles "Intelligence artificielle";.
     ?item wikibase:apiOutputItem mwapi:item.
  } 
  FILTER BOUND (?item)
  ?item wdt:P31 wd:Q5 . 
  ?item wdt:P27 ?country . 
  ?country rdfs:label ?countryLabel filter (lang(?countryLabel) = "en") .
  ?item rdfs:label ?itemLabel filter (lang(?itemLabel) = "en") .
}

Cliquez pour essayer !

On combine ça ensuite avec la requête sur les continents et le tour est joué :

SELECT DISTINCT ?continent ?continentLabel ?country  ?code WHERE {
VALUES ?continent {
wd:Q55643
wd:Q48
wd:Q15
wd:Q18
wd:Q49
wd:Q46
} 
 ?continent (wdt:P527*) ?country.
  ?country 
    wdt:P2082 ?code.
  SERVICE wikibase:label { bd:serviceParam wikibase:language "en". }
}

Cliquez pour essayer !

Venons en maintenant aux résultats. Si on prend un article sur un thème très général et si Wikipedia représente l'ensemble des connaissances sur un sujet, on devrait s'attendre à avoir une représentation de personnalités de tous les continents dans les entités mentionnées dans un article.

Maintenant, quand on regarde l'article Intelligence artificielle, on trouve 69 personnalités nord-américaines, 58 personnalités européennes, 9 personnalités non classées pour seulement 6 personnalités asiatiques, 5 personnalités africaines, 3 personnalités oceaniennes et 2 personnalités sud-americaines[17].

L'article Philosophie mentionne 158 personnalités européennes mais aucune personnalité africaine[18].

L'article Amour mentionne une personnalité africaine pour 58 personnalités européennes[19].

L'article Travail ne mentionne aucune personnalité africaine, aucune personnalité asiatique ou aucune personnalité sud-américaine contre 23 personnalités européennes.

Même bilan avec l'article Musique : 36 personnalités européennes, 6 nord américaines et 1 océanienne mais aucune personnalité asiatique, africaine ou sud-américaine[20].

On pourrait penser que l'article consacré à l'humanité mentionnerait des personnalités de tous les continents. Ça n'est pas le cas. On ne compte aucun représentant de l'Océanie, de l'Afrique et de l'Asie dans l'article[21].

On peut multiplier les exemples et on voit que les continents nord-americains et européens sont largement représentés alors que les autres continents et notamment l'Afrique et l'Amérique du Sud sont représentés de manière marginale dans les articles généraux de l'encyclopédie.

Il y a sans doute de multiples raisons à ce déséquilibre. L'outil peut nous aider à prendre conscience du déséquilibre et chercher, article par article, des idées pour mieux représenter les personnes des continents sous représentés. En creux, on en vient à se demander si Wikipedia représente la « somme de toutes les connaissances » ou simplement le point de vue européen et nord-américain. Le point de vue du « reste du monde » est aujourd'hui manifestement peu représenté dans Wikipedia[22].

La grande interview

Dans cette section, nous donnons la parole à des wikimédien(ne)s sur des thèmes donnés afin de recueillir leurs avis ou les faire parler tout simplement de leurs expériences dans le mouvement.

Entretien avec Warp3

Ses activités wikimédiennes.
Par écrit sur cette page.
L'embellie.
Merci à Noé et Cantons-de-l'Est pour les suggestions de questions.
 ↑ 1. Bonjour Warp3. Merci d'avoir accepté cet entretien après que Cantons-de-l'Est vous ait suggéré comme invité. Pour commencer, je vous laisse vous présenter.

Comme beaucoup de Wikipédistes anciens et français, j'ai connu les débuts d'Internet en France en entreprise puis à domicile, période riche en projets informatiques de toutes les sortes. Intéressé par les articles de vulgarisation dans plusieurs domaines, j'eus vent d'un projet de réalisation d'une encyclopédie à accès gratuit sur le Net, qui s'appelait Wikipédia. Il y avait alors quelques autres encyclopédies comme Encarta de Windows, sur disquettes ou CD, mais assez chères, et les rares encyclopédies gratuites étaient très limités dans leur étendue et d'usage pas bien pratique. Le premier contact avec ce projet balbutiant fut une relative déception : peu d'articles et pas grand-chose dedans.

J'y revins quelques années après... et c'était déjà beaucoup mieux ! Peu à peu, je trouvais le plus souvent un article de Wikipédia après une recherche avec Google, et je m'étonnais que, même si l'article était peu développé, il répondait au minimum à la question « qu'est-ce que c'est ? ». Je faisais alors quelques apports ou corrections minimes, à l'occasion. Quelque trois ans après, fort d'avoir parcouru des pages d'aides et de règles (pas faciles à trouver) ainsi que plusieurs discussions, je fus fin prêt à prendre un compte... mais j'ai attendu encore deux ans avant de m'incrire fin juin 2008, sur un coup de tête. Première constatation après : hors l'accueil (automatique), l'impression d'être complètement seul à se dépatouiller dans l'édition (les pages de discussions des articles sont très souvent vides), jusqu'à me demander où se retrouvaient les Wikipédistes. C'est sur quelques pages plus spécifiques qu'ils se « cachaient », dont un certain Bistro.

Ma page de présentation contient un peu de mon état d'esprit au moment de l'inscription (elle est succinte et un peu ancienne maintenant, mais elle reste encore d'actualité). J'appris qu'il fallait s'inscrire aussi à un autre projet : WM Commons, afin d'ajouter des images (y compris les siennes) à un article. C'était cependant une façon de découvrir que Wikipédia s'appuie sur d'autres projets. Et puis, par curiosité, je visitai d'autres projets encore... (suspense)

 ↑ 2. Comment êtes-vous arrivé dans le mouvement Wikimédia ? Sur quel wiki en premier et comment avez-vous découvert les autres projets ?

Après Wikipédia, puis Commons, j'ai examiné plusieurs autres projets et enfin Wikimédia.

Au début, Wikimédia n'était pas un vrai mouvement mais une entreprise qui mettait en place Wikipédia, l'encyclopédie libre, dans de nombreuses langues puis soutenait d'autres projets voisins de l'encyclopédie. Wikimedia, utilisant des logiciels libres et parfois sous domaine public, s'est mis à promouvoir aussi le développement du libre. C'est plus récemment que la fondation Wikimédia, d'abord à travers la diffusion des projets et par leur utilisation avec tous, en fournissant les moyens de se connecter jusque dans les régions dépourvues d'accès au Net, est devenue un mouvement de développement local et privilégie l'intégration sociale.

j'ai cherché à comprendre l'organisation des projets par rapport à Wikimédia, comme l'existence des chapitres pour chaque projet dans un pays donné. J'ai fait ainsi au passage un peu de traduction de pages en anglais sur Wikimédia (à partir de 2015), participé plus ou moins à divers projets dont Wikiquote (fr), Wikisource, Wiktionnaire, Wikilivres. Je me suis aussi intéressé au thème de l'humour et enrichi le contenu de son portail à partir de 2015.

 ↑ 3. En vous présentant, Cantons-de-l'Est écrit : « Il trouve régulièrement des images qu'il « décore » de légendes savoureuses. » C'est dans cette activité que je vous ai aussi connu notamment sur le Bistro ou dans d'autres sections de discussions. Quand et comment avez-vous commencé à illustrer Le Bistro ?

Ce doit être le 15 décembre 2009, avec le drapeau de l'Acadie. Le calendrier du Bistro est né le 14 septembre 2005 et a vite évolué : la première illustration date du 7 novembre, la première image commentée est du 25 novembre de la même année. L'habitude est prise de décorer assez régulièrement le calendrier dès 2006. Les images avec leurs commentaires sont dans le ton du bistro, souvent légères et comiques, alternant avec des rappels de faits historiques. D'autres images se trouvent parfois ailleurs dans les discussions. Elles décrivent un aspect ou l'autre de Wikipédia en français, de ses débats.

On retrouve alors souvent DocteurCosmos en illustrateur du calendrier. Il se chargeait de l'illustrer avec un tour souvent amusant quand personne d'autre ne l'avait fait. C'est cette façon ludique qui m'a conduit à oser une première illustration dans ce petit espace en haut à droite de chaque page quotidienne du Bistro. J'ai augmenté progressivement mon implication dans ce cadre, comme une sorte de détente après un tas de modification dans les articles. Comme on pourra vérifier, les histoires de cabales et de chats au Bistro existaient depuis au moins 2006, bien avant mon arrivée Émoticône !

 ↑ 4. Vos choix d'illustration, vos légendes ainsi que parfois (souvent ?) vos commentaires de modifications sont tantôt profondes, tantôt légères, mais revêtent toujours une certaine beauté selon moi. Où trouvez-vous l'inspiration ?
— Warp3 ? Mmm... Attendez que je zoome sur l'image... Non, connais pas.

Voilà une question qui doit certainement tarabuster Cantons-de-l'Est depuis des années Émoticône. Il y a de nombreuses façons pour moi de trouver une idée de Bistro, idée souvent de type comique. Le cas le plus courant : c'est au cours de mes périgrinations quasi aléatoires sur Wikipédia et Commons que se fait la découverte de photos ou de dessins qui sont déjà comiques ou étonnantes en elle-même, ou quand leur rapport me semble raconter une historiette ; une sorte de hasard heureux peut-on dire. Sinon, quand j'ai une idée précise, quelques fois inspirée par l'actualité de wpfr, je cherche dans la catégorie idoine celles qui peuvent faire l'affaire. Et il m'arrive aussi d'élaborer des gags un peu plus complexes au saut du lit Émoticône. Dans un premier temps, j'ajoutais un lien vers une vidéo Youtube pour illustrer avec de la musique ou avec un sketch. Mais quelqu'un(e) m'a fait savoir que Commons héberge aussi des fichiers de musiques, qui sont libres de droits, contrairement aux vidéos Youtube. Depuis, je fouine dans les diverses catégories, et en place quelques-unes aux emplacements qui me semblent les plus appropriés. Cette bibliothèque de musiques (et de vidéos), pas assez connue à mon avis ni assez utilisée, semble s'être fortement enrichie ces dernières années.

Chaque fois que je place une illustration assortie d'un commentaire, je ne sais pas vraiment comment cela va être reçu, car il n'y a presque jamais de commentaires sur place ou sur ma page. En général, sur WP, quand personne ne fait de commentaire sur votre modification sur un article, ça signifie qu'elle est plus ou moins acceptée et je me figure que c'est pareil avec une image. Mais c'est comme être sur un bout de scène avec un public derrière une cloison, invisible et muet, qui peut une fois dans la rue faire un petit signe discret de connivence ou au contraire flanquer une claque, sans que je sache trop pour quoi.

 ↑ 5. Utilisez-vous des outils en particulier pour retrouver des images, les archiver, s'en souvenir ? Comment effectuez-vous vos recherches ?

Sur les projets : très peu, en fait. J'ai même décoché tout un tas de gadgets mis par défaut dans mes préférences. J'utilise parfois un éditeur de texte autre que celui de base. Pour les recherches, il arrive que c'est par les images que je retrouve certaines pages ou informations. Mais dans mes recherches d'un fichier sur Commons, je n'utilise guère le gadget fourni, qui retourne n'importe quoi tant qu'il existe dans le nom du fichier une seule erreur, ou que le nom n'est pas assez complet. Utiliser un moteur de recherche extérieur donne plus de chance de trouver le fichier cherché. Et, non, je ne fais pas de recherche SPARQL à travers WikiData, malgré les nombreux exemples donnés par les RAW (!). Question visuels, j'utilise les pauvres logiciels de base de Windows : mspaint, photo, wordpad, bloc-notes. Oui, frugalité extrême... il y a de quoi rire !

 ↑ 6. Assidu du Bistro, qu'aimez-vous y trouver et quelle est la raison d'être que vous donnez à cet espace communautaire ?

Quand j'ai découvert le Bistro à l'époque de mon inscription, je pensais y trouver une sorte d'assemblée très sérieuse réglant avec précision l'avenir de l'Encyclopédie, alors que c'était plutôt une sorte d'auberge espagnole bruyante et un tantinet folle. Le Bistro actuel est en majorité le rendez-vous de toutes les personnes un peu anciennes désireuses de débattre, et parfois d'informer la Wikipédie. C'est le lieu pour poser ses questions avec de grandes chances d'avoir au moins une réponse, que l'on soit novice ou non. Certains débats sont cependant si extravagants que je finis par les trouver rigolos ! Je préfère cependant le discours plus léger tenu par d'autres personnes, comme il arrivait souvent dans les premières années de l'existence du Bistro.

 ↑ 7. Comment trouvez-vous la convivialité et l'ambiance en général au sein de la communauté ?

La communauté de Wikipédia en français est diverse, très partagée sur plusieurs thèmes (inclusionnisme/suppressionnisme, paternalisme/féminisme, fair-use, Comité d'arbitrage (CAr), etc.) depuis au moins 2006 sur les espaces de discussions. Ce n'est que par l'observance des règles établies et de la volonté de participer sereinement à la création et à la maintenance des articles que l'on peut dire qu'il existe une sorte de lien solidaire entre les membres. L'ambiance peut être bonne ou mauvaise selon l'importance que l'on porte à ces thèmes. Il est ainsi possible d'avoir de bons rapports en travaillant sans apriori avec des personnes dans un espace d'articles peu polémiques (potentiellement plusieurs millions Émoticône) .

 ↑ 8. Quel type de wikipédien êtes-vous ? Comment décririez-vous votre manière de contribuer sur l'encyclopédie ?

Si j'ai pris un compte sur Wikipédia, c'est aussi parce que je me sentais redevable de tant d'informations offertes sans contreparties de ma part. J'ai commencé par des corrections orthographiques et quelques reformulations, mais ne me destinais pas à faire beaucoup plus. C'est en voyant l'état de quasi ébauche de l'article Bugs Bunny que je me suis décidé à le développer, par traduction de l'article anglophone. Aussi, le goût me prit de continuer des articles initiés par d'autres, d'abord dans le domaine du dessin animé alors presque déserté hormis le champ disneyien, puis dans d'autres domaines.

Wikipédiste papillonnant, assez solitaire, je passe d'un sujet à l'autre selon mes goûts du moment. L'Amérique de la période située entre 1850 et 1950, le cinéma (Warner Bros. surtout) et la musique sont autant de sujets qui m'intéressent le plus. Malgré une bonne centaine d'articles créés et pas mal de traductions de l'anglais (je vous conseille DeepL comme base) depuis plus de 15 ans, je me considère encore comme un petit rédacteur-relecteur (et suis étonné de faire partie des mille premiers modificateurs actifs de WP). Je n'ai d'ailleurs développé aucun article jusqu'à un niveau de labellisation.

 ↑ 9. Créateur de plus de 110 articles, quand considérez-vous que le sujet d'un article est épuisé avant de passer à un autre ? Quels sentiments cela vous inspire de savoir qu'il reste tant à faire sur le wiki ?

Un article très pointu (dit « d'intéret faible » dans les évaluations), comme un certain type d'invertébré marin très peu connu, s'il est traité pleinement à travers toute la documentation existante, devient un article abouti. S'il n'a pas sa belle étoile doré d'article de qualité, c'est tant pis, mais cela n'enlève rien à son degré d'achèvement. Inversement, sur un article portant sur un sujet connu où la documentation abonde, ou alors un article généraliste, il faut non seulement traiter tous les angles de vue mais aussi rester synthétique (et faire des articles secondaires), et le travail de retrait devient aussi important que celui d'ajout.

Pour ma part, les articles en anglais que je traduis, qui me plaisent, ne sont que rarement des articles complets avec labels de qualité. Je vérifie les sources et complète certains détails, mais je les sais très perfectibles. Le minimum, au-delà des sources, est que la lectrice ou le lecteur puisse se faire au moins une bonne idée du sujet, typiquement un résumé introductif (RI).

Une majorité d'articles de Wikipédia sont (encore) des ébauches ou des articles à peine développés. Tant que des sources sûres justifient l'existence d'un article et qu'il dispose d'une sorte de RI, je considère celui-ci comme valable (en tant que lecteur). Contrairement à d'autres Wikipédistes, cette masse de mini articles ne me semble pas dommageable à l'image de l'encyclopédie, au contraire ! Mieux vaut un article minimum (mais bon) que rien du tout. C'est la multiplicité des articles qui fait l'une des forces de l'Encyclopédie. Les articles faux (canulars) sont, en revanche, une plaie et à éradiquer au plus vite (merci les admins et les vigilant(e)s).

 ↑ 10. En considérant votre expérience sur le wiki, qu'est-ce qui vous a procuré le plus grand plaisir sur Wikipédia ? Au contraire, qu'est-ce qui vous a le plus marqué négativement ?

Il n'y a pas beaucoup d'expériences à vivre sur Wikipédia si on reste à faire des modifications légères sur des articles sans controverses, voire peu lus. Mais dès que l'on prend un compte et que l'on s'attaque à certains gros articles, on rencontre fatalement une partie de la « communauté» hétéroclite wikipédienne.

Il y a eu plusieurs heureuses rencontres, mais je crois que l'une des plus heureuses fut celle de la création des RAW, journal à la fois très instructif et bien présenté par son créateur (mais non, je ne fais pas de la publicité éhontée !). Après réflexion, je dirais que la pire rencontre arriva deux mois après mon inscription, à propos d'une discussion sur ma page de discussion avec un Wikipédien dynamique, aujourd'hui admin actif. Juste après un de mes propos pourtant assez mesuré, déboula sur ma page un parfait inconnu qui se mit à me faire une leçon wikipédienne magistrale dans le plus pur style des « anciens » s'adressant à un complet ignorant. J'avais beau m'être mentalement préparé à des avis extrêmes ou divagants, ce genre d'attaque très limite fut fort désagréable, surtout quand elle fut appuyée par d'autres.

 ↑ 11. Quels seront selon vous les plus grands défis de Wikipédia en français dans les cinq prochaines années ?

Je ne suis pas dans le secret des dieux, mais je crois percevoir :

- L'arrivée de l'intelligence articielle (IA, donc) sur WP est un peu ce que depuis longtemps des Wiképidistes appelaient de leurs vœux pour traiter les millions d'articles de façon automatique. Est-ce la bonne formule ? On peut en douter, dans l'état actuel. Le bon usage de cette IA sur WP reste à définir, et à faire évoluer en même temps qu'elle. Peut-elle éclipser WP même ? La boule de cristal est floue, rappelez plus tard Sourire diabolique.

- Les nouvelles structures qui se mettent lentement en place sous l'égide de Wikimédia, et qui semblent être complètement ignorées du gros de la communauté wikipédienne francophone, mis à part l'application du Code de conduite universel dans les règles de wpfr.

- Maintenir une certaines cohésion entre les membres des Wikipédistes, faire évoluer certaines mentalités ; attirer de nouveaux membres actifs ; se prémunir contre les nouvelles formes d'atteintes aux articles : publicitaires, politiques ou autres ; trouver (et financer) un moyen pérenne de conserver les traces des sources sur Internet.

 ↑ 12. Que pensez-vous des médias qui sont stockés sur Wikimedia Commons et du wiki en général ?

(Wikimedia) Commons est un site énorme, qui recueille des documents (hors textes), pas seulement des photos mais aussi des vidéos et des fichiers sonores. Des musées et institutions prestigieux sont sollicités, ce qui fait que des images exceptionnelles, historiques, y sont copiés et cotoient le reste, inimaginable tant il y en a.

Je me suis incrit presque en même temps sur Commons, site qui héberge donc la plupart des fichiers libres de droits utilisés par Wikipédia, dans le but d'illustrer certains articles. Tout d'abord, j'ai posté quelques-unes de mes photos et me suis conformé aux règles (pas exactement fixées) des droits d'auteur. Mais au fur et à mesure des années, les administrateurs et autres personnes à statut m'ont semblé avoir un comportement de plus en plus incohérent face au soupçon de copyright : aveugles à des imports clairement douteux et sans source mais impitoyables, voire désinvoltes, avec d'autres pourtant accompagnés d'une preuve d'ancienneté suffisante ou/et d'autres garanties. Cela m'a ôté l'envie de discuter et d'y importer quoi que ce soit. Je me contente maintenant principalement de traduire le descriptif des fichiers ou de les catégoriser.

 ↑ 13. Si j'en crois ce diff, le concours de l'image de l'année POTY vous intéresse. Quels ont été vos coups de cœur ou les images qui vous ont profondément marquées depuis que vous suivez ce concours ?

Les concours d'images (principalement photographiques) Picture of the Year (POTY) organisés sur Commons chaque année depuis 2006 sont un plaisir des yeux. Depuis que je connais l'existence du concours, j'y participe régulièrement et leur fait une certaine publicité au Bistro. J'ai aidé à traduire des pages et à vérifier la validité de votes, quand tout était encore fait à la main et qu'il fallait tout refaire et repenser chaque année. Ces dernières années, une poignée de codeurs ont pris le taureau par les cornes et ont automatisé la création au maximum. Cela évite en bonne partie la triche et le recompte manuel mais il n'y a plus le charme des commentaires qui étaient aussi utiles aux photographes participants, et la tenue d'une nouvelle édition ne semble plus être décidée que par eux. Trop de photos m'ont ébloui par leur qualité ou leur sujet pour me décider de seulement quelques-unes ! J'ai découvert cependant que deux noms de photographes reviennent souvent dans les auteurs des photos que je trouve parmi les meilleures : Luc Viatour et Basile Morin (ce dernier étant aussi remarquable pour ses nombreux et excellents ambigrammes). La photo gagnante du concours 2023 est superbe en plus d'être étonnante, même si je ne l'ai pas choisie au dernier tour. Mais elle a eu droit auparavant à plein de prix et je l'avais utilisée dans le Bistro du 15 juillet 2023. Une photo remarquable plus ancienne mais découverte par moi il y a peu de temps m'a complètement désorienté au premier coup d'œil (voir mon commentaire ici).

 ↑ 14. Quel(le) wikimédien(ne) souhaiteriez-vous voir interviewé(e) dans un prochain numéro et sur quel thème ?

Il y a beaucoup de candidats possibles (et disponibles !) mais je serais curieux de Kropotkine 113, Wikipédiste chevronné toujours présent mais finalement assez discret sur les espaces de discussions grand public.

 ↑ 15. Y a-t-il un sujet particulier qui vous tient à cœur et qu’on n’a pas abordé dans cet entretien ? Vous avez carte blanche 🙂.

Je tiens à (re)dire à Cantons-de-l'Est mon plein soutien à la création d'un dictionnaire visuel (multilingue) !

 ↑ 16. Avez-vous un message particulier à adresser aux lectrices et lecteurs du RAW ? Quel serait votre mot de la fin ?

Pas particulèrement au lectorat des RAW mais plutôt aux Wikipédistes en général : si vous avez une idée, ou si une remarque vous tient à cœur, exprimez-la gentiment : on ne vous embastillera pas pour cela ! Si participer à Wikipédia devient une obsession ou un énorme boulet, prenez des vacances. Mais si rien de Wikipédia ne vous plait, alors peut-être que Wikipédia... n'est pas (ou plus) pour vous.

Merci d'avoir accepté cette interview. Bonne continuation !

L'agenda

Les autres infolettres

La page Wikipédia:RAW/Découvrir recense les infolettres et blogs relatifs à Wikimedia.

En plus de RAW, vous pouvez lire le Wikimag, newsletter hebdomadaire de la Wikipedia francophone (Voir le dernier numéro Wikipédia:Wikimag/2024/44), l'infolettre Wikifier la science (voir le dernier numéro Projet:Wikifier la science/Infolettre/Octobre 2024) et les Actualités du Wiktionnaire newsletter mensuelle du Wiktionnaire (wikt:Wiktionnaire:Actualités/114-septembre-2024).

Les anglophones peuvent aussi lire The Signpost, publié toutes les deux semaines, la newsletter hebdo de la communauté Wikidata (voir ici d:Wikidata:Status updates/2024 10 28) ou encore la newsletter du projet Wikifunction ("wikifunction:Wikifunctions:Status updates/2024-10-25).

Courrier du lectorat

(Il nous fera plaisir de lire les messages déposés ici et, si nécessaire, d'y répondre dans les plus brefs délais.)

Wikipédia face au problème du contenu généré par intelligence artificielle — L’intérêt des intelligences artificielles génératives comme ChatGPT réside, selon moi, dans leur capacité de rédaction. À partir du moment où on leur fournit une première version d’un texte sourcé, elles sont capables de le synthétiser ou de le compléter afin qu’il soit rédigé dans un style clair et encyclopédique. De ce point de vue, ce sont d’excellents assistants.
En revanche, comme dit Le chat perché, elles ne peuvent pas faire le travail à notre place, et ce pour une raison très simple : elles ne sont pas conçues pour. Ce sont des IA « probabilistes ». Elle donne le résultat « le plus probable », pas forcément le plus fiable. C’est ce qui explique qu’elles peuvent inventer un concept scientifique… qui n’existe pas, ou encore inventer des sources. Attention donc à ne pas les prendre pour ce qu’elles ne sont pas Émoticône. Merci aux rédacteurs et rédactrices du RAW, comme toujours très instructif.--Pronoia (discuter) 1 novembre 2024 à 10:10 (CET)

De mon côté, ce qui m'inquiète le plus est l'illusion de qualité avec des utilisateurs ne voyant même pas les problèmes. Pour l'exemple, question que j'ai posé hier sur quoi faire avec ce cas où il se pourrait que l'utilisateur soit de bonne foi. J'ai prévu de traduire cet essai anglais pour avoir une base pédagogique vers laquelle orienter mais si ce genre de chose se développe, faudra peut-être penser à un avertissement quelque part pour que toute personne venant contribuer sache qu'il y a des choses à ne pas faire.
Pour l'heure, le principe de signalement n'est pas encore en place côté francophone mais côté anglophone, ils ont eu 69 articles indiqués en octobre et si on en croit l'étude indiquée plus haut, il y a des chances qu'on en rate. Fabius Lector (discuter) 1 novembre 2024 à 11:50 (CET)
Je partage l'inquiétude sur l'illusion de qualité. Mais ça va au delà de l'IA.
Sinon je suis honnoré d'être cité Émoticône. Le chat perché (discuter) 1 novembre 2024 à 13:35 (CET)

Biais de surreprésentation des idées et auteurs occidentaux — Merci PAC2 pour ton outil de mesure des biais géographiques dans les articles ! Je trouve cela très parlant et assez préoccupant de voir que Wikipédia reflète avant tout les connaissances occidentales. Il y a probablement une explication historique à ça (naissance de la science moderne en Europe, développement de la plupart des disciplines universitaires en Occident + colonisation, effacement des savoirs autochtones et difficultés d'accès aux études supérieures dans beaucoup d'endroits). On a du boulot pour lutter contre ce biais ! Skimel (discuter) 2 novembre 2024 à 09:58 (CET)

Grande interview de Warp3 — Merci Warp3 pour cette interview, qui m'a diverti de mes soucis IRL. Comme d'habitude, j'ai lu des observations et des commentaires qui m'ont fait Émoticône ! — Cantons-de-l'Est p|d|d 🧹 4 novembre 2024 à 23:51 (CET)

Boîtes à livres — Merci pour la mention, je n'avais pas encore lu ce RAW, quelle bonne surprise de voir le site mentionné ! Symac (discuter) 7 novembre 2024 à 13:12 (CET) (développeur dudit site :p)

L'IA a une forte valeur ajoutée pour "aider à faire" mais jamais pour "faire à la place".
 – Le chat perché sur le Bistro.
Rédigé/traduit par L'embellie et PAC2.
Citations originales
Notes
Références
  1. Découvert via https://wikis.world/@festal@tldr.nettime.org/113243136048240433
  2. https://www.404media.co/the-editors-protecting-wikipedia-from-ai-hoaxes/
  3. en:Wikipedia:Wikipedia Signpost/2024-10-19/Recent research
  4. Pour les plus curieuses et les plus curieux, la méthode Binoculars est une méthode de détection des textes générés par des grands modèles de langage qui s'appuie sur la « perplexité croisée  » de deux grands modèles de langage. Pour en savoir plus : https://arxiv.org/html/2401.12070v3
  5. a et b (en) Creston Brooks, Samuel Eggert et Denis Peskoff, « The Rise of AI-Generated Content in Wikipedia », {{Article}} : paramètre « périodique » manquant,‎ (lire en ligne).
  6. « Since 2017, Herron’s two accounts have made more than 300 contributions to pages on Wikipedia, of which more than half are entirely embellishments to Herron’s page, but there are notable deletions of positive content from the pages of Dauwalter, 2018 Boston Marathon champion Des Linden and Greek ultrarunning legend Yiannis Kouros. »- Merci DeepL pour la traduction. C'est pas parfait mais c'est pratique :).
  7. Victor Garcia, « Patrick Hetzel, un ministre bien peu scientifique : enquête sur le discret nettoyage de sa page Wikipédia », L’Express, (consulté le )
  8. https://x.com/WikiResearch/status/1843699094579229068
  9. Découvert via d:Wikidata:Status_updates/2024_10_14
  10. « As the saying goes, we move fast and break things: Wikidata is getting too big, too fast. The Wikidata Query Service graph got so huge it will be split, and the growth of the core database is deemed unsustainable. »
  11. « Let’s have it for slow data. Let’s make edits that take minutes rather than racking tens per second. (And sure, “It’s not the quantity, it’s the quality” is an old Wikipedia trope, at times ill-used, but not wrong per se.) »
  12. Traduit avec DeepL.com (version gratuite) « This does not mean not creating new items. But it does mean creating them more intentionally. The old, somewhat hyperbolic jest is that Wikipedia is full of articles that « no-one will ever read » (and I have done my fair share of that!) ; but on Wikidata, we sure have items that were not even created by someone, merely by something. »
  13. https://wikidata-game.toolforge.org/#
  14. https://observablehq.com/@pac02/explore-gender-diversity-in-a-single-wikipedia-article
  15. https://observablehq.com/@pac02/articles-wikilinks-inspector
  16. https://observablehq.com/@pac02/olympic-medals-by-continent
  17. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Intelligence%20artificielle
  18. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Philosophie
  19. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Amour
  20. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Musique
  21. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Humanit%C3%A9
  22. J'emprunte l'expression reste du monde au média Rest of world : https://restofworld.org/about/
  23. https://www.wikimedia.fr/participer-au-prix-wikimedia-de-la-recherche/

Numéro du 12 novembre 2024

Tuesday, 12 November 2024 00:00 UTC

Éloge de la lenteur / L'édito de PAC2 — Depuis 2 ans que je contribue activement à RAW, la question de l'intelligence artificielle revient régulièrement dans l'actualité de Wikimédia. Ce numéro n'échappe pas à la règle et on retrouve encore dans ce numéro des inquiétudes face à la tentation de l'IA. À rebours des « accélérationnistes » qui veulent utiliser l'IA pour contribuer plus vite et mettre toujours plus de contenu, Jean-Frédéric sur le blog The Commonist fait un éloge bienvenu de la lenteur et de la contribution artisanale.

Vous trouverez aussi ce mois-ci une interview de Warp3 et un format atelier pour réfléchir à la représentation des personnalités des différents continents dans les articles Wikipédia.

Les brèves

Wikipédia face au problème du contenu généré par intelligence artificielle — Sur la Wikipédia anglophone, la communauté a créé un projet spécifique pour lutter contre le problème des contenus générés par intelligence artificielle mal sourcés et mal écrits[1]. 404 média revient en détail sur les enjeux. Un article anglophone sur la forteresse Amberlihisar, qui n'a jamais existé, constitue un bon exemple de mauvais recours à l'IA. L'IA a notamment généré des références parfaitement mises en forme mais totalement fictives. Le projet AI Cleanup recense aussi les images synthétiques. Certaines sont légitimes et sont utilisées à bon escient mais d'autres sont manifestement trompeuses[2].

Dans son édition du 19 octobre, The Signpost revient sur un récent article académique cherchant à quantifier la part de nouveaux articles générés avec de grands modèles de langage[3]. L'article intitulé « The Rise of AI-Generated Content in Wikipedia » utilise deux détecteurs automatiques de grands modèles de langage, GPTZero et Binoculars[4] pour estimer la proportion d'articles contenant des morceaux générés par des grands modèles de langage parmi les articles créés en août 2024[5].

« À l'aide de deux outils, GPTZero et Binoculars, nous détectons que jusqu'à 5 % des 2 909 articles anglais de Wikipédia créés en août 2024 contiennent un contenu significatif généré par l'IA. Les seuils de classification des deux outils ont été calibrés pour maintenir un taux de faux positifs ne dépassant pas 1 % sur une base Wikipédia pré-GPT-3.5, comme indiqué par la ligne rouge[5]. »

Sur la Wikipédia francophone, Fabius Lector a créé le projet Projet:Observatoire des IA et Simonk a initié un essai sur l'intelligence artificielle.

Logo de la conférence

WikiIndaba2024 — La conférence WikiIndaba, consacrée à la présence de l'Afrique sur Wikipédia, a eu lieu du 4 au 6 octobre à Johannesbourg.

Camille Herron, championne d'ultra-marathon et wikipédienne sous les pseudos Rundbowie et Temporun73.

La coureuse Camille Herron accusée de manipuler Wikipedia — La coureuse Camille Herron et son mari et entraîneur Conor Holt sont accusés d'avoir manipulé Wikipédia en diminuant le palmarès de concurrentes de Camille Herron.

« Depuis 2017, les deux comptes de Herron ont apporté plus de 300 contributions à des pages de Wikipédia, dont plus de la moitié sont entièrement des embellissements de la page de Herron, mais il y a des suppressions notables de contenu positif des pages de Dauwalter, du champion du marathon de Boston 2018 Des Linden et de la légende grecque de l'ultrarunning Yiannis Kouros[6]. »

Patrick Hetzel est ministre de l'enseignement supérieur et de la recherche dans le gouvernement de la République française depuis septembre 2024.

Le cabinet du ministre de l'enseignement supérieur et de la recherche français manipule Wikipédia ! — Une enquête du magazine L'Express révèle que le cabinet du nouveau ministre de l'enseignement supérieur et de la recherche français, Patrick Hetzel, a tenté de manipuler la biographie Wikipedia du ministre[7].

Florence Devouard, ancienne présidente de la fondation Wikimédia, est à l'initiative de la campagne SheSaid.

Florence Devouard interviewée sur l'initiative SheSaidDiff, le blog de la communauté interviewe Florence Devouard sur l'initiative de la campagne SheSaid.

« J'ai remarqué très tôt que les femmes étaient peu nombreuses dans nos projets, mais je ne me suis vraiment impliquée dans la lutte contre l'écart entre les sexes que lorsque Isla Haddow-Flood et moi-même avons lancé l'initiative Wiki Loves Women en 2016. Nous avons exploré différentes stratégies pour recruter plus de femmes, fournir un environnement plus inclusif, former et soutenir, mettre en œuvre différentes stratégies. Le sujet est complexe. En 2020, en pleine pandémie, j'ai lancé l'idée de #SheSaid... et nous voilà 4 ans plus tard ! »

Boîte à livres à Amboise, France.

11 000 boîtes à livres recensées — Le site boîtes-à-livres.fr recense les boîtes à livres en France en s'appuyant sur OpenStreetMap et Wikimédia Commons. On y trouve maintenant plus de 11 000 boîtes à livres.

Tous les chemins entre deux éléments Wikidata — Des chercheurs ont développé un nouvel outil capable de trouver tous les chemins possibles entre deux entités Wikidata[8].

Articles les plus centraux — L'université de Milan publie la liste des articles les plus centraux de Wikipédia (à priori uniquement la version anglophone).

C'est la saison des Nobel — Chaque année les différents prix Nobel sont remis début octobre. C'est l'occasion de remettre à jour et de développer de nouveaux notebooks consacrés aux Nobel.

Comme pour les jeux olympiques, on peut calculer la concentration des prix par pays de nationalité à partir d'une requête Wikidata.

Les États-Unis sont en tête du classement pour le prix Nobel de médecine, le prix Nobel de physique, le prix Nobel de la paix et le prix Nobel de Chimie. La France est en tête pour le prix Nobel de littérature. Les États-Unis obtiennent près de 40% des prix en médecine et plus de 32% des prix en physique et en chimie ! Parmi les cinq prix Nobel historique, c'est le prix Nobel de littérature qui est le plus diversifié en terme de pays de nationalité.

Jean-Frédéric propose l'approche SNAIL, acronyme de « Slow, NArrow, In-depth, Local », ce qu'on peut traduire par « Lent, précis, en profondeur et local ».

L'approche escargot ou l'éloge de la lenteur — Sur le blog The Commonists, Jean-Frédéric propose une approche escargot à la contribution #Wikidata 🐌[9]!

Plutôt que de faire de l'édition en masse, il propose de prendre le temps de faire de la contribution manuelle.

« Comme le dit le proverbe, nous allons vite et nous cassons des choses : Wikidata devient trop gros, trop vite. Le graphique du service d'interrogation de Wikidata a pris une telle ampleur qu'il sera scindé, et la croissance de la base de données principale est jugée insoutenable[10]. »

Plutôt que d'utiliser QuickStatement ou OpenRefine, Jean-Frédéric propose l'approche lente en s'inspirant du mouvement lent :

« Faisons ça avec les données lentes. Faisons des modifications qui prennent des minutes au lieu d'en faire des dizaines par seconde. (Et bien sûr, "Ce n'est pas la quantité, c'est la qualité" est un vieux trope de Wikipedia, parfois mal utilisé, mais pas faux en soi)[11]. »

« Cela ne signifie pas qu'il ne faut pas créer de nouveaux articles. Mais cela signifie qu'il faut les créer plus intentionnellement. La vieille plaisanterie, quelque peu hyperbolique, est que Wikipédia est pleine d'articles que " personne ne lira jamais " (et j'en ai fait ma part !) ; mais sur Wikidata, nous avons certainement des articles qui n'ont même pas été créés par quelqu'un, mais simplement par quelque chose[12]. »

Une nouvelle interface pour contribuer aux données lexicographiques de Wikidata — Lexico est une nouvelle interface qui permet de faciliter la contribution aux données lexicographiques (lexemes) sur Wikidata. Le principe rappelle les Wikidata Games de Magnus Manske[13].

65 000 citations sur Wikiquote — Wikiquote en français compte désormais 65 000 citations réparties sur près de 9 000 pages.

L'atelier

Dans cette section, un(e) wikimédien(ne) peut raconter un de ses bricolages à la première personne.

Ce mois-ci c'est PAC2 qui raconte comment il a bricolé un outil pour mesurer les biais de Wikipedia.

Il y a quelques années, j'avais développé le Gender Diversity Explorer, un petit outil en ligne qui récupère tous les liens bleus d'un article Wikipédia (ie les mentions), récupère la valeur de la propriété P21 (Sexe ou genre) dans l'élément Wikidata associé et calculé des statistiques de genre sur la répartition des entités nommées dans l'article[14].

L'approche se généralise facilement à n'importe quelle propriété dans Wikidata. C'est ce que propose le Wikilinks inspector[15].

Pour réfléchir à la représentation de certains continents comme l'Afrique ou l'Amérique du Sud, j'avais besoin d'adapter l'outil et de trouver un bon moyen de faire la correspondance entre des pays et des continents. C'est mon travail sur la répartition des médailles aux jeux olympiques qui m'a permis de trouver le bon moyen d'obtenir une correspondance à peu près pertinente entre pays et continents[16].

Techniquement, la magie vient toujours de la possibilité d'appeler l'api Wikimédia depuis une requête SPARQL :

SELECT ?item ?itemLabel ?country ?countryLabel 
WHERE {
  SERVICE wikibase:mwapi {
     bd:serviceParam wikibase:endpoint "fr.wikipedia.org";
                     wikibase:api "Generator";
                     mwapi:generator "links";
                     mwapi:titles "Intelligence artificielle";.
     ?item wikibase:apiOutputItem mwapi:item.
  } 
  FILTER BOUND (?item)
  ?item wdt:P31 wd:Q5 . 
  ?item wdt:P27 ?country . 
  ?country rdfs:label ?countryLabel filter (lang(?countryLabel) = "en") .
  ?item rdfs:label ?itemLabel filter (lang(?itemLabel) = "en") .
}

Cliquez pour essayer !

On combine ça ensuite avec la requête sur les continents et le tour est joué :

SELECT DISTINCT ?continent ?continentLabel ?country  ?code WHERE {
VALUES ?continent {
wd:Q55643
wd:Q48
wd:Q15
wd:Q18
wd:Q49
wd:Q46
} 
 ?continent (wdt:P527*) ?country.
  ?country 
    wdt:P2082 ?code.
  SERVICE wikibase:label { bd:serviceParam wikibase:language "en". }
}

Cliquez pour essayer !

Venons en maintenant aux résultats. Si on prend un article sur un thème très général et si Wikipedia représente l'ensemble des connaissances sur un sujet, on devrait s'attendre à avoir une représentation de personnalités de tous les continents dans les entités mentionnées dans un article.

Maintenant, quand on regarde l'article Intelligence artificielle, on trouve 69 personnalités nord-américaines, 58 personnalités européennes, 9 personnalités non classées pour seulement 6 personnalités asiatiques, 5 personnalités africaines, 3 personnalités oceaniennes et 2 personnalités sud-americaines[17].

L'article Philosophie mentionne 158 personnalités européennes mais aucune personnalité africaine[18].

L'article Amour mentionne une personnalité africaine pour 58 personnalités européennes[19].

L'article Travail ne mentionne aucune personnalité africaine, aucune personnalité asiatique ou aucune personnalité sud-américaine contre 23 personnalités européennes.

Même bilan avec l'article Musique : 36 personnalités européennes, 6 nord américaines et 1 océanienne mais aucune personnalité asiatique, africaine ou sud-américaine[20].

On pourrait penser que l'article consacré à l'humanité mentionnerait des personnalités de tous les continents. Ça n'est pas le cas. On ne compte aucun représentant de l'Océanie, de l'Afrique et de l'Asie dans l'article[21].

On peut multiplier les exemples et on voit que les continents nord-americains et européens sont largement représentés alors que les autres continents et notamment l'Afrique et l'Amérique du Sud sont représentés de manière marginale dans les articles généraux de l'encyclopédie.

Il y a sans doute de multiples raisons à ce déséquilibre. L'outil peut nous aider à prendre conscience du déséquilibre et chercher, article par article, des idées pour mieux représenter les personnes des continents sous représentés. En creux, on en vient à se demander si Wikipedia représente la « somme de toutes les connaissances » ou simplement le point de vue européen et nord-américain. Le point de vue du « reste du monde » est aujourd'hui manifestement peu représenté dans Wikipedia[22].

La grande interview

Dans cette section, nous donnons la parole à des wikimédien(ne)s sur des thèmes donnés afin de recueillir leurs avis ou les faire parler tout simplement de leurs expériences dans le mouvement.

Entretien avec Warp3

Ses activités wikimédiennes.
Par écrit sur cette page.
L'embellie.
Merci à Noé et Cantons-de-l'Est pour les suggestions de questions.
 ↑ 1. Bonjour Warp3. Merci d'avoir accepté cet entretien après que Cantons-de-l'Est vous ait suggéré comme invité. Pour commencer, je vous laisse vous présenter.

Comme beaucoup de Wikipédistes anciens et français, j'ai connu les débuts d'Internet en France en entreprise puis à domicile, période riche en projets informatiques de toutes les sortes. Intéressé par les articles de vulgarisation dans plusieurs domaines, j'eus vent d'un projet de réalisation d'une encyclopédie à accès gratuit sur le Net, qui s'appelait Wikipédia. Il y avait alors quelques autres encyclopédies comme Encarta de Windows, sur disquettes ou CD, mais assez chères, et les rares encyclopédies gratuites étaient très limités dans leur étendue et d'usage pas bien pratique. Le premier contact avec ce projet balbutiant fut une relative déception : peu d'articles et pas grand-chose dedans.

J'y revins quelques années après... et c'était déjà beaucoup mieux ! Peu à peu, je trouvais le plus souvent un article de Wikipédia après une recherche avec Google, et je m'étonnais que, même si l'article était peu développé, il répondait au minimum à la question « qu'est-ce que c'est ? ». Je faisais alors quelques apports ou corrections minimes, à l'occasion. Quelque trois ans après, fort d'avoir parcouru des pages d'aides et de règles (pas faciles à trouver) ainsi que plusieurs discussions, je fus fin prêt à prendre un compte... mais j'ai attendu encore deux ans avant de m'incrire fin juin 2008, sur un coup de tête. Première constatation après : hors l'accueil (automatique), l'impression d'être complètement seul à se dépatouiller dans l'édition (les pages de discussions des articles sont très souvent vides), jusqu'à me demander où se retrouvaient les Wikipédistes. C'est sur quelques pages plus spécifiques qu'ils se « cachaient », dont un certain Bistro.

Ma page de présentation contient un peu de mon état d'esprit au moment de l'inscription (elle est succinte et un peu ancienne maintenant, mais elle reste encore d'actualité). J'appris qu'il fallait s'inscrire aussi à un autre projet : WM Commons, afin d'ajouter des images (y compris les siennes) à un article. C'était cependant une façon de découvrir que Wikipédia s'appuie sur d'autres projets. Et puis, par curiosité, je visitai d'autres projets encore... (suspense)

 ↑ 2. Comment êtes-vous arrivé dans le mouvement Wikimédia ? Sur quel wiki en premier et comment avez-vous découvert les autres projets ?

Après Wikipédia, puis Commons, j'ai examiné plusieurs autres projets et enfin Wikimédia.

Au début, Wikimédia n'était pas un vrai mouvement mais une entreprise qui mettait en place Wikipédia, l'encyclopédie libre, dans de nombreuses langues puis soutenait d'autres projets voisins de l'encyclopédie. Wikimedia, utilisant des logiciels libres et parfois sous domaine public, s'est mis à promouvoir aussi le développement du libre. C'est plus récemment que la fondation Wikimédia, d'abord à travers la diffusion des projets et par leur utilisation avec tous, en fournissant les moyens de se connecter jusque dans les régions dépourvues d'accès au Net, est devenue un mouvement de développement local et privilégie l'intégration sociale.

j'ai cherché à comprendre l'organisation des projets par rapport à Wikimédia, comme l'existence des chapitres pour chaque projet dans un pays donné. J'ai fait ainsi au passage un peu de traduction de pages en anglais sur Wikimédia (à partir de 2015), participé plus ou moins à divers projets dont Wikiquote (fr), Wikisource, Wiktionnaire, Wikilivres. Je me suis aussi intéressé au thème de l'humour et enrichi le contenu de son portail à partir de 2015.

 ↑ 3. En vous présentant, Cantons-de-l'Est écrit : « Il trouve régulièrement des images qu'il « décore » de légendes savoureuses. » C'est dans cette activité que je vous ai aussi connu notamment sur le Bistro ou dans d'autres sections de discussions. Quand et comment avez-vous commencé à illustrer Le Bistro ?

Ce doit être le 15 décembre 2009, avec le drapeau de l'Acadie. Le calendrier du Bistro est né le 14 septembre 2005 et a vite évolué : la première illustration date du 7 novembre, la première image commentée est du 25 novembre de la même année. L'habitude est prise de décorer assez régulièrement le calendrier dès 2006. Les images avec leurs commentaires sont dans le ton du bistro, souvent légères et comiques, alternant avec des rappels de faits historiques. D'autres images se trouvent parfois ailleurs dans les discussions. Elles décrivent un aspect ou l'autre de Wikipédia en français, de ses débats.

On retrouve alors souvent DocteurCosmos en illustrateur du calendrier. Il se chargeait de l'illustrer avec un tour souvent amusant quand personne d'autre ne l'avait fait. C'est cette façon ludique qui m'a conduit à oser une première illustration dans ce petit espace en haut à droite de chaque page quotidienne du Bistro. J'ai augmenté progressivement mon implication dans ce cadre, comme une sorte de détente après un tas de modification dans les articles. Comme on pourra vérifier, les histoires de cabales et de chats au Bistro existaient depuis au moins 2006, bien avant mon arrivée Émoticône !

 ↑ 4. Vos choix d'illustration, vos légendes ainsi que parfois (souvent ?) vos commentaires de modifications sont tantôt profondes, tantôt légères, mais revêtent toujours une certaine beauté selon moi. Où trouvez-vous l'inspiration ?
— Warp3 ? Mmm... Attendez que je zoome sur l'image... Non, connais pas.

Voilà une question qui doit certainement tarabuster Cantons-de-l'Est depuis des années Émoticône. Il y a de nombreuses façons pour moi de trouver une idée de Bistro, idée souvent de type comique. Le cas le plus courant : c'est au cours de mes périgrinations quasi aléatoires sur Wikipédia et Commons que se fait la découverte de photos ou de dessins qui sont déjà comiques ou étonnantes en elle-même, ou quand leur rapport me semble raconter une historiette ; une sorte de hasard heureux peut-on dire. Sinon, quand j'ai une idée précise, quelques fois inspirée par l'actualité de wpfr, je cherche dans la catégorie idoine celles qui peuvent faire l'affaire. Et il m'arrive aussi d'élaborer des gags un peu plus complexes au saut du lit Émoticône. Dans un premier temps, j'ajoutais un lien vers une vidéo Youtube pour illustrer avec de la musique ou avec un sketch. Mais quelqu'un(e) m'a fait savoir que Commons héberge aussi des fichiers de musiques, qui sont libres de droits, contrairement aux vidéos Youtube. Depuis, je fouine dans les diverses catégories, et en place quelques-unes aux emplacements qui me semblent les plus appropriés. Cette bibliothèque de musiques (et de vidéos), pas assez connue à mon avis ni assez utilisée, semble s'être fortement enrichie ces dernières années.

Chaque fois que je place une illustration assortie d'un commentaire, je ne sais pas vraiment comment cela va être reçu, car il n'y a presque jamais de commentaires sur place ou sur ma page. En général, sur WP, quand personne ne fait de commentaire sur votre modification sur un article, ça signifie qu'elle est plus ou moins acceptée et je me figure que c'est pareil avec une image. Mais c'est comme être sur un bout de scène avec un public derrière une cloison, invisible et muet, qui peut une fois dans la rue faire un petit signe discret de connivence ou au contraire flanquer une claque, sans que je sache trop pour quoi.

 ↑ 5. Utilisez-vous des outils en particulier pour retrouver des images, les archiver, s'en souvenir ? Comment effectuez-vous vos recherches ?

Sur les projets : très peu, en fait. J'ai même décoché tout un tas de gadgets mis par défaut dans mes préférences. J'utilise parfois un éditeur de texte autre que celui de base. Pour les recherches, il arrive que c'est par les images que je retrouve certaines pages ou informations. Mais dans mes recherches d'un fichier sur Commons, je n'utilise guère le gadget fourni, qui retourne n'importe quoi tant qu'il existe dans le nom du fichier une seule erreur, ou que le nom n'est pas assez complet. Utiliser un moteur de recherche extérieur donne plus de chance de trouver le fichier cherché. Et, non, je ne fais pas de recherche SPARQL à travers WikiData, malgré les nombreux exemples donnés par les RAW (!). Question visuels, j'utilise les pauvres logiciels de base de Windows : mspaint, photo, wordpad, bloc-notes. Oui, frugalité extrême... il y a de quoi rire !

 ↑ 6. Assidu du Bistro, qu'aimez-vous y trouver et quelle est la raison d'être que vous donnez à cet espace communautaire ?

Quand j'ai découvert le Bistro à l'époque de mon inscription, je pensais y trouver une sorte d'assemblée très sérieuse réglant avec précision l'avenir de l'Encyclopédie, alors que c'était plutôt une sorte d'auberge espagnole bruyante et un tantinet folle. Le Bistro actuel est en majorité le rendez-vous de toutes les personnes un peu anciennes désireuses de débattre, et parfois d'informer la Wikipédie. C'est le lieu pour poser ses questions avec de grandes chances d'avoir au moins une réponse, que l'on soit novice ou non. Certains débats sont cependant si extravagants que je finis par les trouver rigolos ! Je préfère cependant le discours plus léger tenu par d'autres personnes, comme il arrivait souvent dans les premières années de l'existence du Bistro.

 ↑ 7. Comment trouvez-vous la convivialité et l'ambiance en général au sein de la communauté ?

La communauté de Wikipédia en français est diverse, très partagée sur plusieurs thèmes (inclusionnisme/suppressionnisme, paternalisme/féminisme, fair-use, Comité d'arbitrage (CAr), etc.) depuis au moins 2006 sur les espaces de discussions. Ce n'est que par l'observance des règles établies et de la volonté de participer sereinement à la création et à la maintenance des articles que l'on peut dire qu'il existe une sorte de lien solidaire entre les membres. L'ambiance peut être bonne ou mauvaise selon l'importance que l'on porte à ces thèmes. Il est ainsi possible d'avoir de bons rapports en travaillant sans apriori avec des personnes dans un espace d'articles peu polémiques (potentiellement plusieurs millions Émoticône) .

 ↑ 8. Quel type de wikipédien êtes-vous ? Comment décririez-vous votre manière de contribuer sur l'encyclopédie ?

Si j'ai pris un compte sur Wikipédia, c'est aussi parce que je me sentais redevable de tant d'informations offertes sans contreparties de ma part. J'ai commencé par des corrections orthographiques et quelques reformulations, mais ne me destinais pas à faire beaucoup plus. C'est en voyant l'état de quasi ébauche de l'article Bugs Bunny que je me suis décidé à le développer, par traduction de l'article anglophone. Aussi, le goût me prit de continuer des articles initiés par d'autres, d'abord dans le domaine du dessin animé alors presque déserté hormis le champ disneyien, puis dans d'autres domaines.

Wikipédiste papillonnant, assez solitaire, je passe d'un sujet à l'autre selon mes goûts du moment. L'Amérique de la période située entre 1850 et 1950, le cinéma (Warner Bros. surtout) et la musique sont autant de sujets qui m'intéressent le plus. Malgré une bonne centaine d'articles créés et pas mal de traductions de l'anglais (je vous conseille DeepL comme base) depuis plus de 15 ans, je me considère encore comme un petit rédacteur-relecteur (et suis étonné de faire partie des mille premiers modificateurs actifs de WP). Je n'ai d'ailleurs développé aucun article jusqu'à un niveau de labellisation.

 ↑ 9. Créateur de plus de 110 articles, quand considérez-vous que le sujet d'un article est épuisé avant de passer à un autre ? Quels sentiments cela vous inspire de savoir qu'il reste tant à faire sur le wiki ?

Un article très pointu (dit « d'intéret faible » dans les évaluations), comme un certain type d'invertébré marin très peu connu, s'il est traité pleinement à travers toute la documentation existante, devient un article abouti. S'il n'a pas sa belle étoile doré d'article de qualité, c'est tant pis, mais cela n'enlève rien à son degré d'achèvement. Inversement, sur un article portant sur un sujet connu où la documentation abonde, ou alors un article généraliste, il faut non seulement traiter tous les angles de vue mais aussi rester synthétique (et faire des articles secondaires), et le travail de retrait devient aussi important que celui d'ajout.

Pour ma part, les articles en anglais que je traduis, qui me plaisent, ne sont que rarement des articles complets avec labels de qualité. Je vérifie les sources et complète certains détails, mais je les sais très perfectibles. Le minimum, au-delà des sources, est que la lectrice ou le lecteur puisse se faire au moins une bonne idée du sujet, typiquement un résumé introductif (RI).

Une majorité d'articles de Wikipédia sont (encore) des ébauches ou des articles à peine développés. Tant que des sources sûres justifient l'existence d'un article et qu'il dispose d'une sorte de RI, je considère celui-ci comme valable (en tant que lecteur). Contrairement à d'autres Wikipédistes, cette masse de mini articles ne me semble pas dommageable à l'image de l'encyclopédie, au contraire ! Mieux vaut un article minimum (mais bon) que rien du tout. C'est la multiplicité des articles qui fait l'une des forces de l'Encyclopédie. Les articles faux (canulars) sont, en revanche, une plaie et à éradiquer au plus vite (merci les admins et les vigilant(e)s).

 ↑ 10. En considérant votre expérience sur le wiki, qu'est-ce qui vous a procuré le plus grand plaisir sur Wikipédia ? Au contraire, qu'est-ce qui vous a le plus marqué négativement ?

Il n'y a pas beaucoup d'expériences à vivre sur Wikipédia si on reste à faire des modifications légères sur des articles sans controverses, voire peu lus. Mais dès que l'on prend un compte et que l'on s'attaque à certains gros articles, on rencontre fatalement une partie de la « communauté» hétéroclite wikipédienne.

Il y a eu plusieurs heureuses rencontres, mais je crois que l'une des plus heureuses fut celle de la création des RAW, journal à la fois très instructif et bien présenté par son créateur (mais non, je ne fais pas de la publicité éhontée !). Après réflexion, je dirais que la pire rencontre arriva deux mois après mon inscription, à propos d'une discussion sur ma page de discussion avec un Wikipédien dynamique, aujourd'hui admin actif. Juste après un de mes propos pourtant assez mesuré, déboula sur ma page un parfait inconnu qui se mit à me faire une leçon wikipédienne magistrale dans le plus pur style des « anciens » s'adressant à un complet ignorant. J'avais beau m'être mentalement préparé à des avis extrêmes ou divagants, ce genre d'attaque très limite fut fort désagréable, surtout quand elle fut appuyée par d'autres.

 ↑ 11. Quels seront selon vous les plus grands défis de Wikipédia en français dans les cinq prochaines années ?

Je ne suis pas dans le secret des dieux, mais je crois percevoir :

- L'arrivée de l'intelligence articielle (IA, donc) sur WP est un peu ce que depuis longtemps des Wiképidistes appelaient de leurs vœux pour traiter les millions d'articles de façon automatique. Est-ce la bonne formule ? On peut en douter, dans l'état actuel. Le bon usage de cette IA sur WP reste à définir, et à faire évoluer en même temps qu'elle. Peut-elle éclipser WP même ? La boule de cristal est floue, rappelez plus tard Sourire diabolique.

- Les nouvelles structures qui se mettent lentement en place sous l'égide de Wikimédia, et qui semblent être complètement ignorées du gros de la communauté wikipédienne francophone, mis à part l'application du Code de conduite universel dans les règles de wpfr.

- Maintenir une certaines cohésion entre les membres des Wikipédistes, faire évoluer certaines mentalités ; attirer de nouveaux membres actifs ; se prémunir contre les nouvelles formes d'atteintes aux articles : publicitaires, politiques ou autres ; trouver (et financer) un moyen pérenne de conserver les traces des sources sur Internet.

 ↑ 12. Que pensez-vous des médias qui sont stockés sur Wikimedia Commons et du wiki en général ?

(Wikimedia) Commons est un site énorme, qui recueille des documents (hors textes), pas seulement des photos mais aussi des vidéos et des fichiers sonores. Des musées et institutions prestigieux sont sollicités, ce qui fait que des images exceptionnelles, historiques, y sont copiés et cotoient le reste, inimaginable tant il y en a.

Je me suis incrit presque en même temps sur Commons, site qui héberge donc la plupart des fichiers libres de droits utilisés par Wikipédia, dans le but d'illustrer certains articles. Tout d'abord, j'ai posté quelques-unes de mes photos et me suis conformé aux règles (pas exactement fixées) des droits d'auteur. Mais au fur et à mesure des années, les administrateurs et autres personnes à statut m'ont semblé avoir un comportement de plus en plus incohérent face au soupçon de copyright : aveugles à des imports clairement douteux et sans source mais impitoyables, voire désinvoltes, avec d'autres pourtant accompagnés d'une preuve d'ancienneté suffisante ou/et d'autres garanties. Cela m'a ôté l'envie de discuter et d'y importer quoi que ce soit. Je me contente maintenant principalement de traduire le descriptif des fichiers ou de les catégoriser.

 ↑ 13. Si j'en crois ce diff, le concours de l'image de l'année POTY vous intéresse. Quels ont été vos coups de cœur ou les images qui vous ont profondément marquées depuis que vous suivez ce concours ?

Les concours d'images (principalement photographiques) Picture of the Year (POTY) organisés sur Commons chaque année depuis 2006 sont un plaisir des yeux. Depuis que je connais l'existence du concours, j'y participe régulièrement et leur fait une certaine publicité au Bistro. J'ai aidé à traduire des pages et à vérifier la validité de votes, quand tout était encore fait à la main et qu'il fallait tout refaire et repenser chaque année. Ces dernières années, une poignée de codeurs ont pris le taureau par les cornes et ont automatisé la création au maximum. Cela évite en bonne partie la triche et le recompte manuel mais il n'y a plus le charme des commentaires qui étaient aussi utiles aux photographes participants, et la tenue d'une nouvelle édition ne semble plus être décidée que par eux. Trop de photos m'ont ébloui par leur qualité ou leur sujet pour me décider de seulement quelques-unes ! J'ai découvert cependant que deux noms de photographes reviennent souvent dans les auteurs des photos que je trouve parmi les meilleures : Luc Viatour et Basile Morin (ce dernier étant aussi remarquable pour ses nombreux et excellents ambigrammes). La photo gagnante du concours 2023 est superbe en plus d'être étonnante, même si je ne l'ai pas choisie au dernier tour. Mais elle a eu droit auparavant à plein de prix et je l'avais utilisée dans le Bistro du 15 juillet 2023. Une photo remarquable plus ancienne mais découverte par moi il y a peu de temps m'a complètement désorienté au premier coup d'œil (voir mon commentaire ici).

 ↑ 14. Quel(le) wikimédien(ne) souhaiteriez-vous voir interviewé(e) dans un prochain numéro et sur quel thème ?

Il y a beaucoup de candidats possibles (et disponibles !) mais je serais curieux de Kropotkine 113, Wikipédiste chevronné toujours présent mais finalement assez discret sur les espaces de discussions grand public.

 ↑ 15. Y a-t-il un sujet particulier qui vous tient à cœur et qu’on n’a pas abordé dans cet entretien ? Vous avez carte blanche 🙂.

Je tiens à (re)dire à Cantons-de-l'Est mon plein soutien à la création d'un dictionnaire visuel (multilingue) !

 ↑ 16. Avez-vous un message particulier à adresser aux lectrices et lecteurs du RAW ? Quel serait votre mot de la fin ?

Pas particulèrement au lectorat des RAW mais plutôt aux Wikipédistes en général : si vous avez une idée, ou si une remarque vous tient à cœur, exprimez-la gentiment : on ne vous embastillera pas pour cela ! Si participer à Wikipédia devient une obsession ou un énorme boulet, prenez des vacances. Mais si rien de Wikipédia ne vous plait, alors peut-être que Wikipédia... n'est pas (ou plus) pour vous.

Merci d'avoir accepté cette interview. Bonne continuation !

L'agenda

Les autres infolettres

La page Wikipédia:RAW/Découvrir recense les infolettres et blogs relatifs à Wikimedia.

En plus de RAW, vous pouvez lire le Wikimag, newsletter hebdomadaire de la Wikipedia francophone (Voir le dernier numéro Wikipédia:Wikimag/2024/44), l'infolettre Wikifier la science (voir le dernier numéro Projet:Wikifier la science/Infolettre/Octobre 2024) et les Actualités du Wiktionnaire newsletter mensuelle du Wiktionnaire (wikt:Wiktionnaire:Actualités/114-septembre-2024).

Les anglophones peuvent aussi lire The Signpost, publié toutes les deux semaines, la newsletter hebdo de la communauté Wikidata (voir ici d:Wikidata:Status updates/2024 10 28) ou encore la newsletter du projet Wikifunction ("wikifunction:Wikifunctions:Status updates/2024-10-25).

Courrier du lectorat

(Il nous fera plaisir de lire les messages déposés ici et, si nécessaire, d'y répondre dans les plus brefs délais.)

Wikipédia face au problème du contenu généré par intelligence artificielle — L’intérêt des intelligences artificielles génératives comme ChatGPT réside, selon moi, dans leur capacité de rédaction. À partir du moment où on leur fournit une première version d’un texte sourcé, elles sont capables de le synthétiser ou de le compléter afin qu’il soit rédigé dans un style clair et encyclopédique. De ce point de vue, ce sont d’excellents assistants.
En revanche, comme dit Le chat perché, elles ne peuvent pas faire le travail à notre place, et ce pour une raison très simple : elles ne sont pas conçues pour. Ce sont des IA « probabilistes ». Elle donne le résultat « le plus probable », pas forcément le plus fiable. C’est ce qui explique qu’elles peuvent inventer un concept scientifique… qui n’existe pas, ou encore inventer des sources. Attention donc à ne pas les prendre pour ce qu’elles ne sont pas Émoticône. Merci aux rédacteurs et rédactrices du RAW, comme toujours très instructif.--Pronoia (discuter) 1 novembre 2024 à 10:10 (CET)

De mon côté, ce qui m'inquiète le plus est l'illusion de qualité avec des utilisateurs ne voyant même pas les problèmes. Pour l'exemple, question que j'ai posé hier sur quoi faire avec ce cas où il se pourrait que l'utilisateur soit de bonne foi. J'ai prévu de traduire cet essai anglais pour avoir une base pédagogique vers laquelle orienter mais si ce genre de chose se développe, faudra peut-être penser à un avertissement quelque part pour que toute personne venant contribuer sache qu'il y a des choses à ne pas faire.
Pour l'heure, le principe de signalement n'est pas encore en place côté francophone mais côté anglophone, ils ont eu 69 articles indiqués en octobre et si on en croit l'étude indiquée plus haut, il y a des chances qu'on en rate. Fabius Lector (discuter) 1 novembre 2024 à 11:50 (CET)
Je partage l'inquiétude sur l'illusion de qualité. Mais ça va au delà de l'IA.
Sinon je suis honnoré d'être cité Émoticône. Le chat perché (discuter) 1 novembre 2024 à 13:35 (CET)

Biais de surreprésentation des idées et auteurs occidentaux — Merci PAC2 pour ton outil de mesure des biais géographiques dans les articles ! Je trouve cela très parlant et assez préoccupant de voir que Wikipédia reflète avant tout les connaissances occidentales. Il y a probablement une explication historique à ça (naissance de la science moderne en Europe, développement de la plupart des disciplines universitaires en Occident + colonisation, effacement des savoirs autochtones et difficultés d'accès aux études supérieures dans beaucoup d'endroits). On a du boulot pour lutter contre ce biais ! Skimel (discuter) 2 novembre 2024 à 09:58 (CET)

Grande interview de Warp3 — Merci Warp3 pour cette interview, qui m'a diverti de mes soucis IRL. Comme d'habitude, j'ai lu des observations et des commentaires qui m'ont fait Émoticône ! — Cantons-de-l'Est p|d|d 🧹 4 novembre 2024 à 23:51 (CET)

Boîtes à livres — Merci pour la mention, je n'avais pas encore lu ce RAW, quelle bonne surprise de voir le site mentionné ! Symac (discuter) 7 novembre 2024 à 13:12 (CET) (développeur dudit site :p)

L'IA a une forte valeur ajoutée pour "aider à faire" mais jamais pour "faire à la place".
 – Le chat perché sur le Bistro.
Rédigé/traduit par L'embellie et PAC2.
Citations originales
Notes
Références
  1. Découvert via https://wikis.world/@festal@tldr.nettime.org/113243136048240433
  2. https://www.404media.co/the-editors-protecting-wikipedia-from-ai-hoaxes/
  3. en:Wikipedia:Wikipedia Signpost/2024-10-19/Recent research
  4. Pour les plus curieuses et les plus curieux, la méthode Binoculars est une méthode de détection des textes générés par des grands modèles de langage qui s'appuie sur la « perplexité croisée  » de deux grands modèles de langage. Pour en savoir plus : https://arxiv.org/html/2401.12070v3
  5. a et b (en) Creston Brooks, Samuel Eggert et Denis Peskoff, « The Rise of AI-Generated Content in Wikipedia », {{Article}} : paramètre « périodique » manquant,‎ (lire en ligne).
  6. « Since 2017, Herron’s two accounts have made more than 300 contributions to pages on Wikipedia, of which more than half are entirely embellishments to Herron’s page, but there are notable deletions of positive content from the pages of Dauwalter, 2018 Boston Marathon champion Des Linden and Greek ultrarunning legend Yiannis Kouros. »- Merci DeepL pour la traduction. C'est pas parfait mais c'est pratique :).
  7. Victor Garcia, « Patrick Hetzel, un ministre bien peu scientifique : enquête sur le discret nettoyage de sa page Wikipédia », L’Express, (consulté le )
  8. https://x.com/WikiResearch/status/1843699094579229068
  9. Découvert via d:Wikidata:Status_updates/2024_10_14
  10. « As the saying goes, we move fast and break things: Wikidata is getting too big, too fast. The Wikidata Query Service graph got so huge it will be split, and the growth of the core database is deemed unsustainable. »
  11. « Let’s have it for slow data. Let’s make edits that take minutes rather than racking tens per second. (And sure, “It’s not the quantity, it’s the quality” is an old Wikipedia trope, at times ill-used, but not wrong per se.) »
  12. Traduit avec DeepL.com (version gratuite) « This does not mean not creating new items. But it does mean creating them more intentionally. The old, somewhat hyperbolic jest is that Wikipedia is full of articles that « no-one will ever read » (and I have done my fair share of that!) ; but on Wikidata, we sure have items that were not even created by someone, merely by something. »
  13. https://wikidata-game.toolforge.org/#
  14. https://observablehq.com/@pac02/explore-gender-diversity-in-a-single-wikipedia-article
  15. https://observablehq.com/@pac02/articles-wikilinks-inspector
  16. https://observablehq.com/@pac02/olympic-medals-by-continent
  17. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Intelligence%20artificielle
  18. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Philosophie
  19. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Amour
  20. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Musique
  21. https://observablehq.com/@pac02/continental-and-country-diversity-in-wikipedia-art?wikipedia=fr.wikipedia.org&article=Humanit%C3%A9
  22. J'emprunte l'expression reste du monde au média Rest of world : https://restofworld.org/about/
  23. https://www.wikimedia.fr/participer-au-prix-wikimedia-de-la-recherche/

Du 15 août au 27 septembre, s’est déroulé le concours “Photographier le patrimoine vivant de France en 2024”, organisé par l’association Wikimédia France et ses bénévoles, en partenariat avec le ministère de la Culture. On vous révèle les 5 photos lauréates qui sont à couper le souffle. La période estivale a été un temps propice […]

L’article Photographier le patrimoine vivant en France 2024 : les résultats est apparu en premier sur Wikimédia France.

Où vont les dons collectés sur Wikipédia ?

Monday, 23 September 2024 15:30 UTC

Pourquoi je vois un bandeau d’appel aux dons sur Wikipédia en ce moment ? Vous avez peut-être remarqué qu’en automne, un bandeau concernant la collecte de dons s’affiche sur Wikipédia… Peut-être vous demandez-vous qui organise cette collecte et où vont les dons ? Tout d’abord, nous pouvons vous assurer qu’il s’agit d’une campagne légitime. EHughes […]

L’article Où vont les dons collectés sur Wikipédia ? est apparu en premier sur Wikimédia France.

Vous avez envie d’apprendre à contribuer sur la plus grande base de connaissances libre du monde ? Le MOOC Wikidata revient pour une 3 ème édition avec 20 vidéos et quelques nouveautés pour les professeurs du secondaire. Les inscriptions sont gratuites et ouvertes du 1er septembre au 31 décembre 2024 avec la possibilité d’obtenir une […]

L’article MOOC Wikidata : une 3ème édition centrée sur les enseignants du secondaire est apparu en premier sur Wikimédia France.

Participer au prix Wikimédia de la recherche

Monday, 16 September 2024 07:00 UTC

Du 16 septembre au 16 novembre 2024, vous pouvez participer au prix Wikimédia France de la Recherche, organisé par l’association Wikimédia France en partenariat avec le laboratoire Dicen-IdF de l’Université Paris Nanterre. Qu’est-ce que le prix Wikimédia France de la recherche ? Le prix Wikimédia France de la recherche constitue une initiative importante pour encourager […]

L’article Participer au prix Wikimédia de la recherche est apparu en premier sur Wikimédia France.

De 2023 à 2024, trois résidents ont intégré les Unités Régionales de Formation à l’Information Scientifique et Technique de Bordeaux, Rennes et Toulouse pour sensibiliser aux projets Wikimédia. Que peut-on retenir de l’expérience ? Résidents, personnels de l’URFIST et membres de la communauté de l’enseignement supérieur et de la recherche reviennent sur leur expérience en […]

L’article Résidences wikimédiennes : retours vidéos sur leur impact est apparu en premier sur Wikimédia France.

Journal de bord de ma première Wikimania à Katowice

Monday, 9 September 2024 12:12 UTC

Chaque année, environ un millier de personnes contributrices se retrouve quelque part dans le monde pour échanger autour des projets Wikimédia. Après Singapour en 2023, la 19ème édition de la Wikimania s’est déroulée cette année du 7 au 10 août à Katowice en Pologne. Pour vous faire vivre l’évènement au plus près, j’ai écrit un […]

L’article Journal de bord de ma première Wikimania à Katowice est apparu en premier sur Wikimédia France.

Pour la première fois, Isabelle a assisté à la 4e édition du Wikicamp, le grand rassemblement annuel de la communauté wikimédienne de France, organisé à Saint-Malo en juillet dernier. De ses débuts de contributrice en ligne jusqu’à sa rencontre avec la communauté wikimédienne, Isabelle partage son parcours et ses premières impressions sur l’évènement. « Je ne […]

L’article Témoignage d’Isabelle : Mon premier Wikicamp à Saint-Malo est apparu en premier sur Wikimédia France.

Que vous soyez contributeurs novices ou experts, il existe plein de manières de contribuer aux projets soutenus par l’association Wikimédia France pendant les Jeux olympiques et paralympiques. On en a listé 5.  Du 26 juillet au 11 août auront lieu les Jeux olympiques suivis des Jeux paralympiques du 28 août au 8 septembre en France. […]

L’article 5 manières de contribuer sur Wikipédia pendant les Jeux olympiques et paralympiques est apparu en premier sur Wikimédia France.

Du 15 août au 27 septembre, vous pouvez participer au concours “photographier le patrimoine vivant de France”, organisé par l’association Wikimédia France en partenariat avec le ministère de la Culture. Qu’est-ce que le patrimoine vivant ? Vous connaissez le patrimoine culturel, mais connaissez-vous le patrimoine vivant ? Moins connu que le patrimoine culturel, le patrimoine vivant […]

L’article Participer au concours sur le patrimoine vivant en France est apparu en premier sur Wikimédia France.

 

Bellevue - La Terrasse
 

Depuis 2017, les archives des Hauts-de-Seine mettent en ligne le fonds de cartes postales anciennes (CPA). En octobre 2020, cela représente 9558 CPA provenant de la sous-série 9Fi réunissant les CPA de 1900 à 1944. Ces photos tombées dans le domaine public accompagnées de quelques métadonnées sont publiées sur le site d'Open Data des Hauts-de-Seine. Cela peut surprendre mais il y a quelques fonds de cartes postales et fonds photographiques sur les sites d'open data. C'est en fait une très bonne idée car ces sites sont adaptés à une réutilisation massive des données, contrairement aux sites des archives qui ne sont pas faits pour récupérer des centaines ou milliers de documents d'un seul coup.

Suite à cette découverte, j'ai importé un peu plus de 200 photos de la revue municipale de Marseille des années 1930, une collection de cartes postales de la ville de Brocas dans les Landes, avant de m'attaquer à ce gros fonds.

Dans ce billet de blog, je souhaite vous montrer ma méthode qui est adaptée aux personnes, comme moi, qui ne savent pas se servir de l'API, coder en Python, etc. Je commence par récupérer les données en format CSV ou EXCEL afin de les visualiser dans un tableur. 

1. Télécharger les images

La première étape consiste à récupérer les images. Pour cela j'utilise l'extension Simple mass downloader qui existe en version Firefox et Chrome. Il suffit de copier les urls du csv dans l'extension :

  1. copier les liens
  2. lancer le logiciel
  3. onglet Download list 
  4. menu Hamburger Import URLs from clipboard 
  5. Lancer la sauvegarde en cliquant sur start selected

Dans le cas des archives des Hauts-de-Seine, j'atteins assez vite le quota quotidien de requêtes qui permet de télécharger environ 3000 fichiers. Tous les fichiers téléchargés iront dans le dossier Téléchargements si vous utilisez Windows.

Les fichiers n'ont pas d'extension, j'utilise le logiciel Advanced Renamer pour rajouter l'extension jpg (<Name>.jpg).

Enfin dans le tableur, il faut indiquer l'emplacement des fichiers en remplaçant https://opendata.hauts-de-seine.fr/api/v2/catalog/datasets/cartes-postales/files/ par le répertoire où sont stockés vos fichiers.

2. Mettre en forme les données

Un travail de mise en forme des données est nécessaire. 

2.1 Coordonnées géographiques

Pour les coordonnées, je crée une colonne avec la formule de LibreOffice Calc : CONCATENER("{{Object location|";B2;"}}"). Puis je fais un collage spécial du texte dans une autre colonne (Pattypan ne semblant pas comprendre les cellules avec des formules) et enfin je remplace la virgule par un pipe ( | ).

2.2 Identifiants

Il peut également être nécessaire dans certains cas de retravailler les identifiants qui sont de la forme 9FI/ANT_1, 9FI/ANT_15, 9FI/ANT_153, ce qui ne peut pas se trier correctement. Dans une autre colonne je copie le contenu, puis supprime tout sauf les chiffres à l'aide d'une expression régulière dans Rechercher/Remplacer : (.......)_ par rien. Puis dans Notepad++, j'ajoute les zéros manquants : \n(..)\r par \n0$1\r puis \n(.)\r par \n00$1\r

2.3 Noms des fichiers

Wikimedia Commons ne souhaite pas de titres incompréhensibles du type 2e8e8c525c2ae4c9f983c64e725ef047.jpg ou 9FI/ANT_15.jpg. Il faut donc créer un titre si possible simple mais explicite et précis. Avec la commande CONCATENER je créé les nouveaux titres ainsi : 
Carte postale - VILLE - TITRE - IDENTIFIANT.jpg.
L'ajout de l'identifiant permet d'éviter d'avoir des titres identiques, ce qui n'est pas possible sur Wikimedia Commons.
 
Attention le titre ne doit pas contenir de crochets et ne doit pas être trop long. Dans le cas contraire, le logiciel d'import des données arrêtera le téléchargement. La commande NBCAR permet de compter le nombre de caractères d'une cellule et ainsi rapidement détecter les titres très longs. La documentation de MediaWiki n'indique pas le nombre de caractères limite mais parle d'une limite de 255 bytes. Des tests sont nécessaires pour savoir à quoi cela correspond en caractères, mais de toute façon il est préférable d'utiliser des noms de fichier pas trop longs dans MediaWiki.

3. Importer les données

Pour cette phase j'utilise Pattypan. La première étape du logiciel consiste à Générer un tableau. Importez les photos, sélectionnez le modèle MediaWiki que vous souhaitez utiliser (dans mon cas il s'agit de Template:Photograph) puis indiquez les champs à remplir par défaut :

  • Photographer : {{unknown|author}}
  • Title : {{fr|Carte postale des Hauts-de-Seine}}
  • Institution : {{institution:Archives départementales des Hauts-de-Seine}}
  • Source : https://data.opendatasoft.com/explore/dataset/fr-219200730-cartes-postales-anciennes%40hauts-de-seine/information/
  • Licence : {{licence ouverte}}

Et je coche les champs Description, Date, Accession number et Partnership pour que Pattypan remplisse ces champs à l'aide des données dans le tableur. Vous obtenez un tableau de ce type avec des colonnes pré-remplies et d'autres à remplir à l'aide des données provenant des archives départementales :


Partnership va servir à indiquer la géolocalisation. Pour cela, il faut aller dans le 2e onglet Template du tableau créé par Pattypan afin de déplacer ce modèle. Cet onglet peut sembler vide mais en agrandissant la taille des cellules on voit le code des modèles de Wikimedia Commons. Le fonctionnement de cet onglet n'étant pas documenté, je ne sais pas exactement comment il fonctionne et pourquoi le contenu est dupliqué dans de nombreuses cellules. Faites donc le changement dans toutes les cellules.

'=={{int:filedesc}}==
{{Photograph
 |photographer = ${photographer}
 |title = ${title}
 |description = ${description}
 |depicted people =
 |depicted place =
 |date = ${date}
 |medium =
 |dimensions =
 |institution = ${institution}
 |department =
 |references =
 |object history =
 |exhibition history =
 |credit line =
 |inscriptions =
 |notes =
 |accession number = ${accession_number}
 |source = ${source}
 |permission =
 |other_versions =
}}
${partnership}
=={{int:license-header}}==
${license}

<#if categories ? has_content>
<#list categories ? split(";") as category>
[[Category:${category?trim}]]
</#list>
<#else>{{subst:unc}}
</#if>

Une fois le travail de mise en forme des données terminé, vous pouvez passer à la 2e étape de Pattypan qui s'intitule Valider et envoyer.

À l'heure actuelle, le logiciel s'arrête de téléverser les photos sans afficher le moindre message d'erreur s'il rencontre un problème. Par contre, il se contente de zapper l'import dans deux cas : s'il détecte que le fichier a déjà été importé et si le nom est déjà utilisé.

Je télécharge les photos dans la catégorie Collections of Archives départementales des Hauts-de-Seine de Wikimedia Commons, ainsi que dans une des catégories de Postcards of Hauts-de-Seine (Postcards in Meudon, Suresnes, etc.) Il est sans doute possible d'ajouter des catégories en utilisant les thèmes associés provenant des archives.

Les cartes postales géolocalisées peuvent être visualisées dans Wikimedia maps.


4. Dernières retouches

Quatre outils peuvent servir pour affiner la catégorisation et les données :

4.1 Fichiers manquants

À la fin de l'import, il y avait sur Wikimedia Commons un millier de cartes postales en moins que sur le site des Hauts-de-Seine. Des fichiers ont dû se perdre lors du téléchargement des milliers de photos. Pour identifier rapidement les fichiers manquants, j'ai utilisé un outil de comparaison de listes en lui demandant de comparer les noms de fichiers.

4.2 Remplacer et déplacer un modèle

Visual File Change va notamment me permettre de corriger une erreur faite lors des premiers imports en utilisant le modèle de coordonnées géographiques adéquat et en le déplaçant. L'expression régulière consister à rechercher :

/=={{int:license-header}}==\n\{\{licence ouverte\}\}\{\{location\|([^\|]+)\|([^\|]+)\}\}/ 

Et remplacer par :

{{Object location|$1|$2}}

=={{int:license-header}}==
{{licence ouverte}}

4.3 Affiner la catégorisation

Visual File Change peut également servir à catégoriser les CPA à partir de termes inclus dans le nom du fichier. Il est possible de faire des recherches du type :

intitle:"train" incategory:"Collections of Archives départementales des Hauts-de-Seine"

Puis d'ajouter la catégorie souhaitée :

33 millions de fichiers sur Commons, et après ?

Saturday, 25 March 2023 10:46 UTC

Wikimedia Commons, c’est 33 millions de fichiers. Beaucoup de ressources sont consacrées à augmenter ce nombre : contributeurs prenant de nombreuses photos, développement d’outils de versement automatique depuis Flickr, financement d’appareils-photos, studios et déplacements, organisation de concours avec prix (Wiki Loves Africa, Wiki Loves Earth, Wiki Loves Monuments) ou non (Wiki Takes, Opérations Libres), partenariats de versement des collections d’institutions culturelles, etc.

Je crois que Wikimedia Commons est un projet à part entière et plus un simple dépôt commun aux différentes versions linguistiques de Wikipédia (et ses projets-frères). Toutefois, en l’état actuel de la navigation est assez pauvre. Le plus simple pour trouver une image est de passer par une recherche Google plutôt que par l’outil de recherche interne, et l’arborescence des catégories est parfois obscure dans sa logique, sans compter qu’elle est multilingue au mauvais sens du terme : à tout moment, vous pouvez tomber dans une sous-catégorie dans une langue que vous ne maîtrisez pas. S’il est, je crois, urgent de réfléchir et implémenter une vraie navigation dans Commons (via la vraie gestion du multilingue, la possibilité d’afficher à la fois les images d’une catégorie et de ses sous-catégories, etc), en attendant, la meilleure manière de valoriser les fichiers de Commons est encore de les utiliser dans les autres projets Wikimedia.

La réflexion autour de ce sujet est encore balbutiante. Les global metrics n’intègrent que « nombre de fichiers réutilisés », ne faisant pas la différence entre un fichier utilisé une fois et une centaine de fois. La plupart des rapports d’activité (FDC, This Month in GLAM, billets de blog) ne comptent que le nombre de fichiers versés, sans regarder le reste.

Très peu d’actions existent en faveur de la valorisation des fichiers de Commons :

  • les nombreux outils de réutilisation de l’image du jour comme fond d’écran
  • les edit-a-thons ont parfois un volet « photographie et illustration », mais cela se limite aux nouveaux fichiers, pas au fond existant
  • certains programmes avec versement de fichiers veillent à l’aspect internationalisation avec des métadonnées au moins traduites en anglais
  • de nombreux versements (mais pas tous !) de collections institutionnelles inclus un travail préparatoire ou a posteriori de catégorisation des fichiers, mais assez peu de réflexion existe sur leur réutilisation
  • un atelier spécifiquement dédié à l’illustration d’articles Wikipédia grâce à un versement
  • des outils permettant de suggérer des fichiers à utiliser dans une version linguistique de Wikipédia basé sur leurs utilisations dans une autre langue

Que pourrait-on faire de plus pour mieux valoriser ces fichiers ? Quels sont les manques (outils, information, temps) qui nous manquent ?

Wikipédia a 15 ans

Thursday, 16 February 2023 12:14 UTC

Vous en avez sans doute entendu parler. Cet événement est l’occasion de revenir sur quelques usages de Wikipédia… en lui souhaitant un très joyeux anniversaire !

dm_009_wikipedia_a_15_ans

Crédit : Simon Gee Giraudot (Creative Commons By-Sa)

Action politique et biens communs en Catalogne

Tuesday, 14 February 2023 15:29 UTC

Le mois dernier, les médias ont abondamment montré et commenté la victoire électorale des militants de la mouvance «  Indignés  ». Ils ont en revanche plus parcimonieusement évoqué le programme, l’esprit et les convictions des responsables qui vont bientôt être aux commandes de Barcelone.
Le témoignage de l’universitaire Mayo Fuster Morell suggère que les valeurs et les pratiques du Libre ne sont pas étrangères à cette victoire, ce qui pourrait — rêvons un peu — servir d’exemple à d’autres pays européens confrontés à l’austérité. Ce relatif investissement du Libre dans le champ de la politique a de quoi nous réjouir  : voilà longtemps que le Libre n’est pas seulement du code ou de l’art. Culture et objets libres gagnent aussi du terrain désormais. À Barcelone, on en est peut-être au libre citoyen.

Les communs à la conquête de Barcelone  !

Une victoire de David sur Goliath

Par Mayo Fuster Morell
Article original  : http://www.onlinecreation.info/archives/1135
Traduction Framalang  : Piup, Obny, sebastienc, line, goofy, r0u

mayoFustellLe 24 mai, les candidats de la liste «  Barcelone en commun  » (Barcelona en Comú) ont remporté les élections municipales en réunissant sur leur nom un quart des suffrages exprimés. «  Maintenant Madrid  », une candidature aussi liée à l’éthique des communs, est devenue une force clé pour la gouvernance de la ville de Madrid. Ce ne sont que deux des nombreuses surprises survenues hier lors des élections municipales et régionales en Espagne. Ces villes pourraient donner le signal d’un changement politique plus vaste. Les résultats électoraux ont ouvert la voie à un scénario optimiste pour une chance de victoire aux élections nationales à la fin de cette année, ou même à un mandat plus ambitieux encore, une coalition européenne des pays du Sud contre l’austérité.

Irruption de candidatures citoyennes

Le Parti populaire et le Parti socialiste restent les principaux partis politiques, comme c’est le cas depuis la transition démocratique de la fin des années 70, mais le pouvoir politique habituel a encaissé une grosse claque. La part de ces deux formations a chuté de 65 % lors des précédentes élections il y a 4 ans à 52 % au niveau national. Le renouvellement ou plutôt le changement des forces politiques en présence a été provoqué […] par la création de nouveaux partis  : tel est le cas pour les «  Citoyens  », qui se sont imposés avec force comme un nouveau protagoniste de poids dans la vie politique. Cette irruption des candidatures citoyennes a été aussi impressionnante que rapide. Elle a contribué à l’augmentation d’au moins 5 points de la participation au scrutin.

Seulement quatre ans après que les Indignés du mouvement du 15 mai se sont mobilisés pour «  une vraie démocratie maintenant  » en opposition aux hommes politiques «  qui ne nous représentent pas  » et à la «  dictature des marchés  », l’impact de leur mouvement est désormais si visible qu’il ne peut plus être démenti. Les listes de candidature sont pleines de personnes venant du réseau des mouvements sociaux. Pour en donner une idée, Ada Colau, militante connue pour ses actions contre l’expulsion des activistes et des squatters va être le prochain maire de Barcelone. C’est l’ironie de l’Histoire  : une militante anti-expulsion «  expulse  » les politiciens traditionnels de la mairie. Si l’on regarde la trajectoire des leaders du mouvement, on peut également dire que le cycle a démarré avec le mouvement anti-mondialisation (l’origine de Colau ou de Pablo Iglesias, le leader de Podemos/Yes we can), mais qu’il a réussi à mobiliser une fois encore la génération qui s’est battue contre le régime de Franco pour ramener la démocratie en Espagne (c’est de là que vient Manuela Carmena de «  Madrid maintenant  », une juge en retraite et très probable future maire de Madrid).

En ce qui concerne leurs programmes, la première chose à souligner est la place centrale réservée aux plans d’urgence pour secourir les citoyens qui étouffent sous les politiques d’austérité, tels que la mise en œuvre de différentes variantes d’un revenu de base, et la révision de la privatisation des services publics. Un code d’éthique existe pour contrôler les personnels politique en ce qui concerne la transparence, la fin de leurs privilèges (par ex. une limitation des indemnités à 29 000 € par an) et leur engagement à soutenir les initiatives citoyennes.

Au-delà du poids politique, c’est fascinant d’un point de vue organisationnel. En moins d’un an et sans aucun lien avec les mondes politique, économique, judiciaire ni avec le pouvoir médiatique existant, des citoyens ordinaires joignant leurs forces ont été capables de conquérir des positions importantes dans le système politique. Une victoire de David contre Goliath. Pour cela, ils ont associé le financement participatif, les programmes collaboratifs, les assemblées de voisinage, et le vote en ligne. Ils ont aussi, comme le leader de Podemos, bâti leur succès sur la popularité obtenue par leur propre programme télé.

Que disait la chanson  ? «  Prenons d’abord Barcelone, puis nous prendrons Manhattan ?  » En effet, certains travaillent là-dessus. Une délégation d’activistes de New-York a parcouru l’Espagne pendant la campagne afin d’apprendre de cette expérience et «  d’exporter  » un tel soulèvement du peuple dans leurs propres villes. Il y a de nombreuses leçons et idées à en tirer. Voici quelques sources d’inspiration que je vous suggère d’envisager, pour démarrer un processus similaire dans d’autres pays.

L’effet CC

Un des combats citoyens (surtout chez les jeunes) qui a précédé et ensuite nourri le mouvement du 15 mai a vu le jour en réaction contre une loi imposée par le gouvernement, réprimant le partage en ligne et la culture libre (Loi Sinde de décembre 2010). Dans une large mesure, ce mouvement de culture collaborative sur le Web a réagi comme le fit Lessig en 2008, qui est passé des «  Creative Commons  » à «  Change Congress  » («  Changeons le Congrès  ») . Au départ concentré sur les politiques sectorielles en lien avec la propriété intellectuelle et la régulation d’Internet, il a évolué pour appréhender le fait que défendre ces libertés est nécessaire pour transformer le système politique dans son ensemble. Au cours de cette évolution, les modèles de la culture libre et du travail collaboratif sont devenus une voie à suivre pour organiser la protestation politique.

[…]

En somme, les secteurs ayant de l’expertise dans les méthodes de co-création et coopérant grâce aux ressources en ligne ont un grand potentiel politique.

 

Le modèle «  d’innovation cachée  » de Wikipédia

Même s’il existe de grandes innovations dans les structures, il faut que le discours soit «  simple  » voire «  strict  ». Mako Hill a étudié comment Wikipédia a pu réussir en 2001 alors que d’autres tentatives de création d’encyclopédie en ligne avaient échoué. Une de ses conclusions est que Wikipédia a adopté un concept très simple à comprendre, tout en étant très innovant dans son fonctionnement. Il s’est fermement accroché à la notion traditionnelle d’encyclopédie  : une idée vieille de plusieurs siècles qui est simple à comprendre. De la même façon, on peut dire la même chose ici. Le discours qui a pu faire grossir les votes en faveur d’un profond changement politique en Espagne n’est ni avant-gardiste ni particulièrement innovant, mais il est populaire, compréhensible par chacun et relié aux besoins fondamentaux. Quelques points se rapprochent de la démocratie radicale proche de Laclau et Mouffe. C’est un «  combat  » de bon sens, pour obtenir une hégémonie. Pendant ce temps, des modèles plus avant-gardistes, comme les nouveaux partis ayant un discours «  innovant  » et une identité sur Internet tels le Parti pirate ou le Parti X, sont pertinents en terme de conception d’organisation mais ne parviennent pas à mobiliser les votes du grand public (aux dernières élections européennes, le parti X a recueilli 0,64 % des voix). En somme, il faut des méthodes innovantes associées à un discours pour le peuple, en lien avec un programme portant sur les besoins fondamentaux.

La base et le sommet

Ces principes d’organisation ne sont ni du sommet vers la base, ni de la base vers le sommet, ils sont «  de la base et du sommet  ». Pour être plus précis  : «  un sommet facilement identifiable travaillant pour une base disséminée  ». Ces forces s’appuient sur des leaders forts, mais aussi sur le développement d’une base collaborative et libre d’agir. Un concept-clé est le «  débordement  ». Il se réfère à la capacité de perdre le contrôle du processus, et à la liberté d’agir laissée à ceux qui s’engagent dans le processus. L’augmentation de la créativité des actions et des soutiens hors du contrôle du «  parti  » semble être un des points pertinents dans le succès de ces méthodes (c’est le cas pour le mouvement de création graphique autour des candidatures). De plus, il n’existe pas de frontière précise entre qui est membre du «  parti  » et qui ne l’est pas, il n’y a pas de rituels pour dire qui est dedans et qui n’y est pas, c’est l’implication personnelle au travers de l’action qui permet d’être membre. Les leaders ont tout de même une présence forte, leurs visages sont devenus des symboles-clé du processus (c’est-à-dire que sur le bulletin de vote ne figure pas le logo du parti mais la photo du leader). Des symboles visuels sur un Internet visuel mais, même avec Internet, la télévision reste toujours un moyen-clé de communication. En particulier, l’association des leaders et de la télévision est un moyen-clé de communication vers les milieux populaires, ceux qui ne sont pas touchés par les mouvements sociaux de la classe moyenne relayés par Internet. La crédibilité des leaders se construit sur leur capacité à communiquer et sur un engagement social de longue date. Les candidatures féminines – peu importe leur âge – (les femmes sont en tête de liste dans des villes comme Barcelone, Madrid et Valence) ont une plus grande capacité à augmenter les votes car elles transmettent l’idée de changement et dirigent de façon plus démocratique. Comme le dit le prochain maire de Barcelone, Ada Colau (une Zapatiste d’origine)  : «  conduite par l’obéissance aux ordres du peuple  ». La position du leader est construite «  pour  » la base et non «  au-dessus  » d’elle. En somme, un leader social et très reconnaissable, mais une participation disséminée et non contrôlée.

Une fois encore, ce ne sont que trois visions «  impressionnistes  » du processus d’émancipation du peuple en Espagne. Il reste encore beaucoup à venir. 2015 est l’année du changement, cela continuera donc. En attendant, il est temps de fêter cela. Je vous laisse avec la rumba «  run run  » chantée par le prochain maire de Barcelone  :

defendreBienCommun
Ci-dessus, Ada Colau, dans un clip de campagne très joyeux. Le refrain de la rumba dit  : «  défendre le bien commun  ». Pour voir et entendre la vidéo sur YouTube  : https://www.youtube.com/watch?v=wB6NDWKDyKg

 

Ce texte est diffusé avec la licence d’origine  : CC BY-NC-SA 2.5 IT

Menaces sur les œuvres du domaine public

Tuesday, 14 February 2023 15:27 UTC

La numérisation des collections patrimoniales des musées devrait constituer une chance pour la diffusion de la culture. Trop souvent hélas, ce n’est pas le cas, à cause du copyfraud auquel se livrent les institutions. Comme l’a dit très justement Pier-Carl Langlais, le copyfraud est l’inverse du piratage : une revendication abusive de droits sur le domaine public pour en restreindre la réutilisation.

Les exemples de copyfraud ne manquaient déjà pas, mais le Reiss Engelhorn Museum de Mannheim en Allemagne a franchi cette semaine une ligne rouge en la matière. L’établissement a en effet décidé d’attaquer en justice la Wikimedia Foundation et Wikimedia Deuschland, pour la diffusion de 17 images d’œuvres du domaine public sur Wikimedia Commons. Depuis 2008, la Wikimedia Foundation a défini une position très claire à propos du copyfraud, en indiquant qu’elle ne reconnaissait pas la légitimité des restrictions rajoutées sur la réutilisation d’images en deux dimensions d’œuvres du domaine public. L’année suivante, une alerte sérieuse s’était produite lorsque le wikimédien Derrick Coetzee avait téléversé sur Wikimedia Commons plusieurs milliers d’images extraites du site de la National Portrait Gallery de Londres. Son geste dénonçait le fait qu’elle portait un copyright alors qu’elles correspondaient à des œuvres du domaine public . La National Portait Gallery avait alors agité la menace d’un procès, sans la mettre à exécution à la différence cette fois du musée Reiss Engelhorn.

Si l’on peut déplorer un tel comportement de la part d’une institution patrimoniale, ce sera peut-être aussi l’occasion pour un tribunal de se prononcer sur la légalité des pratiques de copyfraud. Comme le dit la fondation Wikimedia dans sa réponse au musée, la reproduction fidèle de tableaux ne crée pas une « nouvelle œuvre » et il est improbable que ces photographies satisfassent au critère de l’originalité, impliquant que le créateur imprime « l’empreinte de sa personnalité » dans son œuvre pour bénéficier d’une protection.

En France également, nombreux sont les établissements culturels se livrant à des pratiques de copyfraud. Le site Images d’art, lancé récemment par la Réunion des Musées Nationaux, comporte plus de 500 000 œuvres numérisées provenant de nombreux musées français. Mais toutes ces images portent le copyright du photographe les ayant réalisées, ce qui en interdit la réutilisation. Quelques institutions choisissent pourtant au contraire de diffuser librement leurs images et certaines comme le Musée des Augustins à Toulouse ou le Musée des Beaux Arts de Lyon ont engagé des partenariats avec Wikimedia France pour diffuser leurs images sur Wikipédia . Mais elles restent encore minoritaires.

Le plus inquiétant, c’est que la loi française risque bientôt d’évoluer pour légaliser les pratiques de copyfraud. Le recours au droit d’auteur par le musée Reiss Engelhorn reste juridiquement très fragile et la fondation Wikimédia peut encore affronter un procès avec des chances sérieuses de l’emporter. Mais la loi Valter, actuellement en cours d’adoption, s’apprête à consacrer la possibilité pour les établissements culturels de fixer des redevances de réutilisation sur les reproductions d’œuvres qu’elles produisent — y compris à partir des œuvres du domaine public —  en les assimilant à des données publiques.

Là où devant la justice allemande, on peut encore revendiquer le droit de réutiliser le domaine public librement, ce ne sera peut-être bientôt plus possible en France.

Lionel Maurel (Calimaq)

*  *  *  *  *

Wikimedia Foundation et Wikimedia Deutschland invitent instamment le musée Reiss Engelhorn à abandonner ses poursuites concernant des œuvres d’art du domaine public.

source : cet article du blog de Wikimedia
Traduction Framalang : KoS, goofy, Bromind, sebastien, r0u

Le 28 octobre, le musée Reiss Engelhorn de Mannheim, en Allemagne, a intenté un procès à la Wikimedia Foundation et ensuite à Wikimedia Deutschland, la branche allemande du mouvement international Wikimedia. L’objet en est une plainte pour copyright concernant 17 images d’œuvres d’art du musée qui relèvent du domaine public et qui ont été mises en ligne sur Wikimedia Commons. Wikimedia Foundation et Wikimedia Deutschland examinent la plainte et feront une réponse commune avant l’échéance fixée en décembre.

La Wikimedia Foundation et Wikimedia Deutschland maintiennent fermement leur engagement à rendre les œuvres publiques gratuites et libres d’accès. Les institutions publiques telles que les galeries et musées ont la même mission, et ont été des alliées historiques pour rendre accessibles à tous les connaissances du monde entier. Avec ce procès, le musée Reiss Engelhorn limite l’accès public à d’importantes œuvres culturelles qui seraient inaccessibles autrement pour le reste du monde.

Les peintures, portraits et autres œuvres d’art concernés par ce procès sont exposés au sein du musée Reiss Engelhorn, mais sont déjà présents dans le domaine public. Quoi qu’il en soit, la loi allemande sur le droit d’auteur peut s’appliquer aux photographies des œuvres qui appartiennent au domaine public, selon différents critères incluant l’artiste créateur de l’œuvre lui-même, la compétence et les efforts qui ont été mis dans la photographie, la créativité et l’originalité, et enfin l’art en tant que tel. Le musée Reiss Engelhorn prétend que ces images sont soumises au droit d’auteur car le musée a rémunéré le photographe qui a pris certaines d’entre elles, ce qui lui a demandé du temps, de la compétence et des efforts pour les prendre. Le Musée Reiss Engelhorn affirme encore que, à  cause de ce droit d’auteur, les images des œuvres d’art ne peuvent pas être partagées au travers des Wikimedia Commons.

635px-Hendrick_Goltzius_Cadmus_Statens_Museum_for_Kunst_1183Les œuvres du domaine public affrontant l’hydre du droit d’auteur (allégorie)

(Hendrick Goltzius, Cadmus (Statens Museum for Kunst). Licence Domaine public via Commons)

La Wikimedia Foundation et Wikimedia Deutschland estiment que le point de vue du musée Reiss Engelhorn est erroné. Les lois sur le droit d’auteur ne doivent pas être utilisées à mauvais escient dans le but de contrôler la dissémination d’œuvres d’art appartenant au domaine public depuis longtemps, telles que les peintures exposées au musée Reiss Engelhorn. Le but du droit d’auteur est de récompenser la créativité et l’originalité, et non de créer de nouveaux droits limitant le partage en ligne d’images d’œuvres du domaine public. De plus, même si la loi allemande accorde quelques droits sur ces images, nous pensons qu’utiliser ces droits dans le but d’empêcher le partage des travaux du domaine public va à l’encontre de la mission du musée Reiss Engelhorn et de la ville de Mannheim et appauvrit l’héritage culturel mondial.

De nombreuses institutions se sont donné pour mission de rendre leurs collections le plus accessible possible pour le monde entier. En octobre, le musée des Arts et Métiers d’Hambourg, en Allemagne, a rendu sa collection accessible librement en ligne. Le Rijksmuseum d’Amsterdam a fourni un accès en ligne à toutes ses peintures, y compris la possibilité de les télécharger et d’utiliser les reproductions sous licence domaine public CC0. Au Danemark, SMK (Statens Museum for Kunst, la Galerie Nationale du Danemark) a rendu publiques ses images et vidéos numériques sous la licence CC-BY. La British Library [N.d.T : Bibliothèque de Grande-Bretagne, équivalent de la BNF] et le Japan Center for Asian Historical Records [N.d.T : le Centre japonais d’archives historiques asiatiques] ont conjointement libéré plus de 200 gravures japonaises et chinoises dans le domaine public.
Ces institutions culturelles conservent les valeurs du domaine public et protègent le droit de prendre part à notre héritage culturel. La tentative du musée Reiss Engelhorn de créer un nouveau copyright dans le domaine public va à l’encontre des principes européens sur le domaine public.

soldatsFrançaisL’armée française part en campagne contre le copyfraud

(image issue du catalogue en ligne de The British Library, aucune restriction de droit d’auteur connue – Voir tous les détails)

Dans un communiqué du 11 août 2008, la Commission européenne a écrit : « il faut souligner qu’il est essentiel que les œuvres qui sont dans le domaine public restent accessibles après un changement de format. En d’autres termes, les œuvres qui sont dans le domaine public devraient y rester une fois numérisées et être rendues accessibles par Internet ». Cela a été renforcé par la charte d’Europeana de 2010 qui stipule : « Aucun autre droit sur la propriété intellectuelle ne doit être utilisé pour rétablir une exclusivité sur des matériaux du domaine public. Le domaine public fait partie intégrante de l’équilibre interne du système de droit d’auteur. Cet équilibre interne ne doit pas être rompu par des tentatives pour obtenir ou rétablir un contrôle exclusif via des règles extérieures au droit d’auteur. »

Ces dernières années, le mouvement Wikimédia a bénéficié de partenariats fructueux avec des musées et des galeries à travers le monde grâce à l’initiative GLAM-Wiki, qui aide des institutions culturelles à partager leurs ressources avec le monde entier par le biais de projets de collaboration avec des éditeurs expérimentés de Wikipédia. Ces partenariats ont permis à des millions de personnes de découvrir et d’apprécier des collections situées dans des endroits qu’ils ne pourront jamais visiter. Wikimédia Deutschland, seule, a travaillé avec plus de 30 musées en Allemagne pour rendre leurs collections accessibles gratuitement à n’importe qui n’importe où, au travers des projets Wikimédia. Ces partenariats font partie d’un effort indispensable qui permet aux institutions culturelles et à Wikimédia d’accomplir leur mission de libération de la connaissance et de partage de la culture.

Partout dans le monde des gens utilisent Wikipédia pour découvrir et comprendre le monde qui les entoure. Grâce à Internet, de nombreux obstacles traditionnels à la connaissance et à l’apprentissage ont disparu. Refuser l’accès en ligne à des images du domaine public empêche les gens d’explorer et de partager notre patrimoine culturel mondial. Nous exhortons le musée Reiss Engelhorn à reconsidérer sa position et à travailler avec la communauté Wikimédia pour rendre encore plus accessibles leurs œuvres élevées dans le domaine public.

Michelle Paulson, Legal Director
Geoff Brigham, General Counsel
Wikimedia Foundation

Plus de 15 articles en deux mois et demi pour vous décrire nos actions, et nous avons encore une petite surprise pour vous !

Cet article fait partie des « Carnets de voyage de Contributopia ». D’octobre à décembre 2019, nous y ferons le bilan des nombreuses actions que nous menons, lesquelles sont financées par vos dons (qui peuvent donner lieu à une réduction d’impôts pour les contribuables français). Si vous le pouvez, pensez à nous soutenir.

Dernier interlude « Nos actions sont financées par vos dons »

Les carnets de voyages de Contributopia sont aussi bien une campagne d’informations qu’une campagne de dons. Nous venons de publier une quinzaine d’articles en moins de deux mois pour faire le bilan de deux années à suivre la feuille de route Contributopia. C’est à la fois pour vous dire « voici ce que nous avons fait grâce à vos dons » mais aussi pour vous faire comprendre que « si vous voulez que nous poursuivions nos actions, nous avons besoin de dons ».

Cliquez pour découvrir la page des Carnets de Contributopia, et sa carte qui s’adapte à votre écran… (par David Revoy)

 

Alors voilà, c’est notre dernier moment « pub » de l’année ! Avant que d’aller boire avec la modération qui vous sied, d’aller demander si ce bisou sous le gui est consenti, et surtout avant d’aller dire au revoir à 2019… Nous voulions – une dernière fois – rappeler aux contribuables français qu’il ne leur reste plus que quelques heures pour faire un don à Framasoft qui soit défiscalisable en 2019 ! Car même avec le prélèvement à la source, un don de 100 € à Framasoft revient, après déduction à 34 €. Vous connaissez le chemin pour nous soutenir : c’est là.

Des carnets magnifiquement illustrés

Ces Carnets de voyage de Contributopia n’auraient pas été les mêmes sans le travail, l’enthousiasme et le talent de David Revoy, qui a de nouveau accepté de les illustrer pour nous. Il a commencé cette nouvelle prestation en nous posant une question simple : quelle est la contrainte ? Nous voulions une espèce de carte aux trésors, de carte de jeu vidéo, à afficher sur une page web. Mais aujourd’hui, une page web peut aussi bien être vue sur un écran 4K, une tablette ou un ordiphone tout en longueur…

– Tu peux nous faire une carte responsive ? Ça te va, comme contrainte, David ?

– Chiche !

Allez, franchement, avouez : est-ce que vous aviez remarqué que la carte des Carnets de Voyage de Contributopia peut s’afficher tout en longueur, tout en hauteur, ou dans un joli rectangle proportionné… ? Allez tester, pour voir : c’est bluffant !

Surprise : ces carnets vous appartiennent

David Revoy est connu comme un artiste libriste : il contribue à Krita, a travaillé avec la Blender Fondation, et son web-comic Pepper & Carrott est publié sous licence CC-By. Il est donc logique que les quatre panneaux de la carte retraçant nos Carnets de Voyage, ainsi que les 15 œuvres illustrant les 15 pages de nos carnets soient sous la même licence !

La surprise, c’est que chacune de ces illustrations a été ajoutée en contribution à Wikimédia Commons, le commun créé par la Wikimedia Fondation pour rassembler les œuvres libres.

Cliquez sur ces joyeux drilles pour retrouver l’ensemble des illustrations des Carnets de Voyage de Contributopia sur Wikimedia Commons

 

Il sera donc tout facile de les retrouver pour les utiliser, les modifier et les diffuser… Et pour les personnes qui veulent les étudier, aller bidouiller les calques, etc., les fichiers source de ces illustrations (créées avec le logiciel libre Krita) sont à votre disposition sur le site de David Revoy !

Belle année 2020 à vous

« Contributopia » n’est pas qu’un joli mot mettant dans une même valise nos désirs d’Utopies et de Contribution. Nous venons de montrer, dans ces Carnets de Voyages, que c’est aussi un ensemble d’actions, de réflexions, et de liens que nous tissons.

Nous espérons que ces partages vous ont plu, en tous cas vos retours nous ont souvent fait chaud au cœur, et remplis de l’envie de faire au moins aussi bien en 2020 !

Nous vous souhaitons, avec quelques heures d’avance, une année 2020 riche de contributions, d’utopies et d’émancipations.

— Les membres de l’association Framasoft.

Illustrration de David Revoy Le jeu de méracartes vu par David Revoy

Rendez-vous sur la page des Carnets de Contributopia pour y découvrir d’autres articles, d’autres actions que nous avons menées grâce à vos dons. Si ce que vous venez de lire vous plaît, pensez à soutenir notre association, qui ne vit que par vos dons. Framasoft étant reconnue d’intérêt général, un don de 100 € d’un contribuable français reviendra, après déduction, à 34 €.

Soutenir Framasoft

Illustration d’entête : CC-By David Revoy

Retour sur le premier Confin’atelier

Tuesday, 14 February 2023 11:36 UTC

Le samedi 25 avril dernier s’est tenu le premier Confin’atelier, premier Contribatelier en ligne, et ça a été un succès. Afin de valoriser cette belle initiative, nous republions ici le compte-rendu publié sur https://contribateliers.org/ et nous sommes ravi⋅es de vous annoncer qu’un second opus est en préparation ! La date est même fixée : ce sera le samedi 6 juin 2020 de 14h à 17h.

Alors qu’est-ce qu’on a fait pendant ce Confin’atelier, premier Contribatelier en ligne, et qu’est-ce qu’on en retient ? Plein de choses ! Allez on y va, on commence par le global et on détaillera pôle par pôle ;-). Ready ? Go !

Globalement

Déjà les chiffres qui nous réchauffent le cœur : plus 80 participant·es, 11 salons en simultané (10 salons pour les pôles et 1 pour l’accueil), 13 animateur·rices, plus de 3 heures de Confin’atelier : Wouhou ! On ne s’était pas fixé d’objectifs à atteindre mais même si ç’avait été le cas, on est plus que largement satisfait·es !

Autre chose notable : aucun souci rencontré concernant la technique. C’était un peu la crainte, qu’il y ait beaucoup de participant·es et que l’instance Big Blue Button de FAImaison soit surchargée. On avait même prévu un plan B si besoin, dans lequel on était prêt à migrer les salons de certains pôles sur une autre instance Big Blue Button pour absorber la charge. Au final RAS comme on dit, aucun pôle n’a subi de bugs, ralentissements ou autre : bref, on était bien à l’aise ! (bon on a aussi demandé à tou·tes les participant·es de ne pas utiliser leur webcam et de se contenter de l’audio : ça aide !)

Pôle par pôle

Le retour de chaque pôle a été rédigé par le ou les animateur·rices du pôle concerné, sauf pour le pôle accueil où c’est un participant qui a voulu nous faire part de son retour. Merci fabulousfabs !

Pôle Accueil

Pôle animé par MeTaL_PoU, Numahell & QuentinD

Du monde tout l’après-midi, le pôle accueil avait la lourde responsabilité d’accueillir sur le Confin’atelier, d’expliquer le fonctionnement de l’outil BBB, de guider les participant·e·s vers les différents pôles, de répondre aux questions. Ce pôle « tampon » était nécessaire et a été remarquablement bien orchestré par nos 3 ami·e·s ! Ambiance franchement sympathique, accueil chaleureux et patience dans leurs explications, MeTal_PoU & Numahell se sont données sans retenue sur le pôle accueil ! QuentinD gérait la comm’ sur les réseaux sociaux (de ce que j’ai compris, pour la première fois), et venait faire un coucou aux rares moments où il avait 5 minutes. Pendant ce temps, MeTal_PoU & Numahell prenaient leur temps pour dire bonjour, expliquer inlassablement le système de salons multiples, comment basculer vers un autre pôle, comment aider à régler / couper son micro sur BBB, tout cela sans jamais perdre le sourire (qui s’entendait) ou patience. Elles ont eu à cœur de laisser présenter les pôles aux responsables de salons qui en avaient le temps, permettant à nos 80 bonnes âmes de choisir où aller donner un coup de pattes. Bravo à vous 3 !

Pôle Framalibre

Pôle animé par Gavy

Environ une dizaine de personnes pour ce pôle autour de l’annuaire historique de Framasoft. On a commencé par une petite présentation de Framalibre – ce qu’est l’annuaire, ce qu’on peut y trouver et ce qu’on peut y faire – avant de voir comment y contribuer.

Au final, plusieurs comptes Framalibre ont été créés, des notices existantes ont été modifiées et de nouvelles sont apparues :

Notices crées :

Notices modifiées :

Si contribuer à Framalibre vous donne envie, le meilleur moyen pour commencer, c’est de venir en parler sur Framacolibri (le forum de Framasoft), dans la section dédiée à l’annuaire !

Pôle Design & Libre

Pôle animé par Maiwann

Une dizaine de personnes qui étaient présentes pour cet atelier visant à regrouper les designers ayant envie de faire bouger les choses coté logiciel libre ! Petite surprise : Il y avait aussi des personnes qui étaient plutôt développeurs et qui étaient en demande pour savoir comment trouver quelqu’un avec qui collaborer. Après plusieurs petites discussions sur « Pourquoi y a-t-il aussi peu de designers dans le monde du libre ? » nous avons décidé de faire un petit site afin de pouvoir renvoyer les différentes personnes intéressées par le sujet dessus \o/ Ni une, ni deux, entre celleux qui s’occupaient du contenu et celleux qui étaient lancés sur la technique, nous avons déjà une page à vous présenter regroupant des façons de nous contacter et des ressources autour du design : Foire aux questions, articles, témoignages de collaboration… C’est par là ! ! 🎉 => https://design-et-libre.frama.io/ Merci à celles et ceux qui ont participé à cet atelier 🥳

Pôle Communiquer pour des projets libres

Pôle animé par Pouhiou

La proposition était de faire un tour de table des expériences et besoins dans la communication pour des projets libres, puis de prendre chaque besoin un par un et de partager nos retours d’expérience dessus. S’en est suivie une conversation de 3h avec plus de 10 personnes présentes absolument passionnante. Une des problématiques récurrentes fut de trouver comment communiquer sans reproduire les codes du capitalisme de surveillance.

Ces échanges ont été sketch-notés par Chloé :

Reproduction dans ce billet de blog avec l’autorisation de Chloé. Merci !

Pendant les échanges, David Revoy nous a écouté (et est parfois intervenu) tout en dessinant en direct une nouvelle illustration de Sépia, lae poulpe-mascotte de PeerTube, dont nous avons appris à cette occasion qu’iel n’avait pas de genre (découvrez-la plus bas !). Le seul regret de l’animateur (Pouhiou) c’est d’avoir du mal à jongler entre son animation et ses envies de partager une grosse expérience accumulée au sein de Framasoft (et donc de monopoliser la parole). Merci à toutes les personnes qui ont contribué !

Pôle PeerTube

Pôle animé par Angie

Une douzaine de personnes ont participé à cet atelier portant sur la sélection de contenus de qualité hébergés sur PeerTube. Angie a commencé par expliquer qu’il était important de valoriser ces contenus pour en montrer la diversité. Ce travail de curation permet d’alimenter le bloc « Découvrez notre sélection de contenus » de https://joinpeertube.org/ Plusieurs participant⋅es ayant des questions sur le fonctionnement du logiciel PeerTube, nous avons passé un peu de temps à y répondre. Angie a ensuite rappelé quelques critères pour la sélection (contenus sous licence libre ou dont on a l’assurance qu’ils sont publiés par leur créateur) et proposé des outils permettant la recherche au sein des différentes instances de PeerTube et les participant⋅es se sont lancés dans la recherche de contenus. Au final, 14 nouveaux contenus (vidéos, chaînes et instances) ont été sélectionnés. Pour chacune de ces sélections, un texte de présentation a été rédigé. Ces éléments seront prochainement visibles sur la page d’accueil de joinpeertube. Cet atelier était vraiment chouette car il a permis à l’ensemble des participant⋅es de découvrir ces contenus mais aussi d’échanger sur le fonctionnement du logiciel et sur les modalités d’inscription sur une instance. A reproduire pour découvrir de nouveaux contenus !

La nouvelle illustration de Sépia, mascotte de PeerTube, realisée par David Revoy pendant le Confin’atelier (licence CC-BY)

Pôle OpenStreetMap

Pôle animé par gibro

Le pôle OSM a débuté par une présentation rapide de la carte OpenStreetMap : son modèle, ses principes de fonctionnement et les principaux outils de contributions. Il y a ensuite eu une démonstration du fonctionnement de la carte ça reste ouvert :

  • Utilisation de la carte => affichage des informations, codes couleur utilisés, choix des langues, mode daltonien
  • Explication de la fonctionnalité « Signaler un changement » => formulaire permettant d’ajouter directement les informations sur un lieu sans avoir besoin d’un compte OpenStreetMap
  • Résolution des notes générées par le site => à partir du site NoteReview avec le tag #caresteouvert permettant aux contributeurs de suivre les signalements « ça reste ouvert » et de renseigner les informations dans la base OpenStreetMap
  • Documentation avec les ressources mises à la disposition sur le blog caresteouvert et le wiki OpenSteetMap.

Pendant et après la démonstration, nous avons échangé en fonction des besoins et interrogations des personnes présentes. Il y avait une douzaine de personnes en continu dans le salon et plusieurs contributeurs pour l’animer (merci Sebbaz et Eric B). Nous avons aussi discuté de la possibilité de mettre en place un site web facilitant la saisie des informations sur les commerces sans passer par un compte OpenSteetMap, sur le modèle https://caresteouvert.fr ou https://wheelmap.org/ Pour conclure, j’ai trouvé très agréable et efficace l’outil BigBlueButton pour les démonstrations et les interactions avec les participants. Il était également intéressant d’être à plusieurs pour animer pour gérer les échanges sur le chat et l’ajout d’informations dans les notes en parallèle des démonstrations en partage d’écran.

Retour d’un participant :

Très bon accueil de Gibro :) Belle découverte de caresteouvert, ce qui m'a permis d'actualiser les informations autour de chez moi. Concret et pratique. J'avais aussi des questions plus générales de mises à jour de OSM, que j'ai pu mettre en pratique immédiatement grâce aux conseils avisés de Gibro et Fred, merci à eux. Pratique, concret, convivial, j'ai passé un très bon moment et j'ai pu pratiquer immédiatement pour faire des mises à jour, merci <3

Pôle Wiktionnaire

Pôle animé par Noé

Première session de contribution en ligne et une bonne expérience. L’exploration d’un dictionnaire n’était probablement pas l’expérience la plus séduisante, d’où l’affluence limitée, mais l’animateur a pu néanmoins contribuer et montrer l’intérêt du Wiktionnaire avec de l’ajout d’illustrations et d’exemples, et même créer de nouvelles pages. Un participant, motivé par la présentation a pu téléverser une de ses photographies pour illustrer la page du Wiktionnaire de la ville de Gafsa. L’envie d’en refaire et la hâte de reprendre les permanences mensuelles lyonnaises !

Pôle Wikipédia

Pôle animé par Lyokoi

Une session de 3h bien remplie et qui aurait pu durer si le présentateur ne tombait pas de fatigue et ne perdait pas sa voix à la fin. La session oscillait entre 4 et 6 personnes avec un pic de présence à 8. La première moitié (1h30) fut une présentation globale de Wikipédia, son fonctionnement, sa communauté, ses règles et surtout une visite de l’interface de contribution. Ponctuée par les questions des visiteurs et visiteuses, nous avons apporté des sources à des articles, nous avons découvert plusieurs aspects de la contribution (images, structuration, wikification, etc.) et avons noté dans le pad interne des liens importants. La deuxième partie était surtout consacrée à l’échange avec les participants et les participantes, via message ou via micro. Un contributeur de Lorient a pu se faire aider à monter un groupe local et plusieurs nouveaux et nouvelles ont pu faire leurs premières modifications (ainsi qu’un ancien qui s’y est remis). L’expérience a été très enrichissante et a donné l’envie de recommencer.

Pôle Piaf

Pôle animé par Guillaume

Une super ambiance, avec une dizaine de curieux qui voulaient en savoir plus sur le projet. Nous avons discuté des intérêts de construire des ressources pour créer des intelligences artificielles francophones, et également des façons de procéder. Puis nous avons tous ensemble contribué, en écrivant des questions réponses sur des articles Wikipédia. Avec quelques dizaines de questions réponses produites, Piaf en est maintenant à 7000 depuis le début du projet il y a quelques mois ! Bravo et merci à tous ! Et continuons de contribuer quand nous en avons le temps :)

Pôle Culture libre / Khaganat

Pôle animé par Zatalyz et GPSqueeek

Après une demi-heure à – nous ronger le clavier de peur de n’avoir personne – papoter, nous décidons de revenir faire un tour à l’accueil pour signaler qu’on était là et que c’était chouette de venir dans notre salon. Et ça a marché ! On a en effet eu la joie d’avoir le retour d’une contributrice qui nous a aidé·es à voir comment serait fait le système solaire dans l’univers du Khanat, et c’est pas rien ! Le Khanat serait probablement une lune d’une géante gazeuse, et ensuite il y a des histoires d’angle des plans orbitaux, de masse et de taille des différents astres. On espère un jour avoir de quoi montrer ce ciel dans Godot pour l’intégrer au futur jeu ! Ensuite on a eu plusieurs visites de curieuses dont certaines sont restées pour nous aider à commencer un article au sujet d’une bestiole qui avait été dessinée sur papier en Contrib’atelier en présentiel en fin d’année dernière. Ce n’est pas encore terminé mais il y a une bonne base pour avoir quelque chose de publiable bientôt sur notre wiki on espère ! Merci aux visiteuses et autres contributrices qui ont été toutes plus oniriques les unes que les autres (et chez Khaganat, c’est signe d’un tas de guimauves, accompagnées d’un tas de câlins si ça fait plaisir !).

Pôle Contribuer au libre pour les développeur·ses

Pôle animé par ervin

https://asso.framasoft.org/pic/xPP0qymR/jBZ96zfE.png

Nous avons eu 11 personnes présentes. Globalement les nouveaux venus étaient satisfaits et ont trouvé des projets auxquels contribuer. La durée n’a pas forcément permis de mettre des choses en production, mais le contact a été établi et certains des participants comptent continuer à contribuer. Beaucoup d’appétence pour une autre session. Les notes complètes dont le tour de table final : https://mypads.framapad.org/p/confinatelier-framadate-3m1pcq7p7

En conclusion

Pour nous ce n’est que du positif donc un immense merci à tou·tes celleux qui ont pris part à ce Confin’atelier :

  • Animateur·rices : merci pour la diversité des pôles et leur nombre !)
  • Participant·es : merci d’avoir être été autant de monde à répondre présent·es pour donner de votre temps pour le libre
  • Bénévoles de FAImaison : bah oui, pas de bénévoles FAImaison, pas de Big Blue Button, donc pas de Confin’atelier. CQFD ;-).

À bientôt pour le prochain ?  ;-)

 

Wikipedia et les liens externes

Thursday, 12 January 2023 16:05 UTC

 

Pointeur de souris en forme de main au-dessus d'un hyperlien Wikipédia.
Bernard Ladenthin, CC0

Des acteurs de la presse française viennent d'annoncer la signature d'une charte de la traçabilité de l'information. La charte prévoit que les médias citent correctement leurs sources et qu'ils insèrent des liens hypertextes dans les articles. Aucun roman d'anticipation n'avait sans doute imaginé qu'en 2020 l'humanité serait capable de telles prouesses ! Au-delà de cette pic amicale, je suis content que les médias traditionnels adoptent les bonnes pratiques des pure players et de Wikipédia. La gestion des sources et des hyperliens est complexe et chronophage. Bon courage aux nouveaux titres de presse qui se lancent dans l'aventure.

S'ils leur restent du temps, ce serait bien également de correctement créditer les photos qu'ils prennent sur Wikipédia ou Wikimédia Commons. Bien souvent les médias ne citent pas la licence libre utilisée par le créateur ou utilisent les fameux Droits réservés (DR). Outre le fait que c'est illégal, il est de plus en plus important de pouvoir retracer l'origine des images afin de s'assurer de leurs exactitudes et que les légendes correspondent bien aux photos.

Hasard du calendrier, j'étais depuis plusieurs jours en train de me dépêtrer à faire des requêtes SQL pour mieux connaître les liens externes qui se trouvent sur la Wikipédia francophone.

Liens externes

Les hyperliens qui mènent vers d'autres sites web sont très fréquents sur Wikipédia. Une série de recommandations leurs sont consacrées sur la page Wikipédia:Liens externes. Dans les articles de Wikipédia, on peut en trouver à deux endroits différents. Tout d'abord dans la liste des sources permettant de vérifier ce qui est écrit dans l'article. Ce type de lien externe, aussi appelé source ou référence, est généralement regroupé dans une section intitulée Références ou bien Notes et références. La nature des références est fonction de l'article. Un article d'actualité va utiliser la presse alors qu'un article d'histoire utilisera des monographies.

Un deuxième endroit possible pour les liens externes est une section tout simplement appelée Liens externes en toute fin d’article. Le plus souvent cette section contient le site officiel ou de nombreux liens vers d'autres bases de données. Les wikimédiens consacrent beaucoup de temps pour relier Wikipédia ou Wikidata à des notices d'autorité (base Léonore de la Légion d’honneur, base Mérimée des monuments historiques, IMDb, etc.) ainsi qu'à d'autres sites de référence (Who's Who, Universalis, Maitron, etc.).
 
La Joconde

Requêtes SQL

L'outil Quarry permet d'interroger en live une copie de la base de données de Wikipédia à l'aide du langage SQL. N'y connaissant rien, je me suis contenté de réutiliser une requête faite par un collègue étranger. Les résultats ne sont pas directement utilisables car on y trouve quelques sites internes à Wikimédia et des sites identiques sous plusieurs urls (ex. books.google.com et books.google.fr ou wordlcat.org et www.worldcat.org). Il faut donc penser à agréger certains résultats.

Top 20

Voici les 1 173 sites avec plus de 1000 occurrences dans l'espace principal (= articles) de la Wikipédia francophone et le top 20 :
  1. Insee 624 477
  2. BnF  602 667
  3. Google Livres 405 050
  4. Virtual International Authority File (VIAF) 360 287
  5. Worldcat 253 081
  6. International Standard Name Identifier (ISNI) 213 875
  7. Internet Archive 210 916
  8. culture.gouv.fr 209 686
  9. Bibliothèque du Congrès 191 409
  10. Digital object identifier (DOI) 166 590
  11. Deutsche National Bibliothek (DNB) 161 763
  12. Identifiants et Référentiels pour l'Enseignement supérieur et la Recherche (IdRef) 146 490
  13. Internet Movie Database (IMDb) 128 210
  14. National Center for Biotechnology Information (NCBI) 124 115
  15. Bibliothèque royale du Pays-Bas 110 484
  16. Le Monde 85 010
  17. NASA 80 586
  18. Catalogue of Life 75 291
  19. Inventaire de l'Agence flamande du patrimoine 71 256
  20. Légifrance 75 278
  21. YouTube 70 973

Top 20 français

  1. Insee 624 477
  2. BnF 602 667
  3. culture.gouv.fr 209 686 
  4. IdRef (Identifiants et Référentiels pour l'Enseignement supérieur et la Recherche) 146 490
  5. Le Monde 85 010
  6. Légifrance 75 278
  7. Allociné 67 576 
  8. archive.wikiwix.com 56919
  9. Persée 56 107 
  10. Cassini 51 889 
  11. Le Figaro 46 372 
  12. L'Equipe 39 983 
  13. Le Parisien 30 547 
  14. Ministère de l'intérieur 30 464 
  15. Libération 28 997 
  16. Ouest France 25 578
  17. mondedufoot.fr 25 239 
  18. Cairn 24 096 
  19. Assemblée nationale 22 784
  20. L'Express 20 763 

Médias 

Voici les différents classements pour la presse d'information générale (sans le sport en gros).

Presse française

  1. Le Monde 85 010
  2. Le Figaro 46 372 
  3. Le Parisien 30 547
  4. Libération 34 461
  5. Ouest France 25 578
  6. L'Express 20 763 
  7. Le Point 19 082 
  8. Les Échos 15 409 
  9. Obs 12 733
  10. RFI 11 915 
  11. 20 Minutes 11 425 
  12. La Croix 9 637 
  13. France TV info 8 613 
  14. Sud Ouest 8 215 
  15. Télégramme  7 818
  16. Jeune Afrique 7 597
  17. L'Humanité 7 373 
  18. Télérama 6 900
  19. France Culture 6 633 
  20. Le Monde diplomatique 5 567 

Presse francophone

  1. Radio Canada 11 039
  2. La Presse 10 441
  3. Le Soir 8 942
  4. RTBF 8 384
  5. Le Temps 7 520
  6. Le Devoir  6 223
  7. RTS 5 436
  8. DH Les Sports+ 3 803
  9. Tribune de Genève 2 914
  10. L'Avenir 2 265

Presse étrangère

  1. BBC 41 395
  2. New-York Times 31 282
  3. Guardian 20 579
  4. Telegraph 7 972
  5. Washington Post 7 020
  6. Los Angeles Times 6 579
  7. Independent 5 991
  8. Daily mail 4 210
  9. Forbes 3 658
  10. CBC 3 528

Sites gouvernementaux

  1. www.culture.gouv.fr et www2.culture.gouv.fr 144 174
  2. www.legifrance.gouv.fr et legifrance.gouv.fr 75 278
  3. www.pop.culture.gouv.fr 61 290
  4. www.interieur.gouv.fr 30 464
  5. www.assemblee-nationale.fr 22 784
  6. elections.interieur.gouv.fr 16 018
  7. www.geoportail.gouv.fr 13 293
  8. www.senat.fr 10 353
  9. www.banatic.interieur.gouv.fr 7 824
  10. www.georisques.gouv.fr 5 432
  11. www.data.gouv.fr et entreprise.data.gouv.fr 7 436
  12. cites.application.developpement-durable.gouv.fr 4 876
  13. www.siv.archives-nationales.culture.gouv.fr 4 222
  14. www.education.gouv.fr 3 785
  15. www.defense.gouv.fr 3 681
  16. www.inao.gouv.fr 3 334
  17. www.diplomatie.gouv.fr 3 308
  18. www.loiret.gouv.fr 2 702
  19. www.collectivites-locales.gouv.fr 2 377
  20. www.memoiredeshommes.sga.defense.gouv.fr 2 338
  21. www.developpement-durable.gouv.fr 2 172
  22. alize2.finances.gouv.fr 1 693
  23. www.aisne.gouv.fr 1 681
  24. www.culturecommunication.gouv.fr 1 628
  25. www.gouvernement.fr 1 513
  26. www.annuaires.justice.gouv.fr 1 486
  27. agreste.agriculture.gouv.fr 1 259
  28. carmen.developpement-durable.gouv.fr 1 149
  29. www.statistiques.developpement-durable.gouv.fr 1 104

Sites Wikimedia

De nombreux liens renvoient vers des sites Wikimedia. Il y a tout d'abord les liens vers les autres versions linguistiques de Wikipedia. Il ne s'agit pas des interwikis permettant de passer d'une langue à l'autre mais de liens générés par des modèles tels que {{Traduction/Référence}} ou {{Lien}}.

Il y a également quasiment 200 000 liens vers la ferme de serveurs qui héberge des outils (tools.wmflabs.org) tels que GeoHack, KMLexport, Chemistral Abstracts Service number links, etc.

 Et Wikidata est massivement utilisé avec plus de 3 millions de liens.

Robots

CodexBot

Je terminerai en présentant les travaux des robots. Il y a tout d'abord les outils d'archivage. Les pages internet peuvent avoir une durée de vie assez courte. Afin de permettre l'accès à ces liens morts, la Wikipédia Francophone utilise deux services :
  • La Wayback Machine d'Internet Archive : 210 916 liens
  • Et un service similaire (Wikiwix) proposé par la société française Linterweb : archive.wikiwix.com 56 919

CodexBot sert à mettre en forme les hyperliens laissés par les rédacteurs bénévoles. La Wikipédia francophone utilise principalement trois modèles afin d'harmoniser la présentation des sources :

  • Ouvrage : utilisé 1 064 113 de fois sur 305 392 pages distinctes.
  • Article : utilisé 808 734 de fois sur 238 253 pages distinctes.
  • Lien web : utilisé 3 366 315 de fois sur 679 393 pages distinctes.

Ce robot analyse quotidiennement 2500 citations de livres et en améliore 1500. Il traite également 1000 articles de presse, articles académiques et pages web. Enfin, il signale une trentaine de cas nécessitant une vérification humaine.

 

[Mise à jour] Ajout de requêtes SQL listant les liens par projet

Recette 5 – croque monsieur

Saturday, 10 December 2022 06:23 UTC

Bien le bonjour, ça faisait un bail.

Il fait froid, le four est agréablement chaud… aujourd’hui, une recette simple de croque-monsieurs.

1) Tartinez la tranche du bas avec du beurre.

2) Ajoutez une demi tranche de jambon. Ou une entière si vous voulez, j’suis pas vot’chef.

3) Mélangez le fromage râpé avec un peu de lait et mettez ça sur la 2eme tranche de pain.

Le lait, comme le beurre plus haut, sert principalement à éviter que le pain (et ici le fromage) ne se dessèche pendant la cuisson et garde du moelleux, donc il en faut -un peu- mais pas détremper la tranche non plus. Ça peut prendre quelques essais pour apprendre à doser correctement :)

4) Au four ~180°C pendant une vingtaine de minutes

C’est prêt !

Comment allier passion et travail de fourmis

Wednesday, 1 June 2022 08:46 UTC

 En parallèle d'un gros travail d'amélioration  et de labellisation sur des articles de films Disney par ordre chronologique (dernier en date Les Yeux de la forêt, normalement le prochain sera Rox et Rouky), j'ai plusieurs petites tâches de fond, de fourmis. L'une d'elle est de vérifier la page pointant vers Disney (page d'homonymie) ou Walt Disney. Pour le premier, le travail consiste à corriger les articles pointant sans raison souvent en remplaçant vers la bonne filiale du groupe. Pour le second c'est plus subtil mais se résumé à vérifier que l'article ne point pas vers l'être humain mort en 1966 en lieu et place de l'entreprise... C'est un travail pas très folichon mais nécessaire. 


C'est durant une session de correction que je suis tombé sur Patrick Swayze, acteur du film préféré de ma chère et tendre (plus de 200 visionnages au compteur). L'article indiquait 

Il est d'abord danseur dans les parades de parc d'attractions [[Walt Disney]]. 

Premier point, si c'est pour les parcs Disney, bah je mets la filiale idoine (actuellement Disney Parks, Experiences and Products). Mais il est plus probable que cela soit un parc en particulier. A l'époque, avant 1979 pour le beau Patrick, c'est soit Disneyland en Californie soit Walt Disney World Resort en Floride. Second point, bah il n'y a aucune source pour cette affirmation... 


Après des recherches, il s'avère que c'est faux, car c'était un spectacle itinérant, un Arena show comme dirait les anglosaxons. Il s'appelait Disney on Parade et a parcouru les Etats-Unis et le monde entre 1969 et 1976. Dommage il n'y avait pas encore d'article francophone sur ce spectacle... certains diront qu'un énième article sur Disney n'est pas nécessaire, je plaide coupable et j'ai donc créé un article sur ce spectacle. Et hop me voilà lancé sur l'article Disney on Parade. J'ai aussi corrigé l'article sur Patrick en ajoutant une source. Pour votre information, il a d'abord interprété un cowboy puis le Prince Charmant :D

Pour revenir au nouvel article, je remercie encore une fois la fondation pour l'accès au site Newspapers.com qui m'a permis d'ajouter un grand nombre d'infos. A mon sens l'article est désormais bien développé et le fait que le spectacle soit un prédécesseur de Disney on Ice, permet de compléter la grande trame de Disney. Pas chauvin pour un sou, j'ai même complété l'article sur Bugs Bunny qui a eu le droit à sa déclinaison du concept en 1979.
Le seul problème dans tout cela c'est que ma femme va devoir se faire à l'idée que Patrick Swayze est lié à Disney et pas uniquement pour la voix d'un personnage dans Rox et Rouky 2.