Hello everyone! Here is Harmonia Amanda, squatting Ash_Crow’s blog. Some people told me repeatedly I should write about some of what I did these last few months on Wikidata, e. g. all my work about the RADA (Royal Academy of Dramatic Art) and other things. And after I wrote it in French, some people told me I should write it again in English. So here we are! To ensure that no one will read it, I wrote a long text, stuffed with footnotes,[1] and even with real SPARQL queries[2] here and there. No need to thank me.[3]

How it begins: The Hollow Crown

Everything is because of Ben Whishaw. I was quietly watching Shakespeare’s adaptations by the BBC (and for those who haven’t watched The Hollow Crown, I suggest to do so) and I was thinking that the actor playing Richard II deserved an award for his role, because he was simply extraordinary.[4][5] So I went lurking on his French Wikipedia page[6] and as a good Wikimedian,[7] I decided to make it a little bit better. For now[8] I’ve mostly cleaned up the wikicode and dealt with accessibility for blind-reading software. As I couldn’t instantaneously make it a featured article, I thought it could be fun to complete his Wikidata entry. That was the beginning. As I said, everything is because of Ben Whishaw.

Ben Whishaw in 2008 by KikeValencia – CC-BY-SA

Wikidata : the easy beginning

Wikidata is a free knowledge database with some twenty million entries, under a free license. It’s not made to be directly read by humans (although they can)[9] but to be machine-readable, and to be used in other projects through visualisation tools.[10] I am an experienced Wikidatian by now so, at first, working on Whishaw’s entry seemed easy.

I just had to add more precise occupations (he isn’t just an “actor”, he is a “stage actor”, a “television actor”, a “film actor”…). He received many awards, which should all be listed (P166), as well as for each of them the information about the year it was awarded (P585) and for which work P1686) and even sometimes with whom the award was shared (P1706). And I could do the same work for all the awards he was nominated for (P1411) but didn’t receive. Then I could also list all his roles, which we don’t add to his Wikidata entry but on the works’ entries using “P161 (cast member)” with “Q342617 (Ben Whishaw)” as value. Sometimes we can even use qualifiers, like “P453 (character role)” when the characters themselves have a Wikidata entry (like Q in James Bond).[11]

Wikidata screenshot
Wikidata screenshot

So far, so easy. Well, the thing is, Whishaw is primarily a stage actor. I mean, he became well-known for his heartbreaking interpretation of Hamlet at 23 at the Old Vic.[12] It’s a bit strange to see all his TV and film roles listed and not his theatrical ones (Mojo, Bakkhai…). So I started digging about theatre on Wikidata and let me tell you… it’s at least as much under-treated and messy than on Wikipedia! Which is saying something.[13]

Old Vic Theatre by MrsEllacott – CC-BY-SA 3.0.

Here would be the perfect place to speak about ontologies, semantic web and the questions of knowledge organisation but the consensus between my beta-readers is that my article is already too long and I should focus about the RADA (which is a long time coming) and speak of everything else another time.[14]

The Internet Broadway Database

While I was thinking about the relations between “art”, “work”, “genre” and “performance”,[15] I learned that Whishaw is now[16] in Broadway, where he plays John Proctor in Arthur Miller‘s The Crucible directed by Ivo van Hove.[17] What’s interesting for all of us Wikimedians is that Broadway has already an excellent database (IBDB, Internet Broadway Database). Well done, decently complete, with a limited number of errors;[18] oh joy! And even better: Wikidata already has properties to link to this database (and not only for people; the properties exist also for venues, works and productions).[19]

Walter Kerr Theatre, ad for Grey Garden - Michael J Owens CC-BY 2.0
Walter Kerr Theatre, ad for Grey Garden – Michael J Owens CC-BY 2.0

Of course, no one had properly exploited this database before and there were many errors in the wikidatian uses. So I’ve cleaned up every and each of the uses of these properties on Wikidata.[20] And on Wikipedia, because that’s where the errors came from.[21] I complained about the Wikipedians who add absurd references (or worse, don’t add references at all), who aren’t philosophically unnerved when they add a production identifier to a work entry, or who even seem to think that the IBDB identifier is the same one as the IMDB (Internet Movie Database) identifier (oh hell NO!)[22] but, as I am a Wikimedian, I cleaned up nevertheless.

I came to the conclusion that it would be better if, instead of having some correct links, we linked all the entries. Going from “I-worked-on-Ben-Whishaw-so-I-searched-his-IBDB-identifier” to “this is the complete list of IBDB identifiers, we should find the matching Wikidata entries”. For our joy, there is a truly marvellous tool called Mix n’ Match.[23] Here again I could do a detailed presentation of this tool, but to keep the scope of this article I’ll just say it needs to have the complete list of valid identifiers before working; therefore I started hoarding them all.[24] As it wasn’t an instantaneous process,[25] I needed to do something besides that. For those of you willing to give a hand, you can help me match IBDB entries to Wikidata entries: you can do it for works or for people. Do it carefully and if you are not sure, don’t. Thank you, any help is always appreciated.

Back to when all my scripts were running, I didn’t know exactly what to do to occupy myself, so I went again to Whishaw’s entry[26] and noticed he was a RADA (Royal Academy of Dramatic Art) alumnus.[27]



The cool thing about Wikidata[28] is that not only can we add where people studied (P69) but we can even add numerous details: when they started studying there (P580), when they stopped (P582), what degree they were preparing (P512), their academic major (P812)… There were no references. I didn’t like that at all. I searched for them. I thought: why not try the school’s website? And then… RADA!

RADA Theatre, Malet Street, Londres -- CC-BY-SA 2.0
RADA Theatre, Malet Street, Londres — CC-BY-SA 2.0

Yes. The RADA had put the profiles of its alumni online. Here is Whishaw’s page for the curious ones.[29] Anyway, I was seeking a source and I’ve found a goldmine. My inner Wikimedian went a little dizzy with happiness[30] and I told myself that now, I not only had a reference for Whishaw, I had references for all RADA alumni, with their year of graduation, their degree, everything, and that I could do mad statistics based on SPARQL queries![31] (and that it would give me an occupation when I retrieved the identifiers of all people who ever worked in a Broadway show).[32]

Naively, I thought that the RADA didn’t have so many alumni (approximately a hundred a year in recent years) and so it wouldn’t take me too much time…[33]

Identification of the relevant entries

On Wikidata

To start, I tried to know what already existed on Wikidata. I wrote a little query to find all the existing Wikidata entries with P69:Q523926 (educated at the Royal Academy of Dramatic Art). I cross-checked with the English category. Actually someone had, a few months ago, added P69:Q523926 on all the entries categorised as “Alumni of the Royal Academy of Dramatic Art”.[34] Anyway, at that time I had no intention of writing this blog post, so I didn’t bother writing down the actual number somewhere but it was like ~650, with a very small gap between the Wikidata query and the English category (so only a few Wikidata entries without articles on the English Wikipedia as a working hypothesis). There were more entries listed on the Wikidata query than there were articles in the category (which is logical) but all the categorised articles were correctly present in the Wikidata list. Not too bad as a start.

To follow my progress, I only had to do two queries: the first one to list all RADA alumni and the second one to list all RADA alumni with a year of graduation (which would mean that someone (me) had added the necessary information).

So beware the first SPARQL queries of this article:

SELECT DISTINCT ?student ?studentLabel
  ?student wdt:P69 wd:Q523926 .
 SERVICE wikibase:label { bd:serviceParam wikibase:language "en" . }

link to query.


SELECT ?student ?studentLabel 
  ?student wdt:P31 wd:Q5 . # human
  ?student p:P69 ?statement .                # Student of...
  ?statement ps:P69 wd:Q523926 .        # ...RADA
  ?statement pq:P582 ?x . # with end date
SERVICE wikibase:label { bd:serviceParam wikibase:language "en" . }

link to query.

Easy, as I said.

There were already four or five students for which we had the “end date” information, but we didn’t have a reference, or a reference other than the RADA. I decided not to care and that I would treat these cases at the same time as the others.

On Wikipedia

I had already noted that the whole English category “Alumni of the Royal Academy of Dramatic Art” had the property P69 “educated at” with the RADA value (Q523926) on Wikidata. I knew there were more entries on Wikidata than in the category: where did the difference come from? From uncategorized English articles?[35] From Wikidata entries without a matching article in English?[36]

The category also exists on Wikipedias in others languages: it exists in Spanish, in Arab, in French, in Latin, in Polish, in Russian, in Simple English, in Turkish and in Chinese. But if you visit these pages, you will see they are fairly less complete than the English one (which is logical for a Londonian school) and that they would probably not help me much.[37]

However, the category isn’t the only way to spot students. The English Wikipedia also has a list (List of RADA alumni). This list[38] is interesting because it contains, between brackets, the year of graduation, information missing in the category.

Assuming that all articles present in the category were also on the list, or that all the entries in the list were categorized, was too big of a hope, it seems. Once more, Wikipedia dazzles us with its incomplete management; if there are two systems, of course they won’t match!

Identification: From RADA to Wikidata

I thought the easiest way to begin was to observe the RADA database and search matching entries on Wikidata and Wikipedia. There are indeed many RADA alumni known enough to have a Wikipedia article, but not all of them, let’s not exaggerate. In an ideal world where Wikidata and Wikipedia would have reached completion, once I had verified all the RADA database entries, I should have formally identified the approximately 670 Wikidata entries previously spotted. But as we don’t live in an ideal world and as neither Wikidata nor Wikipedia claims to be complete, I knew before I started that it would very probably not be so easy.

Manual research name by name

At first I thought I would simply search on Wikidata every and each student name listed on the RADA database and hope to find a match. Starting with 1906, the first year with graduates listed[39] as the school opened in 1904.

Very quickly the problems appeared with this painstakingly slow method.

In 1907 for example, the only student listed is “H Bentley”. The Wikidata internal search engine only returns the “H Bentley” and “H. Bentley” with a request with this name. Not “Henry Bentley”, “Harriet Bentley” or whatever. If I had been lucky, someone would have added “H Bentley” as an alias of the wikidata entry label and the search engine would have yielded a result. As I was unlucky but stubborn, I still tried a query like that (not a SPARQL one, it’s an adaptation for Autolist, an old Wikidata tool)[40]:

FIND H% Bentley in Labels in Alias

(link to the autolist query) and hoped it would work.[41] I can also be really dedicated, search for “Bentley” and read quickly all entries… Not as easy as I hoped at first, then.

Typos and database errors

Moreover, the RADA database isn’t immune to typographical errors: I’m reasonably certain that Joan Mibourrrne doesn’t really have three Rs in her last name or Dorothy Reeeve three Es.

Desmond Llewellyn[42] is for example listed on the RADA database as Desmond Wilkinson (Wikipedia says he is called “Desmond Wilkinson Llewellyn”). In fact, that’s not entirely true: he is listed both as “Desmond Llewellyn” (here) and as “Desmond Wilkinson”. Yay duplicate entries![43]

Desmond Llewellyn in 1983 - Towpilot CC-BY-SA 3.0
Desmond Llewellyn in 1983 – Towpilot CC-BY-SA 3.0

Actually there are many duplicates in the RADA database. I think far-fetched that there would really be two different students called “Alison James” and “Allison James” who graduated both in 1954…


Even without typographical errors, if we find a match between a name in the RADA database and a name in Wikidata, it needs verification. The Rose Hersee, graduated in 1908 isn’t the same Rose Hersee as the singer born in 1845.[44] Verification is really necessary! In many cases that means that I had to read the Wikipedia article (which sometimes cites the RADA! Sometimes even with references!) and most importantly the sources used in these articles (honestly, for the first half of the 20th century, it meant reading dozens of obituaries). Sometimes—yay!—I could confirm the match. Sometimes—yay too!—I could confirm that it wasn’t the same person. But often I didn’t succeed with just a short search because the RADA profiles before 1999 are, let’s say, a little bare.

Several students can have the same name, or some people followed several courses (particularly in postgraduate technical studies). On Wikidata, many items share the same label (well, what would you expect from a name like “John Jones”?…), so it is often necessary to filter several hundreds of results to find the most probable person (and I sincerely thank every Wikimedian who ever completed Wikidata descriptions).[45]


They have pseudonyms! Aaaaahhh! And an impressive number of women attained celebrity under their spouse’s name; nobody thought of adding their birth name as an alias on Wikidata. And of course, their RADA entry lists only their original name. Another impressive number of students used pseudonyms (Conrad Havord became known as “Conrad Phillips” for example). Sometimes, it’s even the opposite: the RADA lists the pseudonym they used when they were in the school, or their married name if they were married, or their nickname, and Wikipedia still uses the birth name (for example, June Flewett is listed on the RADA database as Jill Freud, her nickname and husband’s family name). I also like very much Priya Rajvansh listed on RADA as Vera Singh. Each of these cases can only be identified if someone had thought of adding the aliases on Wikidata.[46] And sometimes we even have combo: pseudonyms and typographical errors! We can cite Kay Hammond (pseudonym), whose birth name is “Dorothy Katherine Standing” but who is listed in the RADA website as “Kathrine Standing”. The missing “e” is sufficient for not being returned with a query or a search on Wikidata. Finding her was not easy at all and it was more luck than anything else.

Is Jean Rhys, born “Ella Gwendolen Rees Williams” in 1890 and known for using numerous pseudonyms, the same person as Ella Reeve, the RADA student who graduated in 1909?[47] Vern Agopsowicz became famous under the name John Vernon… I could continue like that for a long time. I went over a hundred “maybe it is them/maybe not” early in April.

Henry Darrow and John Vernon
Henry Darrow and John Vernon – NBC Television, public domain in the USA

Arkanosis helps me!

By then (late March 2016), several Wikimedians already helped me, most notably on my Internet Broadway Database work[48] but one evening in Cléry[49] Arkanosis saw me manually searching the RADA entries and took pity on me. He wrote me a beautiful Linux shell script (later amended by Ash_Crow to become even more easy to use):

#! /bin/sh

if [ $# -ne 2 ]; then
    echo 'Usage:  '
    exit 1


echo "Year $year
      " > list-$profile-$year.html wget -q ''$profile'&yr-acting='$year'&yr-technicaltheatrearts='$year'&crs-technicaltheatrearts=&yr-theatrelab='$year'&yr-directing='$year'&crs-directing=&fn=&sn=' -O - | \ sed -n 's@.*fn=\([^&]*\).*sn=\([^"&]*\).*@\1 \2@p' | \ while read firstname lastname; do echo "
    • $firstname $lastname wikidata" wget -q ''$firstname'+'$lastname -O - | \ sed -n 's@.*title&.*\(Q[0-9]\+\)&.*@\1@p' | \ while read qid; do if grep -q $qid unhandled.lst; then echo " $qid" fi done echo "
" done >> list-$profile-$year.html echo " " >> list-$profile-$year.html

The RADA URLs are systematically constructed like this : year/given name/surname,[50] Arkanosis simply extracted listings by year, a row by student, like this:

  • Student’s name (link to the RADA entry) / Wikidata (link to the search page with the name) / eventually a Qid[51] found in the second link and who also appear in the existing list of P69:Q523926 (entries already marked as RADA students)

For example a row for a student of the “acting” course in 1947 looks like:
harold goodwin wikidata Q1585750

Not all rows have a Qid associated (they were a tiny minority, honestly, as by then only ~650 student were listed and the RADA has had much more than 650 students). Not all Qid lead to correct matches either: as I said, there are some people sharing the same name at the RADA; or the Wikidata search engine was, for once, too generous and yielded combinations of given names/surnames not matching the RADA entry (for example a search for Romany Evens offers George Bramwell Evens on Wikidata). Nevertheless, the majority of the suggested Qid lead to matches, which was a way better result than for the rows without Qid. Thank you Arkanosis and Ash_Crow!

Even with these listings, having only to click on the search links instead of doing dozens of copy/paste, I still needed to verify manually each and every entry.[52] The problem when we use the names from the URLs, is the lack of apostrophes and blank spaces. A search of peter otoole on Wikidata doesn’t yield Peter O’Toole for example. So you still need to add the blank spaces, not just clicking and reading the results.

From RADA to Wikipedia: a temporary conclusion

I’ve spent the end of March, April and early May doing this work. At the end of it, I had identified exactly 835 entries, but of course, the vast majority of alumni didn’t have matches (which was to be expected) and a strangely high number yielded only uncertain results. I have 442 rows in a spreadsheet with each a RADA entry and a possibly matching Wikidata entry. I’ll need to dig deeper to confirm (or not) the matches.

Digging deeper - Hans Hillewaert CC-BY-SA 4.0
Digging deeper – Hans Hillewaert CC-BY-SA 4.0

Identification: from Wikipedia to the RADA

When I finished identifying alumni from the RADA database, I had a problem: there were people listed on the Wikipedia category “Alumni of the RADA” who weren’t on my done list on Wikidata. In a perfect world, at the end of the work on my scripts, the number of Wikidata entries with “studied at:RADA” and the number of Wikidata entries with “studied at:RADA, endtime:something” (and with a RADA reference the query for that) should have been the same. As it isn’t a perfect world, I had people that Wikipedia listed as alumni that I didn’t find in the RADA website. There was some overlap with my “maybe yes/maybe no” list[53] but not so important: my list is mostly composed of people whose drama school I don’t know at all, if they even went to one.

Using PetScan I searched for the list of Wikipedia articles categorized as RADA alumni but which didn’t respond to the query “studied at RADA with an end time”. Link to the automatically updated PetScan query.

I found 132 results, which I—again—treated manually. I identified 23 additional articles (mostly it was cases of pseudonyms or maiden names not present as aliases on Wikidata: they weren’t returned in searches as a result).[54]

At the end of April, the English category listed 907 articles, Wikidata 953 entries and only 850 of them had been correctly completed with a decent reference. And we mustn’t forget that not all Wikidata entries have a matching English Wikipedia article: some actresses and actors have articles on others languages (Norwegian, Italian, German, Romanian…) and a little dozen doesn’t have a Wikipedia article at all, only the Wikidata entry without sitelinks. Their entry was created so Wikidata could list the full cast of a film.

So we query to find the Wikidata entries of RADA alumni without an end date:

SELECT ?student ?studentLabel
  ?student wdt:P31 wd:Q5 .
  ?student p:P69 ?statement .
  ?statement ps:P69 wd:Q523926 .
  FILTER NOT EXISTS { ?statement pq:P582 ?x .}
  SERVICE wikibase:label { bd:serviceParam wikibase:language "en" . }

link to the query.
Usually SPARQL is pretty understandable by humans because it made for querying semantic data. However Wikidata is a multilingual database, which consequently use numeric identifiers.[55] I should comment all my queries but I’m lazy and I take advantage of the Wikidata endpoint which declare itself the needed PREFIX and even offers comments: if you hover over a Pid or Qid, you’ll see the name and description in your language. And you can change this language in the top right corner. So I’m entitled to laziness.[56]


This list contains mostly entries with sitelinks to the English Wikipedia: the SPARQL query above (on Wikidata but without end date for RADA studies) yielded 112 results at the end of April when the PetScan query (in the English category of RADA alumni but without end time on Wikidata) gave us 110 results. One of these is an article deleted on the English Wikipedia after someone imported the category on Wikidata and the other is about a French actress. So all 111 of these “maybe errors, maybe not, but in all cases lacking references” on Wikidata came from the English Wikipedia. I SEE YOU ENWIKI!

The work now is to find under which name the person was registered at the RADA (beware typographical errors…) or to find why they were categorized as students when they weren’t. For example Ash_Crow corrected the article on George Bernard Shaw, listed as student instead of “people associated with” the RADA. He was very implicated in the school and even gave them part of his heritage[57] but never studied here. For Armaan Kirmani, his IMDB entry says that he was the student of a RADA professor… but that doesn’t mean he went to RADA itself.

Men, black and white photograph
George Bernard Shaw in 1915 – Public domain in the USA.

In these dozens of problematic cases, there is a little bit of everything, from articles that don’t mention the RADA at all (why were they ever categorized?), to articles that clearly state that the person was a student (but without any sources),[58] to articles that even have sources but these sources aren’t so explicit… The RADA doesn’t propose exclusively graduating courses; they also organize numerous workshops and internships. If an actor or an actress participated in a two-days workshop at RADA, they won’t appear on the RADA website as a student but they could sincerely say in interviews they learned something at RADA… We are only a step away from an enthusiastic Wikipedian deciding they are alumni.

For example Ash_Crow found a source (in French and of not really great quality) saying that Émilie Rault studied at RADA. She is nowhere on the database because it’s very likely she only did workshops there, as she was also studying musicology at the Sorbonne for her master diploma at the time. This should lead us to question the limits we want to fix to the “studied at” property on Wikidata: do we want to use it exclusively for long formations with diplomas or accept everything including workshops of only a few days?

Differences between the list and the category

Like I already said, the “List of RADA alumni” doesn’t match the articles listed in the category. Systematically, every time I’ve identified someone on Wikidata (and subsequently found their Wikidata article), I added their name on the list and I added the category. So I’ve reduced the gap between the two. The article-list should be more complete than the category, since it can hold red links existing on other Wikipedias.

Xavier Combelle has been kind enough to list the differences between the category and the list in early May, the thirty problematic cases mentioned above remained (missing from the list) and in the list, in addition to the usual red links, we found eighteen uncategorised articles. None of them bore any obvious connection to RADA, except for Xenia Kalogeropoulou which could be identified as Xenia Calogeropoulos and was thus categorised. Among those cases, some Wikipedia articles explicitly mentioned training at RADA as constituting in workshops or interships. We go back to the question: what courses warrant being considered an alumni?

Problems with the RADA database

Having listed issues on Wikipedia and Wikidata sides (which amount of: “people add information without references and that information spread everywhere like an epidemic”), we have to face the fact that some of the problems stem from the RADA database itself.

Completeness of data

As we have already seen, the database is littered with double entries, each pseudonym or name spelling yielding a new page instead of centralising these entries on a unique page associated with the student. This is obviously a problem if you are interested in the number of students for a given year, for instance.

From a Wikidata point of view, this prevents resorting to the simple solution of creating one entry for each student, independently on whether a Wikipedia article exists or not. The Cambridge database, for example, associates a fixed identifier to every student, which enabled us to import these identifiers on Wikidata, creating new entries as needed (P1599: ID of the Cambridge Alumni Database).[59] If the RADA had chosen the solution of one identifier per student instead of the URL of the form diploma/year/first name/last name, it would have been easier to import it in its entirety.

Which brings us to the next problem: we have no certainty that the database is complete at all. Nothing to support that is said on the site. A visit to the Internet Archive’s Wayback Machine shows that the database has only been online since 2015, and that before that date only the current students had a profile on the site. If recent data seem complete (from 1999 on, where profiles are detailed and come with photographs), the profiles of the earlier years are sometimes quite patchy. And in particular, some years seem suspiciously poor in students, such as 1988 and every year before 1922.[60]

Could it be that among the dozens RADA alumni without a match in the database, some have been forgotten? One typical case is the one Noel Streatfeild who, according to her website, attended as a student starting in 1919. I did find a “Noel Goodwin” who graduated in 1922, but is that her?

Another example even more explicit is Dora Mavor Moore, who was the first Canadian who went to RADA, per this biographical article, and who graduated in 1912. The problem is, on the RADA website only one student is listed as graduating in 1912 and “Leonard Notcutt” isn’t a known pseudonym of Dora Mavor Moore.

Data reliability

The more strident problem is that some alumni listed in the RADA database left the RADA before graduation. Someone like Harold Pinter has a RADA profile which says he was part of the 1949 class. In fact, Pinter went to RADA in 1948 and left the course in 1949, before the graduation. Does the RADA list every student, no matter if they are actually graduates or if they didn’t finish? In Wikidata we can use the property “diploma” with “no value” instead of the actual diploma in the qualifiers for the “studied at” property.

Wikidata screenshot to the "studied at" statement of Harold Pinter's entry
Wikidata screenshot to the “studied at” statement of Harold Pinter’s entry

It’s a little bit problematic if we can’t trust the official school website to know who has been graduated there…

I have another problem with the RADA entry of Sheila Terry, whom I think I can match to the Wikipedia article Sheila Terry. It’s very likely she didn’t go to London during her studies; according to Wikipedia, she went to the Dickson-Kenwin academy, “a school affiliated with London’s Royal Academy”. Does that means the Dickson-Kenwin academy was then delivering the RADA diplomas? (before the 2000 reform, the RADA delivered its own diplomas). I lack information.

I also have a Jack May of the 1943 class whose Wikipedia article states explicitly he was admitted to RADA and never went

Never so easy, even when the matchings are done!

What am I doing now?

I still do many other things on Wikidata. This article resumes some of my work but not all, far from it. But to stay somehow on topic I’ll only speak here of what I do in relation with the RADA and theatre in general.

For example, people justly said that Wikidata has a property to indicate the birth name of one person, which should always be present (but isn’t in reality) and is useful in particular in cases of women known under their married name. So I’m working to add these birthnames-in-property as aliases to facilitate the future identification. It’s a lot of fun with little scripts, SPARQL and an healthy use of QuickStatements, a tool made to facilitate bulk editions on Wikidata.

I’m also still working on Mix n’ Match to add the correct IBDB identifiers to Wikidata entries about people and works. You can help me, as I already said above. And it’s not just for the pleasure to have identifiers; when we will have enough of them, we will be able to add many informations about Broadway productions on Wikidata. And that will be fantastic!

I started adding data about theatrical awards too, which is long, somewhat repetitive, but is immediately useful. The English Wikipedia mostly already has articles about the most important awards, but many smaller Wikipedia don’t. I’m working on a lua module to be able to generate a Wikinews article based on Wikidata data:[61] in practice, that will mean watching the Tony awards ceremony, adding the data on Wikidata and immediately after the end being able to have a complete table with links and everything just using a template.[62] And that in dozens of languages. Great, no?

I still have to reduce my two lists of RADA students:

  1. one with people categorized as alumni but whom I didn’t find in the RADA website (errors? workshops? missing?): ~112
  2. one with Wikidata entries I think match a RADA student but I don’t have a definite proof: ~400

Solving these two lists should help me reduce the gap between the English category and the English list. And by the way I’m very proud of my French list of RADA alumni, which has names, date, course, diploma, nationality and even some pictures!

I wrote to the RADA archivist in June to at least inform him of the typrographical errors found in their database but he didn’t write me back for now. Which probably can be explained by the fact the RADA archives are moving to a new building this summer. They are probably pretty busy!

And of course, for a purely Wikidatian point of view, I officially launched the WikiProject:Theatre this week. That’s for every Wikidatian new or confirmed who want to join me in my mad quest.

Curious and fun queries and statistics

Everything being said, we still have an interesting sample with ~850 entries. It’s only a small percent of all RADA alumni (and the technical courses are vastly under-represented) but it’s enough to start to have fun with SPARQL queries. We can ask pretty much anything!

If you want to see the results of the queries, click on the links then sur “Run” and a few seconds after, you will be able to explore the answers yourself!

Number of RADA student with a Wikidata entry by year

Well, starting easily, maybe we don’t want the list of RADA alumni but only the number of them with an entry by year of graduation:

SELECT ?year (COUNT(?student) AS ?number)
  ?student wdt:P31 wd:Q5 .
  ?student p:P69 ?statement .
  ?statement ps:P69 wd:Q523926 .
  ?statement pq:P582 ?endtime .
  BIND(YEAR(?endtime) as ?year) . 
} GROUP BY ?year ORDER BY ?year

Query link.

Screenshot of the SPARQL query
Screenshot of the SPARQL query

We can then do this beautiful graph:

RADA alumni with a Wikidata entry by year of graduation
RADA alumni with a Wikidata entry by year of graduation

Average age at graduation

Maybe we can go further. Now that we know when they graduated, can we know at what age they did it? This means our sample will be reduced to the entries with a birthdate of course.

SELECT ?endYear (AVG(?age) AS ?averageAge)
 ?person p:P69 ?radaStatement .
 ?radaStatement ps:P69 wd:Q523926 .
 ?radaStatement pq:P582 ?endDate .
 ?person wdt:P569 ?birthDate .
 BIND(YEAR(?endDate) AS ?endYear)
 BIND(?endYear - YEAR(?birthDate) AS ?age)
} GROUP BY ?endYear ORDER BY ?endYear

Query link

Screenshot of the SPARQL query
Screenshot of the SPARQL query

Or even something more fun: the average age of graduation (with entire values only, this time), by year and by gender (only “male” and “female” in our sample, but the query could handle others) and to have appearance of seriousness, the number of people in the sample:

SELECT ?endYear ?genderLabel (ROUND(AVG(?age)) AS ?averageAge) (COUNT(?person) AS ?number)
    ?person p:P69 ?radaStatement .
    ?person wdt:P21 ?gender .
    ?gender rdfs:label ?genderLabel filter (lang(?genderLabel) = "en") .
    ?radaStatement ps:P69 wd:Q523926 .
    ?radaStatement pq:P582 ?endDate .
    ?person wdt:P569 ?birthDate .
BIND(YEAR(?endDate) AS ?endYear)
BIND(?endYear - YEAR(?birthDate) AS ?age)
} GROUP BY ?endYear ?genderLabel ORDER BY ?endYear

Query link. I should really do an age pyramid but I suffer of a fit of laziness.[63]

screenshot of the SPARQL query
screenshot of the SPARQL query

Timeline of graduates

That was fun but I want something more human-readable, like a timeline with pictures!

SELECT DISTINCT ?person ?personLabel ?personDescription (SAMPLE(?GraduationDate) AS ?date) (SAMPLE(?photo) AS ?pic)
  ?person wdt:P31 wd:Q5 .
  ?person p:P69 ?statement .
  ?statement ps:P69 wd:Q523926 .
  ?statement pq:P582 ?GraduationDate .            
OPTIONAL { ?person wdt:P18 ?photo . }
SERVICE wikibase:label { bd:serviceParam wikibase:language "en" . }
} GROUP BY ?person ?personLabel ?personDescription ORDER BY ?date

Query link. You just needed to ask! Beware that this query is heavy and can slow down your browser.

Screenshot of the SPARQL query - timeline
Screenshot of the SPARQL query – timeline

How many nationalities were represented in RADA?

We can do a query to list all the nationalities, and for each the number of students involved, in decreasing order.

SELECT ?nationality ?nationalityLabel (COUNT(?student) AS ?number) {
  ?student p:P69 ?statement .
  ?statement ps:P69 wd:Q523926 .
  ?statement pq:P582 ?endtime .
  ?student wdt:P27 ?nationality .
  ?nationality rdfs:label ?nationalityLabel filter (lang(?nationalityLabel) = "en") .
} GROUP BY ?nationality ?nationalityLabel ORDER BY desc(?number)

Query link. Surprisingly[64] the most frequent is the… British. But hey! More than thirty nationalities!

Screenshot of the SPARQL query
Screenshot of the SPARQL query

If we just add, as the first line of the query:


we obtain the results as a bubble chart.[65] It’s explicit:

Map of birth places of RADA students

I don’t really care what nationalities the alumni are… but I would love to see a map of birthplaces! And I can do that directly in SPARQL!

SELECT DISTINCT ?coords ?birthplaceLabel ?person ?personLabel
  ?person wdt:P31 wd:Q5 .
  ?person wdt:P69 wd:Q523926 .   
  ?person wdt:P19 ?birthplace .
  ?birthplace wdt:P625 ?coords.
SERVICE wikibase:label { bd:serviceParam wikibase:language "en" . }

Query link.

Map of RADA alumni birth places
Map of RADA alumni birth places

If you run the query, you can zoom!

Layered map of birth places of RADA students by graduation date

Just a simple map? But why not make a layered one? We could ask for a map showing the birth places of RADA graduates, one layer by decade of graduation!

SELECT DISTINCT ?coords (floor(year(?endtime)/10)*10 as ?layer) ?birthplaceLabel ?student ?studentLabel {
  ?student wdt:P31 wd:Q5 .
  ?student p:P69 ?statement .
  ?statement ps:P69 wd:Q523926 .
  ?statement pq:P582 ?endtime .
  ?student wdt:P19 ?birthplace .
  ?birthplace wdt:P625 ?coords.
SERVICE wikibase:label { bd:serviceParam wikibase:language "en" . }

Query link. Run it and play with the layers!

Screenshot of the query
Screenshot of the query

Number of RADA alumni cast in a James Bond film

Do you remember that Whishaw and Llewellyn played Q? Exactly how many RADA students did play in a James Bond film?

SELECT DISTINCT ?actor ?actorLabel
  ?film wdt:P179 wd:Q2484680 .
  ?film wdt:P161 ?actor .
  ?actor wdt:P69 wd:Q523926 .
  SERVICE wikibase:label { bd:serviceParam wikibase:language "en" . }
} ORDER BY ?actorLabel

Query link.
More than forty!


RADA alumni by James Bond films, ordered by date

Hsarrazin liked my James Bond query but she wanted more: she wanted to know which former student was cast in which James Bond film, and to order the results by publication date of the film. Of course this means that people who worked in several films are listed several times.

SELECT DISTINCT ?actor ?actorLabel ?film ?filmLabel ?year
  BIND(YEAR(?date) AS ?year)
  ?film wdt:P179 wd:Q2484680 .
  ?film wdt:P577 ?date .
  ?film wdt:P161 ?actor .
  ?actor wdt:P69 wd:Q523926 .
SERVICE wikibase:label { bd:serviceParam wikibase:language "en" . }
} ORDER BY ?year

Query link.

Screenshot of the query results
Screenshot of the query results

RADA alumni by James Bond films, in a graph

I don’t actually know why Hsarrazin wanted a table, when we could have all RADA alumni playing in a James Bond film as a graph:

SELECT DISTINCT ?actor ?actorLabel (concat("24890D") as ?rgb) ?film ?filmLabel ?year
  BIND(YEAR(?date) AS ?year)
  ?film wdt:P179 wd:Q2484680 .
  ?film wdt:P577 ?date .
  ?film wdt:P161 ?actor .
  ?actor wdt:P69 wd:Q523926 .
SERVICE wikibase:label { bd:serviceParam wikibase:language "en" . }
} ORDER BY ?year

Query link. Beware, this query is heavy, even more than the timeline one.[66]

Screenshot of the graph generated by the query
Screenshot of the graph generated by the query

And in all films?

Well, James Bond is great, but why limit ourselves to it? Can’t we just have all films on Wikidata with more than 5 actors or actresses listed in the casting, ordered by the number of them who studied at RADA?

SELECT DISTINCT ?film ?filmLabel (COUNT(?actors) AS ?nbActors)
  ?film wdt:P31/wdt:P279* wd:Q11424 .
  ?film wdt:P161 ?actors .
  ?actors wdt:P69 wd:Q523926 .
 SERVICE wikibase:label { bd:serviceParam wikibase:language "en" . }
} GROUP BY ?film ?filmLabel ORDER BY DESC(?nbActors)

Query link.


Films by rate of actors and actresses who studied at RADA

That’s fun but I want even more fun: it’s not exactly the same if there are five RADA actors-actresses in a distribution of eight or in a distribution of one hundred. I want all films with at least five people in casting ordered by rate of RADA students!

SELECT DISTINCT ?film ?filmLabel ((xsd:float(?nbRadaActors)/xsd:float(?totalNbActors)) AS ?rate)
    SELECT DISTINCT ?film (COUNT(?actors) AS ?nbRadaActors) {
      ?film wdt:P31/wdt:P279* wd:Q11424 .
      ?film wdt:P161 ?actors .
      ?actors wdt:P69 wd:Q523926 .
    } GROUP BY ?film
    SELECT DISTINCT ?film (COUNT(?actors) AS ?totalNbActors) {
      ?film wdt:P31/wdt:P279* wd:Q11424 .
      ?film wdt:P161 ?actors .
    } GROUP BY ?film HAVING (?totalNbActors >= 5)
  SERVICE wikibase:label { bd:serviceParam wikibase:language "en" . }
} ORDER BY DESC(?rate)

Query link. Honestly the more “high rated” are probably films with an incomplete cast but I love this query anyway.


RADA alumni who worked in Broadway

Remember when we worked on the Broadway database? How many RADA students ever worked in Broadway? (We are considering that “working in Broadway” means “having an Internet Broadway Database identifier”). Well at least…

SELECT DISTINCT ?human ?humanLabel
  ?human wdt:P31 wd:Q5 .
  ?human p:P1220 ?ID .
  ?human wdt:P69 wd:Q523926 .
SERVICE wikibase:label { bd:serviceParam wikibase:language "en" . }

Query link. 276 listed mid-August 2016!

Screenshot of the query results
Screenshot of the query results

RADA alumni with a Tony award win or nomination

So… if RADA alumni worked in Broadway… how many of them were nominated to or received a Tony award?

SELECT DISTINCT ?human ?humanLabel ?reason ?distinctionLabel (year(?date) as ?year) 
    ?human wdt:P69 wd:Q523926 .
    ?human ?prop ?distinctionStatement .
    ?distinctionStatement ?propS ?distinction .

    VALUES (?prop ?propS ?reason) {
      (p:P1411 ps:P1411 "nominated for") 
      (p:P166 ps:P166 "award received")

    ?distinction wdt:P31*/wdt:P279 wd:Q191874 .

    OPTIONAL { ?distinctionStatement pq:P585 ?date . }
    ?human wdt:P31 wd:Q5 .

 SERVICE wikibase:label { bd:serviceParam wikibase:language "en" . }

} ORDER BY ?humanLabel ?distinction ?year

Query link. More than one hundred!

Screenshot of the query results
Screenshot of the query results

And by the way we should verify that all people nominated to or awarded a Tony Award have an IBDB identifier! (if all is right in the world, this query should lend you a “No matching records found”):

SELECT DISTINCT ?human ?humanLabel
  ?human wdt:P31 wd:Q5 .
  ?human wdt:P1411*/wdt:P279 wd:Q191874 .
  FILTER NOT EXISTS { ?human wdt:P1220 ?ibdb . }
 SERVICE wikibase:label { bd:serviceParam wikibase:language "en" . }

Query link.

All Tony Awards!

Hey! Can we list all people nominated to/awarded a Tony, by win/nomination, by award and by year? Like everyone ever? Well yes, of course, it’s SPARQL!

SELECT ?human ?humanLabel ?reason ?distinctionLabel (year(?date) as ?year)
  ?human ?prop ?statement .
  ?statement pq:P805 ?ceremony .
  ?ceremony wdt:P31 wd:Q24569309 .
  ?statement ?propS ?distinction .
  VALUES (?prop ?propS ?reason) {
    (p:P1411 ps:P1411 "nominated for") 
    (p:P166 ps:P166 "award received")
  OPTIONAL { ?statement pq:P585 ?date . }
  SERVICE wikibase:label { bd:serviceParam wikibase:language "en" }

} ORDER BY ?year ?distinctionLabel

Query link.

Screenshot of the query results
Screenshot of the query results


  1. I’m not done;
  2. I hope the RADA archivist will be as kind as he seems;
  3. People, seriously, you should add aliases on Wikidata items;
  4. And sources. Sources are great;
  5. And you also should take photographs of Ben Whishaw, we are clearly lacking on free Whishaw’s pictures;
  6. Isn’t SPARQL a lot of fun? Whatever your question, someone can ask Wikidata for the answer![67]

(main picture :Pediment of the RADA building in Gower Street, by Chemical Engineer, CC-BY-SA 3.0)

  1. Like this one.
  2. If you went for the SPARQL queries, you should know that they were made for the Wikidata endpoint where most PREFIX are already declared.
  3. But if you have already read it in French, you can still read it again: I updated it!
  4. He isn’t the only one, Rory Kinnear is also excellent in Bolingbroke (and Patrick Stewart makes a terrific Gaunt ♥) but Bolingbroke is interesting in Shakespeare’s play, meanwhile Richard II is the guy who declaims too long monologues without being clearly a good guy we could attach ourselves to or a bad guy we could unashamedly hate. In my experience, in the previous adaptations I saw, it was either a very tiring character or a character played so badly it became funny. He really develops as a character in the fourth act which is a bit late, to be honest. But Whishaw as a child-king-turned-into-an-adult-but-not-really, sometimes capricious, sometimes christic, always mercurial, made me believe in this character long before the Fourth Act. I could write an entire blog article about The Hollow Crown, actors, costumes and sets (and the cinematography! it was really good too) but I’m theoretically here to speak about Wikidata and the RADA and you’ll see it’ll be long in coming…
  5. Actually, he did receive a BAFTA award for this role so my opinion was somewhat shared, it seems.
  6. Yes, I’m French. In case the fact I wrote the first version of this text in French escaped you.
  7. Yes, I’m not only French but a Wikimedian one at that.
  8. Yes, I’m collecting sources and references to redact completely anew the article but first of all, I never wrote an article about a living person, and secondly, I was somewhat occupied since then, as you’ll see if you pursue your reading.
  9. Actually, if you want to read Wikidata and not modify it, I strongly suggest you to use Reasonator, whose slogan is “Wikidata in pretty”.
  10. If you don’t know Wikidata at all and are curious, this Commons category hosts several presentations.
  11. Yes, because Whishaw also played in James Bond and by the way there are many Shakespearean actresses and actors in the last James Bond’s films.
  12. Yes, because Richard II wasn’t even his first Shakespearean role, and not even his second, as he played Ariel in the film adaptation of The Tempest with Helen Mirren as Prosper(a). It isn’t a really good film, frankly, but it needs to be seen because Mirren and Whishaw.
  13. It’s very marginally better on the English Wikipedia than it is on the French Wikipedia, but my point still stands.
  14. And honestly you don’t really need to understand all of that to understand what I do, or even to do the same yourself. It’s fascinating and compelling and if you are interested that’s pretty great, but don’t be frightened or put out if you aren’t.
  15. If by chance you are a specialist of upper ontologies, I would be honoured to talk to you.
  16. Well, uh, he was when I first wrote this article, but the run has ended now.
  17. You are maybe totally indifferent to this information but I would have so loved to go to Broadway to see it…
  18. Not only the IBDB has really few errors, they correct it in less than a week when we tell them.
  19. Yes, I created the Wikidata entry of The Crucible production.
  20. Not sure if it’ll make you laugh but it was the first time I saw a property where all uses were wrong. P1218 has won entry in my personal wtf? ratings. It’s cleared up now, obviously.
  21. In my experience, if there is an error on Wikidata, it nearly always comes from Wikipedia and the IBDB was no exception.
  22. Catalan Wikipedia, I see you!
  23. Which also exist in mobile phone version for people wanting to complete Wikidata on their mobile phones (and who have a mobile phone which can go to the internet).
  24. With help from fellow Wikimedians. They are, objectively, fantastic people.
  25. But I’m done now for this English version of the article! Yay me!
  26. It’s still his fault.
  27. Who said “finally!”?
  28. In fact, there are many cool things about Wikidata.
  29. Where we learn he listed “cat breeding” as a special interest, very important information, admit it, which I couldn’t add on Wikidata. I’m the disappointment incarnated.
  30. I will deny that I cooed at my computer seeing that. Well, maybe not deny. But it was in a dignified sort of way!
  31. SPARQL is the language with which you can ask questions to a semantic database and it answers. And I love SPARQL.
  32. Did you know that more than ~150 000 people worked at Broadway?
  33. I’m a deeply optimistic kind of person.
  34. Action also known as “how to upload Wikipedias’ errors on Wikidata”, see previous note.
  35. Spoiler: Yes, in part.
  36. Spoiler: Yes, that too.
  37. Since then, I did a little bit of work on the French one, so it’s not as bad now as it was back then.
  38. List which is organized manually and not as a sortable table! It’s totally stupid, as we can’t easily sort by year for example, or by diploma. Urrrgh. (I created the French list at the end on July 2016 as a sortable, referenced table, just because).
  39. In this precise case, only one.
  40. I should try to do that one in SPARQL too!
  41. Spoiler: no. I still don’t know who is “H Bentley”. They very probably don’t have a Wikidata entry yet.
  42. Because Whishaw isn’t even the first RADA student to have played Q in James Bond.
  43. And here disappears the hope to know what % of RADA alumni have a Wikidata entry. Sigh.
  44. Which the RADA kindly confirmed on twitter. I love them!
  45. Descriptions are good! Descriptions are great! We love descriptions!
  46. Aliases are good! Aliases are great! We love aliases too!
  47. I really think so but I haven’t found a reference to back this claim yet. Some cases are much more difficult.
  48. Ahah, had you forgotten?
  49. Wikimedia France has a welcoming space for Wikimedians on rue de Cléry in Paris and we can be found there regularly.
  50. Thank you RADA technicians to have chosen to do that consistently!
  51. Wikidatians call “Qid” the Wikidata identifier of an item because the identifier always begin by “Q”.
  52. Finally, the RADA has had too many alumni. Not optimistic any more.
  53. Which second the “maybe yes” hypothesis.
  54. Haven’t I already said how much I love aliases? It bears repeating.
  55. Which are strangely less understandable if you don’t happen to memorize that “Q523926” means “Royal Academy of Dramatic Art”.
  56. So there.
  57. Which was very kind of him.
  58. Like Margaret Rutherford: someone added summarily the information in 2008, the page is categorized in 2010…
  59. Mix n’ Match can tag an identifier as needing a Wikidata entry to be created.
  60. With the exception of 1908 and 1909, all other years only have a unique student listed.
  61. But frankly, my lua isn’t good enough right now.
  62. Tpt created a similar lua module for me when I worked on sled dog races. You can see it in use in this French Wikinews article: the table is dynamic and show the content of the race’s Wikidata entry.
  63. Yes, again.
  64. Or not.
  65. No surprise here.
  66. Am I the only weird one out there who like to poke the graph and see it rearrange itself all around my screen?
  67. And I can write footnotes, which are clearly the other fun part of this article, hands down.

En outre cette solution, qui n'est pas la panacée, va donc devenir de plus en plus énergivore : en effet pour savoir si un lien est mort il est nécessaire d'y accéder de façon automatique mais au vu de la quantité de

Enfin, les Rennais préparent déjà la rentrée avec des ateliers, stands, une sortie photo dans les Côtes d’Armor et d’autres rencontres à venir !


Les Wikimédiens d’Orléans ont organisé le samedi 28 mai 2016 une sortie photo pour valoriser le Val de Loire, classé au patrimoine mondial de l’UNESCO. Partis à 9h de la place du Martroi à Orléans, les Orléanais ont remonté le cours du fleuve en prenant des photos pour documenter Wikimédia Commons. Sous un temps superbe, le groupe a pique-niqué dans la commune de Chécy avant de rentrer sur Orléans où ils ont été accueillis à l’espace de co-working Eurêka pour commencer le tri et le téléversement des photos. Cette première action du groupe orléanais ouvrent la voie à plusieurs projets d’actions grâce à la présence d’un lieu partenaire et plusieurs contacts intéressants pour la suite.



Bustes d’empereur romains de la Villa Chiragan, musée Saint-Raymond de Toulouse. Pierre-Selim, CC-by-SA 4.0.

A l’occasion des journées nationales de l’archéologie, le musée Saint-Raymond, musée d’antiquités de Toulouse, a accueilli une quinzaine de contributeurs à Wikipédia dans sa bibliothèque. Traductions, photographies, wikidata, création et développement d’articles : une après-midi intense et productive, forcément trop courte !


Le groupe local a rencontré les archives départementales de l’Hérault pour discuter d’un partenariat. Il viserait, dans un premier temps, à sensibiliser tous le personnel (~60 personnes) au mouvement Wikimedia, à ses valeurs, ses principes et ses projets. Dans un second temps, pour former les personnels volontaires à contribuer sur Wikipédia et Wikimedia Commons, principalement. Les archives départementales étudient le versement de plusieurs documents sur Commons, et identifient des articles à améliorer liés à ces documents. Une convention de partenariat avec Wikimédia France est à l’étude, et tout ceci pourrait déboucher sur d’autres ateliers de sensibilisation, notamment aux usagers des Archives.


Écho de l’International

Wikimania 2016 à Esino Lario

photo de groupe à la Wikimania

photo de groupe à la Wikimania

Du 21 au 28 juin se déroulait la 12e Wikimania à Esino Lario, un petit village de Lombardie. Plusieurs membres de Wikimédia France étaient présents lors de cet événement. Une rencontre WikiFranca (collaboration entre les chapitres francophones de Wikimédia et les groupes de travail affiliés) s’est tenue lors de laquelle a notamment été abordée la question de l’organisation de la prochaine Wikimania qui aura lieu à Montréal. Les membres du groupes lyonnais Lyokoï, Noé et Benoît Prieur ont présenté, lors d’une conférence, les succès du Wiktionnaire francophone et les projets à venir autour de son développement.

Jean-Frédéric (notre secrétaire adjoint) a, quant à lui, participé au Hackathon qui précédait la Wikimania, et durant cette dernière a présenté le projet WikiLovesMonument et les évolutions futures de cette action d’envergure.

Infos de la Wikimedia Foundation

Lors de la Wikimania, Jimmy Wales a annoncé la nomination de Katherine Maher comme nouvelle Directrice exécutive de la Wikimédia Foundation. Elle avait assuré l’intérim après le départ de l’ancienne directrice Lila Trétikov. Christophe Henner, ancien président de Wikimédia France, a été élu président du Bureau.

Katherine Maher

Katherine Maher

Conseil d’administration

Subvention comité de distribution des fonds

Le Funds Dissemination Committee (FDC, ou Comité de distribution des fonds) a donné ses recommandations pour les demandes de subventions faites en avril, et ce pour les 5 organisations du mouvement Wikimedia qui demandent à cette période de l’année. Wikimédia France avait demandé 636 000 euros et se voit attribuer 570 000 euros. Pour comparaison, la demande de l’année dernière avait été de 600 000 euros et la recommandation avait été de 540 000 euros. De façon très résumée, le FDC apprécie le rôle de leader dans le mouvement ainsi que la grande majorité des programmes décrits, mais pense qu’une subvention complète n’aurait pas un impact suffisamment important.

Composition du Conseil d’administration

Christophe Henner a quitté le Conseil d’administration et son poste de président du fait de sa nomination au Conseil d’administration de la Wikimedia Foundation puis de son élection comme président du Bureau de Fondation. Il a en effet été élu par le collège des 40 organisations Wikimedia, et s’est d’ailleurs retrouvé en tête des préférences de vote. Le bureau a été reformé, mais seule la présidence change : Émeric Vallespi, alors vice-président, devient président, et Samuel Le Goff devient vice-président.

Direction Wikimédia France, week-end CA de mai 2016-7

Direction Wikimédia France, week-end CA de mai 2016-7

Plan d’actions


Une nouvelle classification voit le jour pour le plan d’actions de l’association. Les détails restent à terminer, mais cette nouvelle classification sera utilisée pour le prochain exercice, débutant au 1er juillet. L’ancienne comprenait 6 axes de programme (et un 7e pour l’organisation interne) ; la nouvelle classification proposée comprend 3 axes uniquement :

  1. Accroissement des contenus
  2. Animation de communautés
  3. Actions sur l’environnement


Les avantages de cette modification sont multiples :

  • fait écho à notre démarche qualité précédente et à ses trois niveaux d’impact,
  • est cohérente avec notre offre de services,
  • facilite la communication auprès des parties prenantes externes (principalement pour la levée de fonds) et respecte la recommandation de la WMF sur le fait d’être « focus »,
  • encapsule les Global metrics (aucune n’étant ainsi laissée de côté).

Partenariat pour un Gouvernement Ouvert

Wikimédia France intègre le comité de programme du Partenariat pour un Gouvernement Ouvert (PGO, ou Open Government Partnership en anglais). Ce comité aura pour mission d’aider à construire le programme du 4ème sommet mondial du PGO, et Wikimédia France siège pour la société civile aux côtés de deux autres associations (HelloAsso et OpenLaw). Nathalie Martin et Emeric Vallespi y représenteront l’association, et consulteront d’autres associations qui œuvrent sur les communs. Plus d’informations sur le billet de blog.

Groupes thématiques


Après l’adoption d’une liberté de panorama avec restriction au commercial, la bataille continue. En effet, à travers le projet de loi création, le gouvernement met gravement en danger le rayonnement du patrimoine français : l’article 24 du projet de loi Patrimoine acte la nécessité d’obtenir une autorisation pour toute réutilisation commerciale d’une illustration représentant un domaine national. Vous imaginez les conséquences sur l’environnement Wikimédia comme par exemple le retrait de centaines de photographies sur Commons de ces fameux domaines nationaux, alors même que ces bâtiments sont tombés dans l’espace public !

Mais ce n’est pas tout, la deuxième mesure concerne la mise en place d’une redevance obligatoire liée à l’indexation des moteurs de recherche. Ces derniers vont devoir payer pour avoir le droit d’indexer des photos et illustrations et les présenter dans les résultats. Toutes les images qui vont être publiées sur Internet vont être automatiquement mises en gestion auprès des différentes sociétés d’ayants-droit. Cette affiliation d’autorité ne permettant pas d’identifier les auteurs, ni le statut juridique des contenus, les sommes vont êtres versées directement par les moteurs de recherche à ces sociétés de perception et de répartition des droits, sans que les auteurs touchent quoi que ce soit. Conséquences : des licences Creative Commons vidées de leur sens car rendues inopérantes et des images illicites qui vont générer des revenus similaires aux images licites.

Face à ces régressions qui ne correspondent pas du tout à la réalité des usages, nous mobilisons des médias, et nous dénonçons cela lors de nos rendez-vous publics, dernièrement à la Gaîté Lyrique à travers une table ronde sur l’open content culturel.

Pour plus de place dans l’espace public, nous avons formé un groupe de travail avec République citoyenne ainsi que d’autres associations où nous représentons la société civile, dans le cadre de l’Open Governnment Partnership, dont le sommet aura lieu en Décembre prochain. Wikimédia France fera d’ailleurs partie du comité de programme du sommet.



Sarah Krichen

Depuis le 6 juin 2016, Sarah Krichen est la nouvelle Chargée de Mission Communication et Événementiel à Wikimédia France. Vous pouvez la joindre à l’adresse suivante :


D’octobre 2015 à mai 2016, 60 classes du secondaire ont participé au Wikiconcours lycéen.

Cette action, organisée pour la quatrième année consécutive, associe le CLEMI (Centre de liaison de l’enseignement et des médias d’information) à Wikimédia France pour proposer aux lycéens et lycéennes de contribuer à Wikipédia (création d’articles et enrichissement de contenus existants). Le projet s’inscrit dans une démarche d’éducation aux médias et à l’information ainsi que d’éducation au numérique. L’écriture collaborative est au centre du travail et mobilise des compétences essentielles telles que savoir chercher, savoir organiser, savoir vérifier, savoir publier.

Ce Wikiconcours lycéen a rassemblé dix-sept académies et six lycées français à l’étranger : Aix-Marseille, Bordeaux, Caen, Corse, Créteil, Dijon, Grenoble, Guadeloupe, Lille, Montpellier, Nancy-Metz, Orléans-Tours, Paris, Poitou-Charentes, Rennes, Strasbourg, Toulouse, New-York (États-Unis), Port-Vila (Vanuatu), Tamatave (Madagascar), Londres (Royaume-Uni), Braila (Roumanie) et Madrid (Espagne).

Les coordonnateurs du CLEMI ont bénéficié d’une formation à la contribution en décembre 2015 ; les élèves, enseignants et documentalistes ont pu s’appuyer sur une page de ressources et d’aide dont l’objectif est de les guider dans leur découverte de Wikipédia. Une page de discussion a également permis des interactions avec la communauté wikipédienne.

Lauréats :

  • Le prix de la rédaction et de la contribution, qui récompense la qualité des contributions, est décerné au lycée français de New-York (États-Unis) ;
  • Le prix de la communauté, qui récompense le travail collaboratif et les interactions avec les Wikipédiens, est attribué à l’établissement Voltaire (Orléans, académie d’Orléans-Tours) ;
  • Le prix coup de cœur revient à l’établissement Jean Monet (Annemasse, académie de Grenoble)

Fiche pratique: Les outils de communication à disposition des groupes locaux


Vous animez un atelier, vous organisez une formation ou vous souhaitez présenter les projets Wikimedia à un possible partenaire, vous pouvez avoir besoin de documentations ou d’outils prêts à être utilisés. Grâce à vos identifiants du Wikimembres, vous pouvez consulter et choisir les documents dont vous pourriez avoir besoin.

Où puis-je trouver ces outils?

Sur le Wikimembres :

Comment recevoir ces documents?

Vous souhaitez recevoir ces outils de communication pour préparer un atelier ou une formation? Vous pouvez envoyer une demande de documentation par mail à Pierre-Antoine Le Page ( ou à Rémy Gerbet (

Vous souhaitez être formés?

Si vous souhaitez qu’une formation aux différents dispositifs mis à votre disposition par Wikimédia France ou plus largement aux projets Wikimédia soit organisée près de chez vous, ou si vous souhaitez être accompagné par rapport à une autre thématique, n’hésitez pas à contacter Mathieu Denel <>.

Wikimédia France

Wiki loves archaeology

Journées nationales de l’archéologie au musée Saint-­Raymond de Toulouse

Le musée Saint-Raymond, musée des antiques de Toulouse, est le musée archéologique de la ville situé dans l’ancien collège Saint-Raymond à proximité de la basilique Saint-Sernin. Il offre aux visiteurs une riche collection de sculptures et d’objets issus de fouilles réalisées à Toulouse et dans la région. Il développe une politique dynamique et audacieuse d’action culturelle favorisant l’expérience participative des publics comme dans l’exposition présentée actuellement « Archéo. Une expo à creuser ! »

Christelle Molinié (membre des projets GLAM) travaille à la bibliothèque de Toulouse où elle assure, entre autres choses, des formations à la publication sur Wikipédia à destination des usagers et de ses collègues. Dans le cadre de ses précédentes fonctions au musée des Augustins, elle a participé à un projet de valorisation des collections via les projets Wikimédia. Elle est intimement convaincue de l’intérêt pour les institutions culturelles d’investir les projets Wikimédia pour accomplir leur mission fondamentale de service public autour de la médiation du patrimoine dans un esprit d’ouverture et de partage.


L’atelier co-­organisé par le groupe local de Wikimédia et le musée Saint-Raymond a affiché complet ce samedi 18 juin après­ midi et on était probablement bien mieux à Tolosa en narbonnaise qu’à Narbonne­-Plage !

13 contributeurs accompagnés de deux membres de l’équipe de la conservation se sont retrouvés à la bibliothèque du musée pour enrichir les plateformes Wikimédia à partir des ressources documentaires mises à disposition autour des thèmes de l’archéologie, du musée et de ses collections. Cet atelier s’est tenu dans le cadre des Journées nationales de l’archéologie (17-­19 juin) qui ont pour objectif de promouvoir la diffusion des connaissances autour de l’archéologie auprès des publics, une ambition partagée par les projets Wikimédia.

La préparation en amont

On peut saluer l’implication particulière de l’équipe du musée dans la préparation de l’événement qui avait élaboré une proposition de thèmes à traiter et assuré la sélection bibliographique et documentaire correspondantes.

Une communication forte et bien relayée a par ailleurs été assurée via le site Internet, les réseaux sociaux et le programme des JNA.

Le Jour J

Le groupe de contributeurs a bénéficié d’une visite préalable du musée avec un accent mis sur les objets proposés à la publication. Très rapidement les rôles se sont répartis entre les photographes, les rédacteurs et les formateurs auprès des néo-­contributeurs. Les deux membres du musée ont assuré un support scientifique très utile durant tout l’atelier pour répondre aux demandes ponctuelles complémentaires.

Certains ont travaillé à l’amélioration et l’enrichissement d’articles Wikipédia comme celui portant sur le musée Saint ­Raymond et d’autres ont créé des articles sur des œuvres phares de la collection. Les photographes ont réalisé des prises de vue dans les salles venant enrichir les campagnes photos déjà réalisées par des Wikimédiens à l’occasion d’expositions temporaires comme L’Image et le pouvoir en 2012.

Tout cela s’est déroulé dans un climat très convivial et dans le plaisir de la découverte, du partage et de l’échange.

Atelier au musée Saint-Raymond Photographe : Pierre-Selim

Atelier au musée Saint-Raymond
Photographe : Pierre-Selim

Et après ?

Le travail reste à poursuivre car les 4 heures d’atelier sont très vite passées.

Les articles ébauchés sur des pages brouillon seront publiés sur Wikipédia et les photos traitées et versées sur Wikimedia Commons dans les semaines venir. Une réflexion doit être menée sur la catégorisation des images et chaque œuvre photographié sera référencée sur Wikidata à partir des données d’inventaire fournies par le musée.

Le MSR nous invite déjà à renouveler l’expérience. Il encourage les photographes à poursuivre les prises de vues étant lui même un utilisateur régulier de Wikimedia Commons pour illustrer ses propres publications.

Il nous a été précisé que la bibliothèque était en libre accès toute l’année avec des ressources documentaires accessibles sur simple demande auprès de la conservation. Ce type d’événement est également l’occasion de faire connaître l’existence des fonds de bibliothèques et de musées bien trop souvent confidentielles mais pourtant complémentaires à l’offre des bibliothèques municipales et universitaires.

Les ressources Wikimedia disponibles seront signalées aux participants à Muséomix qui se tiendra au MSR en novembre prochain. Cet atelier Wikipédia constituant une bonne entrée en matière avant le lancement dans une aventure participative à plus grande échelle.

En guise de conclusion nous pouvons citer Romain qui, en en repartant vers Montpellier dont il était venu spécialement pour l’occasion, a lancé héroïquement : « Veni, vidi, wiki ! »

Wiki Loves Monuments (fr)

Wiki Loves Monuments

Wiki Loves Monuments* est un concours photographique mondial qui se déroule lors du mois de septembre et visant à valoriser les monuments historiques, via les projets Wikimédia (principalement Wikipédia et Wikimedia Commons). L’édition française du concours est organisée par Wikimédia France, association pour le libre partage de la connaissance.

Chacun peut participer et améliorer Wikipédia. Les monuments historiques sont tout autour de vous !

En savoir plus

Wikimédia France

Plaidoyer pour enseigner Wikipédia

Ce billet, sous licence CC-BY-NC-SA, premier d’une série sur l’enseignement de Wikipédia à l’Université, fut initialement publié le 14/06/2016 sur le blog par Alexandre Hocquet (Professeur des Universités à l’Université de Lorraine, appartenant au laboratoire de philosophie et d’histoire des sciences « Archives Henri Poincaré » dont le domaine est les STS, ou plus spécifiquement les Software Studies, et sa méthode l’analyse de conversations en fil).

Wikipédia est (ou devrait être) un objet extraordinaire à enseigner : tout le monde connaît Wikipédia, et presque tout le monde connaît mal Wikipédia. Cela devrait être la situation idéale pour un enseignant : intéresser les étudiants avec quelque chose qu’ils connaissent, les surprendre en leur montrant qu’ils peuvent y découvrir beaucoup de choses.

CC-By-SA Lane Hartwell

CC-By-SA Lane Hartwell

Malheureusement, mes propositions d’enseigner Wikipédia restent souvent lettre morte auprès des collègues qui font les maquettes pédagogiques. Je propose un cours à toutes les formations et tous les niveaux : enseigner Wikipédia est transversal et peut être fructueux du L1 au doctorat. Un des principaux malentendus est que « enseigner Wikipédia » est vu par les collègues comme une formation courte : au mieux « apprendre à l’utiliser », au pire « apprendre à s’en méfier ». Pourtant, il y a dans Wikipédia de quoi apprendre pendant tout un semestre. Tout d’abord, plonger dans Wikipédia demande de s’y faire petit à petit (voir les expériences pédagogiques de Lionel Barbe, ou le Wikimooc l’expérience massive d’enseignement par les wikipédiens eux mêmes). Surtout, Wikipédia est un objet d’étude sans égal du point de vue de la pertinence pour tout un tas d’aspects différents, pour moi qui voudrait enseigner mon domaine de recherche : les STS, ou, dit autrement, les relations entre sciences et sociétés.

Émilien Ruiz a développé en quoi Wikipédia est utile pour l’enseignement de la critique des sources. En tant qu’historien, je rejoins Émilien sur ce sujet : Wikipédia est un outil qui permet de distinguer ce qui est une bonne source selon Wikipédia et de le comparer à ce qu’est une source selon l’école méthodologique, l’école des Annales, la microhistoire, la ou encore la sociologie des épreuves : c’est un vrai cours d’histoire de la critique des sources, par la pratique.

L’enseignement de l’analyse critique est à la mode en ce moment, particulièrement dans l’injonction ministérielle à se méfier « des théories du complot », à peine différente de l’injonction ministérielle à se méfier « d’Internet » d’il y a quelques années. Pour l’école, pour l’université et pour la presse, ce qui vient d’Internet est suspect a priori et Wikipédia est le « usual suspect » dans les entreprises de décrédibilisation de la part de ces trois institutions. Pourtant Wikipédia est un laboratoire très intéresant pour tester une « analyse critique des médias ». Plonger dans Wikipédia permet de se mettre à l’épreuve d’une communauté de pairs plutôt que d’une voix magistrale. Intervenir dans Wikipédia, c’est soumettre sa production (ou tout simplement son avis) aux mécanismes de recherche de consensus, de la vérifiabilité, de la neutralité de point de vue (des notions wikipédiennes qui elles mêmes demandent à être déconstruites mais cela demande du temps d’enseignement pour le faire).

Ces notions épistémologiques ne sont pas seulement celles d’un mode de production de connaissance bien particulier, elles sont aussi liées (et se façonnent mutuellement) avec l’infrastructure technique et logicielle de Wikipédia (qu’est ce que le wiki et d’où vient-il ? Que sont les bots et comment travaillent-ils ?), l’infrastructure juridique et politique (quel est le rôle de la Wikimedia Foundation, en quoi la production est elle liée aux licences ?). Les licences utilisées dans Wikipédia, et Wikipédia elle même, sont aussi un projet politique lié au monde du libre, aux « creative commons », et plus généralement aux « communs ». Enseigner Wikipédia c’est aussi enseigner un projet politique particulier et nouveau : c’est le seul « commun » à avoir réussi à exister à grande échelle, et les politiques du libre ne sont pas seulement un projet, ce sont aussi une mise en oeuvre, dans lesquelles la notion de forking est primordiale (le forking, en tant qu’action politique, est l’équivalent d’un schisme. Il est à la fois une garantie de démocratie et une menca de division). De manière plus générale, Wikipédia est un des rares exemples à grande échelle d’un projet qui se veut « Open » et qui est obligé chaque jour par la pratique de définir ce qui est « Open » et ce qui ne l’est pas, parfois avec violence. Wikipédia est donc une étude de cas essentielle pour comprendre les « politiques de l’Open« , au delà d’un washing politique ou d’une vision militante, une critique de l’Open.

Enfin, Wikipédia est aussi une communauté et ce projet politique est aussi un projet d’organisation communautaire par les principes, les règles, les protocoles et la technique. L’organisation des débats, les règles de recherche de consensus, les procédures de vote s’y inventent. Wikipédia est une excellente étude de cas pour enseigner la « culture numérique » par l’exemple. Wikipédia permet de comprendre en quoi des projets techniques, des projets politiques, des projets épistémologiques (les trois mélangés) liés au monde du libre, au monde du software, au monde des « algorithmes » transpose ces notions dans un monde accessible au grand public. En ce sens, j’ai la conviction qu’il est bien plus utile pour comprendre ce monde, pour acquérir une « littératie numérique » de plonger dans les entrailles de Wikipédia que « d’apprendre à coder ».

Wikimédia France

Open Content Culturel – conférence à la Gaîté Lyrique

Les enjeux

La valorisation et la diffusion des collections est une préoccupation ancienne des institutions culturelles (musées, galeries, bibliothèques, etc.). Cependant, répondre à ce besoin nécessite des moyens humains et financiers dont elles ne disposent pas toujours.

C’est de ce constat qu’est née la RMN (Réunion des Musées Nationaux). Elle a acquis le statut d’établissement public à caractère industriel et commercial (EPIC) par décret, le 14 novembre 1990. L’établissement est doté aujourd’hui de trois nouvelles missions : l’accueil du public, l’organisation d’expositions temporaires et la diffusion culturelle autour des expositions et des collections permanentes de 34 musées nationaux.

De par ces missions, elle se trouve en situation de monopole pour la commercialisation des reproductions des œuvres, et ce, quelque soit le support (beaux livres, posters, cartes postales, etc.).

Cet état de fait convenait à toutes les parties, jusqu’à ce que la révolution numérique vienne rebattre les cartes, et introduire un nouvel acteur dans le « jeu », à savoir le grand public.

En effet, celui-ci, avide d’informations et de partage, est au cœur même de la mutation en marche. Il consulte massivement Internet pour obtenir des contenus culturels et s’inscrit dans des processus collaboratifs et de partage pour améliorer l’accès à l’information.

Cet investissement est notamment possible grâce aux dispositions légales permettant un “domaine public” qui comprend des oeuvres qui sont la propriété de tous. Europeana¹ a publié en 2010 la charte du domaine public dont l’un des principes essentiels est le suivant :

Ce qui fait partie du domaine public doit rester dans le domaine public. Le contrôle exclusif des œuvres du domaine public ne peut pas être rétabli en réclamant des droits exclusifs sur les reproductions techniques des œuvres ou en utilisant des mesures techniques ou contractuelles pour limiter l’accès aux reproductions techniques de ces œuvres. Les œuvres qui font partie du domaine public sous leur forme analogique continuent de faire partie du domaine public une fois qu’elles ont été numérisées.”

Ce nouveau contexte rend la RMN désuète et contraint les institutions culturelles à (re)considérer l’outil numérique, notamment du point de vue économique, et tout particulièrement concernant leurs collections relevant de ce domaine public.

Toutefois, une forme d’instinct de survie, ou d’appât du gain (voir des deux), conduit la RMN à maintenir la main mise sur la diffusion des œuvres détenues par les musées, qui ont signé avec elle. Ils ne sont ainsi plus libres de décider de leurs politiques en matière d’Open Data, et ce, même si ce modèle économique n’est clairement plus viable.

Cette absurdité est possible au motif que les principaux établissements publics culturels sont soumis à un régime dérogatoire (loi 78-753 sur les données publiques et son article 11 sur les données culturelles) : ils restent libres d’ouvrir ou non leurs données, une conséquence de la fameuse exception culturelle française. Cette privatisation du domaine public conduit à de nombreuses aberrations.

Quelques exemples :

  • les historiens des estampes font leurs recherches sur des ressources françaises, dans des lieux culturels français, mais ils privilégient des ouvrages étrangers (librement réutilisables) lorsqu’il s’agit d’illustrer leurs publications.
  • Les étudiants (thésards) en histoire de l’art ne peuvent pas publier leurs recherches, seuls ceux qui ont les moyens de payer les droits de reproduction le peuvent.
  • Les professeurs de l’Ecole du Louvre, pour pouvoir illuster leurs cours devraient payer à la RMN des droits qui leur coûteraient dix fois plus cher que ce que leur rapportent leur cours.


Les atouts de l’ouverture des contenus culturels


Pour les établissements culturels déjà, nous pouvons lister plusieurs pistes :

– l’opportunité de développer de nouveaux produits ou services autour des données publiques culturelles,

– la possibilité de créer une médiation entre les institutions et l’émergence d’un nouveau type d’entreprenariat,

– la création de modèles économiques innovants pour les institutions qui vont générer des moyens supplémentaires et qui vont représenter un levier de croissance pour l’industrie culturelle française.

Pour les pouvoirs publics ensuite, des perspectives enthousiasmantes se dessinent :

– l’impulsion de nouvelles dynamiques dans le secteur du tourisme culturel,

– la modernisation et la dynamisation de l’action publique et l’occasion de repenser le service public,

– la transparence économique.


Un exemple, le cas du Rijksmuseum au Pays-Bas


Europeana a travaillé avec ce musée depuis 2011 pour rendre les collections d’oeuvres d’art appartenant au domaine public disponibles, en ligne et sans restrictions. Cela a donné lieu à plus de 150 000 images en haute résolution visualisables, téléchargeables, remixables, copiables et utilisables. Dans le cas du Rijksmuseum, seuls 8 000 objets sur 1 000 000 sont accessibles aux visiteurs. En rendant ces images disponibles sans restrictions, leurs portées se sont étendues de façon exponentielle.

Quels ont été les motifs de cette stratégie employée par le musée ?

– Faire le pari que libérer du contenu de qualité va aiguiser l’intérêt du public, et les inciter à venir sur place, plutôt que mettre en danger les revenus potentiels de l’institution.

– Lutter contre la prolifération des représentations numériques non officielles de célèbres peintures sur le web. (Comme les images proviennent d’une source fiable, les bonnes copies numériques ont été rapidement adoptées par les plates-formes de diffusion de savoir en ligne comme Wikipédia, ce qui fait baisser dans le même temps la popularité de représentations non officielles ou de mauvaise qualité.)

– Atteindre les utilisateurs : à ce jour 6 499 images provenant du Rijksmuseum ont été téléversées sur Wikimedia Commons. 2 175 d’entre elles sont actuellement utilisées dans divers articles de Wikipedia. Ces images ont été vues plus de 10 millions de fois. La visibilité est donc accrue pour les oeuvres de l’institution et pour l’institution elle-même.

– Augmenter leurs sources de revenus : le Rijksmuseum a, comme la plupart des musées, une banque d’images où se vendent des copies numériques des images. Lorsque fin 2011, ils ont commencé à libérer des images, ils ont proposé deux tailles à la vente. L’image de qualité moyenne (au format JPG, de 4500x4500px, à ± 2MB) est disponible gratuitement en téléchargement à partir de leur site web, sans aucune restriction. Lorsque l’utilisateur clique sur le bouton de téléchargement, une fenêtre s’ouvre et demande à l’utilisateur de créditer le Rijksmuseum lors de l’utilisation du fichier. Pour de la très haute résolution, 40€ sont demandés. En 2010, quand aucune photo n’était disponible dans des conditions ouvertes, il y avait effectivement moins de revenus qu’en 2011, lorsque le premier jeu a été mis à la disposition. Il est encore plus intéressant de voir qu’en 2012, il y a une augmentation significative des ventes. Cela montre que libérer des images de qualité moyenne au public en 2011 a permis d’avoir un modèle économique viable, et a, en fait, augmenté les ventes d’images.

Le coût des recherches et de la mise à disposition de demandes individuelles d’oeuvres peu connues coûte parfois plus cher que le revenu qui en découle. Du coup, le Rijksmuseum a persévéré dans sa démarche de rendre disponible en résolution suffisante le plus d’oeuvres possibles, et a ainsi choisi de recentrer le travail de ses agents sur la recherche de fonds auprès de fondations artistiques, de manière à numériser de nouvelles collections.

La renommée acquise pour avoir libéré du contenu sans restrictions semble aussi avoir facilité l’obtention de ces subventions. Le Rijksmuseum a ainsi été invité à participer à de nombreuses conférences pour expliquer sa démarche, ce qui a attiré l’attention des médias et de nouveaux publics.

¹ Europeana est une bibliothèque numérique européenne lancée en novembre 2008 par la Commission européenne. Elle est une mise en commun des ressources (livres, matériel audiovisuel, photographies, documents d’archives, etc.) numériques des bibliothèques nationales des 27 États membres. Source Wikipédia

Wikimédia France

Day 3: Ce n’est qu’un au revoir

C’est sous une chaleur écrasante que s’est déroulée la troisième et dernière journée de la Wikimania 2016 à Esino Lario. Au programme de ce dimanche 26 juin, questions et réponses à la nouvelle directrice exécutive de la Wikimedia Foundation ainsi que conférences et discussions autour de l’héritage culturel dans le monde par les wikimédiens.

Katherine Maher, nouvelle directrice exécutive de la Wikimédia Foundation a répondu à une série de questions de la part des wikimédiens afin d’évoquer la vision future du mouvement ainsi que la stratégie de la Fondation. Puis c’est un focus sur la Wikimedia Foundation qui a été opéré afin de préciser les différents services et missions que cette dernière propose pour le mouvement.

Séance de questions et réponses avec Katherine Maher, Directrice Exécutive Wikimédia Foundation (Niccolò Caranti - CC BY-SA 4.0). Questions posées par les Wikimédiens à Katherine Maher (Niccolò Caranti - CC BY-SA 4.0).


Dans l’après-midi, c’est Jean-Frédéric Berthelot, secrétaire adjoint du conseil d’administration de Wikimédia France, et Philip Kopetzky, membre du conseil d’administration de Wikimédia Autriche, qui ont présenté le projet Wiki Loves Monuments et les évolutions futures de ce projet.

Puis, en fin d’après-midi a eu lieu la traditionnelle cérémonie de clôture de la Wikimania 2016. Ce fut l’occasion de remercier les habitants du village d’Esino Lario ainsi que les organisateurs de cette Wikimania pour leur accueil chaleureux et leur organisation minutieuse. Ce fut aussi l’occasion d’annoncer que la Wikimania 2017 sera notamment organisée par WikiFranca et aura lieu à Montréal au Canada !

Cérémonie de clôture de la Wikimania 2016 avec les élus locaux et Jimmy Wales (Martina Corà - CC BY-SA 4.0). Annonce de la Wikimania 2017 à Montréal par Marc-André Pelletier (Martina Corà - CC BY-SA 4.0).


Comme chaque année, la Wikimania permet un rassemblement de toute la communauté internationale des wikimédiens qui est finalisée par une belle photo de groupe. Aucun doute que cette 12ème édition restera gravée dans les mémoires.

Photo de groupe à la cérémonie de clôture de la Wikimania 2016  (Niccolò Caranti - CC BY-SA 4.0).


Gribouillage 193 : style encyclopédique.

0193 - neutralite

Je n’ai pas la moindre idée de par quel bout prendre l’article pour essayer d’arranger les choses, pour être honnête. C’est juste… structurellement déjà, ya un problème.

Classé dans:Gribouillage, les coulisses de Wikipédia Tagged: géographie des états-unis

Wikimédia France

Day 2 : Journée pluvieuse mais fructueuse à la Wikimania 2016

C’est sous une pluie diluvienne qu’ont démarré les conférences, rencontres et ateliers de cette deuxième journée à Esino Lario. Rien n’a pu néanmoins doucher l’enthousiasme des wikimédiens français. Ils ont en effet animé une conférence sur l’importance qu’a pris en France le projet Wiktionnaire, dont nous avions publié l’extraordinaire odyssée il y a quelques articles… Très attendus et largement soutenus par les francophones, c’est avec beaucoup d’énergie que Noé Gasparini, Lucas Lévêque et Benoît Prieur ont détaillé l’engouement qu’il y a eu autour du développement de ce projet en France et ses retombées positives, notamment dans les médias.


Sebastiaan ter Burg (CC-BY-2.0)

En fin de journée, s’est tenu un meeting réunissant les directeurs exécutifs des chapitres Wikimédia,  auquel Nathalie Martin a participé pendant qu’une autre réunion se tenait avec l’ensemble des présidents des organisations affiliées au mouvement, à laquelle Emeric Vallespi  à participé, afin d’aborder divers sujets liés à l’amélioration des échanges de bonnes pratiques entre les chapitres et dans le mouvement, et à la rencontre avec la nouvelle Directrice Exécutive de la Wikimedia Foundation. Enfin, dans la continuité du travail entrepris suite à la Wikimania 2015 à Mexico, Anne-Laure Prévost a participé à la réunion du groupe de travail ‘Partnerships and Resource Development’ afin d’enrichir l’espace dédié aux récits d’expérience et aux bonnes pratiques des chapitres en terme de partenariats.

Katherine Maher assiste au meeting des Directeurs Executifs et Présidents des chapitres Wikimédia imania 2016 Esino Lario - Niccolò Caranti (CC BY-SA 4.0 ) Le meeting des Directeurs Exécutifs et Présidents des chapitres Wikimédia 2016 Esino Lario - Sebastiaan ter Burg (CC-BY-2.0)


Cette journée s’est conclue par un concert sur la place principale du village. On se retrouve encore demain pour faire le point sur le troisième  et dernier jour de cette Wikimania 2016.

Wikimédia France

Day 1: un démarrage sur les chapeaux de roues pour Wikimania 2016 !

C’est à Esino Lario près du lac de Côme en Italie que la 12e édition de Wikimania se déroule. Des annonces et rencontres pimentées ont été à l’ordre du jour.

Après deux jours de pré-conférence, notamment technique avec la tenue du traditionnel hackathon, ce jeudi 24 juin a vu le lancement de la Wikimania 2016. À cette occasion, Jimmy Wales, fondateur de Wikipédia, a pris la parole pour annoncer l’élection de Christophe Henner, ancien président de Wikimédia France, comme membre et président du conseil d’administration de la Wikimédia Foundation pour une durée de 3 ans. À la suite de son intérim, Katherine Maher a été nommée directrice exécutive de la Wikimedia Foundation. Ces annonces officielles ont été suivies d’une inspirante présentation de l’impact positif de la Wikimania 2016 sur Esino Lario, par Catherine de Senarclens, membre du conseil municipal du village. Jimmy Wales s’est d’ailleurs vu remettre les « clefs du changement » par le maire de la ville pour clore cette séance.

Les Wikimédiens au travail durant le Hackathon Pietro Pensa remet la clef du changement à Jimmy Wales

Du “coolest project” aux enjeux de la confidentialité comme frein à l’accès à la connaissance, c’est un programme riche qui est proposé aux 1000 wikimédiens accueillis par les habitants d’Esino Lario. C’était aussi l’occasion pour tous les francophones de se retrouver lors du Meetup de fin de journée et d’échanger sur les projets en cours et à venir. À ce titre, un zoom sur la première Wikiconvention Francophone, qui se déroulera du 19 au 21 août à Paris, a été fait par Pierre-Yves Beaudouin (les inscriptions sont ouvertes, pour rappel !).

Les Wikimédiens francophones pris en photo par Pierre-Selim (CC-BY-SA 4.0)

Les Wikimédiens francophones pris en photo par Pierre-Selim (CC-BY-SA 4.0)

Rendez-vous demain pour un nouveau point autour de la deuxième journée
à Esino Lario ! Vous pouvez aussi suivre le fil twitter #Wikimania2016 et le compte @WikimaniaEsino pour plus d’informations.

Crédits photo galerie : Niccolò Caranti – CC-BY-SA 4.0

Viva Italia

Non é pericoloso sporgersi dentro la #Freikultur.

Wikimédia France

Privatisation du domaine public : avec la loi création, on a touché le fond !



domaine public plus si public


Mercredi dernier a eu lieu la Commission Mixte Paritaire dans le cadre du projet de loi relatif à la liberté de la création, à l’architecture et au patrimoine, les parlementaires ont frappé particulièrement fort avec deux mesures notablement absurdes et scandaleuses.

La première concerne la privatisation de l’image des domaines nationaux qui a été entérinée. Nous vous expliquions cette affaire, en détails, dans un précédent article de blog. Demain, Wikipédia va donc se retrouver privée d’illustrations pour des articles emblématiques de l’histoire et de la culture française tels que : le Château de Chambord, le Château de Versailles, le Château de Saint Germain en Laye… Alors même que ces bâtiments sont tombés dans le Domaine public, les parlementaires ont créé un droit inédit pour leurs gestionnaires, afin de susciter de nouveaux revenus liés à l’utilisation des images.

La deuxième mesure concerne la mise en place d’une redevance obligatoire liée à l’indexation des moteurs de recherche. Ces derniers vont devoir payer pour avoir le droit d’indexer des photos et illustrations et les présenter dans les résultats. Voici l’objectif affiché mais ce qui est intéressant c’est la stratégie déployée pour y parvenir !

Toutes les images qui vont être publiées sur le web (réseaux sociaux, blog ou site personnel, forums, etc) vont être automatiquement mises en gestion auprès des différentes sociétés d’ayants-droit. Cette affiliation d’autorité ne permettant pas d’identifier les auteurs, ni le statut juridique des contenus, les sommes vont êtres versées directement par les moteurs de recherche à ces sociétés de perception et de répartition des droits, sans que les auteurs touchent quoi que ce soit.


C’est tout simplement une spoliation des œuvres réalisées, avec la complicité de l’Assemblée Nationale et du Sénat, qui au-delà de l’aspect du gain illégitime pose d’autres questions :

– les licences Creative Commons sont tout simplement niées donc rendues inopérantes,

– les images illicites vont générer des revenus similaires aux images licites.


On se demande vraiment comment les parlementaires ont pu cautionner à la fois ce non-respect du droit des auteurs et à la fois ce mépris éhonté de la légalité d’une image.

Ces régressions sont d’autant plus douloureuses qu’au même moment, nos voisins belges ont su faire preuve de plus de discernement en adoptant le jeudi 16 juin dernier la liberté de panorama, sans restriction commerciale. Ils viennent grossir les rangs des pays européens qui s’engagent en faveur du partage de la connaissance et d’un droit correspondant à la réalité des usages.

Pendant ce temps-là la France, quant à elle, n’a jamais fait autant d’efforts pour privatiser les biens communs…


La Wikimania se met au vert…


Connaissez-vous Esino Lario ? C’est un petit village de 761 habitants, situé à 12 kilomètres au-dessus du lac de Côme et à 100 kilomètres de Milan, dans la province de Lecco en Lombardie. Cet endroit diffère en tous points des lieux d’accueil des précédentes Wikimania, qui se sont tenues depuis 2005 au cœur de mégapoles mondiales telles que Hong-Kong, Washington, Londres, Alexandrie ou encore Mexico. Cette année, une équipe de plus de 35 bénévoles, avec le soutien de Wikimedia Italie, s’est mis en tête de permettre à plus de 1000 contributeurs aux projets Wikimedia venant du monde entier d’avoir pour terrain de jeu et lieu de retrouvailles un village tout entier.

Un challenge et une épopée qui partent d’un questionnement : que représente la Wikimania pour ses participants ? L’objectif de cet événement est-il de rassembler le plus grand nombre de personnes possible ? L’organisation d’une telle conférence est-elle durable pour les pays qui l’accueillent ? Quelles traces de son passage, au-delà d’un événement éphémère ? Wikimania Esino Lario 2016 a pour vocation de remettre en question un format bien rodé et d’embarquer les participants à travers une expérience au grand air, au cœur des montagnes italiennes. Une occasion d’offrir à la communauté des wikimédiens une occasion unique d’intensifier ses échanges et de vivre au rythme des habitants qui l’accueillera.  Et surtout, un objectif de pérennité : un développement territorial pour ce village, qui perdurera après la grand-messe des contributeurs à Wikipédia.

Panoramica_di_Esino_Lario B2014_03_19_Esino_2047_Il_lago_dal_Belvedere Esino_Lario_screenshot_Open_Street_Map.tiff

Plus qu’un rassemblement,  un projet de développement à fort impact

Pour pouvoir satisfaire aux exigences d’un rassemblement tel que la Wikimania, c’est un projet de développement territorial qui a vu le jour en 2014, de manière à disposer d’assez de temps pour rendre le village apte à l’accueil des participants. Les aménagements prévus ont été conçus pour être pérenne et apporter au village d’Esino Lario et ses habitants, des infrastructures durables qui auront un impact sur leur quotidien. En premier lieu, une connexion wi-fi disponible dans toute la ville et l’installation de la fibre optique dans 7 bâtiments publics, mais aussi : la réhabilitation de la salle de sport municipal afin qu’elle soit accessible à tous, la rénovation de l’ancien cinéma local en une salle polyvalente, la création d’une salle multimédia et la réhabilitation du musée de la ville dans un nouveau bâtiment, la rénovation des équipements sportifs en extérieurs et la création d’un nouveau parking. Derniers travaux, et non des moindres : la rénovation de la seule et unique route menant à Esino Lario, qui n’avait pas été faite depuis plus de 40 ans.

800px-Esino_Lario_May_2016_14 800px-Esno4Wkmana_jul_2014_Cassnam_019

Pour réussir un tel exploit et mener un projet de cette envergure, les équipes bénévoles mobilisées sont allées à la recherche de soutiens financiers : ils ont obtenu 200 000 € de la part de la Fondation Wikimedia, 190 000 € de la Fondation Cariplo, 500 000 € de la région de Lombardie, sans compter les nombreux sponsors locaux et le soutien du conseil municipal.

Wikimédia France se rendra à Esino Lario la semaine prochaine, pour une expérience qui promet d’être unique en son genre : nous vous tiendrons informés de la suite de nos aventures sur ce blog !



Wikimédia France

La première Wikiconvention francophone arrive à Paris !


La toute première WikiConvention francophone aura lieu à Paris du 19 au 21 août 2016 !

Comme son nom l’indique, elle accueillera près de 160 participants francophones issus des communautés des projets Wikimedia comme Wikipédia et ses projets-frères. Elle a été conçue pour contribuer à l’émergence et au développement d’entités francophones locales. Des Wikimédiens venant d’Algérie, de Belgique, de Côte d’Ivoire, de Madagascar, de Suisse, du Sénégal, de France, de la Tunisie, du Canada et d’ailleurs sont attendus. Un tel événement s’inscrit dans les missions de WikiFranca, coopération des entités francophones du mouvement Wikimedia, où Wikimédia France s’investit de manière conséquente.

Organisée pour la première fois pour et par les Wikimédiens francophones, comme cela a été le cas, depuis plusieurs années dans les communautés germanophones, hispanophones, ou encore néerlandophones, la WikiConvention sera un événement dédié au partage de savoirs, de pratiques et de perspectives pour encourager les synergies et développer des stratégies d’enrichissement des projets Wikimedia en français, sans oublier de valoriser les langues régionales et minoritaires des pays participants. Elle cherchera également à assurer la présence de contributrices, notamment par la mise en œuvre d’une garderie sur place. En effet, moins de 15 % des contributeurs à Wikipédia aujourd’hui sont des femmes. Ce fossé des genres est un combat prioritaire du mouvement, tout comme l’est la contribution des pays dits du “Sud”. En effet, l’un des objectifs prioritaires de la Wikimedia Foundation, comme pour le reste du mouvement Wikimedia est d’agir face au fossé qui se creuse entre les pays dits “du Nord” et ceux dits “du Sud” tant au niveau de la diversité des contenus qui se trouvent sur les projets Wikimedia, que sur la diversité des contributeurs à ces projets.

L’événement sera accueilli au sein de la Halle Pajol, un bâtiment récemment réhabilité, éco-conçu, pourvu de 7 salles de réunion et d’une auberge de jeunesse, afin de faciliter l’hébergement des participants à moindres frais. Dans cette même idée, plusieurs partenaires soutiennent cet événement. L’Organisation Internationale de la Francophonie finance généreusement la venue de 15 Wikimédiens d’Afrique francophone, dont la contribution aux débats est essentielle ; Google soutient financièrement la mise en œuvre de l’événement et la Fondation L’Oréal participe quant à elle à permettre l’accueil d’enfants lors de la convention, afin de favoriser la venue des parents, comme évoqué ci-dessus. Wikimedia CH soutient également cette action, à travers un soutien financier mais aussi grâce à l’attribution de bourses pour les participants suisses.

Le programme est encore en train d’être affiné, mais les inscriptions sont d’ores et déjà ouvertes et ce jusqu’au 15 juillet.

Plus d’informations sur la page Meta de l’événement.

Pour retrouver toute l’actualité de la WikiConvention, abonnez-vous au fil Twitter @wikiconvention et suivez le hashtag #WikiConvFR !


Gribouillage 192 : Petit historique de Wikidata.

0192 - historique de wikidata

Bien sur, il manque des points intermédiaires. Mais je suis gribouilleur, pas archéologue.

  • J’aimerais pouvoir dire que j’invente le gus arrivé mi-2014 qui se plaint de ne pas avoir été mis au courant de trucs faits en 2013, mais hélas…
  • Une précédente gribouille traite de la vaste fumisterie qu’est la PdD Wikidata de janvier dernier.

Classé dans:actualités, Gribouillage, les coulisses de Wikipédia Tagged: wikidata

Wikimédia France

Prochain sommet mondial de l’OGP à Paris

Logo de l'OGP - Open Government Partnership - CC-BY-SA 3.0

OGP, kézako ?

“Inaugurée en septembre 2011 par huit pays fondateurs, l’Open Government Partnership est une initiative multilatérale qui compte aujourd’hui 65 pays membres, ainsi que des ONG et représentants de la société civile. Le Partenariat s’attache, au niveau international, à promouvoir la transparence de l’action publique et la gouvernance ouverte, à renforcer l’intégrité publique et combattre la corruption, et à exploiter les nouvelles technologies et le numérique pour renforcer la gouvernance publique, promouvoir l’innovation et stimuler le progrès.”

Source : Blog de la mission Etalab,






Présidence française en 2016

La France a rejoint le Partenariat pour un Gouvernement Ouvert (OGP en anglais) en avril 2014 et en assurera la présidence à partir de septembre 2016, pour une durée d’un an, après en avoir occupé la vice-présidence lors du mandat de l’Afrique du Sud. Un plan d’action 2015-2017, co-construit avec des acteurs de la société civile, a été rendu public l’année dernière et est disponible en ligne. La France prend ainsi 26 engagements, sur 5 axes :

4e sommet mondial à Paris

Le quatrième sommet mondial de l’OGP se tiendra à Paris du 7 au 9 décembre 2016, dans trois lieux d’exception : la salle Pleyel,  le palais de Tokyo et le palais d’Iéna. Des représentants des gouvernements, du monde universitaire, de la société civile et des organisations internationales se réuniront à cette occasion pour partager leurs expériences et bonnes pratiques et faire progresser l’agenda du gouvernement ouvert à l’aune des grands enjeux de notre monde. Le programme de cette rencontre sera là encore co-construit avec les participants, et sa version finale sera présentée à la rentrée. Un comité de programme a été constitué, comprenant 3 représentants de la société civile. Les candidatures retenues ont été les suivantes :

  • Benjamin Jean, président d’Open Law
  • Ismaël Le Mouël, co-fondateur de HelloAsso
  • Emeric Vallespi et Nathalie Martin, président et directrice exécutive de Wikimédia France

Nous ne manquerons pas de vous faire part, dans les prochaines semaines, de l’avancée de ces travaux !

Crédits : Logo de l’OGP – Open Government Partnership – CC-BY-SA 3.0

Gribouillage 191 : Necromanceur (5).

Note : Avertissement épilepsie. Bon, probablement pas, j’ai fait gaffe à ce que l’animation ne clignote pas trop vite. Mais autant ne pas prendre de risque.

Cette gribouille fait partie de la série Necromanceur. À défaut de pouvoir vous faire tourner les pages, scrollez doucement :)

0191 - necromanceur 5-0





0191 - necromanceur 5-4b

0191 - necromanceur 5-5


0191 - necromanceur 5-7

Sources :

La dernière image est comme ça parce que je sais pas comment dessiner des gens qui courent.

Classé dans:Gribouillage, les coulisses de Wikipédia Tagged: gif, necromanceur, wikidata

Gribouillage 188 : Lunettes.

0188 - wakfu

Petit échange entre Thibaut et moi sur IRC. Nous avons sur notre canal un bot qui nous notifie de divers types de changement sur les articles de notre domaine (voir Gribouille 117).

L’anime Schwarzesmarken fait partie de la franchise Muv-Luv, et se déroule en Allemagne de l’Est, dans un monde alternatif ou les gens se battent contre des méchants aliens avec des grorobots, sur fond de harem.


Classé dans:anime, Gribouillage, les coulisses de Wikipédia Tagged: muv-luv, Schwarzesmarken

Gribouillage 173 – Wikipédia sur la Lune.

0173 - wikipedia sur la lune

C’est une initiative super d’un point de vue communication et presse, je ne dis pas le contraire.
Par contre, passer des mois de délibérations pour choisir quoi mettre sur le support, ça sert un peu à rien.

Resources :

Classé dans:actualités, Gribouillage, les coulisses de Wikipédia Tagged: Google Lunar X Prize, Wikimedia Deutschland

Wikimédia France

Copyfraud sur les Domaines Nationaux

A l’occasion d’un projet de loi sur le patrimoine, les parlementaires ont introduit des amendements permettant aux domaines nationaux de s’arroger un droit à l’image sur les bâtiments qu’ils gèrent. Droit qui n’existait pas jusqu’alors !

C’est ainsi que le domaine national de Chambord, ou celui de Versailles, pourront demander le paiement de droits concernant l’utilisation des photos des châteaux qu’ils gèrent, s’ils estiment qu’elle revêt un caractère commercial.

À maintes reprises, nous avons expliqué la difficulté actuelle de déterminer ce qui relève ou non d’un périmètre commercial. (1)

Or, depuis des siècles, ces monuments historiques appartiennent au patrimoine de la Nation et au domaine public.

Ce ne sont pas à des gestionnaires, mandatés par l’État français pour prendre soin des témoignages de notre histoire, de décider de l’usage qui doit être fait, ou pas, de leur image. Chacun doit être libre de la réutiliser comme il l’entend, puisqu’ils constituent des (biens) communs !

Cette nouvelle volonté des gestionnaires d’exploiter un nouveau filon commercial n’est rien d’autre qu’un copyfraud manifeste, une privatisation illégitime d’un bien public que Wikimédia France dénonce avec vigueur.

Le château de Chambord par Arnaud Scherer [CC BY-SA 4.0 ]

Si cet article de loi est adopté définitivement, le 15 juin prochain, lors de la CMP (Commission Mixte Paritaire : commission constituée de parlementaires du Sénat et de l’Assemblée Nationale), il entraînera un retrait de toutes les photos de ces lieux emblématiques de notre passé, des projets Wikimédia, car elles ne seront plus libres de droits.

Ce serait un appauvrissement conséquent de la qualité des articles de Wikipédia, ce que nous déplorons. En effet, ces articles et photos offrent une visibilité incomparable à ces sites, dont il serait dommage de se priver. Plus largement, c’est donc le rayonnement de la culture française qui est directement menacé.

Qu’est-ce qui explique un tel retour en arrière aujourd’hui ?

Le Château de Chambord a voulu empêcher une marque de bière d’utiliser son image pour ses publicités. Après avoir essayé d’imposer au brasseur une facture s’élevant à 251 160 € sans succès, l’affaire est portée en justice. Après moult épisodes, la Cour d’appel de Nantes confirme, en 2015, les jugements antérieurs, et condamne le château à verser 1 500 €, au titre des frais de justices.

Qu’à cela ne tienne, n’ayant pas eu gain de cause devant les tribunaux, il essaie aujourd’hui de faire changer la loi ! (2)

Nous n’avons plus que quelques jours pour éviter l’inscription de cette nouvelle enclosure dans la loi.

C’est pourquoi, nous lançons un appel aux parlementaires pour qu’ils défendent l’espace public, ainsi que la visibilité sur internet de notre patrimoine, malgré les demandes, à très courte vue, des gestionnaires financiers des domaines nationaux.

Gribouillage 187 : Raccourcis.

0187 - raccourcis

Du coup sur enwiki ils ont été forcés de nommer l’article V (The Final Battle). On n’a pas ce problème chez nous, toutes les séries de la franchise étant sur une seule page.

Classé dans:Gribouillage, les coulisses de Wikipédia Tagged: raccourci, V

Wikimédia France

Wiki Loves Earth 2016 : la 2e édition française terminée

Vous avez pu découvrir le concours photo Wiki Loves Earth en 2015, année de la première participation de la France à cette compétition internationale visant à collecter des photos de sites du patrimoine naturel – tels que les réserves naturelles, les zones de conservation du paysage, les parcs nationaux, les zones et paysages pittoresques, les jardins remarquables… Tout cela dans le but à la fois d’illustrer des articles de l’encyclopédie libre Wikipédia et également de sauvegarder sur Internet aussi ces espaces protégés.

En 2015, 108 000 photos avaient été soumises entre le 1er et le 31 mai, par plus de 8 900 participants de 26 pays différents. Pour cette deuxième édition française, qui est également la troisième édition internationale, autant de pays se sont impliqués dans le concours, et nous pouvons notamment citer l’Australie, qui pour sa première participation a recueilli 4 126 photos !

Uluru-Kata_Tjuta_National_Park.jpeg Arakoon_National_Park A_gnarled_paper_bark_tree_on_the_edge_of_a_Fraser_Island_Lake

Quelques chiffres-clés pour l’édition française (source : Wikimedia Commons) :

  • 2 442 images téléversées
  • 161 contributeurs, dont 115 nouveaux
  • En moyenne, 15 photos téléversées par contributeur
  • Plus de 20 % de photos non admissibles (notamment des gros plans de plantes ou d’animaux)

Une standing ovation au top 5 des contributeurs de l’édition 2016 : Ibex73, PIERRE ANDRE LECLERCQ, Espirat, Lionel Allorge et X-Javier, qui à eux seuls ont téléversé plus de la moitié des photos en compétition.

Il faut également remercier les personnes impliquées dans l’organisation du concours et notamment Pmau, qui, dans l’ombre, a vérifié la grande majorité de toutes ces photographies. Il nous livre quelques informations sur son travail de vérificateur :

Les vérifications « faciles »

  • taille du fichier : produit de la largeur par la hauteur inférieur à 2000000 pixels
  • licence bien renseignée
  • espace naturel bien renseigné
  • présence de watermark

Les vérifications « moyennes »

  • apprécier si la photo respecte le cadre du concours (espaces naturels)
  • apprécier si la photo a bien été faite dans l’un des espaces naturels
  • contrôler si la commune éventuelle fait partie d’un parc naturel régional ou d’un parc national
  • ajouter d’autres catégories (plantes, animaux, communes, coucher de soleil, etc)

Les vérifications « difficiles »

  • corriger les emplacements incorrects ou manquants
  • géolocaliser quand c’est possible : retrouver le cadrage avec Google Earth et geolocator

Un travail de titan (et de fourmi !) pour que le jury de cette édition 2016 puisse ensuite faire son travail de sélection des 10 images gagnantes. Cette année, il se compose de 5 gagnants de l’année dernière ; d’Anne-Sophie Novel, docteur en économie, journaliste et blogueuse et de Philippe Julve, enseignant, chercheur en écologie et membre du conseil d’administration de Tela Botanica et du réseau des Conservatoires d’espaces naturels.

Les résultats seront connus durant l’été : à suivre !

PHARE_SAINT_MATHIEU Réflexion_sur_les_marais_rhétais Montagne_saint_Michel


Crédits photos (toutes sous licence CC-By-SA 4.0) :

Gribouillage 186 : Priorités.

0186 - priorites


『Only Sense Online』 est une série de light novel (10 tomes parus), aussi adaptée en manga (3 tomes parus). Faudrait que je me bouge le cul et fasse son article chez nous.

Classé dans:anime, Gribouillage, les coulisses de Wikipédia Tagged: only sense online, wikia

Wikimédia France

Lauréats du Wikiconcours lycéen 2015-2016


By Jean-Philippe WMFr (Own work) [CC BY-SA 4.0 (], via Wikimedia Commons

D’octobre 2015 à mai 2016, 60 classes du secondaire ont participé au Wikiconcours lycéen.

Cette action, organisée pour la quatrième année consécutive, associe le CLEMI (Centre de liaison de l’enseignement et des médias d’information) à Wikimédia France pour proposer aux lycéens et lycéennes de contribuer à Wikipédia (création d’articles et enrichissement de contenus existants). Le projet s’inscrit dans une démarche d’éducation aux médias et à l’information ainsi que d’éducation au numérique. L’écriture collaborative est au centre du travail et mobilise des compétences essentielles telles que savoir chercher, savoir organiser, savoir vérifier, savoir publier.

Ce Wikiconcours lycéen a rassemblé dix-sept académies et six lycées français à l’étranger : Aix-Marseille, Bordeaux, Caen, Corse, Créteil, Dijon, Grenoble, Guadeloupe, Lille, Montpellier, Nancy-Metz, Orléans-Tours, Paris, Poitou-Charentes, Rennes, Strasbourg, Toulouse, New-York (États-Unis), Port-Vila (Vanuatu), Tamatave (Madagascar), Londres (Royaume-Uni), Braila (Roumanie) et Madrid (Espagne).

Les coordonnateurs du CLEMI ont bénéficié d’une formation à la contribution en décembre 2015 ; les élèves, enseignants et documentalistes ont pu s’appuyer sur une page de ressources et d’aide dont l’objectif est de les guider dans leur découverte de Wikipédia. Une page de discussion a également permis des interactions avec la communauté wikipédienne.


  • Le prix de la rédaction et de la contribution, qui récompense la qualité des contributions, est décerné au lycée français de New-York (États-Unis) ;
  • Le prix de la communauté, qui récompense le travail collaboratif et les interactions avec les Wikipédiens, est attribué à l’établissement Voltaire (Orléans, académie d’Orléans-Tours) ;
  • Le prix coup de cœur revient à l’établissement Jean Monet (Annemasse, académie de Grenoble) pour la création de l’article Dessin de presse en France ;

Le jury remercie et félicite chaleureusement l’ensemble des participants pour leurs contributions. Le rapport du jury est consultable ici afin que les différents participants puissent progresser dans la maîtrise de l’outil Wikipédia.

Gribouillage 183 : name dropping.

0183 - name dropping

Pour le bandeau, voir la gribouille précédente.

Classé dans:les coulisses de Wikipédia

Ben Whishaw, Broadway, la RADA et Wikidata

Bonjour tout le monde, ici Harmonia Amanda squattant le blog d’Ash_Crow. Il m’a été suggéré de faire un billet de blog pour vous raconter tout ce que je fais en ce moment en rapport avec la RADA (Royal Academy of Dramatic Art) sur Wikidata. Pour m’assurer que personne ne le lira, j’ai donc écrit un truc long, bourré de notes de bas de page et avec même des vrais bouts de SPARQL dedans. Ne me remerciez pas.

Comment ça commence : The Hollow Crown

Tout est de la faute de Ben Whishaw. Je regardais tranquillement les adaptations de Shakespeare par la BBC (et pour celleux qui ne connaissent pas The Hollow Crown, je conseille) et je me disais que l’acteur qui joue Richard II méritait une récompense pour ce rôle, parce qu’il est simplement extraordinaire[1][2]. Je suis donc allée traîner sur sa page Wikipédia et en bonne Wikimédienne, j’ai décidé de l’améliorer un peu : pour le moment[3] j’ai surtout nettoyé le code et arrangé un peu l’accessibilité pour les lecteurs d’écran. À défaut de le labelliser tout de suite, je me suis dit que ce serait sympa de compléter correctement son entrée Wikidata. C’était le début. Comme je le disais, tout est de la faute de Ben Whishaw.

Ben Whishaw en 2008 par KikeValencia – CC-BY-SA

Au début, ça avait l’air simple, il fallait juste mettre des occupations plus précises (il n’est pas juste « acteur », mais acteur de théâtre, de télévision, de cinéma…). Il a reçu un paquet de récompenses, qu’il importait de lister (P166), et pour chacune d’entre elles ajouter l’année où il l’a reçue (P585) ainsi que l’œuvre concernée (P1686), voire avec qui il a partagé la récompense (P1706). Et on peut faire pareil pour celles pour lesquelles il a juste été nommé (P1411) mais n’a pas gagné. Et on peut aussi lister tous ses rôles, ce qui ne se fait pas sur son entrée Wikidata à lui mais en utilisant P161 « distribution » avec la valeur « Ben Whishaw (Q342617) » sur les entrées des œuvres en question. Parfois on peut même qualifier l’information en utilisant P453 (rôle) quand le personnage lui-même a une entrée Wikidata (par exemple Q dans James Bond[4]).

Jusque-là, rien que de très facile. Bon, le truc, c’est que Whishaw au départ, c’est un acteur de théâtre. Je veux dire, il s’est fait connaître vers 23 ans en jouant Hamlet[5] à l’Old Vic. C’est un peu étrange de voir ainsi listés tous ses rôles télévisuels et pas ses performances théâtrales (Mojo, Bakkhai…). Donc j’ai commencé à creuser un peu côté théâtre et laissez-moi vous dire que le théâtre sur Wikidata… ben c’est au moins autant le bazar que sur Wikipédia. C’est dire.

Old Vic Theatre par MrsEllacott – CC-BY-SA 3.0.

Ce serait l’endroit idéal dans ce billet pour vous parler des ontologies, du web sémantique et des questions d’organisation du savoir mais le consensus parmi les gens ayant relu ce billet est qu’il est déjà bien assez long et que je ferais mieux de me concentrer sur la RADA (qui se fait attendre) et de parler de ça une autre fois.

L’Internet Broadway Database

Pendant que j’étais donc en train de réfléchir aux relations entre « art », « œuvre », « genre » et « performance », j’ai appris que Whishaw était en ce moment à Broadway où il joue John Proctor dans The Crucible d’Arthur Miller dans une mise en scène d’Ivo van Hove[6]. Or Broadway a une très bonne base de données (IBDB, Internet Broadway Database). Bien fichue, relativement complète, avec un nombre d’erreurs relativement restreint, bref le bonheur. Et encore mieux, Wikidata a déjà des propriétés pour lier des entrées à cette base (et pas que pour les humains, il y a les mêmes pour les théâtres, pour les œuvres et pour les productions)[7].

Walter Kerr Theatre, , publicité pour Grey Garden - Michael J Owens CC-BY 2.0
Walter Kerr Theatre, , publicité pour Grey Garden – Michael J Owens CC-BY 2.0

Évidemment, personne n’avait encore exploité cette base proprement et il y avait pas mal d’erreurs dans les utilisations wikidatiennes. J’ai donc nettoyé tous les usages de ces propriétés sur Wikidata. Et sur Wikipédia, parce que les erreurs viennent de là[8]. J’ai râlé contre les Wikipédien⋅ne⋅s qui sourcent n’importe comment (ou ne sourcent pas), qui ne sont pas philosophiquement choqué⋅e⋅s quand iels associent une œuvre à l’identifiant d’une production voire qui pensent que l’identifiant IMDB (Internet Movie Database) est le même que l’identifiant IBDB (ahah NON) mais, comme je suis Wikimédienne, j’ai nettoyé malgré tout.

J’en suis arrivée à la conclusion que ce serait encore mieux si au lieu d’avoir quelques liens corrects on liait vraiment toutes les entrées. Passer de « j’ai-bossé-sur-Ben-Whishaw-donc-j’ai-cherché-son-identifiant-IBDB » à « voici la liste complète des identifiants IBDB, trouvons leurs entrées Wikidata correspondantes ». Joie des joies, il existe un outil merveilleux du nom de Mix n’ Match[9]. Là encore je pourrais faire une présentation détaillée de cet outil mais dans le cadre de cet article je vais me contenter de dire qu’il nécessite de récupérer au préalable la totalité des identifiants valides de la base de données à lier à Wikidata, ce que j’ai donc commencé à faire (et je remercie pour cela Ash_Crow[10], Dereckson[11] et Rama[12]). Récupérer tous ces identifiants prend du temps (pour le moment je n’ai importé que la partie de la base sur les œuvres, si vous voulez aider[13]). Il fallait que je m’occupe en attendant que les scripts finissent de tourner. C’est là que j’ai remarqué que Ben Whishaw (oui, parce que c’est toujours de sa faute) avait été étudiant de la RADA (Royal Academy of Dramatic Art)[14].



Le truc cool sur Wikidata[15] c’est que non seulement on peut indiquer (P69) où les gens ont fait leurs études, mais en plus on peut apporter plein de précisions : la date de début (P580), celle de fin (P582), le diplôme préparé (P512), la principale spécialité d’études (P812)… Il n’y avait pas de sources. Ça m’a énervée. Je suis allée en chercher. Et là… RADA !

RADA Theatre, Malet Street, Londres -- CC-BY-SA 2.0
RADA Theatre, Malet Street, Londres — CC-BY-SA 2.0

Oui. La RADA a mis en ligne les profils de ses anciens élèves. Voilà la fiche de Whishaw pour les curieu⋅ses⋅x[16]. Bref, je cherchais une source et je suis tombée sur une mine d’or. Là, la Wikimédienne en moi s’est dit : non mais attends, tu ne vas pas sourcer que pour Whishaw, tu vas pouvoir sourcer tous les anciens étudiants avec à chaque fois leur année de diplôme, leur diplôme et tout ça et faire plein de statistiques démentes à partir de requêtes SPARQL ! (et puis ça t’occupera le temps que tu récupères les identifiants de tous les gens ayant un jour bossé dans un spectacle à Broadway).

Naïvement, je me suis dit que la RADA n’avait pas tant d’élèves que ça par année et que ça ne prendrait donc pas un temps fou[17]

Identification des éléments concernés

Sur Wikidata

Pour commencer j’ai essayé de savoir ce qui existait déjà sur Wikidata. J’ai donc fait une petite requête pour trouver la totalité des éléments Wikidata ayant P69:Q523926 (scolarité à la Royal Academy of Dramatic Art). J’ai croisé avec la catégorie anglophone. En fait, quelqu’un a, il y a quelques mois, ajouté P69:Q523926 sur tous les éléments catégorisés comme « Alumni of the Royal Academy of Dramatic Art »[18]. Bref, comme à l’époque je n’avais pas encore l’intention d’écrire ce billet de blog, il y en avait environ 650, avec relativement peu d’écart entre WD et la catégorie anglophone (donc peu d’entrées WD sans articles sur WP:en a priori). Il y avait plus d’éléments sur Wikidata que dans la catégorie anglophone mais toutes les entrées de la catégorie sortaient bien dans la liste Wikidata.

Pour suivre mon avancement, je n’ai donc à faire que deux requêtes : la première pour lister les étudiants de la RADA, la deuxième pour lister les étudiants de la RADA avec une date de sortie de l’école.

En WikidataQuery, parce que c’est tellement simple que ce n’est pas la peine de sortir SPARQL ça donne[19] :





Il y avait déjà quatre ou cinq élèves où l’information « date de sortie de l’école » était déjà présente mais il n’y avait soit pas de source, soit une source autre que celle de la RADA. J’ai décidé de ne pas m’en soucier et que je les traiterais en même temps que les autres.

Sur Wikipédia

J’avais déjà constaté que la totalité des articles de la catégorie anglophone « Alumni of the Royal Academy of Dramatic Art » avait la propriété P69 « scolarité » avec la valeur RADA sur Wikidata. Je sais aussi qu’il y a plus d’entrées marquées sur WD que dans la catégorie : le décalage vient-il d’articles anglophones non catégorisés[20] ou d’entrées Wikidata sans article correspondant en anglais[21] ?

La catégorie existe dans d’autres langues que l’anglais : en espagnol, en arabe, en français, en latin, en polonais, en russe, en anglais simplifié, en turc et en chinois. Mais un survol de chacune de ces catégories m’a indiqué qu’elles sont beaucoup moins remplies que la catégorie anglophone (assez logique pour une école londonienne) et qu’il est donc peu probable qu’elles me servent beaucoup.

Cependant, il n’y a pas que la catégorie pour repérer les étudiants. WP:en a aussi une liste (List of RADA alumni). Cette liste[22] est intéressante car elle indique entre parenthèses l’année d’obtention du diplôme, ce qui est une information absente de la catégorie.

Par contre, il aurait été trop demander que la totalité des entrées de la catégorie soient présentes dans la liste, ou que la totalité des entrées de la liste soient dans la catégorie… Oui, vous avez bien lu, les deux systèmes de la Wikipédia anglophone ne se recoupent pas.

Identifions : de la RADA vers Wikidata

Le plus simple pour commencer me paraissait de partir de la base RADA et de regarder s’il y avait une correspondance sur WD/WP : en effet, même si beaucoup d’étudiant⋅e⋅s de la RADA sont devenus connu⋅e⋅s, iels n’ont pas tou⋅te⋅s un article Wikipédia, il ne faut pas exagérer. Dans un monde idéal où Wikipédia et Wikidata seraient complètes après avoir fini de vérifier toutes les entrées de la RADA je devrais être passée sur les 700 et quelques entrées Wikidata déjà repérées. Mais comme Wikipédia et Wikidata n’ont jamais prétendu être complètes, je me doutais avant de commencer que j’aurais des pertes.

Recherche artisanale par nom

Au début, je me suis dit que j’allais simplement chercher dans Wikidata chaque nom d’élève listé sur le site de la RADA et vérifier si je l⋅a⋅e trouvais. En commençant par 1906, qui est la première année avec des diplômé⋅e⋅s[23] vu que l’école a été fondée en 1904.

Très vite, les premiers problèmes sont apparus avec cette méthode artisanale.

En 1907 par exemple, la⋅e seul⋅e élève est « H Bentley ». Le système de recherche de Wikidata fait que si je fais une recherche sur ce nom, je n’aurai comme résultat que les « H Bentley » et « H. Bentley » (et pas Henry, Harriet ou autres). Si j’ai de la chance, quelqu’un aura pensé à ajouter « H Bentley » en alias de l’élément Wikidata et iel sortira dans la recherche. Si je n’en ai pas, je suppose que je peux toujours faire une requête de la forme :

FIND H% Bentley in Labels in Alias

(lien vers la requête autolist) et espérer que quelque chose en sorte[24]. Je peux aussi rechercher « Bentley » et passer rapidement sur toutes les entrées… Bref, l’identification n’est pas simple.

Fautes d’orthographe et la base mal remplie

D’autant qu’il peut y avoir des fautes d’orthographe dans la base RADA : je suis quasiment certaine que Joan Mibourrrne n’a pas en réalité trois R dans son nom de famille ou Dorothy Reeeve trois E.

Desmond Llewellyn[25] est par exemple entré dans la base RADA sous le nom de Desmond Wilkinson (il s’appelle Desmond Wilkinson Llewellyn d’après l’article en anglais, ce qui n’est même pas présent sur l’article en français). En fait ce n’est pas tout à fait vrai : lui est entré à la fois sous le nom de « Desmond Llewellyn » (fiche ici) et sous le nom de « Desmond Wilkinson ». Oui, il a deux fiches la même année.

Desmond Llewelyn en 1983 - Towpilot CC-BY-SA 3.0
Desmond Llewelyn en 1983 – Towpilot CC-BY-SA 3.0

Les doublons dans la base sont nombreux : la probabilité que deux étudiantes différentes, nommées Alison James et Allison James, soient diplômées toutes les deux en 1954 me semble assez faible.

Les homonymes

Même sans faute d’orthographe, si on trouve un homonyme, ce n’est pas nécessairement correct. Rose Hersee, étudiante de 1908 n’est pas Rose Hersee, la chanteuse née en 1845. Oui, il faut vérifier. Dans nombre de cas, cela a signifié aller fouiller l’article Wikipédia (qui parfois mentionne la RADA ! Parfois même avec des sources !) et surtout les sources de ces articles (pour la première moitié du XXe siècle, cela a essentiellement signifié lire des dizaines de nécrologies). Parfois, bingo ! le lien pouvait être fait. Parfois le non-lien pouvait être fait. Dans nombre de cas, je n’ai pas pu trancher avec une recherche de ce type parce que les profils de la RADA avant le XXIe siècle sont pour le moins sommaires.

Il peut y avoir plusieurs élèves de la RADA avec le même nom, ou des cas où la même personne a suivi plusieurs formations (surtout le cas dans les diplômes techniques, où certains noms reviennent). Côté Wikidata les homonymies sont légion (surtout avec des noms comme « John Jones »…), donc il faut parfois fouiller dans plusieurs centaines de résultats pour trouver la personne la plus probable (et remercier au passage les personnes qui remplissent les descriptions[26]).

Les pseudonymes

Iels ont des pseudonymes. Un nombre impressionnant de femmes sont devenues connues sous le nom de leur mari, et personne n’a mis en alias leur nom de naissance. Un nombre impressionnant a simplement pris un pseudonyme (Conrad Havord est devenu connu sous le nom de « Conrad Phillips » par exemple). Parfois c’est l’inverse, iels se sont inscrits à la RADA avec un pseudonyme/nom d’épouse/surnom et l’article Wikipédia a conservé le nom de naissance (par exemple, June Flewett est inscrite à la RADA sous le nom de Jill Freud, son diminutif et le nom de famille de son mari). J’aime beaucoup aussi Priya Rajvansh inscrite à la RADA sous le nom de Vera Singh. Tous ces cas ne sont identifiables que si quelqu’un a pensé à mettre les alias sur Wikidata[27]. Et parfois il y a des cumuls de pseudonymes plus fautes d’enregistrement, comme dans le cas de Kay Hammond (nom de scène), dont le véritable nom est « Dorothy Katherine Standing » mais qui est enregistrée à la RADA comme « Kathrine Standing », ce qui ne facilite pas l’identification puisque ne ressortant pas dans les recherches sur Wikidata.

Est-ce que Jean Rhys, née « Ella Gwendolen Rees Williams » en 1890 et ayant utilisé nombre de pseudonymes, est Ella Reeve, l’étudiante de la RADA diplômée en 1909[28] ? Vern Agopsowicz est devenu connu sous le nom de John Vernon… Je pourrais continuer longtemps.

Henry Darrow et John Vernon - Domaine public aux États-Unis
Henry Darrow et John Vernon – NBC Television, Domaine public aux États-Unis

Arkanosis à la rescousse

À ce stade Arkanosis a eu pitié de moi et m’a créé un script pour faciliter le travail (avec une retouche par Ash_Crow pour être encore plus simple pour moi après) :

#! /bin/sh

if [ $# -ne 2 ]; then
    echo 'Usage:  '
    exit 1


echo "Year $year
      " > list-$profile-$year.html wget -q ''$profile'&yr-acting='$year'&yr-technicaltheatrearts='$year'&crs-technicaltheatrearts=&yr-theatrelab='$year'&yr-directing='$year'&crs-directing=&fn=&sn=' -O - | \ sed -n 's@.*fn=\([^&]*\).*sn=\([^"&]*\).*@\1 \2@p' | \ while read firstname lastname; do echo "
    • $firstname $lastname wikidata" wget -q ''$firstname'+'$lastname -O - | \ sed -n 's@.*title&.*\(Q[0-9]\+\)&.*@\1@p' | \ while read qid; do if grep -q $qid unhandled.lst; then echo " $qid" fi done echo "
" done >> list-$profile-$year.html echo " " >> list-$profile-$year.html

Les urls de la base RADA étant systématiquement de la forme année/prénom/nom[29], il en a simplement extrait des listes par année avec un élève par ligne, sous la forme :

  • Nom de l’élève (lien vers la fiche RADA) / Wikidata (lien qui pointe sur la page de recherche avec ce nom) / éventuels Qid qui sont sortis dans le 2e lien et qui donnent aussi un résultat dans la liste des P69:Q523926 (déjà listés comme élèves de la RADA)

Par exemple une ligne pour un élève de la formation « acting » en 1947 est :
harold goodwin wikidata Q1585750

Toutes les lignes n’ont pas de Qid, loin de là (les lignes avec sont même largement minoritaires). Tous les Qid ne sont pas corrects : comme je le disais, il y a quelques homonymes à la RADA ; ou alors le système de recherche de Wikidata a pour une fois ratissé trop large et sorti des combinaisons prénom/nom qui ne correspondent pas à la fiche RADA (par exemple une recherche sur Romany Evens suggère George Bramwell Evens sur Wikidata). Néanmoins, l’immense majorité des lignes avec un Qid a effectivement permis de repérer de véritables étudiant⋅e⋅s tandis que le pourcentage était bien plus faible sur les lignes sans Qid pré-suggéré. Merci encore à Arkanosis.

Même avec ces listes pré-établies, n’ayant plus qu’à cliquer sur les liens au lieu de faire un copié-collé à la main, il a fallu passer manuellement sur toutes les entrées[30]. Le problème de tirer les noms des url, c’est aussi la non-gestion des apostrophes et des espaces. Une recherche de peter otoole sur Wikidata ne renvoie pas Peter O’Toole par exemple.

Conclusion de la RADA vers Wikipédia

Un certain nombre d’entrées ont pu être identifiées (835 très exactement à la fin du travail sur scripts) mais la majorité des élèves listés de la RADA n’ont renvoyé aucun résultat (on s’y attendait) et un nombre important n’a renvoyé que des résultats incertains. J’ai ainsi pour le moment 442 lignes dans un tableur avec une entrée RADA et une entrée Wikidata potentielle, en attente de sources pour confirmer, et ce alors que je n’ai pensé à les lister que lorsque j’avais déjà traité un bon quart de la base : on parle donc de plusieurs centaines de cas où une recherche plus approfondie va être nécessaire.

Aparté sur les féminins

À force de regarder les éléments sur des act⋅rices⋅eurs, je me suis aperçue qu’un grand nombre d’actrices avaient une description en anglais de la forme « Nationalité actor ». Quelqu’un a fait passer un robot pour compléter automatiquement les descriptions et ne s’est pas aperçu que cela mettait une description au masculin y compris sur les femmes.

Donc j’ai requêté le nombre d’entrées Wikidata avec genre (P21) féminin (Q6581072) et une description en « % actor », j’ai mis tout ça dans un csv, que j’ai passé dans CSVtoQuickStatements, puis dans QuickStatements[31], et quelques dizaines de milliers de modifications plus tard j’aimerais vous rappeler de bien faire attention lorsque vous codez vos scripts, ou de vous relire après coup. Merci.

Identifions : de Wikipédia vers la RADA

J’ai commencé à regarder les étudiant⋅e⋅s présent⋅e⋅s sur WP mais pas dans la liste traitée sur WD. Le grand retour de la méthode artisanale !

Dans un monde parfait, une fois fini de traiter les scripts, le nombre d’entrées Wikidata marquées comme élèves de la RADA et le nombre d’entrées marquées comme élèves de la RADA avec une date de fin de renseignée (et donc ayant un lien vers la base RADA comme source) aurait dû correspondre. Le monde n’étant pas parfait, il nous reste alors plus de gens que Wikipédia indique comme élèves qu’il n’a été possible d’identifier du côté de l’école. Il y a un certain recoupement avec les lignes du tableur précédemment mentionné, mais pas si important : l’essentiel du tableur est constitué d’act⋅rices⋅eurs pour lesquel⋅le⋅s il ne m’a pas été possible de trouver une mention de leur école.

En utilisant autolist, il est possible de demander la liste des entrées présentes dans la catégorie de WP:en et ne répondant pas à la requête « claim[69:523926]{claim[582]} »

Cela donnait 132 résultats, sur lesquels je suis passée manuellement. Ce passage a permis d’identifier 23 personnes de plus (pseudonymes ou noms de naissance pour les femmes essentiellement, présents dans le texte des articles, mais non renseignés en alias sur Wikidata : la recherche sur ce site de ces noms-là ne renvoyait pas aux articles Wikipédia correspondants).

Fin avril, la catégorie anglaise comptait 907 entrées, Wikidata 953 entrées et seules 835 entrées avaient en réalité été traitées proprement avec une véritable source. De plus il ne faut pas oublier que toutes les entrées Wikidata ne correspondent pas à un article sur la Wikipédia en anglais : un certain nombre d’act⋅rices⋅eurs ont des entrées sur des Wikipédias en d’autres langues mais pas sur l’anglophone et une petite dizaine n’a pas d’article Wikipédia associé du tout, leur entrée Wikidata ayant souvent été créée dans ce cas pour remplir complètement la distribution d’un film.

SELECT ?student ?studentLabel {
  ?student wdt:P31 wd:Q5 . # human
  ?student p:P69 ?statement .		# Student of...
  ?statement ps:P69 wd:Q523926 .	# ...RADA
  FILTER NOT EXISTS { ?statement pq:P582 ?x .} # with no end date
  SERVICE wikibase:label {
		bd:serviceParam wikibase:language "en" .

lien vers la requête des cas à traiter.

Les incohérences

La liste à traiter provient essentiellement de la Wikipédia en anglais : la requête SPARQL (sur Wikidata mais sans date de fin) signalait 112 erreurs fin avril quand la requête autolist (dans la catégorie anglophone mais sans date de fin sur Wikidata) n’en renvoyait que 110 (et l’un d’eux correspond à un article depuis supprimé de WP:en). Je n’ai pas vérifié systématiquement la centaine d’historiques concernés mais à chaque fois que j’ai regardé, j’ai pu confirmer que l’information était arrivée sur Wikidata lors de l’import massif de la catégorie.

Le travail consiste désormais soit à trouver sous quel nom la personne a été enregistrée côté RADA (puisqu’il y a des fautes de frappe, par exemple) ou à trouver d’où peut bien provenir l’erreur. Ash_Crow a ainsi corrigé George Bernard Shaw catégorisé comme étudiant alors qu’il a légué une partie de son héritage à la RADA[32]. Pour Armaan Kirmani, son entrée IMDB indique qu’il a été l’élève d’un enseignant de la RADA, ce qui ne signifie pas qu’il y a étudié non plus…

Homme barbu, photo en noir et blanc
George Bernard Shaw en 1915 – Domaine public aux États-Unis

Dans cette centaine de cas problématiques, il y a un peu tous les cas de figure, de ceux qui ne mentionnent pas du tout la RADA, à ceux qui disent clairement que la personne y a étudié mais sans citer de sources[33], voire à ceux qui sourcent avec une déclaration qui n’est pas si claire que ça. En effet, la RADA ne propose pas que des formations longues diplômantes : elle organise aussi un certain nombre de stages et ateliers. Si un⋅e actrice⋅eur a participé à un stage de deux jours à la RADA, iel n’apparaîtra pas dans la base RADA des ancien⋅ne⋅s élèves mais iel pourra déclarer sincèrement en interview qu’iel a appris tel truc à la RADA… d’ici à ce qu’un⋅e Wikipédien⋅ne enthousiaste décide que ça fait d’ellui un⋅e ancien⋅ne élève, il n’y a qu’un pas. Par exemple Ash_Crow a trouvé une source (même si de qualité douteuse) affirmant qu’Émilie Rault avait bien étudié à la RADA mais elle n’est nulle part dans la base parce qu’il est extrêmement probable qu’elle n’a fait qu’y suivre des stages vu qu’elle était en master de musicologie à la Sorbonne en même temps. Ce qui pose la question de l’utilisation de la propriété « scolarité » sur Wikidata : doit-on la réserver pour les formations diplômantes ou accepter y compris jusqu’aux stages de quelques jours ?

Les écarts entre la liste et la catégorie

Comme préalablement signalé, la « List of RADA alumni » ne correspond pas à la liste de la catégorie. Systématiquement, à chaque fois que j’identifiais une personne et l’article associé, j’ai ajouté son nom dans la liste et je l’ai catégorisé correctement. Je n’ai cependant pas encore trouvé le courage de vérifier les deux listes proprement pour identifier les décalages. La liste manuelle devrait être plus complète que la catégorie, puisque comprenant également des liens rouges (non existant sur la Wikipédia en anglais) avec des liens vers l’article dans d’autres langues.

Xavier Combelle ayant eu l’amabilité de lister les différences entre la catégorie et la liste début mai, il reste bien dans la catégorie la centaine de cas problématiques précédemment évoqués (non présents dans la liste donc) et dans la liste, outre les liens rouges tout à fait normaux, dix-huit articles non catégorisés. Aucun d’entre eux ne renvoie de lien évident avec une entrée de la RADA, à l’exception de Xenia Kalogeropoulou qui a pu être identifiée avec Xenia Calogeropoulos et être catégorisée dans la foulée. Parmi ces cas, certains articles Wikipédia évoquent explicitement que la formation à la RADA a pris la forme d’ateliers ou de stages. Nous revenons à la question : quel cursus faut-il avoir suivi pour être considéré⋅e comme un⋅e ancien⋅ne étudiant⋅e ?

Les problèmes sur la base RADA

Une fois listés tous les problèmes côté Wikipédia/Wikidata (qui peuvent se résumer à : des gens ajoutent des informations sans sourcer et celles-ci se répandent ensuite partout[34]), force est de constater qu’une partie des problèmes provient de la base RADA.

Complétude des données

Comme nous l’avons déjà constaté, la base est remplie de doublons, chaque pseudonyme ou graphie de nom créant une nouvelle page au lieu de se centraliser avec une page par élève. Cela pose évidemment un problème si nous sommes intéressé⋅e⋅s par le nombre d’étudiant⋅e⋅s par année par exemple.

Du point de vue wikidatien, cela empêche également la solution simple de créer une entrée par élève, indépendamment de la présence d’un article Wikipédia. La base de données de Cambridge par exemple, attribue un identifiant fixe par élève, ce qui a permis l’importation complète de ces identifiants sur Wikidata, au besoin en créant les entrées manquantes (P1599: ID de la Cambridge Alumni Database)[35]. Si la RADA avait choisi la solution d’un identifiant/élève au lieu d’url de la forme diplôme/année/prénom/nom, il aurait été plus facile de l’importer entièrement.

Ce qui nous amène au point suivant : il n’est pas du tout certain que la base soit actuellement complète. Rien n’est indiqué en ce sens sur le site. Un petit tour sur la Wayback Machine d’Internet Archive nous montre que la base n’est en ligne que depuis 2015, auparavant seul⋅e⋅s les élèves en cours d’études avaient un profil sur le site. S’il semble donc très probable que les données les plus récentes soient complètes (à partir de 1999, où les profils sont détaillés et accompagnés de photographies), les profils des années antérieures sont parfois très sommaires. Surtout, certaines années semblent étrangement vides d’élèves, comme 1988.

Serait-il possible que dans la centaine de cas listés comme élèves de la RADA qui n’ont pu trouver de correspondance dans la base il y ait des oublis ? Un des cas qui me font douter est celui de Noel Streatfeild qui d’après son site internet aurait été acceptée comme élève en 1919. J’ai bien trouvé un⋅e « Noel Goodwin » diplômé⋅e en 1922 mais est-ce elle ?

Un cas encore plus explicite est celui de Dora Mavor Moore, qui d’après cet article biographique a été la première Canadienne acceptée à la RADA et aurait été diplômée en 1912. Le problème, c’est que côté RADA, un seul élève a été diplômé cette année-là et « Leonard Notcutt » n’est pas un pseudonyme connu de Dora Mavor Moore.

Fiabilité des données

Le problème avec probablement le plus d’impact, c’est que certain⋅e⋅s des élèves listé⋅e⋅s dans la base RADA en sont sorti⋅e⋅s avant d’être diplômé⋅e⋅s. Quelqu’un comme Harold Pinter a bien une fiche RADA disant qu’il fait partie de la promotion de 1949. En fait, Pinter est entré à la RADA en 1948 et a abandonné le cursus en 1949, avant d’être diplômé donc. La RADA liste-t-elle ses ancien⋅ne⋅s élèves indépendamment du fait qu’iels aient achevé leur cursus ? Dans Wikidata ces cas sont gérés en entrant un « no value » au lieu d’une valeur personnalisée dans le champ du qualificatif « diplôme » de la propriété « scolarité ».

Il est tout de même un peu problématique que nous ne puissions pas faire confiance à l’école elle-même pour savoir qui en a été diplômé⋅e…

J’ai un autre problème avec la fiche RADA de Sheila Terry qui me semble correspondre à Sheila Terry sur Wikipédia. Il est à peu près certain qu’elle n’a pas mis les pieds à Londres pendant ses études ; d’après WP, elle les aurait faites à la Dickson-Kenwin academy, une école « affiliée » à la RADA. Est-ce à dire que cette école délivrait alors le diplôme de la RADA ? (oui, avant la réforme des années 2000, la RADA délivrait ses propres diplômes). Là encore, je manque d’informations.

J’ai un certain Jack May de la promotion de 1943 dont l’article Wikipédia en anglais dit explicitement qu’il a été reçu à la RADA et n’y est jamais allé

Bref, ce n’est pas simple, même lorsque les personnes en question sont identifiées !

Requêtes et statistiques marrantes

Tout ceci étant dit, nous avons malgré tout un échantillon intéressant avec 835 entrées. Cela ne correspond pas à tous les élèves de la RADA, loin de là, mais c’est un nombre suffisant pour pouvoir commencer à s’amuser un peu avec les requêtes SPARQL !

Nombre d’élèves avec entrée WD par année

Commençons tout simplement par demander la liste complète des élèves de la RADA avec une date de fin d’études :

SELECT ?year (COUNT(?student) AS ?number) {
  ?student wdt:P31 wd:Q5 .
  ?student p:P69 ?statement .
  ?statement ps:P69 wd:Q523926 .
  ?statement pq:P582 ?endtime .
  BIND(YEAR(?endtime) as ?year) . 
} GROUP BY ?year ORDER BY ?year

lien vers la requête ce qui nous permet de faire ce joli graphique :

Nombre d'élèves de la RADA ayant une entrée Wikidata par année
Nombre d’élèves de la RADA ayant une entrée Wikidata par année

Âge moyen à la sortie d’école

Toujours sur l’échantillon wikidatien, maintenant que nous savons quand iels sont sorti⋅e⋅s de l’école, à quel âge l’ont-iels fait ? Cela suppose que leur date de naissance est renseignée sur Wikidata, ce qui réduit encore un peu notre échantillon.

SELECT ?endYear (AVG(?age) AS ?averageAge) WHERE {
	?person p:P69 ?radaStatement .
    ?radaStatement ps:P69 wd:Q523926 .
    ?radaStatement pq:P582 ?endDate .
    ?person wdt:P569 ?birthDate .
   	BIND(YEAR(?endDate) AS ?endYear)
  	BIND(?endYear - YEAR(?birthDate) AS ?age)
} GROUP BY ?endYear ORDER BY ?endYear

lien vers la requête

Ou même une requête plus avancée : l’âge moyen à la sortie de l’école, selon les années, le genre (masculin ou féminin, aucun autre genre déclaré dans notre échantillon), avec indication du nombre de personnes concernées par année :

SELECT ?endYear ?genderLabel (ROUND(AVG(?age)) AS ?averageAge) (COUNT(?person) AS ?number) WHERE {
	?person p:P69 ?radaStatement .
    ?person wdt:P21 ?gender .
    ?gender rdfs:label ?genderLabel filter (lang(?genderLabel) = "fr") .
    ?radaStatement ps:P69 wd:Q523926 .
    ?radaStatement pq:P582 ?endDate .
    ?person wdt:P569 ?birthDate .
   	BIND(YEAR(?endDate) AS ?endYear)
  	BIND(?endYear - YEAR(?birthDate) AS ?age)
} GROUP BY ?endYear ?genderLabel ORDER BY ?endYear

lien vers la requête. Il y aurait une pyramide des âges à faire si je n’étais pas si flemmarde.

Combien de nationalités ont été représentées à la RADA ?

SELECT ?nationality ?number ?nationalityLabel {
 {SELECT ?nationality (COUNT(?student) AS ?number) {
 ?student p:P69 ?statement .
 ?statement ps:P69 wd:Q523926 .
 ?statement pq:P582 ?endtime .
 ?student wdt:P27 ?nationality .
 } GROUP BY ?nationality}
 SERVICE wikibase:label { bd:serviceParam wikibase:language "en" . }
} ORDER BY desc(?number)

lien vers la requête qui affiche donc la liste des nationalités avec à chaque fois le nombre d’élèves concerné⋅e⋅s, classé de la plus représentée (étonnamment[36], les Britanniques) à la plus rare. Plus d’une trentaine de nationalités ont donc été représentées à la RADA !

Nombre d’étudiants de la RADA ayant joué dans un James Bond

SELECT DISTINCT ?actor ?actorLabel WHERE {
  ?item wdt:P179 wd:Q2484680 .
  ?item wdt:P161 ?actor .
  ?actor wdt:P69 wd:Q523926 .
  SERVICE wikibase:label { bd:serviceParam wikibase:language "en" . }
} ORDER BY ?actorLabel

lien vers la requête.
Ce qui représente quand même plus d’une quarantaine de personnes, ce n’est pas rien !


  1. Je n’ai pas fini ;
  2. J’espère que l’archiviste de la RADA est sympathique ;
  3. Les gens, sérieusement, importez les alias sur Wikidata ;
  4. Et vos sources. C’est bien, les sources ;
  5. Et photographiez Ben Whishaw, on manque cruellement d’images libres ;
  6. On peut quand même faire des requêtes amusantes non[37] ?

(image à la une : Fronton de la RADA, par Chemical Engineer, CC-BY-SA 3.0)

  1. Il n’est pas le seul, Rory Kinnear est excellent aussi en Bolingbroke (et Patrick Stewart ♥) mais Bolingbroke est intéressant dans la pièce de Shakespeare, alors que Richard II, c’est le type qui se tape de longues tirades sans qu’il ne soit ni clairement un gentil auquel s’attacher, ni clairement un méchant qu’on pourrait détester. Dans mon expérience, selon les adaptations, c’est soit un personnage saoulant, soit un personnage tellement mal joué qu’il en devient ridicule. Il ne commence à acquérir une certaine dimension qu’à l’acte IV ce qui est un peu tard, avouez-le. Sauf que Whishaw en enfant-roi-devenu-adulte-mais-pas-vraiment, tour à tour capricieux et christique, m’a rendu ce personnage vivant bien avant ce fameux Acte IV. Je pourrais faire un billet de blog entier sur The Hollow Crown, acteurs, costumes et décors (et la cinématographie ! une des grandes réussites aussi) mais il paraît que je suis là pour vous parler de Wikidata et de la RADA et vous verrez que ce sera bien assez long à venir comme ça).
  2. En fait il a eu un BAFTA pour ce rôle, comme quoi mon opinion a été quelque peu partagée.
  3. Oui, j’ai vaguement commencé à récupérer des sources pour rédiger correctement l’article mais 1. je n’ai jamais écrit d’article sur une personne vivante 2. j’ai été un peu occupée depuis, comme vous allez le voir dans le reste de l’article.
  4. Oui, parce qu’il joue aussi dans James Bond et y a d’ailleurs un nombre impressionnant d’actrices/eurs shakespearien⋅ne⋅s dans les derniers James Bond.
  5. Parce que Richard II n’était pas son premier rôle shakespearien, ni même son deuxième, vu qu’il a aussi joué Ariel dans l’adaptation de La Tempête avec Helen Mirren en Prosper(a).
  6. Vous vous en fichez peut-être, mais là, j’ai juste envie d’aller à Broadway. Bref.
  7. Oui, j’ai créé l’item Wikidata de la production actuelle.
  8. Dans mon expérience, s’il y a une erreur sur Wikidata, elle vient presque toujours de Wikipédia et l’IBDB ne faisait pas exception.
  9. Et qui existe en version jeu de téléphone portable, pour ceux qui veulent jouer à améliorer Wikidata sur leur téléphone portable (et qui ont un téléphone portable qui va sur internet).
  10. pour le python
  11. pour le serveur
  12. pour le soutien moral et avoir regardé The Hollow Crown avec moi
  13. Il faut associer le bon élément Wikidata à chaque entrée de l’IBDB ou marquer l’élément comme à créer.
  14. Qui a dit : « enfin ! » ?
  15. En fait, il y a plein de trucs cools sur Wikidata.
  16. Où l’on apprend qu’il pratiquait le « cat breeding », information importante s’il en est et que non, je n’ai pas encore réussi à entrer dans Wikidata. Je suis déception.
  17. Je suis quelqu’un d’optimiste.
  18. Ou comment importer sur Wikidata les erreurs des Wikipédias (voir note 7).
  19. En utilisant Autolist bien sûr.
  20. Spoiler : oui, en partie.
  21. Spoiler : oui, aussi.
  22. Liste qui est sous forme manuelle et non de tableau, ce qui est une hérésie car ne permettant pas facilement un tri par année.
  23. En l’occurrence, un seul.
  24. Spoiler : non.
  25. Parce que Whishaw n’est même pas le premier étudiant de la RADA à avoir joué Q dans James Bond.
  26. Les descriptions, c’est bien, mangez-en.
  27. Les alias, c’est bien aussi, mangez-en.
  28. Dans ce cas précis c’est probable mais pas certain. Certains cas sont bien plus douteux.
  29. Merci à la RADA d’avoir fait ça proprement.
  30. Tout compte fait, il y en a quand même beaucoup.
  31. Outils qui mériteraient aussi une présentation détaillée.
  32. Ce qui est fort aimable de sa part mais n’en fait pas un étudiant.
  33. Par exemple Margaret Rutherford : un compte ajoute sommairement l’information sans source en 2008, ce qui conduit la page à être catégorisée en 2010…
  34. C’est une épidémie.
  35. Mix n’ Match permet de marquer un identifiant comme nécessitant la création d’une entrée Wikidata.
  36. Ou pas.
  37. Et des notes de bas de page, qui sont quand même la partie la plus intéressante de ce billet.

Gribouillage 181 : Ça s’en va et ça revient.

C'est fait de tous petits riens ♫

Certains contributeurs quittent « définitivement » Wikipédia. Genre, plusieurs fois… tous les quelques mois à années. En grandes pompes. Et reviennent toujours.

Classé dans:Gribouillage, les coulisses de Wikipédia

8 mai : ce qu’il ne faut pas montrer

Je vais parler ici d’une petite wiki-polémique sans importance mais qui m’a assez touché.

« Couvrez ce sein que je ne saurais voir »
Le Tartuffe, 1664 – Molière

Le 8 mai 1945, l’Allemagne nazi a capitulé. La seconde guerre mondiale a été particulièrement meurtrière avec une extermination de masse de minorités. En 1945 l’incrimination de crime contre l’humanité est mise en place.

Quoi donc de plus logique que de mettre une image en lien avec cette réalité historique (voir) avec un commentaire « N’oublions pas la gravité de ce qu’il s’est passé » sur le Bistro ?

L’image a cependant été retiré, car « je n’ai pas envie de voir des morts sur le Bistro, je n’y suis pas préparée quand j’y vais ». Un IP a alors écrit une réponse que je partage entièrement : « L’usage d’images-choc est pourtant devenu une habitude quand il s’agit de nos petits soucis avec le tabac ou la vitesse, quitte à tomber dans le racolage. Mais quand il s’agit de notre histoire, ça coince… ».

La discussion réussi même à dériver sur la protection des mineurs. On a même été jusqu’à censurer en mettant en boîte déroulante des images de poumon malade, d’accident de voiture et de cadavres qui étaient pourtant en (très) petite taille et qui était bien dans le contexte de la section.

Je trouve cette réaction excessive. Je me suis douté qu’il y aurait pententiellement une image concernant le 8 mai sur le bistro du… 8 mai. De plus j’aimerai connaitre le nombre de mineurs innocents qui lisent le Bistro, une page meta de Wikipédia où l’on a (très) peu de chance de tomber dessus en tant que lecteur.

Pour information, le dimanche 8 mai la chaîne de télévision publique française France 2 a diffusé un documentaire Après Hitler en prime-time (21h00) montrant des vidéos de personnes battues, pendaisons en séries, femmes tondues… avec un avertissement CSA « Déconseillé aux moins de 10 ans » seulement. Qu’est ce qui est le plus choquant ? Mettre une image de cadavres d’assez mauvaise qualitée sur une page fréquenté par un petit nombre de contributeurs qui connaissent généralement les évènements historiques du 8 mai ou alors mettre un documentaire sur une chaîne publique montrant des images bien pires ?

J’ai décidé de placer à la place une image de voiture accidentée avec cette légende : « N’oublions pas la gravité de ce qu’il s’est passé (faut bien utiliser des euphémismes puisque la réalité peut choquer. » en réaction à cette mini-affaire.

May 02, 2016

Wikimédia France

L’extraordinaire odyssée du Wiktionnaire

Lyokoï, wiktionnariste et référent du groupe local de Lyon – aussi connu sous le nom de “cabale de la quenelle” – retrace pour notre blog le chemin parcouru jusqu’à la création de la première Wikipermanence au monde autour du Wiktionnaire. Un récit vivant et plein d’humour, à la découverte d’un projet moins bien connu que sa grande sœur Wikipédia.

Logo du Wiktionnaire - Smurrayinchester - CC-BY-SA 3.0

Le Wiktionnaire fait partie des projets Wikimédia, impulsés par la Wikimedia Foundation. Son objectif est de « définir tous les mots de toutes les langues dans toutes les langues ». Il existe en 172 langues, est fondé sur un système de wiki et son contenu, librement réutilisable, est publié sous licence CC-BY-SA. Image : logo du Wiktionnaire – Smurrayinchester – CC-BY-SA 3.0

Genèse d’une idée

« Tiens ? T’es sur le Wiktionnaire toi aussi ? » Tout a commencé ainsi. Depuis, quelque chose d’inédit s’est mis en place en France : la seule et unique Wikipermanence (réunion informelle et régulière autour d’un projet lié à l’univers Wikimedia) du monde uniquement dédiée au projet du Wiktionnaire.

Mais revenons au commencement : Lyon, une ville où il fait bon vivre, et surtout bon manger, accueille un groupe local de Wikimédiens important. Une vingtaine de personnes se réunissent ainsi régulièrement pour discuter, boire un coup, mais surtout ripailler. Fait inhabituel pour ce groupe, il dispose d’une forte représentation de wiktionnaristes – c’est-à-dire, contributeurs au Wiktionnaire – alors qu’ils sont peu nombreux dans le reste du pays. Cette prise de conscience de leur existence mutuelle les a amenés à un coup de génie à la fin de l’année scolaire 2014-2015 : tenir une permanence pour parler de ce projet.

Première étape : le lieu et les personnes

Il existe à Lyon un lieu génial pour les philologues, répondant au doux nom de KoToPo, qui en espéranto signifie : « etc ». C’est un bar, tenu par l’association Mille et une langues, qui, envers et contre tout, s’est donné pour objectif d’apprendre au plus grand nombre de personnes possible une des 45 langues enseignées en son sein. Dictionnaire – Langue ? Le lien est évident. Il n’a pas fallu longtemps pour que Noé, un membre appartienne aux deux entités et lance l’idée que la minorité agissante du Wiktionnaire pouvait bien former les apprentis du KoToPo à utiliser ce dictionnaire en tant qu’outil d’apprentissage d’une langue.

Ainsi fut-il : tous les premiers jeudis du mois, de 17h à 20h (officiellement, mais ça a tendance à déborder…), un groupe de 3-4 personnes se réunissent pour présenter le projet aux curieux et pour discuter entre eux. Les curieux sont peu nombreux, mais certains sont devenu des contributeurs occasionnels, et c’est ce que l’on pouvait espérer de mieux.

Cet espace de discussion de vive voix bouleversa le petit monde du Wiktionnaire (enfin petit… si on regarde les chiffre, c’est plutôt le contraire : presque 3 millions de mots venant de presque 4000 langues y sont décrits). En effet, depuis que ces wiktionnaristes disposent d’un temps dédié au débat autour du Wiktionnaire, ils ont formalisé de nombreuses avancées.

Deuxième étape : porter la bonne parole et impliquer la communauté

Cette permanence est par ailleurs directement issue d’une série de conférences que j’ai pu donner, depuis septembre 2014, en sillonnant la France pour présenter le Wiktionnaire à des publics très variés : lexicographes, linguistes, locuteurs de langues régionales, enseignants, libristes, etc. Les compte-rendus de ces interventions, établis de manière quasi-systématique, donnent souvent lieu à des retours de la part de la communauté en vue d’améliorer la visibilité du projet.

Cette même communauté fait preuve d’une grande curiosité quant à son propre fonctionnement ainsi que de l’avancement de son projet. Certains questionnements ont pu se mettre en place grâce au rassemblement quasi mensuels des Lyonnais. En effet, il n’est pas rare qu’un minimum de wiktionnaristes soient présents et engagent une discussion sur leur sujet préféré (après les bugnes, cela va sans dire !) : le Wiktionnaire.

Troisième étape : des projets pilotes pour inspirer la réflexion

C’est ainsi que s’est d’abord construit le projet WikiFromages (en écho au WikiCheese sur Wikipédia) qui amena notre communauté de Wiktionnaristes lyonnais à s’interroger sur de multiples facettes cachées du projet :

  • réflexion sur les annexes et les thésaurus ; proposition de les intégrer par défaut dans la recherche de base ;
  • mise en place d’une réflexion et d’un début de protocole sur l’intégration du gaulois, qui pourra servir à terme à d’autres langues mortes partiellement écrites ;
  • établissement du premier bilan annuel du Wiktionnaire ;
  • proposition et mise en place de l’actualité mensuelle du projet ;
  • retravail des pages d’aides et de convention ;
  • changement de mise en forme des signes de prononciation pour rendre compte de la diversité…

Au-delà des questionnements propres au fonctionnement du Wiktionnaire et à ses potentialités en tant qu’outil, l’analyse du projet a changé et une vraie réflexion s’est mise en place. Que peut-on faire avec le Wiktionnaire ? Quelles sont ses limites ? Comment l’améliorer ? Qui en a besoin sans le savoir ? Comment faire connaître le projet ?

Quatrième étape : partager avec d’autres le chemin parcouru

On peut considérer, grâce au chemin parcouru, que le Wiktionnaire français fait parti des petits projets les plus actifs de la Wikimedia Foundation, et qu’il a beaucoup à apprendre aux autres. Lorsque nous avons pris conscience de cela, nous sommes allés voir comment cela se déroulait ailleurs. Les anglophones vivant dans des lieux très éclatés ont actuellement énormément de mal à se rassembler, les autres petits wikis sont malheureusement souvent trop peu peuplés pour disposer d’une base de contributeurs minimale. Dans cette optique, nous proposons de partager notre cheminement lors de la Wikimania 2016, qui aura lieu en juin en Italie, où notre proposition de conférence a été acceptée (en plus d’une câlinothérapie entre petits projets).

Si l’encyclopédie Wikipédia est de mieux en mieux comprise par les professionnels du savoir, les autres projets sont encore complètement dans son ombre et leur milieu est souvent à des kilomètres d’une réflexion poussée (environ un centaine d’étude pour le Wiktionnaire contre plus de 5000 pour Wikipédia, toutes langues confondues pour les deux projets). A titre d’exemple, les éditions Larousse et Robert ont découvert l’ampleur du projet Wiktionnaire lors de ma conférence aux Journées Des Dictionnaires en février 2015…

Mais l’avenir est de toute façon radieux : parce que les projets sont libres et que les idées sont folles, parce que les besoins de sauvegarde linguistique sont phénoménaux et les données gigantesques (comptez plusieurs milliers d’entrées par langues, pour plus de 7500 langues), parce que tout le reste n’est finalement pas assez pour ceux qui veulent partager leur savoir et parce qu’il faudra toujours des petits projets pour qu’ils deviennent grands…

« Quoi ? Encore un wiktionnariste ? » est désormais une réflexion commune dans la cabale de la quenelle à Lyon.


Fuine et LHC

L’accélérateur de particule Large Hadron Collider (LHC) a subit dernièrement une attaque de la part d’une fouine.

Cet animal a en effet eu la bonne idée de s’introduire dans le plus grand accélérateur de particules du monde. En essayant de mordre un câble d’alimentation, il est à l’origine d’un court-circuit endommageant un transformateur de 66 kV. L’animal, qui n’a pas survécu au choc éléctrique, a fini carbonisé.

Sources : -
Crédit photo : Bohuš Číčel -  Creative Commons paternité – partage à 
l’identique 3.0 (non transposée)

Sur Wikipédia, Amqui se porte candidat au statut d’administrateur (voir la consultation).

Le Wikiconcours de mars 2016 s’est terminé cette nuit. Félicitation à tous les participants (et jurys) ! Résultats à suivre…

Wikimédia France

Liberté de panorama : le Sénat persiste dans l’erreur et signe !

Comme nous vous le disions mardi, de nombreux sénateurs ont soutenu notre vision de la liberté de panorama. Le sujet de la liberté de panorama aura déchaîné les passions tant à droite qu’à gauche. Malheureusement, tardivement, la lourde machine des lobbies de l’industrie culturelle s’est mise en marche, de manière pour le moins efficace.Le sénateur Assouline, grand porte-parole des sociétés d’ayants-droit, nous parle de la « population d’artistes la plus fragile », « sous le seuil de pauvreté », pour défendre les architectes et les sculpteurs ayant vendu leurs ouvrages à des collectivités territoriales. La sénatrice Robert instrumentalise, quant à elle, la cause des photographes professionnels alors que les droits de ces derniers ne sont pas touchés par la liberté de panorama (nous vous le disions, ils en seraient pourtant même les premiers bénéficiaires).

Néanmoins, le combat ne fut pas vain. Bien au contraire. En voyant les courageuses positions prises par les sénateurs Chaize, Leconte et Rome, nous constatons que nos parlementaires peuvent faire preuve de pragmatisme et évoluer avec leur société. Malgré cela, plusieurs sénateurs n’ont pas tenu compte des réalités d’Internet en faisant voter un amendement inapplicable.

Le séanteur Assouline se félicite d’une prise en compte des usages d’Internet faite « sans barrages conservateurs ». Il fait cependant preuve de méconnaissance du droit lorsqu’il reconnaît que, jusque là, le particulier pouvait être poursuivi, mais qu’aujourd’hui, en déposant une photo sur un réseau social seule la plateforme pourrait être incriminée. Or, c’est bien le particulier qui signe les conditions générales d’utilisation permettant l’utilisation commerciale de sa photo. A ce titre, le sénateur Chaize rappelle que les sénateurs sont également là pour défendre le particulier en danger, qui jusque là, n’a été représenté par personne. Ils étaient pourtant près de 19 000 à demander une liberté de panorama applicable.

Malgré les efforts remarquables de l’industrie culturelle pour rendre cette loi inopérante, nous pouvons, néanmoins, nous réjouir du fait que le principe de liberté de panorama ait eu un tel impact médiatique et politique. La sénatrice Mélot, rapporteur sur ce projet de loi, conviendra même du fait qu’il s’agissait d’une « exception justifiée ».

A l’instar de la sénatrice Mélot, nous pensons que cette liberté est appelée à évoluer. Deux occasions se présenteront : la discussion en Commission Mixte Partiaire et celle de la révision de la directive européenne sur le droit d’auteur. D’autant que notre gouvernement, par la voix d’Axelle Lemaire, est désormais favorable à cette exception.

A ce sujet, n’hésitez pas à répondre, comme nous, à la consultation européenne sur la liberté de panorama.

April 26, 2016

Wikimédia France

Projet de loi numérique : début des débats au Sénat

Les débats sur le projet de loi « pour une République numérique » ont commencé cet après-midi, et se poursuivront jusqu’à jeudi, vers l’adoption du projet de loi par vote solennel le 3 mai.

De nombreux sénateurs, de tous bords, ont entendu les 19 000 signataires de notre pétition. En effet, durant toute la phase au Sénat, 36 sénateurs ont, et vont, soutenir notre vision de la liberté de panorama, à travers 5 amendements.

16 sénateurs en commissions (3 amendements), puis 30 en séance (2 amendements) demandent une liberté de panorama fonctionnelle. Aucun amendement n’a été déposé pour demander le retrait de la notion de liberté de panorama tant cette exception est justifiée.

Ainsi, nous vous livrons la liste de ces 36 sénateurs, accompagnés des liens vers les textes d’amendements :

Jérôme Bignon
Jean Bizet
François Bonhomme
Gilbert Bouchet
François Calvet
Agnès Canayer
Caroline Cayeux
Patrick Chaize (amendements n°COM-187 et n°71)
Gérard Cornu
Philippe Dallier
Dominique De Legge
Louis-Jean De Nicolaÿ
Catherine Deroche
Dominique Estrosi Sassone
Bernard Fournier
Joëlle Garriaud-Maylam
Jean-Pierre Grand
Loïc Hervé
Jean-François Husson
Fabienne Keller
Claude Kern (amendement n°COM-158)
Marc Laménie
Robert Laufoaulu
Philippe Leroy
Michel Magras
Didier Mandelli
Patrick Masclet
Philippe Mouiller
Cyril Pellevat (amendement n°COM-154)
Jean-François Rapin
Yves Rome (amendement n°196)
René-Paul Savary
Jean-Pierre Sueur
André Trillard
Michel Vaspart
Alain Vasselle

Les débats sur la liberté de panorama devraient avoir lieu demain en fin d’après-midi ou en soirée (article 18 ter du projet de loi). N’hésitez pas à suivre ici les débats en direct.

Il est toujours temps de signer notre pétition !.

Retour sur la première journée contributive sur l’entrepreneuriat social à Paris !

Pierre Chevelle, à l’initiative du projet-livre “Changer le monde en 2 heures” revient pour nous sur la tenue du premier edit-a-thon sur l’entrepreneuriat social à Paris.

Les participants à l'edit-a-thon entrepreneuriat social - par Jérôme Bonpierre - CC-BY-SA 4.0

Les participants à l’edit-a-thon entrepreneuriat social – par Jérôme Bonpierre – CC-BY-SA 4.0

Dans le cadre du mois de la contribution s’est tenu le premier edit-a-thon sur des projets solidaires samedi 19 mars 2016 à Paris. Avec le soutien de Wikimédia France, cette journée contributive, organisée par Changer le monde en 2 heures et le Noise, a rassemblé 60 participants pour créer et enrichir les articles Wikipédia de projets solidaires. Après une introduction aux principes de Wikipédia et à la contribution par un administrateur, les participants ont travaillé en petits groupes sur un article parmi un corpus d’articles éligibles préparé en amont.

Au total, les participants, débutants pour la majorité, ont créé et enrichi les articles Wikipédia d’une quinzaine de projets solidaires parmi lesquels le Mouvement Colibris de Pierre Rabhi, le collectif Disco Soupe ou l’association Passerelles & Compétences. Dans une ambiance bienveillante, le prix du meilleur article a été remis à l’équipe de l’article microDON et celui de la plus grosse « galère » à l’équipe de l’article des Gueules Cassées.

Qu’en ont pensé les participants ? Quelques retours :

« J’ai appris à rédiger un article en respectant les codes de Wikipédia, notamment la neutralité et l’objectivité. »

« Merci à notre wikipédien qui nous a maternés car il a bien compris qu’on débarquait sur la planète Wikipédia ! »

« Je suis fière de moi et j’ai envie de continuer à contribuer à Wikipédia ! »

Merci aux 11 wikipédiens venus prêter main forte aux débutants et aux partenaires de l’événement. On espère renouveler l’événement l’an prochain pour continuer à rendre le savoir accessible à tous et former de nouveaux contributeurs à l’encyclopédie !

Accueil dans les locaux de l'ESCP Europe - Jérôme Bonpierre - CC-BY-SA - 4.0 Des participants en pleine contribution - jérôme Bonpierre - CC-BY-SA - 4.0

#DieFreiKultur is strong in this one.

Wikimédia France

Liberté de panorama : contradictions de toutes parts !

Mercredi dernier, nous vous avions partagé le sort de la liberté de panorama après son passage en commission culture, puis en commission des lois du Sénat. Les débats n’étant pas diffusés en direct, vous pouvez simplement retrouver, depuis quelques jours, leur transcription en deux comptes rendus (ici celui de la commission culture, et, ici, celui de la commission des lois). Il convient de revenir sur les arguments en faveur d’une restriction “non-commerciale“, qui ont été déployés à cette occasion.

Une exception commerciale au détriment des architectes et artistes plasticiens ? FAUX !

Si la sénatrice Mélot semble se féliciter de l’inscription de la liberté de panorama dans le projet de loi « pour une République numérique », elle indique :

Si la France est effectivement l’un des derniers pays à autoriser l’exception de panorama, très rares sont ceux qui permettent un usage lucratif de cette liberté, dans la mesure où il se ferait au détriment des architectes et des artistes plasticiens.

Cette allégation est erronée à double titre :

1) Les pays permettant l’utilisation commerciale sont majoritaires au sein des états membres de l’Union européenne. En effet, sur les 82 % des états membres ayant adopté la liberté de panorama, 74 % d’entre eux ont une liberté de panorama commerciale. Seuls 6 pays ont une liberté de panorama non-commerciale (la Bulgarie, l’Estonie, la Lettonie, la Lituanie, la Roumanie et la Slovénie).

Carte des législations européennes basée sur l’œuvre de King of Hearts et Quibik [CC BY-SA 4.0]

Gris très foncé : liberté de panorama, y compris dans les intérieurs publics
 : liberté de panorama, y compris dans certains intérieurs publics
Bleu clair
 : liberté de panorama, y compris pour les œuvres d’art
 : liberté de panorama, pour les bâtiments uniquement
 : liberté de panorama, pour les usages non commerciaux uniquement
 : Pas de liberté de panorama

2) Également, sur la base des chiffres d’une étude du Conseil des architectes d’Europe, nous nous apercevons que dans les pays où il existe la liberté de panorama, les architectes sont les mieux payés.

Cette disposition est donc une véritable opportunité économique pour ces créateurs sans jamais remettre en cause leur droit moral.

En Estonie, par exemple, ce sont toutes les associations d’architectes qui demandent à ce que leur liberté de panorama aille au-delà du non-commercial !

Une exception commerciale au détriment des photographes ? FAUX !

Corinne Bouchoux, sénatrice écologique de Maine et Loire ajoute :

Je suis sensible à la situation des photographes : ils ont beaucoup de mal à gagner leur vie. Or, cette disposition pourrait leur porter préjudice.

Nous ne voyons pas en quoi une liberté de panorama commerciale nuirait à la profession, bien au contraire ! Sans restriction “commerciale” les photographes professionnels n’auraient plus à demander une autorisation, pour chaque photographie d’un monument ou d’une sculpture, aux ayants-droit, ni à payer un droit de reproduction. Cela faciliterait, par conséquent, leur travail.

A ce sujet, voici quelques commentaires laissés par des photographes sur notre pétition :

Je signe parce que je suis aussi photographe. Dans chaque pays où je vais, je n’aimerais pas devoir demander une autorisation chaque fois que je fais un cliché.
Gérard MAVEL, Mulhouse, France

Je suis un photographe averti et essaye de publier mes plus belles photos dans les Commons de Wikipédia et suis parfois débouté pour avoir photographié, de près, un bâtiment historique.
Guy LEBÈGUE, France

Je signe car je suis photographe et trouve anormal que de tels monuments historiques soient interdits de photo !
Damien LECARPENTIER, Outreau, France

Je suis moi même reporter photographe et je sais combien ces restrictions sont ridicules et tout à fait invraisemblables.
Gotin MICHEL, France

Photographe, je trouve ces restrictions inadmissibles !
Christophe CUENOUD, France

Je suis étudiant en photographie et j’estime que ces mesures sont contraires à la liberté d’expression.
Philippe LAMBERT, Vivegnis, Belgique

Parce que vivre de la photo n’est déjà pas facile…
Laurent Laveder, pluguffan, France

Colette Mélot conclut en assurant que son « amendement ne satisfait en rien les demandes de Wikimédia ». Ce point est assuré, elle a cédé face aux sociétés d’ayants-droit tout en faisant croire que l’exception pourra profiter aux particuliers et aux associations, alors que la limitation “non-commerciale” rend la liberté de panorama inutilisable en France. Il serait pourtant grand temps pour les sociétés d’ayants-droit de faire primer les intérêts des artistes qu’ils représentent plutôt que les leurs !

Rappelons notre position…

Nous lisons à regret des commentaires mensongers, dans la communication de ces dernières, au sujet de notre “réelle identité” ou de la “véritable finalité de nos actions”.

Ces organisations persistent à qualifier Wikimédia France comme une société américaine, ayant pour but de gagner de l’argent, en ne payant pas les créateurs.

Rappelons que Wikimédia France est une association loi 1901, qui fait partie de l’économie sociale et solidaire et qui œuvre au sein de l’économie de partage. L’association, au même titre que la fondation Wikimedia, n’est absolument pas propriétaire des contenus. Elle se positionne en appui d’une communauté, notamment de photographes (par le biais de son projet Wikimedia Commons). Ce sont ces utilisateurs qui administrent les projets, dans un but de libre diffusion de la connaissance. Notre association ne réalisera donc pas de bénéfice en lien avec la liberté de panorama.

De plus, dans les débats autour du projet de loi « pour une République numérique », nous communiquons ouvertement sur les actions de sensibilisation que nous menons, nous exposons nos arguments publiquement. Nous proposons des rencontres aux auteurs et groupements réticents à cette disposition, afin de leur expliquer nos arguments.

L’ADAGP quant à elle, à court d’arguments, se contente de lancer en l’air des chiffres sur les pertes pour les auteurs qu’engendrerait la liberté de panorama, chiffres que la commission culture inclut dans son avis. Hier, cette organisation indiquait un certain pourcentage, aujourd’hui elle en donne un autre sans jamais expliquer le détail de ces chiffres.

Nous avons, depuis le début des débats en septembre 2015 (via une consultation publique) et constamment depuis, demandé une liberté de panorama réduite :
* aux seules œuvres architecturales ou sculpturales dont les créateurs vivent de la commande publique (excluant ainsi, par exemple, le street art ou les photographies) ;
* aux œuvres étant en permanence dans des extérieurs publics (excluant ainsi toute exposition temporaire, de photos par exemple, mais aussi, les intérieurs publics comme certaines lois européennes le permettent).

Ainsi, après en avoir longuement débattu lors de notre audition avec la rapporteure de la commission culture, il nous semble peu adéquat de signifier que nous défendons « la liberté de panorama dans son acception la plus large » (avis rendu par la commission culture).

Nous avons bon espoir : aucun amendement pour le retrait de la liberté de panorama n’a été déposé, il reste quelques jours pour poursuivre la sensibilisation afin de faire sauter la restriction “non-commerciale”.

Pierrot le chroniqueur

Wikipédia : small Swiss papers

Je Nous n'avons, tout de même, pas pu nous empêcher de (wiki)rigoler — comme ça, juste une dernière fois — à la lecture de ce monument (en chocolat Milka ) de mauvaise foi généralisée qui porte, quand même, très peu à la neutralité. Sa contemplation béate...

Liberté de panorama, la partie s’amorce au Sénat !

Mobilisation de certains sénateurs

Les débats ont commencé au Sénat avec les votes des commissions (le 5 avril en commission culture, notamment et le 6 en commission des lois). Des sénateurs ont bien compris les enjeux d’une vraie liberté de panorama opérante.

Nous saluons leur courage car beaucoup d’entre-eux ont fait l’objet d’un harcèlement orchestré par les sociétés d’ayants-droit pour tenter de les dissuader. Nous désapprouvons ce mode d’action opaque alors que Wikimédia France, au contraire, présente les enjeux publiquement et cherche à sensibiliser tant les politiques que le grand public.

Adoption de l’amendement de Colette Mélot

Colette Mélot, sénatrice de la Seine-et-Marne, a présenté au nom de la commission culture, en tant que rapporteur, un amendement qui rejette clairement l’utilisation “non-commerciale”:

à l’exclusion de tout usage à caractère directement ou indirectement commercial

Précedemment, au mois de janvier, nous avions eu un doute quant à la démarche des députés lors du vote de l’amendement portant sur la liberté de panorama. Nous avions supposé que s’il partait d’une bonne intention (Wikipédia et la participation des particuliers indiqués dans les motifs), c’était la maladresse de sa rédaction qui le rendait inopérant. Ce doute ne peut plus persister aujourd’hui au Sénat.

Alors que nous avons rencontré longuement Colette Mélot, que nous lui avons expliqué la problématique du terme “non-lucratif” sur Internet, elle a fait le choix, sciemment, de confirmer ce concept en ajoutant “directement ou indirectement commercial”.

Les choses sont maintenant très claires, si en séance cet amendement est maintenu tel quel, il ne sera aucunement possible pour des particuliers de poster leurs photos de bâtiments récents que ce soit sur Wikipédia ou sur les réseaux sociaux, etc.

Voir le schéma, ci-dessous, qui démontre que sur Internet, presque tous les espaces peuvent être qualifiés de “commerciaux”.

Schéma résumant les risques de privatisation de l’espace public

La position de Colette Mélot, n’est, semble-t-il pas isolée puisque la Commission des lois a voté favorablement ce texte inutile et hypocrite.

La position du Gouvernement ?

Axelle Lemaire, à l’occasion de son audition hier par la commission des lois, a communiqué sur la liberté de panorama:

La position du Gouvernement est-elle en train d’évoluer ? Si Axelle Lemaire se pose encore ces questions, nous avons des réponses. Pour nous, il est évident que la loi doit correspondre aux usages ou sinon quel est son intérêt !?

Que faire ?

il est certain que la loi ne doit pas être écrite en cédant au chantage de quelques sociétés qui sont prêtes à sacrifier la renommée des auteurs et le partage de la connaissance pour une petite quantité d’argent hypothétique.

Au contraire, la loi doit être élaborée pour permettre au maximum de citoyens d’être protégés et de pouvoir pleinement disposer d’un domaine qui leur est dédié : l’espace public.

Nous ne baissons pas les bras pour autant, les débats en séance auront lieu du 26 avril au 3 mai. Il nous reste encore une vingtaine de jours pour nous mobiliser, notamment en signant et partageant la pétition.

Il faut que la France ait une vraie liberté de panorama afin que les citoyens ne soient pas dans le flou juridique et afin de ne pas pénaliser le tourisme. Comment donner envie à des personnes étrangères de visiter la France si celles-ci ne peuvent pas mettre leurs photos de vacances sur un blog ou sur les réseaux sociaux ? Comment informer sur les différents monuments à voir si les photos ne peuvent être mises en ligne que par les gestionnaires/créateurs de ces monuments ou de leurs modifications ?
Stop aux lois kafkaïennes ! Dotons-nous d’une loi véritablement applicable…

Christel JEANTHEAU, France (commentaire déposé sur la pétition)

