Wikimedia Commons et système de classement

Il y a plus d’un an, je commençais la réaction de ce billet en réaction à un billet de blog de Popo, dans lequel il nous parle de langues étrangères et du douloureux conflit avec le système de classement unilingue de Wikimedia Commons. Je n’avais pas pris le temps de le terminer ; mais puisque la question refait toujours surface, mon billet ne semble pas si périmé que ça.

Dans son billet, Popo concluait que « les catégories, c’est vraiment pourri », et pose deux questions : 1/ quand est-ce qu’on dégage tout ça pour mettre des tags ; 2/ « faire en sorte qu’on puisse catégoriser dans la langue de son choix ».

La réponse à cette double-interrogation est assez longue, et la récente arrivée de Wikidata redistribue grandement les cartes sur ce sujet. Ce billet voulait se concentrer sur la question du système de classement.

Un système de tags ?

Dès que l’on me parle de tags, je me pose toujours la question : « en quoi un système de tags est en soi une solution au problème posé ? »

La question des tags sur Wikimedia Commons n’est pas nouvelle, elle serait plutôt à ranger dans les marronniers commonistes. Périodiquement, le débat ressort comme quoi les tags sont 1/ un meilleur système d’organisation ; 2/ une solution magique à <insérer ici un problème de Wikimedia Commons>.

Pour le premier point, je reprendrai les mots de mon mentor et ami Maarten :

So we're having the tags discussion again? Pops up every once in a
while. Tags is a step backwards compared to categories. With tags there
is a relation between an object (a photo) and a word. No way of telling
what the relation is, what language the tag is, no relations between
tags etc etc. So just a word and no more metadata, but it is very easy
for the user. On the other side we have semantic web (yes, I said the S
word!). That's like an utopia we'll never reach. Categories are
somewhere in between. There's a relation between an object and a
category, we don't know what that relation is. There are relations
between categories, also we don't know what these relations are.

− Maarten, Commons-l, 20 octobre 2010

Passons au second point. J’ai souvent l’impression que l’on considère les tags comme la solution ultime aux problèmes (réels, hein) de Commons, grâce auxquels tout serait rose, rainbows and unicorns, mais sans vraiment d’explication de pourquoi.
Je pense que les gens associent au système de tags tout un tas de Bonnes Choses, comme la recherche aisée ou le multilinguisme. Peut-être parce-que ces personnes apprécient la recherche sur Flickr, et que Flickr utilise des tags ; ils voient par ailleurs que Commons a un moteur de recherche paralytique et rejettent la faute sur les catégories.

Deux problèmes orthogonaux

C’est à mon avis une erreur de ne pas dissocier le système de catégories et le système unilingue.

C’est le second que Popo critiquait (et il en montrait bien certaines limites). Or, le système des catégories n’est pas intrinsèquement unilingue : rien n’empêche techniquement de créer des catégories dans toutes les langues (eg [[Category:coëoлoн]]) ; c’est par décision éditoriale qu’on ne le fait pas, parce-que l’on a estimé que ce serait le bordel sinon.

Quand Popo suggèrait les tags comme étant la solution, je suppose qu’il voit des tags dans toutes les langues et d’avoir [cheval], [horse], [coëoлoн] etc. Mais là, on se heurte à plusieurs problèmes :

  • Comment faire l’unification ? Si je tagge en [cheval] et son pote en [coëoлoн], comment le lien est fait entre les deux notions ?
  • Comment gérer les homographes ? Le Wiktionnaire m’apprend par exemple que “kop” signifie “tasse” en danois, “tête” en néerlandais et “coup de pied” en tchèque. Comment faire le distinguo entre tout ça ?

Dans les deux cas, on se pose la question d’un système non pas nécessairement autre que les catégories, mais d’un système multilingue. (Peut-être qu’il est plus aisé de construire un système multilingue avec des tags plutôt que des catégories, mais là, je suis preneur d’arguments).

La guerre des tags n’aura pas lieu

À titre personnel, j’aime les catégories (et pas qu’un peu), j’estime comme Maarten que c’est un outil dans l’ensemble supérieur aux tags − même si largement perfectible. Une catégorie “feuille” (aucun nœuds fils) est un tag qui a le luxe de ne pas être quelque-chose d’isolé. D’ailleurs, on sait comment forcer une catégorie à ne pas être divisée (et on ne se prive pas de le faire) : en utilisant des modèles qui les transcluent.

Par ailleurs, on peut déjà voir une large population des modèles comme des tags plus ou moins exploités − toute la mouvance {{Creator}} & {{Institution}}, plus tous les tags multilingues à la {{Technique}}, créés à des fins d’internationalisation mais qui au final sont aussi une structuration tag-esque.

Un vrai désavantage des catégories par rapport aux tags, c’est la complexité des croisements, extrêmement coûteux de par la structure même des catégories, les rendant en pratique quasi inutilisables (car oui, je reconnais bien volontiers que CatScan n’est pas un outil accessible au commun des mortels − et ce d’autant plus quand il faut le laisser tourner pendant trois plombes). Wikimedia Deutschland a une offre de contrat pour corriger ce problème d’intersections de catégories depuis des lustres.

Cela dit, il y a des critiques très valides du système des catégories − voir notamment [[User:NeilK/Categories_considered_harmful]] (qui me donne beaucoup à réfléchir) et qui notamment reproche aux catégories d’être archaïques et inutiles pour le gars de passage, ce que l’on peut discuter. Là où je suis entièrement d’accord avec Neil, c’est lorsqu’il dit que les catégories ne sont pas un bon système de recherche. Tout à fait, c’est un système d’organisation, mais qui selon moi est une excellente base pour alimenter un bon système de recherche (mais je peux me tromper naturellement) − le lecteur intéressé pourra consulter sur ce sujet cette page de réflexion sur l’avenir de la recherche sur Wikimedia Commons.

Bref, ma conclusion est que faire le procès des catégories sur le chef d’accusation de l’unilinguisme, c’est confondre deux choses.

Avance-rapide en 2013 : Wikidata révolutionne le WikiVerse. Ils se pose en flamboyant exemple de projet multilingue que l’on peut intégralement utiliser dans sa langue − on peut ajouter des déclarations dans sa langue, pourvu qu’elles aient été traduites, en évitant l’écueil des homographes. Il permet d’entrevoir une Wikimedia Commons réellement multilingue, ainsi qu’un système de catégories sous stéroïdes. Ce projet porte les espoirs fous de tous (un peu comme OmegaWiki en son temps #OhWait).

La fin de la FoP, ou plus aucune sculpture récente sur Wikimedia Commons ?

Aura-t-on encore à se poser la question ?
(Irønie, CC-BY-NC-ND).

Début novembre, la Wikimedia Foundation a informé la communauté des contributeurs de Wikimedia Commons de son analyse juridique sur une notification DMCA qui lui a été envoyée. Cette analyse relance le débat sur le bien-fondé des règles de Wikimedia Commons en matière d’application de l’exception au droit d’auteur dite « liberté de panorama ». Cette discussion pourrait résulter en la suppression massive de photographies de statues toujours protégées par le droit d’auteur, et jusqu’à présent acceptées au titre de cette exception. Explications.

De la liberté de panorama

Pour de plus amples informations sur la liberté de panorama, nous citerons extensivement à l’avantage du lecteur cet excellent billet de Jastrow :

Selon l’article de la Wikipédia francophone, « la liberté de panorama (de l’allemand Panoramafreiheit) est une exception au droit d’auteur par laquelle il est permis de reproduire une œuvre protégée se trouvant dans l’espace public. » Son nom prête un peu à confusion : il ne s’agit pas de ce qu’en Common law on nomme le « De minimis » ou en français l’accessoire, c’est-à-dire de plans d’ensemble incluant l’œuvre protégée à titre secondaire, mais bien de reproductions plein pot.

En Allemagne, l’article 59 de l’Urheberrechtsgesetz autorise la « reproduction par la peinture, le dessin, la photographie ou le cinéma d’œuvres situées de manière permanente dans l’espace public, la distribution et la communication publique de telles copies. » En clair, il est parfaitement légal en Allemagne de publier, sans rien demander à personne, une photo d’une Nana installée au Leibnizufer de Hanovre, bien que Niki de Saint Phalle ne soit morte qu’en 2002 et que son œuvre soit encore protégée. Certains pays n’admettent une telle exception que pour les édifices ; d’autres enfin ne l’admettent pas du tout – la Belgique, la France et l’Italie en font partie. Dans le jargon de Wikimedia Commons, on les appelle des pays « no-FOP » (comme dans « freedom of panorama »).

En la matière, Commons applique la règle du pays où est implantée l’œuvre. Par exemple, nous accueillons bien volontiers les photos des Nana de Hanovre, mais nous pourchassons vigoureusement celles de leurs sœurs ises en terre française. Ainsi, vous ne trouverez sur l’article Wikipédia sur Niki de Saint Phalle que des Nana allemandes ou suisses. Cette règle prête à discussion : suivant le raisonnement de Gallimard, ne devrait-on pas empêcher les internautes français d’accéder à cette œuvre ? Elle a toutefois une certaine logique : on peut supposer que Niki de Saint Phalle a obtenu une meilleure rémunération pour son œuvre en compensation du manque à gagner lié au droit d’auteur.

Sur le même sujet, nous signalons également au lecteur ce billet d’Inisheer de 2011 qui critique la règle appliquée sur Wikimedia Commons ; et cette tribune de Rémi Mathis qui détaille les implications en France.

“Taken from the North, so Northern laws (and freedom of panorama) apply.” Imparable.
(Typhoonchaser, CC-BY-SA)

Tant dans un désir de précision extrême que pour le plaisir de cette parenthèse hautement lolesque, nous ajouterons que la règle exacte de Wikimedia Commons est d’appliquer la plus clémente des lois entre celle du pays où est située l’œuvre et celle du pays où est prise la photo. Ce qui permet d’héberger sur Wikimedia Comons les photographies de bâtiments de Corée du Sud prises depuis la Corée du Nord, de bâtiments de Corée du Nord prises depuis la Corée du Sud ; mais pas celles de bâtiments de Corée du Sud prises en Corée du Sud. Forcément.

Dernier détail, la liberté de panorama n’est pas la même partout : au Royaume-Uni, elle s’étend à l’intérieur des édifices publics ; aux États-Unis, elle ne couvre que les bâtiments et pas les sculptures, etc. Le lecteur intéressé pourra consulter [[COM:FOP]] à ce sujet.

Carte montrant le niveau de liberté de Panorama en Europe. C’est variable, quoi.

   Vert foncé : Ok, y compris les œuvres d’art
   Vert clair : Ok pour les bâtiments uniquement
   Jaune : Ok pour les usages non commerciaux uniquement
   Rouge : Pas ok
   Gris foncé : Inconnu

(King of Hearts, Quibik & Revolus / CC-BY-SA)

Du droit international

Dans le contexte de droit international rappelé ici par Léna, quel droit appliquer aux œuvres ? Puisque Wikimedia Commons est accessible dans le monde entier et qu’aucun traité international ne fixe encore de manière claire quel droit appliquer à un site web, il faudrait pour bien faire se conformer à toutes les lois possibles. Le principe retenu est de garder les œuvres qui sont libres/dans le domaine public aux États-Unis et dans leur pays d’origine.

Cette nécessité de se conformer au droit des États-Unis ne s’est pas toujours faite sans heurts : on se souviendra notamment de l’épisode URAA, lors duquel de très nombreuses œuvres passées dans le domaine public dans leur pays d’origine ont vu leur copyright restauré pour de nombreuses années aux États-Unis, empêchant leur hébergement sur Wikimedia Commons.

De la collision des deux

L’affaire qui nous intéresse concerne l’œuvre des artistes américains Claes Oldenburg et Coosje Van Bruggen. Leurs sculptures sous toujours régies par le régime du droit d’auteur et ne sont pas prêtes de passer dans le domaine public, étant donné que Oldenburg est toujours vivant et que Van Bruggen est morte en 2009. Ces œuvres sont installées sur la voie publique dans divers pays, certains reconnaissant la liberté de panorama, comme l’Espagne ou les Pays-Bas. Publier ces photos dans ces pays est donc légal, et c’est à ce titre qu’elles ont été hébergées sur Wikimedia Commons.

Cependant, comme indiqué plus haut, les États-Unis ne reconnaissent pas la liberté de panorama pour les œuvres d’art telles que les sculptures. Devant une telle collision de droits, l’analyse juridique de la Wikimedia Foundation conclut que « compte tenu des principes de droit actuels, la loi des États-Unis est à prendre en compte pour déterminer l’étendue des droits dont jouit l’auteur des œuvres. »

La Wikimedia Foundation, entité américaine devant se conformer à la loi des États-Unis, a obtempéré à la notification DMCA et procédé à la suppression des 59 photographies ciblées.

Analyses et réactions

En préambule, rappelons quelques principes du Digital Millennium Copyright Act. Le Online Copyright Infringement Liability Limitation Act prévoit qu’un hébergeur ne peut être tenu pour responsable de contenus illégaux hébergés s’il n’est pas au courant − on parle couramment de safe harbour provision. En revanche il est tenu d’agir s’il en est informé, soit par notification et take down, soit s’il existe un red flag (« signal d’alarme »), c’est à dire être « au courant de faits ou circonstances manifestes d’une violation ».

La Wikimedia Foundation est donc tenue de se conformer aux notifications DMCA, que celles-ci soient justifiées ou non (sauf demande clairement aberrante) : le fait que les images aient été supprimées ne signifie pas en soi qu’elles devaient l’être. Leur restauration ne dépend que de l’envoi à la WMF d’une contre-notification DMCA par un tiers estimant la notification abusive.

Pour autant, certains contributeurs estiment que l’analyse de la Wikimedia Foundation entérine l’application, pour les questions de liberté de panorama, du principe de Lex loci protectionis − le « principe juridique en droit de la propriété intellectuelle selon lequel la loi qui s’applique est celle du pays où la propriété intellectuelle est revendiquée ». D’autres estiment que si l’opinion de la WMF sur cette notification DMCA est significative, elle ne saurait justifier un changement des règles de Wikimedia Commons ou la suppression en masse de fichiers, en l’absence d’un précédent juridique clair.

Les réactions de la communauté de Wikimedia Commons sont diverses. Certains affirment que cette issue était prévisible depuis le début, et que la communauté a toujours renâclé à prendre ce problème à bras le corps. Leur conclusion est que toutes les reproductions d’œuvres d’art et de sculpture actuellement hébergées au titre de la liberté de panorama doivent être supprimées sans délai. D’autres, vivant dans ces pays jouissant de la liberté de panorama (Pays-Bas, Allemagne, etc.) sont scandalisés, estimant qu’il n’y a aucune raison pour que la loi des États-Unis s’appliquent à des œuvres photographiées dans leur pays.

Discussions et marche à suivre

Même sculpture ∧ photo pas listée ⇒ on garde.
Nanami Turamba, CC-BY.

En premier lieu, une demande de suppression a été ouverte concernant tous les médias représentant des œuvres de Oldenburg et hébergées au titre de la liberté de panorama, mais non listés dans la notification DMCA (éventuellement alors que d’autres reproductions de la même œuvre l’aient été). L’argumentaire repose essentiellement sur « même cause même effet ». Un second argument a été avancé, soulevant que cette affaire constitue un red flag pour la Wikimedia Foundation, ie qu’on peut arguer qu’elle est au courant de la présence de médias problématiques. Les tenants de la conservation arguent essentiellement qu’il n’y a pas lieu d’agir en l’absence de notification précise. Le débat a été clos en conservation il y a quelques jours.

En second lieu, une consultation communautaire a été ouverte pour déterminer la marche à suivre. Les discussions sont allées bon train durant un mois et semblent s’être taries, et nous allons essayer de résumer ici quelques aspects saillants des quelques 20 000 mots de cette page.

Dans la plus pure tradition Commoniste, le premier réflexe est de dégainer un nouveau bandeau pour marquer les fichiers problématiques. Dans la lignée du tristement célèbre {{Not-PD-US-URAA}}, un nouveau bandeau d’avertissement {{Not-free-US-FOP}} a été créé pour marquer les fichiers litigieux. Il vise tant à avertir les réutilisateurs potentiels qu’à prendre la mesure de l’étendue du problème. Au moment de la publication de ce billet, quelques 700 fichiers sont ainsi marqués, ce qui n’est très probablement que la partie émergée de l’iceberg.
Il s’agit aussi de marquer les fichiers non-problématiques comme tels : l’œuvre représentée peut être dans le domaine public, elle peut ne peut atteindre le seuil d’originalité nécessaire pour bénéficier d’une protection au titre du droit d’auteur…

Possibly copyrighted in the U.S. Il se peut que cette œuvre ne soit pas disponible sous une licence libre aux États-Unis car elle représente une œuvre d’art ou sculpture possiblement protégée par le droit d’auteur dans la loi des États-Unis.

  • Dans le pays d’origine de l’œuvre, la publication de photographies de tells œuvres exposées en permanence sur la voie publique ne constitue généralement pas une infraction au droit d’auteur en vertu du principe dit de « liberté de panorama ».
  • En droit américain, il n’y a pas de liberté de panorama pour les œuvres d’art et sculptures, et selon le principe de choix de loi dit lex loci protectionis un juge américain pourrait appliquer les normes de la liberté de panorama américaine à cette œuvre, plutôt que ceux du pays d’exposition de l’œuvre. Cependant, en pratique il est encore incertain si et comment cette approche serait appliquée dans une véritable affaire portée en justice impliquant des éléments de liberté de panorama.

Ceci ne constitue pas une autorisation valide sur Wikimedia Commons. Ce fichier doit être utilisable en vertu de la liberté de panorama dans son pays d’installation ou elle sera supprimée. Il se peut que dans le futur les fichiers porteurs de cet avertissement soient supprimés, en fonction des conclusions de discussions communautaires et de nouvelles décisions de justice. Si vous êtes le détenteur des droits d’auteur de l’œuvre d’art représentée et ne souhaitez pas qu’elle soit hébergée sur Wikimedia Commons, veuillez contacter notre agent en charge.

Imposant non ?

Les mêmes idées que pour URAA reviennent. On parle d’héberger les fichiers en local sur les projets − typiquement la Wikipédia en allemand, mais aussi en catalan − sous un régime d’exception, mais cela ne semble pas très cohérent avec la notification DMCA qui sanctionne l’hébergement par la WMF de ces fichiers.

On parle de transférer les images sur un serveur situé au-dehors des États-Unis, soit à des fins de sauvegarde, soit afin d’établir un deuxième Wikimedia Commons qui permettrait la transclusion des images sur certains projets Wikimédia, mais s’il est légal pour ces sites non-WMF d’héberger ces fichiers, est-il légal pour les sites WMF de les transclure ou même de les lier ? On parle de géolocaliser les adresses IP des visiteurs pour que les contenus ne soient affichés qu’aux visiteurs ayant la le droit de les voir, mais l’installation technique reste à réaliser, et il ne semble pas si évident que cela protège réellement la Wikimedia Foundation.

Il a aussi été proposé de lancer une campagne pour que les États-Unis adoptent une liberté de panorama s’étendant également aux œuvres d’art − le lecteur intéressé pourra consulter les idées proposées sur [[Commons:Freedom of panorama campaign]].

Au final, que sera-t-il fait ? Difficile à dire pour le moment. Comme pour URAA, la prudence prime et on ne s’orientera vraisemblablement pas vers une suppression massive de suite. Comme pour URAA, le marquage systématique des fichiers problématiques est consensuel, mais son exécution prendra du temps et incombe à la charge des jardiniers de Wikimedia Commons déjà surchargés. L’utilisateur lambda de Wikimedia Commons, déjà trop souvent mêlé à ces sombres histoires à grand renforts de jargon du style « [[COM:DW]], architect died in 1967 & no-[[COM:FOP]] in France », en verra peut être aussi les conséquences. La dernière intervention sur la consultation à l’heure où j’écris ces lignes suggère en effet de modifier le formulaire de téléversement de fichier pour demander, à chaque upload si la photo représente une œuvre architecturale et si oui quel est son pays d’implantation. Ben voyons.

De minimis

En l’absence de liberté de panorama, la justice française a, dans sa sagesse, prévu des exceptions pour que le monopole d’exploitation des architectes et autres artistes ne soit pas trop insupportable; notamment, le de minimis ou théorie de l’accessoire : pour simplifier, s’il y a un bout d’oeuvre soumise à la propriété intellectuelle dans une photographie plus large, et que ce bout est inévitable. Comme toujours, il y a une page Commons qui en parle en détail et Jastrow qui en a fait un excellent billet.

Exemple de de minimis : les sculptures sont accessoires par rapport à la vue générale du château de Lunéville.
Caroline Léna Becker, CC-by

Sauf que, des fois, les contributeurs de Commons invoquent cette exception pour totalement autre chose, c’est-à-dire pour contourner l’absence de liberté de panorama. On se retrouve avec l’invocation du de minimis pour ce genre de photo :

Sculpture moderne dans la cours du château de Lunéville

Non mais c’est totalement de minimis, je voulais prendre le château, mais il y avait cette scultpure devant, et j’ai pas pu faire un mètre sur le côté. En plus le focus est sur la sculpture et mon image s’appelle « sculpture devant le château » mais ce que je voulais prendre c’est le château !
Caroline Léna Becker, CC-by. (Cette photo est totalement illégale et tue des bébés chatons, veuillez vous dénoncer à l’Hadopi pour l’avoir regardée)

Et là, l’admin Commons que je suis a un gros gros envie de facepalm. Ce qui est surtout désagréable, c’est d’avoir l’impression que la communauté des contributeurs se fout ouvertement du travail des admins, vu comme des empêcheurs de photographier en rond (enfin plutôt en 3/2). Pourtant, dans les faits, les admins aussi voudraient avoir la liberté de panorama; mais, en attendant, nous pensons juste que la position légaliste de Commons (ie, qu’il faut scrupuleusement respecter le droit d’auteur, même quand il nous semble totalement illégitime et contre-productif) doit être respectée.

Culture Utilisable et Libre (Rama - cc-by-sa-2.0-fr / CeCILL)

Les licences à la con ™

Attention un ou plusieurs trolls velus se cachent dans ce billet, dont le but est uniquement de se moquer des licences bizaroides que l’on peut trouver des fois sur Wikimedia Commons

La licence chiante

GFDL 1.2 – Dans la catégorie des licences chiantes à réutiliser de Commons, cette licence inadapté aux images et aux vidéos est en haut du tableau des licences à la con. Si vous voulez pièger un utilisateur il n’y a pas beaucoup mieux, si il oublie de copier le texte de la licence au bon endroit (selon le nombre d’impression par exemple), vous pourrez être riche!

Le petites envies des utilisateurs

CC-BY-SA avec demande pour utilisation commerciale – Dans le genre farfelue ça se pose là, ce texte ne semble plus d’actualité mais fallait quand même que je le cite!

L’attribution à la con - Vu qu’on peut spécifier l’attribution que l’on veut quand on met en CC-BY-SA, ben faisons le à fond, il faut fournir donc le pseudo, un lien vers la PU de l’utilisateur, avec le pseudo de préférence en font monospace! (ben voyons!)

Les combos ou licences multiples

Alors là, cela devient beaucoup plus drôle:

Combo licence chiante ou licence non commerciale non dérivatif – La licence chiante n’est pas assez complexe, alors on y colle une couche de non commerciale non dérivatif pour être sur que si vous ne voulez pas utiliser la licence chiante vous ne ferez pas d’autre truc avec ce fichier!

Le combo CC-BY-SA ou (c)(tm) Wikimedia Foundation – On était pas certain, alors on a mis ce fichier sous licence libre ou sous (c) ™ de la fondation! Comme ça on choisit ce qu’il y a de mieux non ? Si jamais vous vouliez y a un parfum avec la GFDL en plus!

Licences multiple et à règles variables selon la taille de l’image - Le meilleur pour la fin, la licence imbittable, choix multiple dependant de la taille de l’image que l’on redistribue, attention à ne pas faire d’erreur, c’est écrit l’utilisateur n’hésiteras pas à vous faire cracher les billets!

Voilà c’est fini, j’en oublie beaucoup d’autres, mais ces exemples me font rire à chaque fois.