Wikidatathon « données et théâtre » au Lab de la Bnu
Le 12 décembre 2024, nous avons organisé un Wikidatathon sur les données de théâtre au Lab de la Bnu (Bibliothèque nationale et universitaire de Strasbourg). L’événement a été organisé en collaboration avec le Lab, représenté par Elisa Michelet et Arthur Brody, et le Wikimédien en résidence à l’Urfist Strasbourg, Mickaël Schauli ; le datathon faisait également partie de sa résidence.
Contenu de l’atelier
Le matin, Mickaël Schaüli et d’autres organisateurs ont présenté Wikidata et des projets de recherche qui utilisent Wikidata à l’Université de Strasbourg, à la Bnu et au-delà. En préparation du travail d’automatisation qui était à faire l’après-midi, Mickaël a montré comment créer manuellement des éléments Wikidata pour des pièces de théâtre et pour leurs personnages.
L’après-midi, Mickaël a montré comment automatiser la création d’éléments Wikidata en utilisant OpenRefine. Ensuite, nous avons créé des éléments pour des pièces de théâtre et des personnages du projet Thealtres ; les données avaient été développées auparavant dans le cadre du projet via la transcription des métadonnées bibliographiques des pièces, ainsi que la transcription et annotation manuelle des listes de personnages. Le corpus consiste à des pièces du 19e siècle et du début du 20e qui appartiennent à des sous-genres dramatiques populaires en alsacien, français et allemand (le vaudeville, la Posse, le Schwank …).
Pour les pièces, nous avons travaillé sur les propriétés suivantes :
- P31 (nature de l’élément)
- P407 (langue de l’œuvre, du nom ou du terme)
- P1476 (titre)
- P50 (auteur ou autrice)
- P953 (œuvre intégrale disponible sur)
- P674 (personnages)
Pour les personnages, nous avons travaillé sur les propriétés suivantes :
- P31 (nature de l’élément)
- P170 (créé par)
- P21 (sexe ou genre)
- P106 (occupation)
- P1441 (présent dans l’œuvre)
Résultats
En plus des éléments Wikidata créés (170 éléments créés, 180 éléments modifiés, et 565 références, par 7 contributeur·trice·s), Arthur Brody de la Bnu a développé une interface qui interroge le point d’accès SPARQL de Wikidata pour récupérer les dernières pièces de théâtre et les derniers personnages créés dans Wikidata.
L’interface est disponible sur https://dev-lab-one.vercel.app/wikidata.
Les dernières images ci-dessous montrent les résultats des requêtes visibles sur l’interface à la fin du datathon, avec les personnages et les pièces que nous avons créées.
Défis
La modélisation des groupes de personnages est un défi. De tels groupes peuvent paraître dans les pièces, par exemple comme groupes de personnages non-nommés à la fin de la liste de personnages. Une possibilité est de créer un élément de type groupe d’humains de fiction (Q125919847).
Perspectives
En plus de continuer à importer les données du projet dans Wikidata, une idée de travail futur proposée par les participants consiste à un Wiktionary avec des données reliées au projet.