Aller au contenu principal

Hadopi met à jour son catalogue VOD en open data

25 juin 2015

Le 4 novembre 2014, l’Hadopi publiait une version béta de son fichier ouvert regroupant les catalogues de 6 plateformes de VOD et de SVOD. L’objectif n’était pas tant d’agréger tous les catalogues VOD mais d’encourager à la réutilisation la plus large possible des métadonnées au travers de projets innovants (moteur de recherche, moteur de recommandation, etc.) portés par les utilisateurs eux-mêmes.


Depuis sa mise en ligne, le fichier a été téléchargé 64 fois sur le portail data.gouv.fr et a donné lieu à la création de deux projets, une application Windows Phone  qui permet de rechercher la disponibilité des films parmi la liste publiée par l’Hadopi ; et un second projet, né d’un code camp organisé par l’Hadopi et l’école d’ingénieur ETNA sur le thème des métadonnées – Iscream –moteur de recherche qui s’intéresse à la disponibilité de tous les films connus à ce jour sur support physique, dématérialisé ainsi que les séances de cinéma. Ce dernier a d’ailleurs décidé de sortir du cadre étudiant pour se lancer dans l’aventure entrepreneuriale.

Conscient des enjeux liés à la taille du catalogue proposée dans la version béta du fichier, l’Hadopi a d’une part intégré les catalogues de Wuaki.tv et LovemyVOD ; et a d’autre part travaillé sur une méthode légère de mise à jour des données sans qu’elle n’occasionne de développement spécifique de la part des diffuseurs. Pour cela, le « web scraping » a été privilégié. Il s’agit d’une technique permettant de récupérer directement les métadonnées validées sur les sites, et ce de façon automatisée.

Un nouveau fichier est désormais disponible et peut être téléchargé en cliquant sur le lien ci-dessous. Il est également disponible sur la plateforme ouverte de données publiques françaises data.gouv.fr.

L’élargissement de l’expérimentation au secteur du livre numérique a par ailleurs été décidé et l’Autorité travaille en association avec le Groupement pour le développement de la lecture numérique (GLN) pour produire avant la fin d’année 2015 un fichier similaire regroupant les métadonnées d’un catalogue important de livres numériques.

Etant donné le caractère expérimental de cette publication, les commentaires constructifs sont les bienvenus quant à la structure du fichier, sa conception et le devenir du projet.