Aller au contenu principal

Qualification et quantification des contenus de YouTube

20 mars 2013

Dans le cadre de sa mission légale d’observation, l’Hadopi a mené des travaux de recherche en informatique pour qualifier et quantifier les contenus présents sur la plateforme YouTube.

Le Département Recherche, Etudes et Veille chargé de la mise en œuvre de cette mission prévoit la qualification, la quantification et la suivi périodique des mises à disposition et consommations de contenus sur les canaux utilisées par les internautes. Les supports sont sélectionnés sur la base de leur popularité. Les travaux de recherche en informatique et mathématiques appliquées présentés ici visent à apporter des éléments de compréhension précis et factuels des contenus publics présents et consommés sur la plateforme YouTube.

Méthodologie et précautions de lecture

Le protocole consiste en la réalisation d’un échantillonnage des vidéos publiques de Youtube. L’échantillon a été analysé pour induire les caractéristiques des vidéos hébergées. Les vidéos on été classées selon une première série de catégories ad-hoc permettant d’en préciser le contenu (clips tutoriaux, tutoriels, par exemple). Les catégories dont la diversité le permettait ont fait l’objet d’une sous-catégorisation plus détaillée : clips musicaux, films, séries et média.

Les précautions nécessaires à la bonne lecture de ces travaux sont détaillées dans le document de présentation. Cela concerne : la suréprésentation potentielle de certaines vidéos, la limitation aux vidéos publiques, la non localisation des contenus et son influence sur leur popularité, et enfin la catégorisation.

Résultats

Parmi les éléments remarquables, on relève que :

  • Les clips musicaux représentent 13% de l’ensemble des contenus. Un quart d’entre eux (25,47%) sont « officiels » c'est-à-dire mis à disposition par des comptes officiels des artistes, des sociétés, maisons de production, d’organismes de diffusion, etc. Les trois quart restant sont notamment des versions originales, ou des versions dont les bandes son ou dont l’image ont été modifiées, n’ayant pas été postées par des comptes officiels.
  • Les clips musicaux sont de loin les contenus les plus populaires de la plateforme. Ils totalisent en moyenne 40 000 vues par jour. Ce sont les versions « officielles » qui totalisent le plus d’audience (plus de 110 000 vues en moyenne par jour). Le reste de l’audience se partage principalement entre les versions non officielles, dont celles dont la bande son ou la vidéo support ont été modifiées. Parmi les contenus non officiels, on relève que 36,68% des pages présentent des liens vers une plateforme permettant d’acheter l’œuvre relative à la vidéo.
  • Les contenus relatifs aux films ou aux séries sous forme de parties organisées de sorte à en permettre le visionnage complet ou en intégralité constituent environ 9,65% des vidéos présentes. Les extraits représentent 2,66% des vidéos (les bandes annonces sont intégrées dans la catégorie « publicités »).
  • La catégorie regroupant les parties de films organisées de sorte à en permettre le visionnage complet est la deuxième catégorie la plus populaire. Ses vidéos font l’objet d’environ 12 000 vues en moyenne chaque jour.
  • Enfin les « média », extraits ou intégralité de programmes audiovisuels initialement diffusés sur les chaines de télévision ou de station de radio par exemple, composent 22,18% des contenus et sont de nature variée : une majorité d’extraits sportifs, à hauteur de 33,92 %, une part importante de divertissement (30,25%) et d’information (25,24%) et une quantité significative de documentaires, qui représente 8,55% des contenus « media ».

Télécharger le rapport