« Les chiffres sont des êtres fragiles qui, à force d’être torturés finissent par avouer tout ce qu’on veut leur faire dire » (Alfred Sauvy)
Nous demandons que soient communiquées les données réellement collectées.
Sommaire :
1/ Les données communiquées en 2025 pour 2023 par le DEPS et l’URSSAF
2/ L’activité principale : une information fondamentale manquante à 53 % qui a été artificiellement complétée
3/ La question du degré de fiabilité des estimations se pose nécessairement
• La première hypothèse implicite des statisticiens est que les informations renseignées par les diffuseurs et les OGC sont fiables
• La méthode du « 1 pour 1 »
• La méthode dite « statistique » (l’algorithme Random Forest)
• L’indétermination restante
4/ Conclusion
1/ Les données communiquées en 2025 pour 2023 par le DEPS et l’URSSAF
Les « Travaux de l’Observatoire des revenus et de l’activité des artistes-auteurs » du ministère de la Culture n’ont pas été mis à jour. Seuls les rapports de 2022 et de 2019-2021 sont publiés à ce jour. Ils communiquent des informations relatives à l’ensemble du corps professionnel des artistes-auteurs et autrices (AA par la suite).
En revanche, les données communiquées par l’URSSAF et par le DEPS (Département des études, de la prospective, des statistiques et de la documentation du ministère de la Culture) concernent les artistes-auteurs et autrices en 2023.
Dans un contexte d’invisibilisation statistiques des artistes-auteurs et autrices, ces présentations revêtent une importance toute particulière pour le secteur de la création artistique et constituent des initiatives de l’URSSAF et du DEPS que nous saluons.
De 2019 à 2023, l’URSSAF Limousin ne collectait pas l’information relative aux divers métiers exercés par les AA. Seules étaient disponibles les informations globales relatives à toute la profession d’AA, c’est-à-dire à l’ensemble du groupe professionnel : les créateur•ices d’œuvres artistiques protégées par le code de la propriété intellectuelle.
Ces études du DEPS et de l’URSSAF visent à établir « un état des lieux de la démographie et des revenus artistiques de l’ensemble des artistes-auteurs en 2023, à partir des déclarations effectuées auprès de l’Urssaf-Limousin et selon la nomenclature d’activités mise en œuvre à partir de cette année-là ».
Cette nomenclature des « activités artistiques » renvoie à 34 catégories de métiers ou professions sous forme d’un menu déroulant à cocher.
Dans son étude, le DEPS communique diverses données : effectifs, caractéristiques démographiques (âge, sexe, lieu d’exercice), revenus artistiques annuels moyens et médians, perception d’autres revenus d’activité, montants annuels moyens des autres revenus d’activité, présentées et classées par « activité principale » (métier ou professions) comme si l’activité principale était effectivement connue à 91 %.
Dans son étude l’URSSAF, communique également des données présentées et classées par « activité principale » (« profession principale ») comme si l’activité principale ou profession était effectivement connue à 91 %.
Alors qu’en réalité, comme nous l’avons vu précédemment, seulement 47 % des AA ont déclaré à l’URSSAF une « activité principale ». Il existe donc un biais considérable dans les données communiquées.
2/ L’activité principale : une information fondamentale manquante à 53 % qui a été artificiellement complétée
Le DEPS écrit : « La direction nationale des statistiques de l’Urssaf et le DEPS ont tenté de compléter cette information lorsqu’elle était manquante… ». Et l’Urssaf écrit : « En raison de l’absence d’information sur l’activité principale sur plus de la moitié des déclarations, un correctif est appliqué pour imputer les valeurs manquantes. »
La notion d’identification professionnelle est complexe. Par nature une profession se professe, elle se déclare personnellement. Il appartient nécessairement à l’AA lui-même de dire de quelle profession artistique, il se sent le plus proche. Nul ne peut s’exprimer à sa place. Pourquoi se substituer aux concernés et « tenter » de compléter des informations qualitatives manquantes à la source, a fortiori s’agissant des professions des AA ? Pourquoi cette entorse sociologique ?
A l’heure où l’IAG (intelligence artificielle générative) pille et menace la création artistique, utiliser un algorithme prédictif pour imputer la profession artistique des AA dans leurs propres statistiques n’est pas dénué d’un certaine violence symbolique…
A minima les statistiques des données réellement renseignées auraient dû être également communiquées publiquement. Pourquoi les statisticiens de l’Urssaf et du DEPS se sont-ils abstenus de présenter les données réellement connues ? Pourquoi ont-ils communiqué les données exclusivement selon un prisme d’approximations ? Pourquoi ont-ils amalgamé systématiquement des données réelles et des données imputées a posteriori ? Il en résulte qu’aucune comparaison n’est possible entre les données réelles et les données estimées par les statisticiens.
Les documents de présentation des statistiques 2023 pour les AA communiqués par l’URSSAF et par le DEPS intègrent ainsi de nombreux tableaux « selon l’activité principale augmentée » c’est-à-dire en amalgamant les activités réellement renseignées et celles extrapolées, ce qui donne l’illusion que les activités principales sont effectivement déterminées à 91 % ou pour le moins qu’elles auraient été extrapolées avec une fiabilité suffisante à 91 %).
Seuls les lecteurs attentifs de ces études découvriront en annexe les notes de l’URSSAF et du DEPS (voir documents ci-dessous) qui précisent que « l’activité principale artistique avait été renseignée par moins de 50 % des déclarants » (DEPS) et que « Au titre de 2023, plus de la moitié des artistes-auteurs (dont 95 % sont en traitements et salaires) ne déclare pas l’activité principale » (URSSAF). Et qu’une « méthode partagée entre le service statistiques du ministère de la Culture (DEPS) et l’Urssaf a donc été mise en place pour compléter cette information ».
Cette tentative de « correction des valeurs manquantes », qui constitue un palliatif basé sur des hypothèses et des extrapolations prédictives, réduit de 53 % à 9 % les activités principales « non déterminées ».
3/ La question du degré de fiabilité des estimations se pose nécessairement
Aucune marge d’erreur, ni coefficient de confiance ou de corrélation ne sont mentionnés pour les « activités principales » imputées a posteriori alors que plus la moitié des informations sont manquantes.
- La première hypothèse implicite des statisticiens est que les informations renseignées par les diffuseurs et les OGC sont fiables.
S’agissant de formulaires préremplis par des diffuseurs et des OGC, et non rectifiés par les AA eux-mêmes, la première question qui se pose est la question de la fiabilité des informations mentionnées par ces tiers. Or, les AA qui vérifient effectivement le formulaire de l’URSSAF prérempli par leurs diffuseurs et OGC constatent souvent des erreurs. Quel est le pourcentage de formulaires préremplis qui ne font l’objet d’aucune rectification par les AA qui les vérifient effectivement ? Quel est le degré de fiabilité en pourcentage des informations données par les diffuseurs et des OGC ?
Dans leurs propres formulaires de déclaration à l’URSSAF, les diffuseurs et les OGC renseignent le montant versé hors taxe, la « nature du revenu » et la « nature de l’œuvre ».
Les OGC effectuent notamment des déclarations en grand nombre. Se simplifier la tâche en ne mentionnant systématiquement que le principal type d’œuvre de leur répertoire est tentant. Les déclarations des OGC qui ne sont pas en cohérence avec la diversité des œuvres de leur répertoire ont-elles été repérées ? Le même problème peut se poser pour certains diffuseurs. Ce biais susceptible de gonfler artificiellement certaines « natures d’œuvre » (et par ricochet certaines professions) au détriment d’autres ne semble pas avoir été pris en compte (ni donner lieu à une rectification ni à la mention d’une marge d’erreur).
- La méthode du « 1 pour 1 »
Avec quel degré de fiabilité peut-on déduire l’activité principale de l’AA selon la « nature d’œuvre » déclarée par des tiers ?
Le menu URSSAF pour la « nature de l’œuvre » est le suivant :
001 - Livre publié à compte d’éditeur
002 - Œuvre des arts graphiques et plastiques, sculpture, design et conception d’exposition - hors livre publié à compte d’éditeur et hors photographie
003 - Photographie - hors livre publié à compte d’éditeur
004 - Œuvre dramatique et textes non publiés sous forme de livre à compte d’éditeur
005 - Scénario et dialogues (cinéma, audiovisuel, sonore et web) - hors livre publié à compte d’éditeur
006 - Réalisation (cinéma, audiovisuel, sonore et web)
007 - Traduction, adaptation, voice over (cinéma, audiovisuel, sonore et web) - hors livre publié à compte d’éditeur
008 - Mise en scène, pantomimes
009 - Œuvre musicale et textes liés non publiés sous forme de livre à compte d’éditeur
010 - Œuvre chorégraphique dont partitions chorégraphiques
011 - Œuvre scénographique
012 - Jeux de société, jeux vidéo ou jeux de rôle - hors livre publié à compte d’éditeur
013 - Production de presse - hors livre publié à compte d’éditeur
014 - Autres
Le DEPS précise « Lorsque l’activité principale artistique est renseignée, elle est systématiquement conservée, quelle(s) que soit(soient) la(les) nature(s) d’œuvre déclarée(s) ». L’AA est en effet le seul à savoir quelle est son « activité principale » d’AA, et ce, quels que soient les types d’œuvres déclarés, a fortiori lorsque la « nature d’œuvre » est déclarée par un tiers sans vérification de l’AA [1].
En creux, cette précision du DEPS signifie aussi qu’il peut y avoir une « discordance » entre « l’activité principale » renseignée et les « natures d’œuvre » déclarées. De fait, un même AA peut créer différents types d’œuvres ou percevoir des redevances de droits d’auteur du fait de la diffusion de son œuvre via une œuvre de collaboration [2], ou du fait que ses œuvres sont intégrées dans d’autres œuvres (œuvre composite [3]). Et un même type d’œuvre peut être déclaré par des AA ayant des « activités principales » différentes. Autrement dit, à tout élément du premier ensemble (« nature d’œuvre ») ne correspond pas un élément et un seul du second (« activité principale »), et réciproquement.
Les statisticiens ont cependant cru pouvoir discerner des cas de « correspondance unique entre nature d’œuvre et activité artistique » qu’ils ont appelé « méthode du 1 pour 1 ». L’URSSAF précise « Pour cela, on utilise les natures d’œuvre qui correspondent clairement à une seule profession ».
Mais dans les pratiques professionnelles des AA, les cas de correspondance unique à 100 % sont surtout une vue de l’esprit, une vision théorique sans fondement ancré dans la connaissance de la réalité concrète des divers métiers des AA.
Par exemple, les statisticiens font correspondre la nature d’œuvre « Photographie - hors livre publié à compte d’éditeur » à l’activité principale « Photographe ». Mais ce qui peut apparaître comme une lapalissade ne correspond pas à la réalité professionnelle. Cette « nature d’œuvre » correspond aussi à d’autres professions principales, notamment du domaine de l’image (plasticien, illustrateur, designer, graphiste, journaliste, auteurs de jeux…) Inversement l’activité principale « Photographe » peut correspondre à la réalisation de vidéos en « nature d’œuvre », notamment depuis que de nombreux appareils photo ont les deux fonctions (photo et vidéo) et que les commandes de vidéos aux photographes se sont développées.
La réduction de la nomenclature des « activités principales » de 35 à 32 modalités opérée par les statisticiens ne garantit pas non plus de correspondance unique entre « nature d’œuvre » et profession.
Par exemple, les statisticiens font correspondre la nature d’œuvre « Scénario » à l’activité principale « Scénariste ». Cette « nature d’œuvre » correspond aussi à d’autres professions principales, notamment du domaine de l’écriture (écrivain, auteur dramatique…)
Les « œuvres dramatiques », les monologues, les sketches, les paroles de chansons… peuvent aisément correspondre à une activité principale d’écrivain. Les auteurs d’œuvres scénographiques peuvent ne pas se définir comme des « scénographes » mais comme des graphistes, des designers d’espace… Les « natures d’œuvre » telles que les « réalisations (cinéma, audiovisuel, sonore et web) » et les jeux sont des œuvres de collaboration, éventuellement composites, elles peuvent concerner divers AA dont les professions ou « activités principales » relèvent du domaine de l’image, de l’écriture ou du son…
Déconnectée de la réalité des pratiques professionnelles des AA, la méthode du « 1 pour 1 » fait l’hypothèse de l’existence de correspondances uniques à 100 % entre « nature de l’œuvre » et « activité principale ». Et ce, sans avoir recherché les marges d’erreur, ni tenté de calculer les coefficients de corrélation sur la base des observations réelles renseignées par les AA. Le degré de fiabilité de cette méthode pose donc question.
De plus, le DEPS note qu’en cas de pluralité d’œuvres : « l’activité artistique a été déduite automatiquement de la nature d’œuvre la plus rémunératrice ». Et l’URSSAF précise : « Quand un artiste-auteur a déclaré plusieurs natures d’œuvres et que celles-ci ne peuvent pas être associées à une seule profession sans équivoque, la nature d’œuvre la plus rémunératrice est retenue. Grâce à ce traitement, l’activité principale d’environ 82 000 non déterminée artistes-auteurs a pu être déterminée, soit un peu plus de 23 % du total ».
« Quand un artiste-auteur a déclaré… » ?!? Dans son commentaire, l’URSSAF oublie qu’ici il n’est question que de déclarations faites par des diffuseurs et des OGC, et non par les AA eux-mêmes.
Déduire automatiquement « l’activité principale » de la « nature d’œuvre la plus rémunératrice » en 2023 est un biais supplémentaire qui confond source de revenus et activité. L’activité principale ou profession d’un AA peut ne pas être l’activité créatrice la plus rémunératrice. La notion de profession, en particulier dans la création artistique, ne se réduit pas à une source financière, a fortiori ponctuelle (en l’occurrence l’année 2023).
Parmi les 82 812 AA (23 % de l’effectif total), combien seraient d’accord avec la profession ou « l’activité principale » qui leur a été attribué par les statisticiens avec la méthode « 1 pour 1 » ? Impossible de le savoir.
- La méthode dite « statistique » (l’algorithme Random Forest)
Avec quel degré de fiabilité peut-on prédire l’activité principale d’un AA avec l’algorithme Random Forest ?
Le DEPS note « pour les natures d’œuvres correspondant à un trop grand nombre d’activités possibles (les livres publiés à compte d’éditeur notamment, ou encore les productions de presse), un modèle d’imputation a été mis en œuvre, prenant en compte non seulement la nature d’œuvre la plus rémunératrice, mais également d’autres critères, comme le sexe, l’âge, le type de déclaration, les autres natures d’œuvres éventuelles, etc. » L’URSSAF précise : « un modèle statistique (Random Forest) a été mis en place ».
Random Forest (ou forêt aléatoire [4]) utilise l’intelligence artificielle générative qui fonctionne en utilisant des modèles d’apprentissage automatique (modèle Machine Learning) pour créer du contenu de manière autonome. L’algorithme a été entraîné sur une population d’AA pour laquelle l’activité principale était connue (réellement renseignée), l’objectif étant de prédire « l’activité artistique principale à partir de caractéristiques individuelles et professionnelles » des AA pour qui l’information n’était pas renseignée, donc manquante.
Les deux populations (A : celle ayant renseigné l’activité principale et B : celle ne l’ayant pas renseigné) ont des caractéristiques différentes en raison des conditions dérogatoires pour la validation de la déclaration. Selon le DEPS et l’URSSAF, le profil des AA pour lesquels l’information est manquante correspond à 95 % aux AA précomptés dont l’assiette sociale est inférieure à 150 SMIC horaire.
Pourquoi 95 % et non 100 % ? Ce pourcentage (95 %) est-il déduit de la « part des activités déterminées par le déclarant ou imputées a posteriori selon l’activité artistique principale » donc de la prise en compte des estimations a posteriori ?
La cause de ce déficit d’information est connue : la déclaration d’une « activité principale » est obligatoire pour pouvoir passer à l’étape suivante et valider sa déclaration à l’Urssaf pour les AA de la population A. Normalement, seuls les AA précomptés dont l’assiette sociale est inférieure à 150 SMIC horaire font partie de la population B, le pourcentage devrait logiquement être de 100 %…
Autre question : L’algorithme a-t-il été entraîné sur l’ensemble de la population A ou seulement sur les précomptés ayant une assiette sociale inférieure à 150 SH ?
Avec la méthode Random Forest, il est pratiquement impossible de discerner comment chaque « arbre [5] » de la « forêt » contribue à la prédiction finale et quelles caractéristiques sont importantes ou pertinentes, il en résulte un manque d’interprétabilité et de transparence. Quelle est la valeur prédictive du modèle ? Son degré de fiabilité ?
La validation de cette approche est quasiment de l’ordre de la foi.
| Parmi les 72 951 AA (21 % de l’effectif total), combien seraient d’accord avec la profession ou « l’activité principale » qui leur a été attribuée par les statisticiens avec la méthode Random Forest ? Impossible de le savoir. |
Quels auraient été les résultats si les 82 812 AA traités par la méthode « 1 pour 1 » avaient été traités par l’algorithme Random Forest ? L’une des méthodes est-elle estimée plus fiable ?
- L’indétermination restante
Le DEPS précise « Enfin, pour certains artistes-auteurs, il n’a pas été possible de renseigner l’activité artistique principale, notamment quand aucune nature d’œuvre spécifique n’était indiquée dans la déclaration. »
27 740 AA (8 % de l’effectif total) restent mentionnés avec une activité principale « non déterminée ».
Le tableau de l’Urssaf « nombre d’artistes-auteurs par sexe et profession principale en 2023 », (qui amalgame profession renseignée ou estimée) indique à la fin les informations suivantes pour les pour 8 % d’AA dont l’activité principale est « autre activité ou est restée « déterminée » :
Il est pour le moins surprenant que des « activités principales » non déterminées puissent concerner 32,4 % d’AA en BNC (alors qu’ils ont tous l’obligation de renseigner cette information) et que l’assiette moyenne soit supérieure à 150 SMIC horaire (1 690,50 € en 2023). Il s’agit d’anomalies.
| Rappel régime fiscal AA : La déclaration en TS « ne concerne qu’une catégorie précise de recettes : celles provenant de droits d’auteurs intégralement déclarés par tiers » (éditeurs, producteurs et OGC). Les autres revenus perçus demeurent imposables en BNC. Pour mémoire, jusqu’en 2011, la déclaration en TS (article 93 1 quater du code général des impôts) n’était possible que pour les « écrivains et compositeurs ». |
4/ Conclusion
« Les chiffres sont des êtres fragiles qui, à force d’être torturés finissent par avouer tout ce qu’on veut leur faire dire » (Alfred Sauvy)
Nous demandons que soient communiquées les données réellement collectées.
D’une part, les diverses données selon l’activité principale quand elle est réellement renseignée par l’AA. Et d’autre part, les données relatives aux AA qui n’ont pas renseigné leur activité principale.
Nous demandons que les méthodes d’estimations des valeurs manquantes, éventuellement effectuées a posteriori par les statisticiens, soient présentées distinctement, en précisant leurs marges d’erreur, et qu’elles ne soient pas appelées « méthodes de correction des valeurs manquantes » mais bien « méthodes d’estimation des valeurs manquantes ».



