En comptabilité nationale, toute forme d’activité des entreprises sur le territoire doit être intégrée dans le produit intérieur brut. L’activité dissimulée doit en faire partie. En 2023, l’Insee a diffusé une nouvelle mesure de l’activité non déclarée des entreprises et a estimé le montant de chiffres d’affaires non déclaré pour 2014 à 33,1 Md€ et celui de la valeur ajoutée non observé à 31,6 Md€. Les précédentes estimations de 2011 (sur l’année 2006) étaient respectivement de 20,0 Md€ et de 40,7 Md€. Comment comprendre un tel écart en niveau ? « Cela s’explique notamment par des améliorations de méthode d’estimation et par la disponibilité et l’utilisation de sources plus fines issues des contrôles fiscaux, permettant en particulier de mesurer l’ampleur des dissimulations de consommations intermédiaires », indiquent Cécile Welter-Medée et Simon Quantin, auteurs du document de travail. Leur approche innovante, tant par l’usage et la prise en compte de données plus fines que par l’utilisation du machine learning, a en effet permis davantage de précision et de finesse dans leurs travaux et leurs résultats.
Depuis 2021 des travaux pour accéder de façon massive et automatique (machine learning) aux données des bilans dans les comptes sociaux des entreprises sont menés par l’Insee. En 2023, le chantier s’est poursuivi en appliquant des méthodes innovantes comme la recherche de tableaux dans un document ou la conversion automatique de documents PDF en fichier de type tableur. Actuellement, l’accès aux données se fait manuellement, ce qui représente une contrainte importante. Le processus d’extraction devrait permettre une obtention automatique des informations recherchées, améliorant ainsi la production statistique de l’Insee et la productivité des experts en économie. Un premier prototype réalisé en collaboration avec la Banque de France est attendu en 2024.
L’Insee a engagé la constitution d’un Répertoire statistique des Individus et des Logements (Résil) visant à moderniser la production de statistiques démographiques et sociales, notamment en facilitant l’utilisation des sources administratives et les appariements de différentes sources de données. Ce répertoire est destiné aux statisticiens de la statistique publique et sera mis en production en 2025. Après une large concertation menée en 2022 sur ce projet pour bénéficier de regards extérieurs, la Commission nationale de l’informatique et des libertés (Cnil) a été consultée en 2023 et a rendu un avis favorable. Ce dernier est assorti de recommandations pour accompagner la mise en œuvre et pour renforcer certaines garanties envisagées, concernant notamment la sécurité informatique, la transparence sur Résil et ses usages ainsi que les conditions d’évolution du dispositif. Le décret en Conseil d’État qui autorise la mise en œuvre de Résil a été publié en janvier 2024, accompagné de l’arrêté fixant la liste des sources utilisées pour l’alimentation du répertoire. Pour répondre au besoin de transparence mis en avant par la Cnil, l’Insee a créé une rubrique dédiée sur insee.fr.