À mesure que les technologies numériques gagnent du terrain et ont des incidences de plus en plus profondes sur la société et l’économie, il devient indispensable d’élaborer des politiques fondées sur des données probantes. Or, on manque de données actuelles, comparables à l’échelle internationale, sur la croissance des composantes numériques de l’économie. Si l’« économie numérique » ne se limite plus au seul secteur des technologies de l’information et des communications (TIC), celui-ci en reste le noyau et demeure essentiel à la poursuite de l’innovation numérique. Ce chapitre décrit les résultats d’un modèle de prévision immédiate qui exploite les données Google Trends et les techniques d’apprentissage automatique pour fournir aux responsables de l’élaboration des politiques des données à jour et comparables sur la croissance économique du secteur des TIC. Ces estimations peuvent aider à faire la lumière sur ses performances actuelles et, par là même, à étayer les décisions des pouvoirs publics qui auront à l’avenir des incidences sur ce secteur vital de l’économie.
Perspectives de l’économie numérique de l’OCDE 2024 (Volume 1)
Chapitre 1. Perspectives de croissance du secteur des TIC
Copier le lien de Chapitre 1. Perspectives de croissance du secteur des TICAbstract
Principaux constats
Copier le lien de Principaux constatsDes estimations actualisées de la croissance du secteur des TIC contribuent à éclairer les décisions des pouvoirs publics qui influent sur ce secteur vital
Des données issues de sources non traditionnelles et les techniques d’apprentissage automatique peuvent constituer un complément utile aux statistiques officielles sur la transformation numérique de l’économie. Un réseau neuronal artificiel exploitant les données Google Trends fournit une mesure en temps réel de la croissance du secteur des TIC.
Les indicateurs en temps réel de la croissance économique du secteur des TIC peuvent aider les pouvoirs publics à en appréhender les performances actuelles et, par là même, étayer les décisions de politique publique.
Au cours des dix dernières années, le secteur des TIC a progressé dans la plupart des pays de l’OCDE, mais de manière inégale
Entre 2013 et 2023, tous les pays de l’OCDE ont enregistré, en moyenne, des taux de croissance positifs du secteur des TIC. Pour autant, on observe des disparités importantes (10 points) entre les pays affichant les performances les plus élevées et celles dont les performances du secteur sont les plus faibles.
Les taux de croissance du secteur des TIC dans les pays de l’OCDE tendent à converger
En 2011, le taux de croissance moyen du quatrième quartile (quart supérieur) des pays de l’OCDE était 13 fois supérieur au taux moyen du premier quartile (quart inférieur). En 2023, la croissance moyenne du quatrième quartile était seulement deux fois supérieure à celle du premier quartile. Les écarts de croissance du secteur des TIC dans les pays de l’OCDE se sont donc considérablement réduits. Cette évolution s’explique à la fois par une hausse des taux de croissance moyens dans le premier quartile et une baisse de ceux observés dans le quatrième quartile.
Le secteur des TIC a enregistré une croissance vigoureuse dans tous les pays de l’OCDE en 2023
Les prévisions immédiates montrent que le secteur des TIC a connu une croissance vigoureuse en 2023, avec un taux moyen de 7.6 %. Dans de nombreux pays de l’OCDE, 2023 a été une année record pour le secteur. Dix pays ont enregistré des taux de croissance supérieurs à 9 % : l’Allemagne, l’Autriche, la Belgique, le Canada, le Danemark, les États-Unis, la Finlande, les Pays-Bas, le Royaume-Uni et la Suisse. En Belgique et au Royaume-Uni, ils ont même dépassé 11 %. Ces bons résultats en 2023 pourraient s’expliquer par une augmentation de la demande de produits et de services TIC dans la période de l’après-pandémie de COVID-19.
Si les pays évaluent certains aspects de la transformation numérique de l’économie, ils ont souvent centré leurs efforts sur la mesure de l’adoption des technologies et des activités numériques des ménages et des entreprises. Pour ce faire, ils se sont généralement appuyés sur des enquêtes sur l’utilisation des technologies de l’information et des communications (TIC), à l’instar de l’enquête type de l’OCDE sur l’accès aux TIC et leur utilisation par les entreprises, les ménages et les individus (OCDE, 2015[1]) (OCDE, 2015[2]), ou ont ajouté des questions dans des enquêtes existantes réalisées auprès des entreprises ou des ménages.
L’observation de la réalisation et de l’intensité des activités numériques dans le cadre de la vie quotidienne présente un grand intérêt. Pour autant, ces indicateurs ne renseignent pas sur la valeur monétaire du niveau de production associé à la transformation numérique ni sur les gains d’efficience liés à l’évolution des processus de production. Compte tenu de l’absence de lien direct entre la valeur de la production associée et l’activité numérique, ou entre les gains de productivité et l’utilisation des technologies numériques, nous ne disposons que d’une vision partielle des incidences des technologies et des données sur les indicateurs macroéconomiques traditionnels.
Le manque d’indicateurs sur la valeur de l’« économie numérique » comparables au plan international a conduit à une multiplication des efforts de mesure dans ce domaine. Au niveau national, l’accent a été mis sur la création des tableaux des ressources et des emplois en matière de numérique et des comptes satellites de l’économie numérique dans le Système de comptabilité nationale (SCN) (OCDE, 2023[3]) (Mitchell, 2021[4]). Si l’intégration de la dimension numérique de l’économie dans le SCN constitue la meilleure solution à long terme à ce problème de mesure, il faudra des années avant que les pays mettent en œuvre et produisent des statistiques comparables à l’échelle internationale.
Alors que la transformation numérique s’intensifie, il devient de plus en plus nécessaire de disposer de mesures actuelles solides des composantes numériques de l’économie. Ce chapitre a vocation à contribuer aux efforts déployés pour mesurer un volet essentiel de l’« économie numérique » : le secteur des TIC. Les travaux visent à enrichir la base factuelle en produisant des estimations en temps réel de la croissance économique du secteur des TIC, à l’aide de l’apprentissage automatique et des données massives. Ces estimations peuvent étayer la conception et la mise au point des politiques du numérique, en complément des statistiques officielles produites par les offices statistiques nationaux. La méthodologie utilisée pour élaborer les estimations en temps réel est exposée en détail dans un document technique (Umana Dajud, à paraître[5]).
Vue d’ensemble des efforts déployés pour mesurer la transformation numérique
Copier le lien de Vue d’ensemble des efforts déployés pour mesurer la transformation numériqueMesurer l’étendue de l’économie numérique est une tâche complexe, notamment parce que les technologies numériques et les données sont présentes partout, à des degrés divers. Surtout, alors qu’ils tentaient d’évaluer les incidences de la transformation numérique d’une façon qui soit cohérente avec la comptabilité nationale, les pays se sont demandés quelle activité économique devrait être considérée comme faisant partie de l’« économie numérique ».
Les tableaux des ressources et des emplois en matière de numérique contribueront à améliorer la mesure à moyen terme
Copier le lien de Les tableaux des ressources et des emplois en matière de numérique contribueront à améliorer la mesure à moyen termeLes tableaux des ressources et des emplois en matière de numérique offrent un cadre souple de mesure des composantes numériques de l’économie, qui ne repose pas sur une définition ou un indicateur unique considéré(e) comme étant représentatif(-ve) de l’économie numérique (Mitchell, 2021[4]). Ces tableaux (encadré 1.1) non seulement couvrent les différents produits et acteurs associés à la transformation numérique, mais donnent également à voir la nature des transactions qui lient ces acteurs. Ce cadre délimite également les transactions selon qu’elles portent sur des produits commandés et/ou livrés par voie numérique.
Autres changements notables, le cadre des tableaux des ressources et des emplois en matière de numérique contribue à améliorer la mesure de la transformation numérique grâce à l’ajout de sept colonnes supplémentaires aux tableaux traditionnels des ressources et des emplois. Ces colonnes correspondent aux différents types de secteurs numériques (plateformes d’intermédiation numérique facturant explicitement une commission, plateformes axées sur les données et la publicité, détaillants en ligne, etc.). La deuxième caractéristique importante tient à l’inclusion d’une agrégation des lignes des biens et services TIC. Elle offrira une mesure simple de l’intensité d’utilisation des produits TIC dans le cadre de différentes activités (consommation des ménages, investissement et exportations) (Mitchell, 2021[4]). Enfin, les tableaux contiendront des lignes de produits supplémentaires pour les services infonuagiques et les services numériques intermédiaires.
Encadré 1.1. SCN et économie numérique
Copier le lien de Encadré 1.1. SCN et économie numériqueLe SCN est le cadre le plus solide pour mesurer l’économie numérique. Les normes statistiques internationales définies pour l’établissement de la comptabilité nationale garantissent la comparabilité des mesures entre les pays. Le cadre donne à voir les évolutions des chaînes de production induites par la transformation numérique puisque toute valeur ajoutée y figure déjà. L’adoption des tableaux des ressources et des emplois en matière de numérique devrait donner un aperçu de la contribution de l’économie numérique. En l’absence d’un indicateur unique représentant tous les aspects économiques de la transformation numérique, les tableaux peuvent donner des estimations qui répondent à un large éventail de besoins des utilisateurs.
La mise en œuvre des tableaux des ressources et des emplois en matière de numérique aura pour effet d’améliorer considérablement la mesure de l’économie numérique dans les statistiques officielles. Toutefois, elle ne va pas sans poser d’importantes difficultés. Si l’on parvient à les surmonter, les tableaux pourraient être utilisés à moyen terme par les pays de l’OCDE.
L’un des obstacles tient au fait que l’on ne dispose pas des données requises pour alimenter les tableaux des ressources et des emplois en matière de numérique. Pour les tableaux des ressources et des emplois classiques, les offices statistiques s’appuient sur des données administratives et sur les enquêtes réalisées auprès des entreprises. Or, ces sources n’apportent pas suffisamment de données pour produire les tableaux des ressources et des emplois en matière de numérique (Mitchell, 2021[4]). Il faudra par conséquent soit modifier les enquêtes existantes, soit en créer de nouvelles.
Malgré ces difficultés, les tableaux des ressources et des emplois en matière de numérique offrent une solution intéressante pour améliorer la mesure de l’économie numérique à moyen terme. Des orientations pratiques sur l’élaboration des tableaux, ainsi qu’une liste non exhaustive de statistiques que certaines agences spécialisées produisent actuellement, sont exposées dans le document (Mitchell, 2021[4]).
Les données sur l’adoption des technologies numériques apportent des informations complémentaires
Copier le lien de Les données sur l’adoption des technologies numériques apportent des informations complémentairesLa deuxième méthode pour évaluer la transformation numérique consiste à mesurer l’adoption des technologies numériques. L’utilisation des biens et des services TIC par les consommateurs et les entreprises a rapidement évolué au cours des dernières décennies. Le développement des technologies numériques a transformé le comportement des consommateurs et ouvert la voie à la création de nouveaux modèles économiques.
En parallèle, la mesure de l’adoption des technologies numériques s’est considérablement améliorée. Les statistiques officielles sur les ménages et les entreprises comprennent souvent plusieurs indicateurs de l’adoption à la fois d’outils numériques éprouvés (tels que les plateformes en ligne ou les outils de paiement électronique) et de technologies numériques perfectionnées (telles que l’intelligence artificielle ou l’analytique des données massives). Diverses enquêtes mises en œuvre au niveau national ont aidé à constituer la base factuelle dans ce domaine.
C’est dans ce contexte que l’OCDE a publié, en 2002, deux enquêtes types destinées à fixer les normes internationales relatives à la production d’indicateurs comparables de la transformation numérique. L’enquête type sur l’adoption et l’utilisation des TIC par les ménages et les individus et l’enquête sur l’utilisation des TIC par les entreprises ont été conçues pour améliorer la mesure de la disponibilité des technologies de l’information et des communications et leur utilisation par les ménages, les individus et les entreprises, tout en prenant en considération les besoins nouveaux en termes de politiques publiques (OCDE, 2015[1]).
L’enquête type de l’OCDE axée sur les ménages et les individus s’intéresse aux principales dimensions de la transformation numérique, telles que l’accès à l’internet, la fréquence et l’intensité d’utilisation, le recours au commerce électronique, et les compétences informatiques des individus (OCDE, 2015[1]). Celle axée sur les entreprises vise à aider les offices statistiques nationaux à recueillir des statistiques de base en vue de mesurer la transformation numérique (adoption du haut débit, utilisation de l’informatique, vente en ligne, etc.).
L’enquête contient en outre des modules supplémentaires qui aident à mieux comprendre l’utilisation des TIC (services d’analytique des données ; identification par radiofréquence ; logiciel-service). D’une part, en recourant à une enquête principale, on s’assure que les pays privilégient un ensemble commun de mesures et, ce faisant, que les aspects les plus importants de la transformation numérique sont mesurés dans tous les pays de l’OCDE de manière à faciliter les comparaisons. D’autre part, les modules supplémentaires permettent de mesurer les technologies émergentes et les nouvelles tendances sans renoncer à la partie principale de l’enquête (OCDE, 2015[2]).
Autres méthodes de mesure de la transformation numérique de l’économie
Copier le lien de Autres méthodes de mesure de la transformation numérique de l’économieL’intensité numérique des secteurs économiques peut aussi donner une indication des composantes numériques de l’économie. Les pays établissent leurs propres taxonomies (Statistique Canada, 2019[6]) (Bureau of Economic Analysis, 2018[7]) et l’OCDE a mis au point une taxonomie pour 12 pays (Calvino et al., 2018[8]). Cette dernière comprend une composante technologique (investissement dans les TIC, consommation intermédiaire de TIC et robots), le capital humain requis pour intégrer la technologie à la production (spécialistes des TIC), et la façon dont les technologies influent sur le comportement des entreprises sur le marché des produits (ventes en ligne).
La taxonomie est utilisée dans différents indicateurs de la Boîte à outils de l’OCDE sur la transformation numérique1 (contribution des secteurs à forte intensité numérique à la croissance de la valeur ajoutée, par exemple)2. Les tableaux de bord comme la Boîte à outils constituent un volet important de cet écosystème de mesure. La Boîte à outils, avec son outil d’exploration de données dénommé Data Kitchen, fournit aux décideurs et aux analystes des politiques des indicateurs clés pour chacune des dimensions du Cadre d’action intégré sur la transformation numérique (OCDE, 2019[9]). Elle donne donc un aperçu complet des indicateurs disponibles ayant trait aux performances numériques des pays.
Divers efforts ont également été déployés pour mesurer différents aspects de la transformation numérique. Les échanges numériques en sont un exemple (Mourougane, 2021[10]). Le Bureau central de la statistique des Pays-Bas a ainsi mis au point une méthodologie innovante qui associe les déclarations de taxe sur la valeur ajoutée (TVA) des entreprises et des technologies d’extraction de données à partir des pages web (web scraping) pour estimer les flux transfrontières d’échanges numériques de biens (Meertens et al., 2020[11]). Les données des cartes de crédit sont également utilisées pour mesurer les flux d’échanges numériques de biens comme de services (OCDE, 2019[12] ; Cavallo, Mishra et Spilimbergo, 2022[13]). Par ailleurs, l’OCDE a déployé des efforts considérables pour mesurer les évolutions de l’intelligence artificielle, en s’intéressant notamment aux brevets (Dernis et al., 2021[14]), aux marques (Nakazato et Squicciarini, 2021[15]) et aux compétences (Samek, Squicciarini et Cammeraat, 2021[16]).
Malgré ces efforts, on manque d’indicateurs monétaires à jour, comparables à l’échelle internationale, sur la transformation numérique de l’économie
Copier le lien de Malgré ces efforts, on manque d’indicateurs monétaires à jour, comparables à l’échelle internationale, sur la transformation numérique de l’économieLes indicateurs d’adoption des technologies numériques par les ménages et les entreprises apportent des informations importantes sur le rythme et l’étendue de la transformation numérique. En revanche, ils ne donnent pas à voir l’évolution de la valeur monétaire de l’« économie numérique ». La conception et la mise en œuvre des tableaux des ressources et des emplois en matière de numérique comblera partiellement ce manque à moyen terme. Dans l’intervalle, on ne dispose pas de données à jour et comparables à l’échelle internationale dans ce domaine.
À mesure que la transformation numérique gagne du terrain, force est de constater que l’« économie numérique » concerne tous les secteurs. Dans le même temps, le secteur des TIC reste au cœur de la transformation numérique et joue un rôle essentiel à l’appui de l’innovation numérique et de l’économie dans son ensemble. De précédents travaux de l’OCDE montrent qu’une hausse de la productivité multifactorielle du secteur des TIC peut avoir des incidences sur la croissance économique globale (Nicoletti et Scarpetta, 2003[17]).
La contribution de la valeur ajoutée directement produite par le secteur des TIC dans les pays de l’OCDE a considérablement augmenté au cours des dix dernières années. Dans les pays couverts par la Base de données de l’OCDE pour l’analyse structurelle (STAN)3, le secteur des TIC représentait en moyenne 3.9 % de la valeur ajoutée totale en 2010. En 2019, sa part avait bondi de près de 40 %, pour atteindre en moyenne 5.4 % de la valeur ajoutée totale.
Les ordinateurs, logiciels et services en ligne constituent la clé de voûte de la transformation numérique et évoluent rapidement. Néanmoins, les délais de publication des statistiques officielles sont considérablement plus longs pour les taux de croissance sectoriels que pour les taux de croissance consolidés à l’échelle des pays. Or, les indicateurs en temps réel de la croissance économique du secteur des TIC peuvent aider les pouvoirs publics à en appréhender les performances actuelles et, par là même, étayer les futures politiques publiques.
Méthodologie de mesure en temps réel de la croissance du secteur des TIC
Copier le lien de Méthodologie de mesure en temps réel de la croissance du secteur des TICLes avancées récentes en matière de techniques statistiques ont permis d’améliorer les prévisions qui se fondent sur des sources de données non traditionnelles., Ce chapitre choisit d’utiliser ces techniques pour mesurer en temps réel la croissance économique du secteur des TIC dans les pays de l’OCDE (prévisions immédiates), plutôt que d’établir des prévisions d’avenir. Les données Google Trends fournissent de précieuses informations sur les résultats économiques4,5. L’OCDE les a utilisées pour établir des prévisions immédiates des échanges de services pendant la pandémie de COVID-19 (Jaax, Gonzales et Mourougane, 2021[18]), ainsi que pour produire des estimations hebdomadaires des taux de croissance du produit intérieur (PIB) (Woloszko, 2020[19]). Par ailleurs, l’Observatoire OCDE des politiques relatives à l’IA exploite régulièrement des sources de données innovantes pour mesurer l’utilisation et la diffusion des technologies liées à l’intelligence artificielle en temps réel6.
Une méthode de prévision immédiate rationnelle en termes de données
Copier le lien de Une méthode de prévision immédiate rationnelle en termes de donnéesLe modèle employé dans le cadre de ce chapitre s’appuie sur la méthodologie innovante mise au point par l’OCDE et utilisée pour produire des estimations en temps réel des taux de croissance pour l’ensemble de l’économie (2020[19]). Une version modifiée de la méthodologie est utilisée pour générer des prévisions immédiates des taux de croissance du secteur des TIC dans les pays de l’OCDE. Pour ce faire, la procédure suit la définition du secteur des TIC formulée par l’Organisation (2002[20]) comme « une combinaison de secteurs de fabrication et de services qui recueillent, transmettent et affichent des données et des informations par des moyens électroniques ». Selon cette définition, établie au niveau à deux chiffres de la CITI Rév. 4 (Horvát et Webb, 2020[21]), le secteur des TIC comprend trois sous-divisions : Fabrication d’ordinateurs, d’articles électroniques et optiques (D26), Télécommunications (D61), Technologies de l’information et autres services d’information (D62-63/D62T63). Il convient de préciser que les valeurs présentées dans ce document peuvent différer de celles des offices statistiques nationaux car il arrive que certains pays se fondent sur d’autres définitions du secteur des TIC pour l’établissement de leur comptabilité nationale.
STAN7 fournit des données sur la valeur ajoutée du secteur des TIC dans la plupart des pays de l’OCDE. Pour quelques pays membres, ces données ne sont pas disponibles à l’heure actuelle dans la base (Australie, Chili, Colombie, Corée, Costa Rica, Irlande, Israël, Japon, Luxembourg, Nouvelle-Zélande et Türkiye). Une fois qu’elles y figureront, il sera facile de les inclure dans le modèle de prévision immédiate.
Le modèle de prévision immédiate utilise seulement deux types de données en entrée : les taux de croissance du secteur des TIC dans les pays de l’OCDE et les données Google Trends. Les taux de croissance sont calculés à l’aide des données issues de la base STAN. Plus précisément, les estimations annuelles de la valeur ajoutée des TIC en volumes8 tirées de la base servent au calcul des taux de croissance annuels du secteur pour 27 pays de l’OCDE, de 2010 à 2018 ou 2019, selon les pays.
Google Trends fournit deux types de données sur les recherches effectuées sur l’internet : des mots-clés et des catégories prédéfinies. Des mots-clés sont disponibles pour tout terme ayant fait l’objet de suffisamment de recherches en ligne. Les catégories prédéfinies rassemblent différentes recherches par mots-clés dans des groupes significatifs. Elles présentent l’avantage de pouvoir être directement comparées d’un pays à l’autre, ce qui n’est pas toujours le cas pour les mots-clés. De plus, certaines catégories sont spécifiquement liées au secteur des TIC. Le tableau 1.1 cite neuf catégories Google Trends correspondant à différentes composantes du secteur des TIC, bien qu’il en existe beaucoup d’autres.
Tableau 1.1. Mise en correspondance indicative des catégories Google Trends liées au secteur des TIC
Copier le lien de Tableau 1.1. Mise en correspondance indicative des catégories Google Trends liées au secteur des TIC
Code de la CITI Rév. 4 |
Division de la CITI Rév. 4 |
Catégorie Google Trends |
ID de catégorie Google Trends |
---|---|---|---|
D26 |
Fabrication d’ordinateurs, d’articles électroniques et optiques |
Computer Servers (Serveurs d’ordinateurs) |
728 |
Consumer Electronics (Électronique grand public) |
78 |
||
Binoculars, Telescopes - Optical Devices (Jumelles optiques, télescopes – Appareils optiques) |
1384 |
||
D61 |
Télécommunications |
Telecom (Télécommunications) |
13 |
Mobile Phones (Téléphones portables) |
390 |
||
Communications Equipment (Équipements de communication) |
385 |
||
D62-63/D62T63 |
Technologies de l’information et autres services d’information |
Network Storage (Stockage réseau) |
729 |
Internet Software (Logiciels internet) |
807 |
||
Web Services (Services web) |
302 |
Note : Ce tableau contient une liste non exhaustive de catégories Google Trends disponibles liées au secteur des TIC.
Sources : Base de données de l’OCDE pour l’analyse structurelle (STAN), http://oe.cd/stan ; Google Trends (consulté le 19 février 2024).
Google Trends fournit un indice temporel du volume de questions que les utilisateurs saisissent dans Google depuis un lieu géographique et à une heure donnés : l’indice de volume de recherche, ou Search Volume Index (SVI). Cet indice ne correspond pas au volume réel de recherche : ses valeurs sont exprimées sur une échelle allant de 0 à 100 d’après les volumes de recherche normalisés pour chaque mois et lieu d’une requête. Les prévisions immédiates présentées dans ce chapitre reposent sur un échantillon mensuel de requêtes SVI pour 1 131 catégories9. Ces dernières couvrant l’ensemble des pays de l’OCDE, entre janvier 2004 et décembre 2023 (inclus).
Tirer des informations utiles des données Google Trends
Copier le lien de Tirer des informations utiles des données Google TrendsLes données Google Trends se sont révélées utiles dans différents domaines (dont l’économie, l’épidémiologie, ou la finance). Elles présentent toutefois des limites importantes. En premier lieu, pour protéger la confidentialité des recherches, Google fournit un SVI fondé sur un échantillon aléatoire de toutes les recherches effectuées dans chaque catégorie. Cela ne pose pas de problème pour les catégories populaires, l’échantillon étant suffisamment large pour être représentatif de l’ensemble des recherches qui en relèvent. En revanche, pour les catégories moins populaires, l’échantillon obtenu est plus limité et pourrait donc ne pas être représentatif de la population de recherches. Par conséquent, les SVI pour les catégories dont les univers de recherche comportent peu d’observations pourraient présenter une variance d’échantillonnage importante d’un prélèvement d’échantillon à l’autre (Combes et Bortoli, 2016[22]).
L’un des moyens de repérer et de corriger le bruit consiste à prélever plusieurs échantillons de données Google Trends à différents moments. On définit alors un seuil au-delà duquel la variance des différents échantillons est considérée comme étant trop élevée. Dans ce chapitre, cinq échantillons Google Trends distincts ont été prélevés pour chaque catégorie dans chacun des pays, et l’on a calculé la variance correspondante. Après analyse de la variance observée dans l’ensemble de données, le seuil de variance maximum tolérée a été fixé à dix10. Par conséquent, toutes les combinaisons pays-catégorie présentant une variance supérieure à dix pour les cinq échantillons Google Trends ont été supprimées11. Le graphique 1.1 donne à voir la répartition du bruit d’échantillonnage (variance du SVI) avant (partie A) et après (partie B) la suppression des catégories présentant une variance supérieure à dix. Comme le montre le graphique, ce seuil permet d’éliminer la plupart des catégories particulièrement volatiles qui, à défaut, pourraient nuire à la précision du modèle de prévision immédiate12.
Le deuxième écueil lié à Google Trends tient à la tendance à la baisse observée pour la quasi-totalité des SVI. Celle-ci s’explique par le nombre croissant d’utilisateurs de Google depuis 2004, puisqu’il s’agit là du dénominateur utilisé dans la formule employée pour calculer les SVI. Ce biais semble toutefois s’estomper à partir de 2010, le nombre d’utilisateurs de Google ayant augmenté moins rapidement dans les années qui ont suivi. Le graphique 1.2.A donne à voir les SVI pour dix catégories Google Trends choisies de manière aléatoire aux Pays-Bas, entre 2004 et 2023. L’évolution à la baisse non linéaire, qui ne signifie pas que ces catégories ont perdu en popularité, apparaît clairement.
Pour corriger cette tendance, un lissage LOWESS (locally weighted scatterplot smoothing) non paramétrique a été appliqué aux données afin de procéder à une régression pondérée localement. La procédure est généralement utilisée pour lisser la saisonnalité des données Google Trends (Choi et Varian, 2012[23]). Dans ce chapitre, on applique un lissage LOWESS pour corriger l’évolution à la baisse des SVI (graphique 1.2.B).
Un réseau neuronal pour mesurer la croissance du secteur des TIC en temps réel
Copier le lien de Un réseau neuronal pour mesurer la croissance du secteur des TIC en temps réelLa procédure de prévision immédiate utilisée dans ce chapitre s’appuie sur un algorithme d’apprentissage automatique pour déterminer, à partir des données Google Trends, la croissance du secteur des TIC dans chaque pays. Compte tenu des volumes considérables de données renvoyées par les recherches effectuées sur Google, les relations complexes entre les nombreuses caractéristiques des données peuvent être modelées grâce à l’apprentissage automatique. Cette technique est mieux adaptée que les techniques statistiques et économétriques traditionnelles pour détecter et modéliser les non-linéarités (Woloszko, 2020[19]).
Le modèle utilisé dans ce chapitre pour établir des prévisions immédiates de la croissance du secteur des TIC dans les pays de l’OCDE est un réseau neuronal artificiel13. Ce type de réseau est basé sur une modélisation probabiliste simplifiée de neurones organiques. Le modèle d’apprentissage automatique est plus exactement un perceptron multicouche. Dans ce cas, la connexion entre les couches est établie dans une seule direction, en évitant les boucles au sein du réseau.
Le modèle utilisé pour calculer les prévisions immédiates comprend deux couches cachées de 2 400 et 800 neurones. Pour l’entraîner, on utilise la méthode d’optimisation basée sur le gradient stochastique mise au point par Kingma et Ba (2015[24]). Le choix de cette méthode pour la procédure de prévision immédiate utilisée dans le présent chapitre a été dicté par son efficacité en termes de calcul. Une fonction d’activation ReLU (pour rectified linear unit, ou unité linéaire rectifiée) est employée pour établir les connexions entre les nœuds du modèle. La fonction est activée – et les connexions sont établies – uniquement lorsqu’un seuil est dépassé. L’une des principales forces de la méthode d’optimisation basée sur le gradient stochastique de ce choix de modélisation tient à son efficacité en termes de calcul.
Une méthode de modélisation agnostique
Copier le lien de Une méthode de modélisation agnostiqueLe choix de recourir à des techniques d’apprentissage automatique plutôt qu’à des méthodes statistiques et économétriques plus classiques a été guidé par la capacité des réseaux neuronaux à identifier des relations complexes, souvent non linéaires, entre les variables. Ce principe a dicté chaque décision de modélisation prise dans le cadre de ce chapitre. Trois de ces choix, détaillés ci-après, jouent un rôle central dans les performances du modèle.
Le premier tient à la sélection des variables à intégrer au modèle de prévision immédiate. Google Trends propose 1 131 catégories prédéfinies qui sont comparables à l’échelle internationale. Plutôt que de fonder le choix des variables à utiliser sur l’intuition et, en définitive, sur une décision arbitraire, toutes les catégories Google Trends ont été incluses. L’optimisation du réseau neuronal détermine alors les variables et les connexions pertinentes pour mesurer en temps réel la croissance du secteur des TIC. Cette décision de modélisation présente un inconvénient : elle ne permet pas d’interpréter la relation entre des catégories particulières et les taux de croissance du secteur des TIC. Toutefois, le principal objectif du modèle de prévision immédiate est de mesurer en temps réel, avec la plus grande précision possible, la croissance du secteur des TIC, et non pas de comprendre l’impact des recherches effectuées dans Google sur sa croissance.
Le deuxième choix de modélisation concerne les hyperparamètres du réseau. Il s’agit des variables définies avant de commencer l’entraînement du modèle14. Les paramètres correspondent quant à eux aux estimations apprises par le modèle. Là encore, la méthodologie choisie ne devait pas reposer sur l’intuition. C’est pourquoi la recherche des hyperparamètres a été automatisée à l’aide d’une fonction de recherche par grille. La racine de l’erreur quadratique moyenne (REQM) a été utilisée comme paramètre de décision pour la recherche par grille dans la procédure. Le nombre de couches, le taux d’apprentissage et la fonction d’activation ont tous été choisis à l’aide de la recherche automatisée des hyperparamètres.
Le troisième choix concerne le calcul des erreurs types. En suivant ce principe agnostique, les erreurs types sont calculées à l’aide d’une procédure « bootstrap » qui ne repose sur aucune hypothèse spécifique relative à la distribution des données. À cet effet, 2 000 échantillons aléatoires avec remplacement sont prélevés. Le modèle est ensuite réentraîné en utilisant chacun des nouveaux échantillons. Les erreurs types sont alors classées afin de conserver les intervalles de confiance à 90 %.
Évaluation des performances des prévisions immédiates
Copier le lien de Évaluation des performances des prévisions immédiatesPour entraîner et évaluer le réseau neuronal artificiel, les taux de croissance du secteur des TIC sont répartis dans deux échantillons différents : un échantillon d’entraînement et un échantillon de validation. Le premier comprend les données de 2011 à 2018. Les données pour la dernière année disponible dans la base STAN (soit 2019) sont utilisées pour l’échantillon de validation.
Les performances du réseau neuronal artificiel sont évaluées à l’aide de la REQM des échantillons d’entraînement et de validation. La REQM peut être appréhendée comme une mesure de la distance qui sépare les valeurs prévues par le réseau neuronal et les valeurs observées à partir des données. La REQM est de 2.9 pour l’échantillon d’entraînement, et de 2.7 pour l’échantillon de validation. Ces valeurs peuvent être comparées à l’écart type très élevé des taux de croissance observés (5.4 %)15.
Le graphique 1.3 donne à voir les taux de croissance du secteur des TIC prévus par le modèle par rapport aux taux de croissance observés. On y voit une corrélation claire entre les taux de croissance observés et les taux prévus (54 %) ; elle est statistiquement significative au seuil de 1 %. Cette forte corrélation positive va dans le sens des valeurs de REQM obtenues.
En comparaison, un modèle autorégressif standard AR (1) utilisant uniquement les données historiques de la balance des opérations courantes pour établir les prévisions de croissance du secteur des TIC pour la prochaine période donne une REQM de 4.82. Par conséquent, les prévisions élaborées à partir des données Google Trends sont deux fois plus précises que celles fondées sur un modèle autorégressif à retard simple.
Les bons résultats du réseau neuronal pourraient être dus à une saisonnalité commune entre les données Google Trends et les taux de croissance du secteur des TIC. Par exemple, on pourrait émettre l’hypothèse que Google Trends reflète les performances économiques procycliques du secteur des TIC. Toutefois, le réseau neuronal utilisé pour ce chapitre laisse à voir, plutôt qu’une composante cyclique, un certain nombre d’interactions non linéaires plus complexes entre les données Google Trends et la croissance du secteur des TIC. De fait, la corrélation entre les données Google Trends et les taux de croissance du secteur des TIC est négligeable (-2.8 %). Un comportement cyclique commun des recherches dans Google et des taux de croissance n’explique donc pas les prévisions du réseau neuronal.
Perspectives de croissance du secteur des TIC dans les différents pays
Copier le lien de Perspectives de croissance du secteur des TIC dans les différents paysLe modèle de prévision immédiate produit des mesures des performances économiques pour toutes les années pour lesquelles on ne dispose pas de données observées. Pour la plupart des pays, les années 2020 à 2023 sont concernées. Dans un nombre limité de cas, la Base de données STAN de l’OCDE ne contient des données que jusqu’en 2018. Le modèle est utilisé mesure alors la croissance du secteur des TIC entre 2019 et 2023.
Le modèle de prévision immédiate produit plus exactement des estimations ponctuelles des taux de croissance du secteur des TIC. Elles sont utilisées, dans ce chapitre, pour analyser les performances économiques du secteur dans les différents pays de l’OCDE. Outre les estimations ponctuelles, on trouve également ici des intervalles de confiance à 90 %, dont il convient de tenir compte dès lors que des estimations ponctuelles sont présentées.
Estimations actuelles de la croissance du secteur des TIC
Copier le lien de Estimations actuelles de la croissance du secteur des TICLes données obtenues à l’aide du modèle sont particulièrement utiles à deux égards. D’une part, elles permettent d’étendre l’analyse de l’ensemble de la période en intégrant les performances les plus récentes. Selon les pays, les données contenues dans la base STAN vont jusqu’en 2018 ou 2019. Sans les prévisions immédiates, on ne pourrait pas analyser les données des trois ou quatre dernières années. D’autre part, les prévisions immédiates renseignent sur les performances actuelles du secteur des TIC dans les pays de l’OCDE et permettent aux décideurs de tirer rapidement des conclusions sur l’efficacité des politiques mises en place dans ce domaine.
Le graphique 1.4 présente les taux de croissance observés et ceux issus du modèle de prévision immédiate pour tous les pays de l’OCDE pour lesquels on dispose de l’ensemble des données requises16. Les résultats montrent que la pandémie de COVID-19 a marqué la fin d’une ère de progression soutenue des taux de croissance qui avait débuté peu après la crise financière mondiale. Néanmoins, bien que les taux de croissance aient marqué le pas, l’essor du secteur reste solide : en 2020, le taux de croissance moyen du secteur des TIC dans les pays de l’OCDE s’établissait en effet à 6.6 %. En 2021, dans la plupart des pays de l’OCDE, l’impact de la crise du COVID-19 n’est plus visible, et l’on atteint en 2023 le taux de croissance le plus élevé jamais enregistré. En revanche, les résultats sont à nuancer lorsque l’on observe les estimations ponctuelles dans les intervalles de confiance respectifs17. Pour autant, même en tenant compte des intervalles de confiance, il ressort des prévisions immédiates que la crise du COVID-19 n’a eu qu’un impact modéré sur le secteur des TIC.
Les taux de croissance moyens confirment les évolutions observées au niveau des pays. Le graphique 1.5 illustre les taux de croissance moyens du secteur des TIC pour les pays de l’OCDE entre 2011 et 2023. Les taux moyens à partir de 2011 sont ensuite calculés à l’aide des données observées issues de la base STAN. En fonction des pays, les taux moyens sont calculés sur la base des taux de croissance obtenus à l’aide du modèle de prévision immédiate à partir de 2018 (ou ultérieurement).
Le graphique 1.5 confirme le formidable dynamisme du secteur des TIC18. Si la croissance moyenne a décliné pendant la crise financière mondiale, elle est restée positive tout au long de la période. Après la crise financière, le taux de croissance moyen a cru de manière constante, année après année, sauf au début de la pandémie de COVID-19, où il a légèrement diminué. Le secteur des TIC a ensuite renoué avec la croissance, atteignant en 2023 le taux moyen le plus élevé sur l’ensemble de la période analysée.
Au cours des dix dernières années, le secteur des TIC a progressé dans la plupart des pays de l’OCDE, mais à des degrés variables
Copier le lien de Au cours des dix dernières années, le secteur des TIC a progressé dans la plupart des pays de l’OCDE, mais à des degrés variablesLe dynamisme du secteur des TIC s’est également traduit par des taux de croissance positifs au niveau national. Le taux de croissance moyen au cours de la décennie passée (2013-23) est positif dans tous les pays (graphique 1.6). Pour autant, malgré la bonne tenue générale du secteur, un écart conséquent subsiste entre les pays enregistrant les taux de croissance les plus élevés et celles affichant les taux les plus faibles. Cet écart s’établit en effet à plus de 10 points de pourcentage.
D’après les données de la Base de données STAN, les prévisions immédiates calculées dans le présent chapitre et les prévisions immédiates pour l’ensemble de l’économie issues de l’outil de suivi hebdomadaire de l’OCDE (OCDE, 2023[25]), le secteur des TIC a enregistré au cours de la dernière décennie (de janvier 2013 à avril 2023) une progression presque trois fois plus rapide que celle de l’ensemble de l’économie dans les pays de l’OCDE. Pendant cette période, sa croissance moyenne a dépassé 8 % dans trois pays : l’Islande, la Pologne et le Royaume-Uni. Les deux pays en tête de peloton – l’Islande et le Royaume-Uni – ont affiché des taux de croissance moyens supérieurs à 9 % pendant la période considérée. À l’autre extrémité du spectre, la Grèce, l’Italie et la République slovaque ont enregistré les taux moyens inférieurs à 3 %.
Les taux de croissance du secteur des TIC dans les pays de l’OCDE tendent néanmoins à converger
Copier le lien de Les taux de croissance du secteur des TIC dans les pays de l’OCDE tendent néanmoins à convergerEn 2023, les pays affichant la plus forte croissance du secteur des TIC (25 % supérieurs, ou quatrième quartile) avaient un taux de croissance moyen du secteur des TIC de 11.9 %. La même année, les pays affichant les taux de croissance les plus faibles du secteur des TIC (25 % inférieurs, ou premier quartile) avaient un taux de croissance moyen de 5.7 % (graphique 1.7).
L’écart important entre les pays des premier et quatrième quartiles s’est toutefois réduit au fil du temps (graphique 1.8). En 2011, le taux de croissance moyen du quatrième quartile treize fois supérieur au taux moyen du premier quartile. En 2016, le taux moyen du quatrième quartile était quatre fois supérieur à celui du premier quartile. En 2023, la croissance moyenne du quatrième quartile n’était plus que deux fois supérieure à celle du premier quartile. Les écarts de taux de croissance du secteur des TIC dans les pays de l’OCDE ont donc continué de se rétrécir.
Le secteur des TIC a enregistré une croissance vigoureuse dans tous les pays de l’OCDE en 2023
Copier le lien de Le secteur des TIC a enregistré une croissance vigoureuse dans tous les pays de l’OCDE en 2023Les prévisions immédiates permettent de produire une analyse à jour de la croissance économique du secteur des TIC dans les pays de l’OCDE. Elles montrent en premier lieu que le secteur des TIC est vigoureux. Si entre 2011 et 2022, la croissance s’élevait en moyenne à 5.7 %, elle a atteint 7.6 % en 2023.
Dans de nombreux pays de l’OCDE, 2023 a été une année importante pour la croissance du secteur. Dix pays ont enregistré des taux de croissance supérieurs à 9 % : l’Allemagne, l’Autriche, la Belgique, le Canada, le Danemark, les États-Unis, la Finlande, les Pays-Bas, le Royaume-Uni et la Suisse. En Belgique et au Royaume-Uni, ils ont même dépassé 11 %. Même dans les pays affichant les taux les plus faibles, à l’instar de la Grèce et de la République slovaque, elle était malgré tout supérieure à 3 %.
Il est essentiel de mesurer le secteur des TIC pour en évaluer les performances et concevoir des politiques rationnelles
Copier le lien de Il est essentiel de mesurer le secteur des TIC pour en évaluer les performances et concevoir des politiques rationnellesLa nécessité de concevoir des politiques fondées sur des données probantes va croissant à mesure que la transformation numérique s’intensifie et a des incidences sociétales et économiques de plus en plus profondes. Il est essentiel d’améliorer la mesure à bref délai de la transformation numérique de l’économie afin d’élaborer des politiques publiques propres à soutenir une économie et une société numériques innovantes et inclusives, et en évaluer l’efficacité. Les statistiques disponibles sur l’adoption des technologies numériques par les entreprises et les ménages apportent certes des éclairages importants. Cependant, elles ne permettent pas de mesurer l’évolution de la valeur monétaire de l’économie numérique. Les tableaux des ressources et des emplois en matière de numérique apporteront des informations solides dans ce domaine à moyen terme. En attendant, on manque de données actuelles, comparables à l’échelle internationale, sur l’évolution de l’économie numérique.
L’« économie numérique » touche désormais tous les secteurs de l’économie. Celui des TIC n’en reste pas moins au cœur de la transformation numérique et joue un rôle essentiel dans la poursuite de l’innovation numérique. Lorsqu’ils conçoivent les cadres d’action dans le domaine du numérique, les pouvoirs publics se concentrent généralement sur les règles, les réglementations, les politiques et les stratégies liées au secteur des TIC, qui couvre, entre autres, l’informatique, l’électronique, les télécommunications et les technologies de l’information. Des données à jour sur les performances du secteur sont essentielles pour évaluer l’efficacité de ces outils. C’est pourquoi le présent chapitre utilise des données relatives au secteur des TIC en complément des statistiques officielles. S’appuyant sur un modèle de prévision immédiate qui exploite les données Google Trends et les techniques d’apprentissage automatique, il fournit aux pouvoirs publics et aux décideurs des données actuelles et comparables sur la croissance économique du secteur des TIC dans les pays de l’OCDE.
Le modèle de prévision immédiate utilisé dans ce chapitre pourrait également être utilisé pour mesurer en temps réel les taux de croissance d’autres secteurs, au-delà du secteur « de base » des TIC. Des estimations en temps réel des taux de croissance de tous les secteurs à forte intensité numérique permettraient par exemple de dresser un panorama plus complet de la croissance des composantes numériques de l’économie. Sans compter que des prévisions immédiates des taux de croissance de tous les secteurs donneraient aux décideurs un aperçu en temps réel des performances des secteurs à forte intensité numérique par rapport aux secteurs relativement moins tournés vers le numérique.
Références
[7] Bureau of Economic Analysis (2018), “Defining and measuring the digital economy”, Bureau of Economic Analysis, US Department of Commerce, https://www.bea.gov/sites/default/files/papers/defining-and-measuring-the-digital-economy.pdf.
[8] Calvino, F., et al. (2018), « A taxonomy of digital intensive sectors », Documents de travail de l’OCDE sur la science, la technologie et l’industrie, n° 2018/14, Éditions OCDE, Paris, https://doi.org/10.1787/f404736a-en.
[13] Cavallo, A., P. Mishra et A. Spilimbergo (2022), « E-commerce during COVID: Stylized facts from 47 economies », Documents de travail du FMI, n° 19, Washington, D.C., https://www.imf.org/en/Publications/WP/Issues/2022/01/28/E-commerce-During-Covid-Stylized-Facts-from-47-Economies-512014.
[23] Choi, H. et H. Varian (2012), « Predicting the present with Google Trends », Economic Record, vol. 88, pp. 2-9, https://doi.org/10.1111/j.1475-4932.2012.00809.x.
[22] Combes, S. et C. Bortoli (2016), « Nowcasting with Google Trends, the more is not always the better », CARMA 2016: 1st International Conference on Advanced Research Methods in Analytics, pp. 15-22, https://archive.carmaconf.org/carma2016/wp-content/uploads/pdfs/4226.pdf.
[14] Dernis, H., et al. (2021), « Who develops AI-related innovations, goods and services? : A firm-level analysis », Documents de travail de l’OCDE sur la science, la technologie et l’industrie, n° 121, Éditions OCDE, Paris, https://doi.org/10.1787/3e4aedd4-en.
[26] Ferrara, L. (2022), « When are Google data useful to nowcast GDP? An approach via preselection and shrinkage », Journal of Business & Economic Statistics, vol. 41/4, pp. 1108-1202, https://doi.org/10.1080/07350015.2022.2116025.
[21] Horvát, P. et C. Webb (2020), « The OECD STAN Database for industrial analysis : Sources and methods », Documents de travail de l’OCDE sur la science, la technologie et l’industrie, n° 2020/10, Éditions OCDE, Paris, https://doi.org/10.1787/ece98fd3-en.
[18] Jaax, A., F. Gonzales et A. Mourougane (2021), « Nowcasting aggregate services trade », Documents de travail de l’OCDE sur la politique commerciale, n° 253, Éditions OCDE, Paris, https://doi.org/10.1787/0ad7d27c-en.
[24] Kingma, D. et J. Ba (2015), « Adam: A Method for Stochastic Optimization », 3rd International Conference for Learning Representations, San Diego, CA, 7-9 May, arXiv:1412.6980, https://doi.org/10.48550/arXiv.1412.6980.
[11] Meertens, Q. et al. (2020), « A data-driven supply-side approach for estimating cross-border Internet purchases within the European Union », Journal of the Royal Statistical Society: Series A (Statistics in Society), vol. 183/1, pp. 61-90, https://doi.org/10.1111/rssa.12487.
[4] Mitchell, J. (2021), « Digital supply-use tables : Making digital transformation more visible in economic statistics », OECD Going Digital Toolkit Notes, n° 8, Éditions OCDE, Paris, https://doi.org/10.1787/91cbdd10-en.
[10] Mourougane, A. (2021), « Measuring digital trade », OECD Going Digital Toolkit Notes, n° 18, Éditions OCDE, Paris, https://doi.org/10.1787/48e68967-en.
[15] Nakazato, S. et M. Squicciarini (2021), « Artificial intelligence companies, goods and services : A trademark-based analysis », Documents de travail de l’OCDE sur la science, la technologie et l’industrie, n° 2021/06, Éditions OCDE, Paris, https://doi.org/10.1787/2db2d7f4-en.
[17] Nicoletti, G. et S. Scarpetta (2003), « Régulation, productivité et croissance dans les pays de l’OCDE : OECD Evidence », Documents de travail du Département des Affaires économiques de l’OCDE, n° 347, Éditions OCDE, Paris, https://doi.org/10.1787/078677503357.
[3] OCDE (2023), OECD Handbook on compiling digital supply use tables, Éditions OCDE, Paris, https://doi.org/10.1787/11a0db02-en.
[25] OCDE (2023), « OECD Weekly tracker of economic activity », page web, https://www.oecd.org/economy/weekly-tracker-of-gdp-growth (consulté le 10 Juin 2023).
[12] OCDE (2019), « BBVA big data on online credit card transactions : The patterns of domestic and cross-border e-commerce », Documents de travail de l’OCDE sur l’économie numérique, n° 278, Éditions OCDE, Paris, https://doi.org/10.1787/8c408f92-en.
[9] OCDE (2019), Measuring the digital transformation : A roadmap for the future, Éditions OCDE, Paris, https://doi.org/10.1787/9789264311992-en.
[1] OCDE (2015), The OECD Model Survey on ICT Access and Usage by Households and Individuals, 2nd Revision, OCDE, Paris, https://web-archive.oecd.org/2015-10-26/376629-ICT-Model-Survey-Access-Usage-Households-Individuals.pdf.
[2] OCDE (2015), The OECD Model Survey on ICT Usage by Businesses, 2nd Revision, OECD, Paris, https://web-archive.oecd.org/2015-10-26/376630-ICT-Model-Survey-Usage-Businesses.pdf.
[20] OCDE (2002), Measuring the information economy 2002, Éditions OCDE, Paris, https://doi.org/https://doi.org/10.1787/9789264099012-en.
[16] Samek, L., M. Squicciarini et E. Cammeraat (2021), « The human capital behind AI : Jobs and skills demand from online job postings », Documents de travail de l’OCDE sur la politique scientifique, technologique et industrielle, n° 120, Éditions OCDE, Paris, https://doi.org/10.1787/2e278150-en.
[6] Statistique Canada (2019), « Mesurer les activités économiques numériques au Canada : estimations initiales », Les nouveautés en matière de comptes économiques canadiens, Statistique Canada, Ottawa, https://www150.statcan.gc.ca/n1/pub/13-605-x/2019001/article/00002-fra.htm.
[5] Umana Dajud, C. (à paraître), « Nowcasting the growth rate of the ICT sector », Documents de travail de l’OCDE sur l’économie numérique, Éditions OCDE, Paris, https://doi.org/10.1787/20716826.
[19] Woloszko, N. (2020), « Tracking activity in real time with Google Trends », Documents de travail du Département des Affaires économiques de l’OCDE, n° 1634, Éditions OCDE, Paris, https://doi.org/10.1787/6b9c7518-en.
Notes
Copier le lien de Notes← 3. Plus d’informations sur STAN sont disponibles à l’adresse suivante : http://oe.cd/stan.
← 4. Des travaux récents montrent que les données Google Trends sont moins utiles pour mesurer la croissance du PIB global lorsque l’on dispose de données officielles (Ferrara, 2022[26]). Pour le PIB global, les délais s’échelonnent entre un et trois mois dans la plupart des pays. En revanche, au niveau sectoriel, ils sont beaucoup plus longs et dépassent généralement 12 mois. Par conséquent, les sources de données non traditionnelles restent plus utiles pour obtenir des informations sur la croissance économique au niveau sectoriel qu’elles ne le sont au niveau agrégé.
← 5. Un autre modèle utilisant en entrée les taux de croissance du PIB global a également été testé. Toutefois, le modèle exploitant les données Google Trends a produit de meilleurs résultats. Ceux-ci sont exposés dans le document technique d’accompagnement (Umana Dajud, à paraître[5]).
← 7. Pour plus d’informations sur la base de données STAN, voir : http://oe.cd/stan.
← 8. La valeur ajoutée brute en volumes (VALK) issue de la Base de données STAN est calculée à l’aide de déflateurs des prix. Les chiffres correspondent à la valeur en prix courants pour l’année de référence 2015. Pour de plus amples informations sur le calcul de la valeur ajoutée brute en volumes, voir la documentation relative à la Base de données STAN, à l’adresse : http://oe.cd/stan.
← 9. La liste exhaustive des catégories est consultable à l’adresse : https://serpapi.com/google-trends-categories.
← 10. L’utilisation de ce seuil pour l’analyse permet d’éviter une variance excessive au sein de l’ensemble de données.
← 11. Après abandon des observations présentant une variance supérieure à dix, la taille de l’échantillon passe de 7 328 880 à 6 186 710 observations (1 142 170 observations ont donc été supprimées). Les 1 131 catégories restent malgré tout présentes dans l’échantillon réduit.
← 12. Malgré une variance plus élevée, les combinaisons pays-catégories supprimées présentent des propriétés statistiques similaires à celles de l’échantillon complet. La moyenne et l’écart type s’élèvent respectivement à 35.97 et 25.60 pour l’échantillon complet. Pour les observations supprimées, ils sont de 35.52 et 24.78. Pour les observations utilisées dans le cadre de l’exercice de prévision immédiate, la moyenne est de 36.06 et l’écart type de 24.78.
← 13. Le modèle est entraîné à l’aide de la bibliothèque scikit-learn 1.2.1 de Python.
← 14. La définition des hyperparamètres établie par Google est consultable à l’adresse suivante : https://developers.google.com/machine-learning/guides/text-classification/step-5. Le taux d’apprentissage et le nombre de couches cachées en sont des exemples.
← 15. Plus on s’éloigne de la dernière valeur observée utilisée pour entraîner le modèle, plus la précision de la REQM diminue.
← 16. La Base de données STAN ne contient pas de données relatives à VALK dans le secteur des TIC pour les pays suivants : Australie, Chili, Colombie, Corée, Costa Rica, Irlande, Israël, Japon, Luxembourg, Nouvelle-Zélande et Türkiye.
← 17. Les taux de croissance sectoriels affichent une variance bien plus importante que les taux de croissance du PIB total. Cette caractéristique des données sectorielles explique dans une large mesure le niveau des intervalles de confiance du modèle de prévision immédiate (90 %) par rapport à ceux des modèles utilisant une méthodologie similaire pour les taux de croissance du PIB total (95 %) (Woloszko, 2020[19]).
← 18. Voir par exemple https://ec.europa.eu/eurostat/statistics-explained/index.php?title=ICT_sector_-_value_added,_employment_and_R%26D et https://ec.europa.eu/eurostat/statistics-explained/index.php?title=ICT_sector_-_value_added,_employment_and_R%26D et https://www.cbs.nl/en-gb/news/2020/42/ict-sector-growing-faster-than-the-economy.