Les indices composites étroitement définis décrits ici représentent la meilleure façon de résumer des informations discrètes et qualitatives. Les indices composites sont beaucoup plus faciles à interpréter que la recherche d'une tendance commune dans de nombreux indicateurs distincts (Nardo et al., 2005[1]). Toutefois, leur élaboration et leur utilisation peuvent être controversées. Ces indices sont facilement et souvent mal interprétés par les utilisateurs en raison d'un manque de transparence sur la manière dont ils sont générés, ce qui rend difficile l'analyse de ce qu'ils mesurent réellement.
L'OCDE a pris plusieurs mesures pour éviter ou résoudre les problèmes courants associés aux indices composites. Les indices composites présentés dans cette publication ont été élaborés en suivant les étapes présentées dans le Manuel sur la construction d'indicateurs composites (OCDE/Union Europénne/EC-JCR, 2008[2]) qui sont nécessaires à la construction pertinente d’indices composites ou synthétiques.
Chaque indice composite se base sur un cadre théorique représentant un concept conventionnel dans le domaine qu'il couvre. Les variables composant les indices sont choisies en fonction de leur pertinence par rapport au concept. Chaque indice est construit en étroite collaboration avec les groupes d'experts de l'OCDE concernés, qui ont donné leur avis sur les variables et les systèmes de pondération à utiliser pour l'indice composite.
De nombreuses analyses statistiques ont été menées afin de garantir la validité et la fiabilité des indices composites. Les questions d’enquête utilisées pour créer les indices sont identiques dans l’ensemble des pays, afin de garantir la comparabilité des indices. Afin d'éliminer les effets d'échelle, tous les indicateurs et variables ont été normalisés entre « 0 » et « 1 » à des fins de comparabilité. Pour construire les composites, tous les indicateurs ont été agrégés à l'aide d'une méthode linéaire. Les scores de l'indice ont été déterminés en additionnant les scores pondérés de chaque indicateur. Des outils statistiques (alpha de Cronbach) ont également été employés pour établir le degré de corrélation entre un ensemble de variables composant chaque indice et pour vérifier leur fiabilité interne. Ainsi, toutes les variables composant chaque indice ont une valeur intrinsèque, mais elles sont également liées entre elles et capturent donc le même concept sous-jacent. Enfin, une analyse de sensibilité utilisant des simulations de Monte Carlo a été réalisée pour établir la solidité des scores de l'indice sous différentes options de pondération.