Le présent chapitre porte sur les questions relatives à la qualité des statistiques internationales de l’OCDE dans le domaine de l’éducation. Il reproduit tout d’abord une déclaration de l’engagement de l’OCDE en ce qui concerne la qualité des données et présente les normes de qualité en fonction desquelles les données sont recueillies, élaborées et diffusées. Il examine ensuite les types de problèmes que pose la qualité des données et les raisons pour lesquelles ils se posent, et décrit les mesures prises par l’OCDE pour les évaluer et les résoudre. Enfin, ce chapitre émet certaines suggestions en vue de dresser des estimations pour les données manquantes puis se termine par un exposé des principaux problèmes qui subsistent quant à la qualité des données internationales en matière d’éducation.
Guide de l'OCDE pour l'établissement de statistiques internationalement comparables dans le domaine de l'éducation 2018
Chapitre 6. Qualité des données
Abstract
6.1. Les dimensions de la qualité des données de l’OCDE
La qualité des données est fondamentale pour la crédibilité des statistiques produites par l’OCDE en général et par sa Direction de l’Éducation et des Compétences en particulier. La collecte de statistiques de l’éducation à laquelle procède l’OCDE obéit aux valeurs essentielles suivantes énoncées dans le Cadre de qualité de l’OCDE et dans les Lignes directrices pour la conduite des activités statistiques par l’OCDE (OCDE, 2011[1]).
Les statistiques de l’éducation que l’OCDE produit sont recueillies et diffusées en toute impartialité. Elles sont élaborées en fonction de considérations purement professionnelles et notamment de principes scientifiques et de règles déontologiques concernant les méthodes et les procédures employées pour recueillir, traiter, stocker et diffuser les données.
La qualité se définit comme « l’adaptation aux besoins des utilisateurs ». Cette définition est plus large que celle proposée par le passé, lorsque la qualité était synonyme d’exactitude. Il est désormais communément admis que d’autres dimensions sont importantes. Même si les données sont exactes, leur qualité ne saurait être satisfaisante si elles sont produites trop tard pour être utiles, si elles ne sont pas d’un accès aisé ou si elles paraissent incohérentes par rapport à d’autres données. La qualité est donc un concept aux multiples facettes. Les aspects de la qualité qui sont les plus importants dépendent du point de vue des utilisateurs, de leurs priorités et de leurs besoins, qui varient entre les groupes d’utilisateurs.
L’OCDE envisage la qualité selon sept dimensions : la pertinence, l’exactitude, la crédibilité, l’actualité, l’accessibilité, l’interprétabilité et la cohérence. Enfin, la rentabilité est un facteur important, même si elle n’est pas à strictement parler une dimension de la qualité. La notion de rentabilité doit intervenir dans l’application de chacune de ces sept dimensions.
Le Cadre de qualité de l’OCDE s’articule par conséquent autour de huit critères :
La pertinence s’évalue à l’aune de l’activité des groupes d’utilisateurs et de leurs besoins, qui doivent donc être identifiés.
L’exactitude est la mesure dans laquelle les données évaluent ou décrivent correctement les quantités ou les caractéristiques qu’elles sont censées mesurer.
La crédibilité se rapporte à la confiance que les utilisateurs accordent aux produits de données simplement à partir de l’idée qu’ils se font de celui qui les élabore, autrement dit l’image de marque. La crédibilité dépend en partie de l’intégrité du processus de production. Le deuxième des Principes fondamentaux de la statistique officielle des Nations Unies (Nations Unies, 1994) précise : « Pour que se maintienne la confiance dans l’information statistique officielle, les organismes responsables de la statistique doivent déterminer, en fonction de considérations purement professionnelles, notamment de principes scientifiques et de règles déontologiques, les méthodes et les procédures de collecte, de traitement, de stockage et de présentation des données statistiques. »
L’actualité reflète le délai écoulé entre la mise à disposition des données et le moment auquel s’est produit la manifestation ou le phénomène décrit. La notion d'actualité est évaluée au regard de la durée pendant laquelle l’information présente un intérêt et permet de donner une suite.
L’accessibilité reflète la facilité avec laquelle il est possible de repérer les produits de données au sein des différents services de l’OCDE et d’y accéder.
L'interprétabilité reflète la facilité avec laquelle les utilisateurs peuvent comprendre, utiliser et analyser correctement les données. L’adéquation de la définition des concepts, des populations cibles, des variables et de la terminologie qui sous-tendent les données et la description des éventuelles limites des données déterminent largement le degré d’interprétabilité.
La cohérence reflète les interrelations logiques entre les données et leur cohérence mutuelle.
La cohérence interne des ensembles de données implique que les éléments de données se basent sur des concepts, définitions et classifications compatibles qui peuvent être utilement combinés. Ainsi, il y a des incohérences dans un ensemble de données si deux parties de la même équation, par exemple les entrées et les sorties, ne concordent pas.
La cohérence entre les ensembles de données implique que les données se basent sur des concepts, définitions et classifications communs et que toute différence soit expliquée et puisse se justifier.
La cohérence dans le temps implique que les données se basent sur des concepts, définitions et méthodes stables dans le temps et que toute différence soit expliquée et puisse se justifier. L’incohérence dans le temps renvoie à des ruptures dans les séries de données à cause de changements apportés aux concepts, définitions ou méthodes.
La cohérence internationale implique que les données se basent sur des concepts, définitions, classifications et méthodes communs et que toute différence soit expliquée et puisse se justifier.
La rentabilité est le rapport entre les coûts et la charge de travail des fournisseurs de données et le résultat. La charge de travail est supportée par les fournisseurs de données, mais elle a un coût. L’OCDE ne considère pas la rentabilité comme une dimension de la qualité, mais c’est un facteur qui doit être pris en considération dans toute analyse de la qualité, car il peut affecter la qualité dans toutes ses dimensions.
6.2. Types (ou causes) des problèmes liés à la qualité des données
De même que pour n’importe quel type de données recueillies par l’OCDE, la qualité des statistiques et des indicateurs de l’éducation diffusés dépend de deux aspects : la qualité des statistiques nationales et la qualité des mécanismes internes de collecte, de traitement, d’analyse et de diffusion des données et des métadonnées. Si pour le deuxième aspect, la qualité relève de l’OCDE, c’est moins le cas pour le premier.
La qualité des statistiques nationales dépendra pour l’essentiel de plusieurs questions :
De l’adéquation des sources d’information nationales pour produire les données requises à l’échelle internationale ;
De la mesure avec laquelle les définitions et les lignes directrices applicables aux statistiques internationales sont correctement mises en application ;
De la capacité des pays d’appliquer les lignes directrices de l’OCDE et de concevoir des systèmes appropriés de collecte de données ;
De la qualité et de la fiabilité des canaux de transfert de données entre les offices nationaux de statistique et l’OCDE.
Dans le domaine de l’éducation, les sources nationales d’information peuvent être inadéquates à différents égards pour fournir les données requises à l’échelle internationale.
La couverture des sources nationales - soit isolément, soit collectivement - peut ne pas correspondre à la couverture voulue de « l’éducation », telle qu’elle est définie dans le chapitre 3. Il peut en résulter soit des lacunes dans les données reportées, soit un excès d’information par l’intégration de programmes d’enseignement qui n’entrent pas dans le champ de la collecte de données. Ce manque de concordance peut également se produire lorsqu’une certaine ambiguïté entoure la validité de l’inclusion de tel ou tel programme de formation, tels ceux de formation continue, par exemple. Dans la mesure où les pays ont en règle générale recours à un certain nombre de sources d’informations nationales pour alimenter leurs communications statistiques internationales, le défaut de concordance entre les champs couverts peut être à l’origine de problèmes de cohérence interne et potentiellement de double comptage de données fournies par les pays. Cette situation peut s’observer entre les données sur les étudiants à différents niveaux de la CITE ou entre les données sur les effectifs scolarisés d’une part et les financements d’autre part.
De la même façon, il peut se faire que le moment auquel a lieu la collecte de données (la période de référence) et que la date à laquelle les étudiants sont comptabilisés (l’année de référence) diffèrent des exigences internationales en la matière. Les données peuvent tout simplement ne pas être disponibles pour les périodes de référence retenues dans l’exercice de collecte, soit du fait que le calendrier national de traitement des données ne correspond pas vraiment à l’exercice international de collecte ou que les exercices nationaux n’ont pas lieu chaque année.
Les définitions nationales des items (ce que l’on entend, par exemple, par enseignants, diplômés et programmes) et leur classification (niveau des programmes ou types de personnel de l’éducation) peuvent se différencier de celles qui sont requises à l’échelle internationale.
L’adhésion aux lignes directrices peut se révéler difficile lorsque les données nationales ne peuvent pas être transposées facilement dans les définitions internationales, mais aussi du fait d’insuffisances inhérentes aux lignes directrices elles-mêmes. Ces insuffisances peuvent se présenter lorsqu’un type de données n’a pas fait l’objet d’une définition convenue à l’échelle internationale ou si sa description manque de clarté (Nations Unies, 2014[2]).
Outre ces difficultés, il y a souvent celles qui tiennent à la comparabilité des statistiques dans le temps. Trois raisons peuvent expliquer les changements importants dans les données d’une année sur l’autre :
Des changements apportés au système éducatif. Il s’agit des « véritables » changements dans les données dus à une évolution de la situation du système éducatif, telle que la mise en œuvre de réformes qui aboutit à un accroissement de l’effectif d’étudiants.
Des changements dans le champ couvert par l’exercice de collecte de données. Les changements peuvent en l’occurrence résulter de l’intégration ou de l’exclusion de programmes par rapport aux statistiques de l’année précédente, par exemple l’intégration des programmes destinés aux adultes non alphabétisés ou en situation d’illettrisme, ou encore celle des écoles privées.
Des changements apportés à la méthode employée. Ce sont les changements importants dans les statistiques, qui résultent de la modification des méthodes employées pour recueillir ou évaluer les données ou du recours à de nouvelles méthodes.
6.3. Résoudre les problèmes de qualité des données
L’OCDE et les pays membres ont consenti d’énormes efforts pour garantir et améliorer la qualité des données sur l’éducation. D’un côté, ils supposent un processus de collecte et de vérification rigoureux des données et, de l’autre, la volonté de sans cesse s’attaquer aux insuffisances de qualité des données.
L’OCDE a pris d’importantes mesures pour améliorer la qualité des données, à savoir :
Rencontrer les fournisseurs de données pour leur donner des conseils et des explications sur la définition et la soumission des données et les informer des vérifications prévues et du traitement des valeurs manquantes ;
Utiliser des instruments de collecte de données (questionnaires électroniques) qui prévoient le regroupement de sous-catégories dans des domaines où l’on sait que les pays ont du mal à fournir les données requises, en cas par exemple de regroupement de certains niveaux de la CITE. Ces instruments se prêtent à des vérifications aisées et aident à garantir la cohérence entre les différents questionnaires. Par exemple, les données relatives aux effectifs d’étudiants sont recueillies selon de différentes manières afin de correspondre à la couverture des données sur le financement et le personnel ;
Utiliser des codes dans les tableaux de données pour signaler aux utilisateurs des données manquantes ou de qualité moindre :
catégorie sans objet (a) ;
donnée incluse sous d’autres rubriques (x, xr..., xc..., xa... indiquant la ligne (l) la colonne (c) où les données se trouvent)
donnée provenant d’une autre catégorie (d) ;
donnée non disponible (m) ;
nombre d’observations insuffisant pour fournir des estimations fiables (c) ;
valeur sous le seuil fixé de fiabilité à interpréter avec prudence (r).
Demander aux pays de fournir avec leurs données des métadonnées qui décrivent les concepts, définitions et méthodes utilisés lors de la collecte, de la compilation, de la transformation, de la révision et de la diffusion des statistiques. Dans les statistiques sur l’éducation, la description des programmes nationaux et leur classification en fonction de la CITE sont des éléments importants des métadonnées. Parmi les autres métadonnées à fournir, citons :
Les périodes de référence (début et fin des années scolaires) pour chaque niveau d’enseignement ;
Les périodes de collecte des données (comptabilisation en instantané ou pour la totalité de l’année dans les périodes de référence, par exemple) ;
La date de référence pour déterminer l’âge des étudiants ;
Les âges théoriques de début et de fin de la scolarité et d’obtention du diplôme ;
Les sources de données et méthodes utilisées ;
La documentation des ruptures dans les séries chronologiques.
Automatiser la vérification des questionnaires électroniques (classeurs Excel) que les pays remplissent. Les fournisseurs peuvent procéder à un contrôle automatique qui repère les cellules où les données sont manquantes et vérifie la cohérence interne des données dans les tableaux et entre ceux-ci. Il est demandé aux pays d’expliquer toute erreur signalée lors de ce contrôle qui n’est pas corrigée avant la soumission des questionnaires ;
Soumettre les questionnaires remplis à l’examen rigoureux du Secrétariat de l’OCDE. Cet examen consiste à vérifier la cohérence des données d’une année à l’autre. Le cas échéant, des questions sont posées aux fournisseurs de données, qui peuvent être amenés à soumettre à nouveau leurs données ;
Soumettre des tableaux préliminaires aux pays pour les informer sur la manière dont leurs données sont utilisées pour calculer les indicateurs qui seront publiés par la suite dans Regards sur l’éducation. Pour parvenir à une bonne qualité des données, il est important que les pays sachent comment leurs données seront utilisées.
Au-delà du processus de collecte des données, l’OCDE s’emploie sans relâche à évaluer et à améliorer la qualité des données, un point à l’ordre du jour des réunions du Groupe de travail INES et du Réseau INES. Des études spéciales sont menées dans des domaines où des problèmes de comparabilité sont identifiés. Cette approche spécifique permet à l’OCDE de mieux comprendre la façon dont les pays soumettent leurs données et, donc, d’améliorer ses conseils aux pays et d’enrichir les métadonnées. Des études de ce genre ont été réalisées au sujet du financement de l’enseignement et des effectifs scolarisés.
De plus, l’OCDE procède chaque année à des collectes de données tendancielles pour recueillir des données sur les années précédentes selon une approche cohérente et, ainsi, disposer de données comparables dans le temps et garantir que tout ajustement dans les données antérieures est dûment pris en considération dans la collecte de données en cours (Institut de Statistiques de l'Unesco, OCDE et Eurostat, 2016[3]).
6.4. Suggestions pour évaluer les données manquantes
Les sources nationales de données suffisent rarement pour fournir toutes les informations demandées à l’échelle internationale et il faut souvent avoir recours à des codes pour les données manquantes. Dans la présente section, on suggère quelques techniques pouvant servir à calculer les estimations de certaines de ces valeurs manquantes. Dans chaque cas, il s’agit de simples suggestions ; les fournisseurs de données sont les mieux placés pour déterminer si les techniques d’évaluation sont acceptables dans leurs statistiques nationales.
Les situations dans lesquelles des données pourraient manquer sont généralement au nombre de cinq :
Aucune donnée n’est recueillie pour une variable donnée. Dans ce cas, on peut construire une estimation fondée sur le lien supposé avec d’autres variables. Par exemple, si on connaît la répartition des étudiants non pas par âge mais par niveau/année d’études, on peut raisonnablement supposer que tous les étudiants scolarisés la même année d’études ont le même âge. Autre solution, il est possible d’obtenir des informations sur le lien entre l’âge et l’année d’études à partir d’autres sources (des travaux de recherche ou une enquête ponctuelle, par exemple) qui peuvent permettre de construire l’estimation.
Les données ne permettent pas le niveau d’agrégation souhaité. Un exemple courant à cet égard se présente lorsque la couverture nationale des données n’est que partielle : seules quelques régions sont couvertes. Une solution possible dans ce cas consisterait à extrapoler des statistiques nationales à partir des chiffres infranationaux en utilisant un coefficient calculé sur la base de séries de données apparentées mais différentes. On pourrait par exemple transposer à l’échelle nationale l’effectif partiel d’étudiants en se basant sur des données calculées à partir des enquêtes sur la population active ou des résultats d’enquêtes ponctuelles.
Des données n’existent que pour certaines sous-populations. Cette situation est analogue à la précédente et la même solution pourrait être appliquée. Par exemple, il peut exister des données pour les écoles publiques et les écoles privées subventionnées par l’État mais aucune donnée pour les écoles privées non subventionnées. Ces données pourraient là encore être calculées par extrapolation.
Les données ne permettent pas le niveau d’agrégation souhaité. Si, par exemple, les données relatives aux dépenses n’existent pas pour chaque niveau d’enseignement séparément, les montants peuvent cependant être répartis entre les divers niveaux en fonction de leurs effectifs respectifs d’étudiants. On pourrait aussi répartir les dépenses en fonction soit des taux relatifs d’encadrement soit des effectifs de personnel. De la même façon, les effectifs d’enseignants ou le nombre d’heures d’enseignement pourraient servir à répartir les rémunérations du personnel enseignant entre les niveaux de la CITE. Autre situation connexe : il est possible d’affecter la plupart des données nationales à la classification internationale, mais il est impossible de le faire dans un certain nombre de cas qui normalement seraient reportés sous la rubrique « non connu ». En pareil cas, les données classées sous la rubrique « non connu » pourraient être affectées aux différentes catégories de la classification cible selon un calcul au prorata.
Il n’existe pas de données pour l’année de collecte concernée. En l’occurrence, il est peut-être possible de faire une estimation des données sur la base de celles qui ont été recueillies les années précédentes. Pour certaines données sur le financement, il peut convenir d’appliquer les taux d’inflation aux données de l’année précédente, pour autant que ce calcul aboutisse à une estimation acceptable des dépenses effectivement encourues. Les dépenses budgétisées plutôt que réelles peuvent également donner une base acceptable pour estimer les dépenses de l’année en cours. S’agissant des données sur des effectifs d’étudiants, il est possible de calculer des estimations pour l’année en cours en recourant à des estimations des taux de passage entre les niveaux ou les années d’études, de préférence fondées sur une évolution chronologique de ces taux.
Dans tous les cas, pour choisir une technique pour estimer des données manquantes, il faut réfléchir à l’utilisation qui sera faite des données, en particulier dans le calcul des indicateurs. Il ne serait guère judicieux par exemple d’utiliser les effectifs d’étudiants pour estimer des données manquantes sur les dépenses lorsque ces chiffres servent ensuite à calculer les dépenses par étudiant.
6.5. Autres aspects de la qualité des données à améliorer
Alors que de grands progrès ont été accomplis pour améliorer la comparabilité des statistiques et des indicateurs internationaux de l’éducation, il reste encore beaucoup à faire. La comparabilité pourrait encore être améliorée dans les grands domaines suivants :
6.5.1. La couverture des programmes d’enseignement
Bien que l’enseignement non formel soit reconnu dans la CITE comme le précise le chapitre 3, les collectes de données internationales ont tendance à limiter les statistiques sur l’éducation à l’enseignement formel pour des raisons de comparabilité internationale et de faisabilité.
Les programmes relevant de l’enseignement non formel sont d’une telle hétérogénéité qu’il est difficile de fournir des directives générales sur leur inclusion dans des instruments statistiques, compte tenu de l’objectif de la comparabilité internationale. En l’état, l’OCDE recommande pour classer les programmes relevant de l’enseignement non formel selon la CITE d’utiliser des critères d’équivalence et de rapporter ces programmes à ceux de l’enseignement formel dont le contenu est similaire. À ce stade, la CITE 2011 ne donne pas de directives spécifiques au sujet de la classification des programmes relevant de l’enseignement non formel et des qualifications non officielles qui les sanctionnent.
6.5.2. La classification des programmes par niveau
Selon le manuel de la CITE, les niveaux d’enseignement sont des catégories ordonnées qui regroupent les programmes d’enseignement en fonction de la progression de l’apprentissage et de l’acquisition des connaissances, compétences et aptitudes que chaque programme prévoit. Les « niveaux » de la CITE reflètent le degré de complexité et de spécialisation des programmes d’enseignement, des plus élémentaires aux plus poussés. Toutefois, les cursus sont trop différents, variés et complexes pour permettre une évaluation et une comparaison directes et cohérentes du contenu des programmes dans les systèmes éducatifs. En l’absence de mesures directes pour classifier le contenu éducatif, la CITE se fonde sur des critères d’approximation. De fait, ces variables de substitution n’offrent qu’une solution pragmatique et il y a lieu de poursuivre les efforts pour arriver à une classification des programmes aux différents niveaux, qui soit plus comparable entre les pays.
6.5.3. Définition de la scolarisation à temps plein et à temps partiel et conversion des effectifs scolarisés en équivalents plein temps
Ce domaine est l’un de ceux où la collecte de données en fonction de définitions internationales communes est limitée par les statistiques recueillies à l’échelle nationale. Comme l’indique le chapitre 4 (voir la section 4.1.9), jusqu’à la fin de l’enseignement secondaire, la méthode utilisée pour distinguer les individus scolarisés à temps plein de ceux scolarisés à temps partiel porte le plus souvent sur leur assiduité ou le temps qu’ils passent en classe. Dans l’enseignement tertiaire, la charge d’étude est plus souvent mesurée à l’aune du temps d’instruction et des crédits à accumuler, mais cette méthode n’est pas nécessairement uniforme entre les pays. De plus, certains pays différencient la scolarisation à temps plein de la scolarisation à temps partiel sur la base des caractéristiques des programmes plutôt que sur la charge d’étude. Dans le cas particulier de la formation en alternance, les effectifs des programmes « emploi-études » sont par exemple considérés comme scolarisés à temps plein, alors que le volet scolaire ne représente qu’une partie de leur programme.
En outre, les facteurs employés pour convertir les effectifs d’étudiants concernés en équivalent temps plein ne sont pas nécessairement calculés sur les mêmes bases. Le calcul sera fondé tantôt sur le temps de présence en classe, tantôt sur le temps d’études nécessaire et tantôt encore sur l’accumulation d’unités de valeur, et il est probable qu’il en résultera une certaine distorsion dans les comparaisons internationales. Les indicateurs touchés porteront sur les taux d’encadrement et les dépenses par étudiant.
6.5.4. Achèvement d'un programme/obtention d’un diplôme
La révision récente de la CITE a aidé à clarifier la définition internationale de l'obtention d'un diplôme. Lorsque l'obtention d'un diplôme ne donne pas directement accès à un niveau supérieur de la CITE, l’achèvement d'un programme donné peut être assimilé ou pas à l’achèvement d'un niveau (sans donner accès à un niveau supérieur). Si le programme concerné réunit les conditions énoncées, sa réussite peut revenir à achever partiellement le niveau dont il relève (voir le chapitre 4, section 4.1.4, pour plus de détails). Au fond, la difficulté tient à l’incapacité de comparer la qualité ou la valeur d’un diplôme entre les pays (et au sein de ceux-ci). Pour le faire, il faudrait disposer d’une norme ou d’un critère de comparaison international, qui n’existe pas pour l’heure.
6.5.5. Les dépenses au titre des services auxiliaires
S’il ne fait aucun doute que les dépenses au titre de services auxiliaires dans les établissements d’enseignement doivent être indiquées dans les données collectées (voir le chapitre 4, section 4.5.3), elles le sont plus ou moins selon les pays. S’agissant des pays qui les communiquent effectivement, beaucoup ont encore du mal à le faire en les isolant des dépenses liées aux services éducatifs de base, en particulier dans le tertiaire. Cette situation risque d’entraîner des distorsions dans les indicateurs des dépenses et empêche de calculer ces indicateurs - en particulier les dépenses par étudiant - en fonction de critères plus logiques basés sur les seules dépenses au titre des services de base.
6.5.6. Les aides financières aux étudiants
En général, l’objectif dans ce domaine est de procéder à des mesures plus justes et plus complètes des aides financières consenties aux étudiants. Deux questions en particulier doivent encore être correctement examinées : premièrement, le report des prêts accordés aux étudiants et, deuxièmement, les avantages fiscaux et autres indemnités en faveur des étudiants et de leurs familles dont l’octroi est subordonné à la poursuite des études (voir le chapitre 4, section 4.5.4). Les prêts aux étudiants sont actuellement mesurés en montants bruts sans déduction des remboursements. Alors que ce mode de calcul est acceptable pour mesurer le financement des étudiants en une année donnée, il ne permet pas d’évaluer adéquatement la générosité du dispositif d’aide mis à la disposition des étudiants et ne reflète pas non plus de façon équitable la part des dépenses que supportent respectivement les secteurs public et privé. Les avantages fiscaux dont bénéficient les étudiants et leurs familles sont exclus des dépenses d’éducation car il n’existe aucune méthode convenue à l’échelle internationale pour les mesurer et les reporter, bien qu’il s’agisse d’un moyen légitime de venir en aide aux étudiants et à leurs familles. L’exclusion de ces dépenses nuit par conséquent aux comparaisons des aides financières accordées aux étudiants et des subventions publiques aux ménages d’une façon générale.
6.5.7. La mobilité des étudiants
L’évaluation de la mobilité entre les systèmes d’éducation a pris de l’importance ces dernières années, et des initiatives ont été prises pour mieux définir ce que la mobilité recouvre exactement (voir le chapitre 3, section 3.3.5). Il faut désormais s’employer à recueillir des données plus probantes sur les étudiants étrangers pour améliorer la comparabilité des données sur les étudiants étrangers et différencier ceux-ci des étudiants en mobilité internationale.
Références
[3] Institut de Statistiques de l'Unesco, OCDE et Eurostat (2016), UOE data collection on formal education: Manual on concepts, definitions and classifications, http://uis.unesco.org/sites/default/files/documents/uoe2016manual_11072016_0.pdf (consulté le 26 juillet 2018).
[2] Nations Unies (2014), Fundamental Principles of Official Statistics, https://unstats.un.org/unsd/dnss/gp/fundprinciples.aspx (consulté le 26 juillet 2018).
[1] OCDE (2011), Quality Framework for OECD Statistical Activities, http://www.oecd.org/sdd/qualityframeworkforoecdstatisticalactivities.htm (consulté le 26 juillet 2018).