Stefaan G. Verhulst
The GovLab, Université de New York
Coopération pour le développement 2021
30. Pour une réutilisation responsable des données afin d’atteindre les objectifs de développement
Abstract
Pour exploiter et accroître la valeur des données au service du développement, il est nécessaire d'instaurer de nouveaux mécanismes et de nouveaux partenariats afin d'accéder aux données déjà collectées et de les réutiliser. La collaboration en matière de données est un moyen innovant et rentable d'amplifier l’impact des données sur le développement. Parce qu'ils permettent la combinaison et la triangulation de données provenant de plusieurs sources, les collectifs de données (data collaboratives) peuvent être un moyen d’obtenir de nouvelles informations et de pallier les inégalités en matière de données. Pour que les données numériques aient réellement les retombées positives promises sur le développement, il est urgent de créer et de rendre opérationnels des structures et des cadres permettant d'utiliser et de réutiliser les données de manière responsable, notamment de répondre aux préoccupations concernant l’utilisation abusive des données.
Messages clés
Les pays en développement peuvent compenser la faiblesse de leurs ressources et de leurs capacités en matière de données par une collaboration dans ce domaine et par des partenariats pour la réutilisation des données.
Si rien n’est fait pour répondre aux préoccupations concernant l’utilisation abusive des données et le respect de la vie privée, la collaboration en matière de données ne permettra pas comme elle pourrait d’apporter des éléments de nature à étayer et de faire progresser le développement.
Les acteurs du développement et d’autres parties prenantes devraient contribuer à l’élaboration de cadres de gouvernance des données qui garantissent un juste équilibre entre les risques et les bénéfices de l’utilisation et de la réutilisation des données et associer le public à la mise en place de mécanismes de redevabilité.
La coopération pour le développement peut contribuer au renforcement des capacités dans le domaine des données, à une plus grande culture numérique et à l’instauration de processus permettant de mieux définir les besoins et les priorités en matière de réutilisation des données.
Pour le meilleur ou pour le pire, la transformation numérique en cours facilite le recueil, le stockage et l’analyse d'une grande diversité de données. Encore faut-il utiliser cette multitude de données de manière avisée et responsable et dans l’intérêt de la population. Il existe de multiples exemples dans lesquels les données sont utilisées pour atteindre des objectifs de développement – pour améliorer les performances agricoles, faire en sorte que l’aide humanitaire soit fournie là où elle est le plus nécessaire, gérer les flux migratoires et mesurer l’analphabétisme, entre autres. Toutefois, la capacité d'accéder aux données déjà recueillies, de les utiliser et de les régir varie considérablement d'un pays à l'autre.
Les données numériques ont ceci d'unique qu’elles peuvent être réutilisées à d'autres fins que celles initialement prévues. Cette réutilisation offre aux pays à faible revenu et à d’autres pays la possibilité de partager les coûts liés aux données et de produire de nouvelles informations et connaissances susceptibles d’être mises au service du développement durable. Les préoccupations concernant la confidentialité des données, leur utilisation abusive potentielle et une gouvernance inégale continuent d’entraver la collaboration en matière de données. Pourtant, le partage de données, s’il s’effectue de manière avisée et responsable, peut conduire à une meilleure prise de décision dans l’intérêt du public et du développement. Il est nécessaire que les acteurs du développement apportent leur concours à l'élaboration d’un cadre permettant une réutilisation responsable, systématique et durable des données. L’essor des réseaux sociaux, l’internet des objets et la place croissante de l'intelligence artificielle et de l'apprentissage automatique dans la vie quotidienne ont conduit à une montée en puissance des données qui pourrait entraîner un changement social positif – si ce potentiel est exploité de manière responsable (Lupton et Williamson, 2017[1]).
Des capacités accrues en matière de données permettront d’obtenir un impact accru sur le plan du développement
D’une manière générale, les acteurs publics et privés recueillent des données dans un but particulier, le plus souvent commercial ou administratif. Parmi les objectifs les plus courants figurent le profilage des clients (Poullet, 2021[2]), le suivi des déplacements et la localisation (The GovLab et Cuebiq, 2021[3]) et le ciblage des services sociaux et d’autres services publics (Verhulst, Young et Zahuranec, 2019[4]). Les capacités de collecte, d'utilisation et de gouvernance des données sont cependant très variables d'un pays à l’autre, et cette disparité est le reflet des inégalités économiques mondiales. Le renforcement des capacités des pays à faible revenu en matière de production et d’utilisation des données peut contribuer à la réalisation des Objectifs de développement durable en général : le développement économique peut avoir pour corollaire un renforcement des capacités dans le domaine des données ; l'amélioration des compétences en matière de données est indispensable au développement ; et la possibilité d'accéder aux données pour les réutiliser peut stimuler le développement économique. Les exemples ci-après témoignent de l'importance des données numériques pour le développement, depuis leur contribution à une prise de décision éclairée dans le domaine économique jusqu’à leur intérêt pour l’affectation de l’aide humanitaire :
Partager les données pour prendre de meilleures décisions dans le domaine agricole en Colombie : le ministère de l’Agriculture et le projet Climat et Secteur agricole en Colombie (Clima y Sector Agropecuario Colombiano) ont partagé des données et des éclairages sur l’économie et l'agronomie de la riziculture avec des agriculteurs, leur permettant, entre autres, d’éviter de se lancer dans des cultures vouées à l’échec. Les agriculteurs ont ainsi pu conserver leur mode de vie traditionnel et réaliser des économies estimées à 3.6 millions USD l'année suivant le lancement du projet (Young et Stefaan, 2017[5]).
Cartographier les mouvements de population pour orienter l’aide humanitaire à Haïti : à la suite de l’épidémie de choléra survenue en 2010 à Haïti, l’opérateur de télécommunications Digicel Haiti a partagé des données avec des chercheurs de l’institut suédois Karolinska et de l’Université Columbia de New York. À partir de données anonymisées provenant de 2 millions de téléphones mobiles, les chercheurs ont pu cartographier les mouvements de population, ce qui a permis de fournir l’aide de manière plus efficace et plus efficiente. Des méthodes similaires ont été employées ailleurs (Young et Stefaan, 2016[6]).
Évaluer l'analphabétisme à l’aide des relevés de communications mobiles au Sénégal : au Sénégal, Knuper, une société active dans le champ du développement international, a obtenu de la société de télécommunications Orange les relevés de communications de quelque 9 millions d'abonnés. Knuper a utilisé ces données dans une étude afin de déterminer si ces factures détaillées pouvaient être utilisées pour améliorer la mesure de l’analphabétisme dans les pays en développement. Ce projet est un bon exemple de réutilisation des données à d'autres fins que celles initialement prévues (The GovLab, 2019[7]).
Recourir à l’externalisation participative pour trouver de nouvelles possibilités d'application des données en Afrique de l’Ouest : en Côté d’Ivoire et au Sénégal, l’opérateur Orange a accueilli le Data 4 Development (D4D) challenge, un concours international dans le cadre duquel des données anonymisées étaient mises à la disposition de chercheurs s’intéressant à des problèmes de développement, ce qui a permis de faire appel de manière participative à des compétences extérieures afin de découvrir des exemples inédits et jusqu'alors non reconnus d'application de données détenues par le secteur privé (The GovLab, 2017[8]). Dans le cas du Sénégal, certains des projets lauréats exploraient la possibilité d'utiliser les données téléphoniques à des fins d’électrification et de planification, étudiaient l'influence de l’accès au téléphone portable sur le prix du millet ou examinaient la propagation des parasites véhiculés par l’eau sous l’effet des mouvements de population.
La ruée vers les données et les capacités en matière de données ne signifient cependant pas que l’utilisation ou la réutilisation de données soit un jeu à somme nulle. La collaboration est indispensable pour que les projets reposant sur les données soient fructueux – autrement dit permettent d’obtenir des informations pertinentes et de conduire à un changement social réel et positif1.
Les collectifs de données constituent un modèle pour une réutilisation responsable des données
La valeur ajoutée des données numériques tient à ce qu’elles peuvent être réutilisées, soit dans le même but que celui initialement prévu, soit dans un autre but (Verhulst et Young, 2018[9]), ce qui décuple leur importance potentielle pour le développement. Les collectifs de données constituent un nouveau modèle en matière de réutilisation des données : il s'agit d’une forme de partenariat conclu entre des détenteurs et des utilisateurs de données (mais aussi des acteurs qui peuvent exploiter les informations produites et des experts en science des données) en vue de la réutilisation de formes disparates de données, afin d'obtenir de nouvelles informations, dans l’intérêt du public (Verhulst et al., 2019[10] ; Young et Verhulst, 2020[11]). Cette nouvelle approche de la réutilisation systématique, durable et responsable des données est universellement applicable. The GovLab a recensé plus de 200 exemples de collectifs de données, dont beaucoup dans des pays à faible revenu2.
Les collectifs de données peuvent être rentables, innovants et inclusifs
L'approche reposant sur les collectifs de données présente trois grands avantages :
1. Elle offre un meilleur rapport coût-efficacité. Le recueil, le stockage et l’utilisation de données sont onéreux, surtout si l’on tient compte du coût de l’analyse. Ainsi, d'après une enquête réalisée en 2020 pour McKinsey Digital, une organisation de taille moyenne aux États-Unis consacre chaque année près de 250 millions USD aux données, et ce budget augmente de quasiment 50 % par an (Grande et al., 2020[12]). Une autre étude, conduite par Jerven (2014[13]) pour le Copenhagen Consensus Center, évaluait à pas moins de 254 milliards USD le budget à consacrer à la production des données nécessaires à la « révolution des données » envisagée par le Groupe de haut niveau des Nations Unies. Pour les pays à faible revenu, une dépense d’une telle ampleur est inconcevable. La réutilisation des données peut réduire le coût financier des initiatives en matière de données. Le rapport de McKinsey Digital cite l’exemple d'une banque qui a réduit de 20 % ses coûts dans ce domaine en réutilisant des données et, de manière plus générale, en améliorant leur gouvernance (Grande et al., 2020[12]).
La réutilisation des données peut réduire le coût financier des initiatives en matière de données. Le rapport de McKinsey Digital cite l’exemple d'une banque qui a réduit de 20 % ses coûts dans ce domaine en réutilisant des données et, de manière plus générale, en améliorant leur gouvernance.
2. Elle permet d’apporter de nouveaux éclairages et d'améliorer ainsi l'action publique. La combinaison de données provenant de sources diverses entraîne un décloisonnement et peut ainsi permettre d’apporter des éclairages nouveaux et innovants de nature à aider les responsables publics à prendre de meilleures décisions. Les données satellitaires initialement collectées pour établir des prévisions météorologiques peuvent aider à gérer les prix des récoltes et à lutter contre la pauvreté et la famine (Young et Stefaan, 2016[6]) ; les données issues des communications mobiles peuvent servir à mesurer les mouvements de population, ce qui peut faciliter le contrôle des flux migratoires et la lutte contre les pandémies existantes ou émergentes (The GovLab, 2017[14]). Il est aussi possible de trianguler les données numériques avec des sources d'information plus traditionnelles (comme les données de recensement) pour obtenir de nouveaux éclairages et permettre la vérification de l’exactitude des informations.
3. Elle est un moyen de remédier aux inégalités et aux asymétries. Les inégalités sociales et économiques, à la fois dans les pays et entre eux, coïncident souvent avec des inégalités sur le plan des données (ONU, 2020[15] ; Banque mondiale, 2021[16] ; Vieira, 24 février 2018[17] ; Alonso, Kothari et Rehman, 2 décembre 2020[18]). Le coût de la production de données et la technologie nécessaire à leur traitement constituent un frein de plus en plus puissant pour les pays à faible revenu ou à revenu intermédiaire. Les collectifs de données permettent une mutualisation de ces coûts et de ces outils et techniques d'analyse. À titre d’exemple, l’infonuagique, qui facilite l’accès aux outils d'analyse et à d’autres outils techniques ainsi que leur partage, peut jouer un rôle essentiel en permettant le transfert de compétences et de technologies entre acteurs et entre pays.
Les préoccupations concernant la gouvernance et l’utilisation abusive des données font obstacle à une plus grande collaboration
Quoique prometteuse, la collaboration en matière de données n’est pas encore répandue, en particulier dans les pays à faible revenu ou à revenu intermédiaire. La faiblesse de la réglementation, le risque d’utilisation abusive des données partagées et le nombre limité d’exemples de réutilisation de données demeurent des causes d’inquiétude. Ces obstacles soulignent la nécessité de veiller à une gestion responsable des données à chacune des étapes, depuis leur collecte jusqu'à leur utilisation et réutilisation, en passant par leur stockage. Les défis à relever pour parvenir à une plus grande collaboration peuvent être répartis dans trois grandes catégories :
1. Trouver le bon modèle de gouvernance. Pour la plupart des pays, la difficulté ne réside actuellement pas tant dans la question de savoir s'il faut réglementer l’univers numérique, que dans celle de savoir comment concevoir des cadres réglementaires et institutionnels permettant d’exploiter pleinement le potentiel des données tout en limitant les préjudices qui peuvent en résulter. Dans le meilleur des cas, la gouvernance est un chantier inachevé. Lorsque ces cadres existent, ils sont souvent affaiblis par la captation de la réglementation, par des pressions politiques et par un manque de connaissances ou de compétences des décideurs (Verhulst et Sloane, 2020[19]). Ces problèmes peuvent se poser avec une acuité particulière dans les pays à faible revenu, où les capacités et l’indépendance en matière de réglementation sont souvent plus faibles qu’ailleurs.
2. Répondre aux préoccupations concernant l’utilisation abusive des données. Les préoccupations relatives à l'utilisation abusive des données et au respect de la vie privée continuent de figurer parmi les principaux obstacles à une plus grande collaboration. Il s'agit souvent de préoccupations légitimes de la part des détenteurs de données et des personnes concernées par les données, voire de ceux qui les réutilisent. Pour y répondre, une stratégie multidimensionnelle devrait être adoptée, qui vise principalement à sensibiliser les organisations aux risques d’utilisation abusive des données et à mettre sur pied des cadres institutionnels et juridiques efficaces pour garantir l’exercice de la redevabilité et une réutilisation responsable des données.
3. Constituer un corpus de données à partir de la réutilisation des données et le partager. On sait – et on partage – trop peu de choses sur la manière dont les données sont réutilisées, sur ce qui fonctionne et ne fonctionne pas dans les expériences de collaboration en matière de données et sur les premières leçons à tirer de ces expériences et les principes qui garantissent leur réussite (Verhulst et al., 2019[10]). Une base de connaissances structurée pourrait contribuer à éviter les doublons – un enjeu de taille lorsque les ressources sont limitées – et fournir des informations propres à augmenter les chances de succès des initiatives. Le répertoire d'études de cas constitué par The GovLab contribue à la création d'une base de connaissances solide.
Accroître au maximum les retombées positives potentielles de la réutilisation des données
L’absence de cadre clair pour le partage des données limite les possibilités de collaborer dans ce domaine pour favoriser le développement. Au lieu d'accroître au maximum les retombées positives de la réutilisation des données et de réduire au minimum les préjudices qui peuvent en résulter, les réglementations et les politiques actuelles, fragmentées et spécifiques, ont souvent l’effet inverse. Des approches novatrices sont donc nécessaires – pour protéger la vie privée et prévenir toute utilisation abusive des données, améliorer la prise de décision et mettre en place les ressources humaines nécessaires à une gestion efficace des données.
Remplacer les mécanismes et structures obsolètes de gouvernance des données
Les modèles et les politiques actuellement en place pour protéger la vie privée sont en grande partie obsolètes et reposent souvent sur une approche qui privilégie la réduction des risques plutôt que la maximisation des retombées positives3. Les décideurs, que ce soit au sein de l’administration publique ou d’organisations privées, ont besoin de nouvelles méthodes pour concilier risques et retombées positives, de formes et de modèles institutionnels revitalisés et de solutions inédites pour assurer l’exercice de la redevabilité. Les caractéristiques spécifiques requises sont notamment les suivantes :
Des méthodes innovantes d'évaluation et d'atténuation des risques tout au long du cycle de vie des données peuvent assurer un meilleur équilibre entre risques et retombées positives (Young, Campo et Verhulst, 2019[20]).
Les approches intégrant dès la conception le principe de responsabilité en matière de données peuvent garantir que la protection de la vie privée et d’autres mesures de protection soient intégrées dans l'architecture technique et institutionnelle – par exemple, des solutions techniques intégrées telles que des algorithmes de confidentialité différentielle ou d’autres technologies protectrices de la vie privée, qui empêchent ou atténuent les atteintes dans ce domaine (The GovLab, 2021[21]).
L'établissement et la diffusion d'accords types de partage des données (Contracts for Data Collaboration, 2021[22]) pourraient offrir des modèles aux organisations souhaitant partager des données ou accéder à des données partagées. Ces modèles pourraient être particulièrement utiles aux pays à faible revenu, qui ne disposent pas toujours des ressources techniques et humaines nécessaires pour établir de tels accords.
La création de comités d'éthique chargés de surveiller la manière dont les données sont réutilisées et la désignation d’« intendants des données » compétents pour piloter le processus de partage et de réutilisation des données peuvent être des moyens de remédier aux problèmes de gouvernance des données (Verhulst et al., 2020[23]).
Il est essentiel que soit en place un cadre de gouvernance mondial qui facilite les flux transfrontières de données à l’appui du développement et d’autres objectifs sociaux4.
Le renforcement de l’engagement du public à travers des assemblées citoyennes, des campagnes de sensibilisation et des stratégies éducatives peut favoriser une « acceptation sociale » de la réutilisation des données et permettre d'éviter les approches reposant sur une solution toute faite, ce qui constitue un enjeu particulièrement important dans les pays à faible revenu (Young et al., 2020[24]).
Améliorer la prise de décision en ce qui concerne les priorités en matière de réutilisation des données
Le partage de données est un processus essentiellement réactif, qui dépend davantage des données disponibles ou partagées que du besoin du public. Pourtant, la collaboration en matière de données a plus de retombées si elle est motivée par la demande plutôt que par l’offre. Il faut donc poser les bonnes questions pour définir les priorités et partager les données en conséquence5. Pour être efficace, une telle approche requiert à la fois des compétences spécialisées et une large participation du public, de manière à repérer les besoins du public auxquels les données peuvent répondre en priorité. Cette « nouvelle science des questions » est nécessaire quel que soit le contexte, mais elle l’est probablement encore plus dans les pays à faible revenu, où les priorités publiques (parfois contradictoires) sont en concurrence alors que les ressources sont limitées et où des arbitrages difficiles entre les différents Objectifs de développement durable doivent être opérés6. Poser les bonnes questions peut être un moyen d’établir une stratégie plus systématique, objective et scientifique pour la définition des besoins et l’affectation de ressources publiques limitées. Une science des questions est aussi indispensable pour faire en sorte que les objectifs et et les initiatives soient adaptés au contexte – ce qui constitue toujours une préoccupation majeure pour les projets de développement.
Une « nouvelle science des questions » est nécessaire quel que soit le contexte, mais elle l’est probablement encore plus dans les pays à faible revenu, où les priorités publiques (parfois contradictoires) sont en concurrence alors que les ressources sont limitées et où des arbitrages difficiles entre les différents Objectifs de développement durable doivent être opérés.
Élargir le vivier de talents disponibles et créer de nouvelles fonctions professionnelles et institutionnelles, à l’instar des intendants des données
Si des moyens techniques très divers (ex. : mécanismes d'audit numérique, outils permettant de retracer l’origine des décisions) peuvent être employés pour contribuer au renforcement des cadres d’utilisation responsable des données, la gouvernance des données repose in fine sur les ressources humaines. Or, le progrès technique est plus rapide que l'évolution des capacités. Les pays à faible revenu en particulier ont besoin d’un appui au renforcement de leurs capacités pour superviser le partage responsable et systématique des données. Plusieurs facteurs sont particulièrement importants.
Premièrement, une formation et un enseignement peuvent être intégrés aux systèmes éducatifs formels existants et complétés par des actions locales plus souples, par exemple celles proposées par les organisations de la société civile pour sensibiliser la population aux risques et avantages du partage de données (Young, Campo et Verhulst, 2019[20]).
Deuxièmement, le renforcement des capacités devrait poursuivre une série d'objectifs pour différents segments de la population. Si les pays gagnent à disposer d’experts en science des données plus nombreux et mieux formés, les décideurs publics, les dirigeants d’entreprise, les journalistes et d’autres acteurs de la société ont eux aussi besoin de se former et de monter en compétences. Améliorer les compétences du grand public en matière de données devrait constituer un objectif fondamental, afin de sensibiliser les citoyens et de renforcer la confiance et l’adhésion à l’égard de la collaboration dans le domaine des données.
Troisièmement, pour assurer la redevabilité ainsi que la surveillance des données et des initiatives de partage de données, il est nécessaire de créer de nouvelles fonctions au sein des institutions. Celles-ci peuvent créer, au niveau des individus ou des instances, une fonction d’intendant des données chargé de contrôler la manière dont les données sont gérées, de repérer les possibilités de partage de données et de veiller à l’exercice de redevabilité au sein de la chaîne des données. De telles fonctions sont de plus en plus répandues dans les organisations privées, mais elles sont tout aussi importantes pour les administrations, les organisations de la société civile et les établissements d'enseignement (Verhulst et al., 2020[23]).
Les acteurs du développement devraient activement promouvoir la mise en place de cadres pour une gouvernance responsable des données à l’appui du développement durable
La capacité de produire et d’utiliser des données peut favoriser la mise en place de politiques plus éclairées, et la réutilisation des données dans le cadre de partenariats collaboratifs peut être un moyen économique de produire de nouvelles informations et de prendre de nouvelles décisions en matière de développement. L'accès aux données et leur réutilisation sont porteurs de plus grandes promesses, mais aussi de plus grands défis, dans les pays à faible revenu. Le fait que ces pays disposent de ressources financières et humaines plus limitées peut compromettre la gouvernance des données, nuire à la protection de la vie privée et à la prévention de l’utilisation abusive des données, et se traduire par des occasions manquées d'améliorer le bien-être de leurs citoyens.
C’est pourquoi les décideurs et tous les acteurs du développement devraient avoir pour priorité absolue de créer et de rendre opérationnels des cadres permettant de réutiliser les données de manière responsable, systématique et durable. L’existence de mécanismes de gouvernance actualisés et innovants pour gérer les données peut être un moyen de prévenir les risques et de maximiser les retombées positives potentielles des données. La désignation et la formation d’intendants des données peut contribuer à construire le capital humain nécessaire à l'instauration et à la mise en œuvre de collaborations qui soient à la fois responsables et adaptées à l’objectif qu’elles poursuivent. Ces mécanismes de gouvernance et ces fonctions professionnelles doivent être créés dans un esprit stratégique et collaboratif, en reconnaissant le rôle que les données peuvent jouer dans les organisations publiques et privées de la société.
Références
[18] Alonso, C., S. Kothari et S. Rehman (2 décembre 2020), « Comment l’intelligence artificielle pourrait creuser l’écart entre les nations riches et les nations pauvres », Blog du FMI, https://www.imf.org/fr/News/Articles/2020/12/02/blog-how-artificial-intelligence-could-widen-the-gap-between-rich-and-poor-nations (consulté le 21 septembre 2021).
[16] Banque mondiale (2021), World Development Report 2021: Data for Better Lives, Banque mondiale, Washington, D.C., https://doi.org/://doi.org/10.1596/978-1-4648-1600-0.
[22] Contracts for Data Collaboration (2021), « C4DC », page web, https://contractsfordatacollaboration.org (consulté le 21 septembre 2021).
[12] Grande, D. et al. (2020), « Reducing data costs without jeopardizing growth », McKinsey Digital, https://www.mckinsey.com/business-functions/mckinsey-digital/our-insights/reducing-data-costs-without-jeopardizing-growth (consulté le 21 septembre 2021).
[13] Jerven, M. (2014), Benefits and Costs of the Data for Development Targets for the Post-2015 Development Agenda, Copenhagen Consensus Center, Lowell, MA, https://www.copenhagenconsensus.com/sites/default/files/data_assessment_-_jerven.pdf.
[1] Lupton, D. et B. Williamson (2017), « The datafied child: The dataveillance of children and implications for their rights », New Media & Society, vol. 19/5, pp. 780-794, https://doi.org/10.1177/1461444816686328.
[15] ONU (2020), Questions thématiques : Les mégadonnées au service du développement, Nations Unies, New York, https://www.un.org/fr/global-issues/big-data-for-sustainable-development (consulté le 21 septembre 2021).
[2] Poullet, Y. (2021), Profiling in the Age of AI, AIEthicsCourse.org, https://aiethicscourse.org/lectures/profiling-in-the-age-of-ai (consulté le 20 septembre 2021).
[21] The GovLab (2021), « Data responsibility journey: Risks & responsibilities throughout the data lifecycle », page web, https://dataresponsibilityjourney.org (consulté le 21 septembre 2021).
[7] The GovLab (2019), « Knuper data upcycling in Senegal », Data Collaboratives Cases, https://datacollaboratives.org/cases/knuper-data-upcycling-in-senegal.html (consulté le 21 septembre 2021).
[8] The GovLab (2017), « Orange Telecom Data for Development Challenge (D4D) », Data Collaboratives Cases, https://datacollaboratives.org/cases/orange-telecom-data-for-development-challenge-d4d.html (consulté le 21 septembre 2021).
[14] The GovLab (2017), « Tracking malaria in Namibia with cell phone data », Data Collaboratives Cases, https://datacollaboratives.org/cases/tracking-malaria-in-namibia-with-cell-phone-data.html (consulté le 21 septembre 2021).
[3] The GovLab et Cuebiq (2021), The Use of Mobility Data for Responding to the COVID19 Pandemic: DATA4COVID19 Deep Dive, Open Data Institute, Londres, http://theodi.org/wp-content/uploads/2021/04/Data4COVID19_0329_v3.pdf.
[19] Verhulst, S. et M. Sloane (2020), « Realizing the potential of AI localism », Project Syndicate, Page web, Project Syndicate, https://www.project-syndicate.org/commentary/local-regulation-of-artificial-intelligence-uses-by-stefaan-g-verhulst-1-and-mona-sloane-2020-02?barrier=accesspaylog (consulté le 21 septembre 2021).
[9] Verhulst, S. et A. Young (2018), Toward an Open Data Demand Assessment and Segmentation Methodology, The GovLab, New York, N.Y., https://thegovlab.org/static/files/publications/Data+Demand.pdf.
[10] Verhulst, S. et al. (2019), Leveraging Private Data for Public Good: A Descriptive Analysis and Typology of Existing Practices, The GovLab, New York, N.Y., https://datacollaboratives.org/static/files/existing-practices-report.pdf.
[4] Verhulst, S., A. Young et A. Zahuranec (2019), « Circular data for a circular city: Value propositions for economic development », The Circular City Research Journal, vol. 1, http://files.thegovlab.org/Circular_Data.pdf.
[23] Verhulst, S. et al. (2020), « Wanted: Data stewards: (Re-)defining the roles and responsibilities of data stewards for an age of data collaboration », The GovLab Blog, https://blog.thegovlab.org/post/wanted-data-stewards-re-defining-the-roles-and-responsibilities-of-data-stewards-for-an-age-of-data-collaboration (consulté le 21 septembre 2021).
[17] Vieira, H. (24 février 2018), « Without urgent action big data may widen inequality », LSE Blogs, https://blogs.lse.ac.uk/businessreview/2018/02/24/without-urgent-action-big-data-may-widen-inequality (consulté le 21 septembre 2021).
[20] Young, A., S. Campo et S. Verhulst (2019), Responsible Data for Children: Synthesis Report, Fonds des Nations Unies pour l’enfance, https://rd4c.org/assets/rd4c-synthesis-report.pdf.
[5] Young, A. et V. Stefaan (2017), « Aclímate Colombia: Open data to improve agricultural resiliency », Open Data for Developing Economies Case Studies, The GovLab, New York, N.Y., https://odimpact.org/case-aclimate-colombia.html.
[6] Young, A. et V. Stefaan (2016), « Aclímate Colombia: Open data to improve agricultural resiliency », Open Data for Developing Economies Case Studies, The GovLab, https://odimpact.org/case-aclimate-colombia.html. (consulté le 20 septembre 2021).
[11] Young, A. et S. Verhulst (2020), « Data collaboratives », dans The Palgrave Encyclopedia of Interest Groups, Lobbying and Public Affairs, Palgrave Macmillan, New York, N.Y., https://doi.org/10.1007/978-3-030-13895-0_92-1.
[24] Young, A. et al. (2020), The Data Assembly: Responsible Data Re-Use Framework, The GovLab, New York, NY, https://thedataassembly.org/files/nyc-data-assembly-report.pdf.
Notes
← 1. Après plusieurs années de recherches et de travaux sur le partage et la réutilisation des données, l’auteur du présent article résume l’importance de la collaboration par les trois maximes ou principes suivants : 1) les données dont on a besoin sont vraisemblablement détenues par quelqu’un d'autre ; 2) la connaissance du domaine et l’expertise en matière de données dont on a besoin, quelqu’un d'autre les possède sans doute ; et 3) pour disposer de la puissance de calcul et de l’infrastructure technique nécessaires au traitement des données, il faut probablement accéder aux plateformes de tiers.
← 2. La description des avantages et des difficultés présentée dans cette partie s’appuie sur des études de cas et plusieurs heures d’entretiens, sur une analyse documentaire et sur d’autres recherches conduites par The GovLab au fil des années. Le répertoire des études de cas peut être consulté à l’adresse : http://datacollaboratives.org/explorer.html
← 3. Concernant les difficultés liées aux arbitrages entre les risques et les retombées positives, voir, par exemple : https://www.eesc.europa.eu/en/news-media/news/big-data-how-minimise-risks-while-maximising-benefits-all. Concernant la maximisation des retombées positives, les débats prennent souvent en compte les effets négatifs et les dangers de ce que l’organisation Open Data Watch dénomme les politiques « ouvertes par défaut » en matière de données. Voir, par exemple : https://opendatawatch.com/publications/maximizing-access-to-public-data-striking-the-balance.
← 4. Pour une réflexion sur la nécessité de faciliter les flux transfrontières de données, voir : https://www2.itif.org/2017-cross-border-data-flows.pdf et https://www.cigionline.org/publications/data-different-why-world-needs-new-approach-governing-cross-border-data-flows.
← 5. Pour en savoir plus, voir la page web du projet « 100 Questions » à l’adresse : https://the100questions.org.