En emergencias mundiales como la pandemia del coronavirus (COVID-19), las políticas de ciencia abierta pueden eliminar obstáculos para la libre circulación de datos e ideas de investigación y así acelerar el ritmo de la investigación científica que resulta fundamental para combatir la enfermedad.
Si bien la colaboración y el intercambio de datos de investigación a escala mundial ha alcanzado niveles sin precedentes, prevalecen grandes desafíos. La confianza en ciertos datos es relativamente baja y los problemas a resolver incluyen la falta de normas específicas, coordinación e interoperabilidad, así como la calidad y la interpretación de la información.
Para reforzar la contribución de la ciencia abierta a la respuesta ante el COVID-19, es necesario que los formuladores de políticas se aseguren de brindar modelos adecuados de gestión de datos, normas interoperables, acuerdos de intercambio de datos sostenibles en los que participan el sector público, el sector privado y la sociedad civil, incentivos para los investigadores, infraestructura sostenible, capacidades humanas e institucionales y mecanismos de acceso a la información a través de las fronteras.
Por qué la ciencia abierta es esencial para combatir el COVID-19
Mensajes clave
En la situación de emergencia mundial actual, los descubrimientos científicos han evolucionado con mucha mayor rapidez que antes. El genoma completo del COVID-19 se dio a conocer apenas un mes después del ingreso del primer paciente al hospital de Wuhan en una publicación de acceso abierto en The Lancet. Esto debe compararse con el retraso de cinco meses en el caso del brote del síndrome respiratorio agudo grave (SRAS) en 2002-2003, retraso debido en gran parte a un apagón informativo en los primeros meses de la epidemia SRAS.
Brotes anteriores nos han enseñado la enorme importancia de compartir información y publicaciones para combatir enfermedades. Los siguientes son factores clave que facilitarán dicho intercambio:
Establecer y mantener la confianza entre las diferentes partes que intercambian datos de investigación
Reciprocidad en el intercambio de datos de investigación
Colaboración intersectorial incluyente, basada en funciones y responsabilidades predefinidas
Creación de un sistema de preparación y respuesta para todas las enfermedades infecciosas emergentes con una infraestructura técnica adecuada, con derechos de acceso a la información y responsabilidades de los actores previamente definidos
Confianza con colaboradores internacionales que actúen como asesores y centros de referencia externos
Abordar los obstáculos que impiden compartir los datos de investigación, con soluciones que tomen en cuenta la complejidad y el gran número de causas fundamentales de dichos obstáculos
En esta nota se proporciona un panorama de los logros en el intercambio de información y publicaciones y en la creación de plataformas colaborativas en línea; además, se describen los desafíos pendientes. Se concluye aportando una hoja de ruta hacia políticas aún mejores y más resilientes para el futuro.
Logros de las iniciativas y compromisos de la ciencia abierta
En enero de 2020, 117 organizaciones —incluidas revistas científicas, organismos de financiación y centros para la prevención de enfermedades— firmaron una declaración titulada “Sharing research data and findings relevant to the novel coronavirus outbreak” (Compartir información y resultados de investigaciones pertinentes para el brote del nuevo coronavirus), comprometiéndose a proporcionar acceso abierto inmediato a publicaciones revisadas por homólogos al menos por el periodo de duración del brote, comunicar los resultados de las investigaciones mediante servidores de pre-publicación y compartir de inmediato dichos resultados con la Organización Mundial de la Salud (OMS). Posteriormente, en marzo, 12 países1 emprendieron la Public Health Emergency COVID-19 Initiative a nivel de asesores científicos en jefe o su equivalente, convocando al acceso público a publicaciones y acceso legible por máquina a información relacionada con el COVID-19, lo cual generó un compromiso aún más firme de los editores.
En abril de 2020, una coalición internacional de científicos, abogados y empresas tecnológicas pusieron en marcha The Open COVID Pledge (Compromiso Open COVID), el cual insta a los autores a permitir el acceso a toda la propiedad intelectual (PI) bajo su control de manera gratuita y sin gravámenes, con el fin de ayudar a acabar con la pandemia del COVID-19 y reducir los efectos de la enfermedad. Algunos signatarios notables son Intel, Facebook, Amazon, IBM, Sandia National Laboratories, Hewlett Packard, Microsoft, Uber, la Open Knowledge Foundation, el Massachusetts Institute of Technology y AT&T. Los signatarios ofrecerán una licencia Open COVID específica no exclusiva libre de regalías para utilizar la PI con el propósito de diagnosticar, prevenir y tratar el COVID-19.
Nextstrain y Gisaid permiten rastrear la propagación de la epidemia mediante mutaciones genéticas.
Plataformas como MOBS Lab o MIDAS facilitan el modelaje de la propagación de la epidemia.
Las investigaciones sobre tratamientos y vacunas son respaldadas por Elixir, REACTing, CEPI y otras plataformas.
Iniciativas de colaboración masiva como Foldit implican desafíos y han surgido hackatones como #EUvsVirus y COVID-19 virtual study-a-thon.
Vivli es una plataforma que ofrece una manera fácil de solicitar datos anonimizados de estudios clínicos realizados.
En abril de 2020, la Comisión Europea y varios socios establecieron una plataforma de datos sobre COVID-19 para permitir el intercambio rápido y abierto de datos de investigación para promover los estudios sobre la enfermedad.
La COVID-19 High Performance Computing Platform (Plataforma de Computación de Alto Rendimiento COVID-19) ofrece recursos informáticos y Folding@home, una plataforma de computación distribuida, proporciona más de 1.5 exaFlops.
A partir de estos compromisos, varios editores y revistas de las más importantes2 han brindado acceso abierto y numerosos servidores de datos se han mostrado dispuestos a compartir información epidemiológica, clínica y genómica. También se comparten la información, los protocolos y las normas utilizadas para recabar la información. El CORD-19 (COVID-19 Open Research Dataset) (Conjunto de Datos de Investigación Abierta), contiene 57 000 entradas, incluidos 41 000 artículos legibles por máquina de texto completo sobre COVID-19 y coronavirus relacionados, y sirve de base para la minería de datos por técnicas de aprendizaje automático, con el fin de responder a un conjunto de preguntas abiertas acerca del COVID-19.
Las plataformas en línea facilitan cada vez más el trabajo colaborativo de los investigadores de COVID-19 en todo el mundo, demostrando el poder de la ciencia abierta.
Los siguientes son algunos ejemplos:
Desafíos pendientes
Si bien se cuenta con una gran cantidad de información clínica, epidemiológica y de laboratorio acerca del COVID-19, incluida la secuencia genómica del patógeno, quedan por resolver varios desafíos:
Los datos en su totalidad no son, o aún no son, suficientemente fáciles de encontrar, accesibles, interoperables y reutilizables (FAIR, por sus siglas en inglés).
Las fuentes de datos tienden a estar dispersas y, aunque hay muchas iniciativas en curso para agruparlas, la curación debe hacerse “sobre la marcha”.
Es necesario agilizar el acceso al uso compartido de historiales de salud personales, previa autorización del paciente. En muchos países de la OCDE aún no se promulgan leyes orientadas a fomentar la interoperabilidad y evitar el bloqueo de información. En la mayoría de dichos países, el acceso transfronterizo es aún más difícil bajo los marcos actuales de protección de datos.
Para lograr el objetivo doble de respetar la privacidad y a la vez garantizar el acceso a datos clínicos legibles por máquina, interoperables y reutilizables, la Virus Outbreak Data Network (VODAN) propone crear repositorios de datos FAIR que podrían ser utilizados por algoritmos entrantes (máquinas virtuales) para plantear preguntas de investigación específicas.
Además, surgen muchos dilemas en torno a la interpretación de los datos, lo que puede ilustrarse mediante las estadísticas epidemiológicas ampliamente difundidas. Por lo general, las estadísticas se refieren a “casos confirmados”, “fallecimientos” y “recuperaciones”. Cada uno de estos puntos parece tratarse de manera distinta en diferentes países y algunas veces están sujetos a cambios metodológicos dentro del mismo país.
Por consiguiente, es preciso establecer normas específicas para los datos sobre COVID-19 y esta es una de las prioridades de la UK COVID-19 Strategy (Estrategia del Reino Unido frente al COVID-19). Se ha conformado un grupo de trabajo en el seno de la Alianza de Datos de Investigación para proponer dichas normas a escala internacional.
En algunos casos podría deducirse que la transparencia de las estadísticas quizás haya llevado a los gobiernos a restringir la aplicación de pruebas para limitar el número de “casos confirmados” y evitar el rápido aumento de las cifras. Una tasa menor de pruebas realizadas puede, a su vez, reducir la eficiencia de las medidas de cuarentena y disminuir la eficiencia general de la lucha contra la enfermedad.
En relación con el acceso abierto a publicaciones, también prevalecen algunos desafíos:
Los compromisos positivos actuales de los editores expirarán en tres meses y la sostenibilidad a largo plazo es incierta. Asimismo, esto involucra a un pequeño núcleo de conocimientos directamente vinculados al COVID-19 y no consigue abrirse a la base de conocimientos interdisciplinarios más amplia3 que se requiere para comprender a fondo el virus. Un estudio reciente muestra que menos de un tercio de las publicaciones interdisciplinarias con referencias al COVID-19 son de acceso abierto.
Es incierto de qué manera la crisis afectará el debate general sobre los avances hacia la publicación de acceso abierto, incluidas iniciativas como Plan S, un proyecto internacional que requiere que todas las publicaciones científicas provenientes de investigaciones financiadas con subsidios públicos estén disponibles en acceso abierto.4
Se han alentado las pre-publicaciones5 como un medio para la rápida difusión del conocimiento durante la crisis y esto ha demostrado ser muy positivo. Si bien la circulación de pre-publicaciones permite una mayor velocidad de difusión, presenta riesgos de control de calidad. Por ejemplo, en un documento publicado en el servidor BioRxiv el 2 de febrero, erróneamente se afirmó que la secuencia viral del COVID-19 podría haber sido creada por el hombre. Afortunadamente, el error fue detectado rápidamente por otros científicos y el documento se retiró en unas horas.
También persisten desafíos con las plataformas que están surgiendo para facilitar la colaboración en la investigación:
Es necesario mejorar la comunicación y coordinación entre las múltiples iniciativas. En algunos casos, realizar una estructuración dentro de una red de sistemas radiales podría ayudar a aumentar la usabilidad.
La falta de coordinación se complica con los aspectos de interoperabilidad. Diferentes plataformas tienen diferentes arquitecturas y es esencial resolver esto durante la etapa inicial de la respuesta.
Algunas veces no queda claro a quién se dirigen las distintas plataformas. Puede tratarse de investigadores, personal médico, formuladores de política y/o el público en general. Es importante aclarar y atender las necesidades de las tres audiencias.
Por último, la sostenibilidad de las plataformas para la colaboración en investigación no es un hecho. Se cuenta con financiación en el corto plazo como una medida en respuesta a la crisis, pero esta no podrá garantizarse en el largo plazo a medida que surjan otras prioridades.
El camino a seguir: políticas de ciencia abierta resilientes
Dados los logros y los desafíos de la ciencia abierta en la crisis actual, puede aprenderse de la experiencia previa en países de la OCDE para ayudar a diseñar iniciativas de ciencia abierta dirigidas a combatir la crisis por el COVID-19. Al aplicar el marco general de recomendaciones mencionadas en publicaciones previas de la OCDE sobre el acceso a información de las áreas de ciencia, tecnología e innovación financiadas con fondos públicos, las acciones siguientes pueden ayudar a fortalecer la ciencia abierta en apoyo a las respuestas a la crisis por COVID-19:
1. Desarrollar modelos de gestión de datos que admitan datos de investigación abierta de manera predeterminada, y a la vez protejan la privacidad individual. Eso implica establecer fuertes mecanismos de consentimiento controlados por consejos de supervisión ética. Se requieren marcos éticos para proteger a todas las partes (por ejemplo, pacientes, trabajadores de la salud, instituciones) de repercusiones inmediatas y a largo plazo.
2. Proporcionar marcos regulatorios que permitirían la interoperabilidad dentro de las redes de grandes proveedores de registros sanitarios electrónicos, intercambios mediados por los pacientes e intercambios directos entre pares.6 Es necesario que los estándares de datos garanticen que estos sean fáciles de encontrar, accesibles, interoperables y reutilizables, incluidas las normas generales de datos, así como normas específicas para la pandemia. En abril de 2020, la Alianza de Datos de Investigación conformó un grupo de trabajo COVID-19 preparado para brindar recomendaciones a este respecto.
3. Trabajar conjuntamente con actores públicos, actores privados y la sociedad civil para desarrollar y/o aclarar un marco de gobernanza para la reutilización confiable de datos de investigación de propiedad privada en beneficio del interés público. Este marco podría incluir principios de gobernanza, políticas de datos abiertos, acuerdos de reutilización de datos privados, requisitos y salvaguardas de transparencia y mecanismos de rendición de cuentas, incluidos consejos éticos, que definan con claridad las obligaciones de proteger los datos a los que se accede en contextos de emergencia.
4. Aclarar los incentivos y las recompensas para investigadores y requerir la inmediata divulgación de datos, software y protocolos de publicación. Las políticas institucionales y nacionales deberán abordar las cuestiones de reconocimiento y los obstáculos culturales y estructurales entre aquellos que aportan información, aspirando a una cultura en la que compartir sea la norma.
5. Asegurar una infraestructura adecuada (incluyendo repositorios de datos y software, infraestructura informática y plataformas de colaboración digitales) para prever el surgimiento de situaciones de emergencia recurrentes. Esto incluye una red mundial de repositorios certificados confiables e interrelacionados con normas compatibles para garantizar la preservación a largo plazo de los datos FAIR COVID-19, así como la preparación para cualquier emergencia futura.
6. Asegurarse de que se cuente con el capital humano y las capacidades institucionales adecuadas para gestionar, crear, curar y reutilizar datos de investigación, tanto en instituciones individuales como en instituciones que actúan como agregadores de datos, cuya función es la curación en tiempo real de datos de diferentes fuentes.
7. Facilitar el acceso restringido a datos de investigación confidenciales a nivel internacional mediante entornos informáticos seguros. Esto tiene que ver sobre todo con datos clínicos que no pueden salir del repositorio original, pero a los que se accedería mediante algoritmos móviles7 que podrían utilizar los datos para responder preguntas de investigación específicas.
Lecturas adicionales
OECD (2020), Enhanced Access to Publicly Funded Data for Science, Technology and Innovation, OECD Publishing, París, https://doi.org/10.1787/947717bc-en.
OECD (2020), “Open science initiatives related to the COVID-19 pandemic”, sitio web, OECD, París, https://community.oecd.org/docs/DOC-172520.
OECD (2020), “Ensuring data privacy as we battle COVID-19”, OECD, París, https://www.oecd.org/coronavirus/policy-responses/ensuring-data-privacy-as-we-battle-covid-19/.
OECD (2017), “Business models for sustainable research data repositories”, OECD Science, Technology and Industry Policy Papers, vol. 47, OECD Publishing, París, https://doi.org/10.1787/302b12bb-en.
OECD (2016), “Research ethics and new forms of data for social and economic research”, OECD Science, Technology and Industry Papers, vol. 34, OECD Publishing, París, http://dx.doi.org/doi.org/10.1787/23074957.
OECD (2015), “Making open science a reality”, OECD Science, Technology and Industry Policy Papers, Vol. 25, OECD Publishing, París, http://dx.doi.org/10.1787/5jrs2f963zs1-en.
OECD (2006), Recommendation of the Council concerning Access to Research Data from Public Funding, OECD, París, https://legalinstruments.oecd.org/en/instruments/OECD-LEGAL-0347.
Contactos
Notas
← 1. Alemania, Australia, Brasil, Canadá, Estados Unidos de América, India, Italia, Japón, Nueva Zelanda, Corea, el Reino Unido y Singapur.
← 2. The British Medical Journal, The Lancet, Nature, Elsevier, Springer, Cambridge University Press, Wiley y otros.
← 3. Los campos pertinentes son 138, entre ellos virología, bioquímica y biología molecular, inmunología, investigación biomédica general, microbiología, medicina, farmacología, biología celular, genética, naturología, sistema respiratorio y salud pública.
← 4. Algunos signatarios de la declaración Wellcome Trust antes citada se oponen al Plan S.
← 5. Las pre-publicaciones son versiones preliminares de publicaciones presentadas a las revistas científicas y que esperan a ser sometidas a revisión de expertos.
← 6. Por ejemplo, las nuevas reglas de la Oficina del Coordinador Nacional de Tecnología de la Información de Salud y de los Centros de Servicios de Medicare y Medicaid ahora requieren que los proveedores adopten la interfaz de programación de aplicaciones para permitir a los pacientes acceder con facilidad a su información médica sin costo alguno.
← 7. Un algoritmo móvil es uno que se envía por Internet para acceder a un conjunto de datos remoto. La idea es que los datos no se muevan de manera virtual o de ninguna otra forma. Solo se accede a él por un algoritmo que se envía para analizarlo.