Em emergências globais como a pandemia do novo coronavírus (COVID-19), as políticas de ciência aberta podem facilitar o livre fluxo de pesquisas de dados e ideias e, assim, acelerar o ritmo de pesquisas críticas para o combate à doença.
Embora a colaboração e a troca global de dados de pesquisa tenha atingido níveis sem precedentes, os desafios permanecem. A confiança de pelo menos alguns dos dados é relativamente baixa e a falta de padrões específicos, coordenação e interoperabilidade, bem como qualidade e interpretação dos dados ainda são questões pendentes.
Para fortalecer a contribuição da ciência aberta em resposta ao COVID-19, os responsáveis políticos precisam garantir modelos adequados de governança de dados, padrões interoperáveis, acordos sustentáveis de compartilhamento de dados envolvendo os setores público e privado e a sociedade civil, incentivos a pesquisadores, infraestruturas sustentáveis, capacidades
Por que a ciência aberta é fundamental no combate a COVID-19
Mensagens principais
Na atual emergência global, a descoberta científica evoluiu muito mais rapidamente do que antes. O genoma completo da COVID-19 foi publicado apenas um mês após o primeiro paciente ser internado no hospital de Wuhan, como uma publicação de acesso aberto no The Lancet. Isso comparado a uma espera de cinco meses no surto de SARS em 2002-03, onde grande parte do atraso foi devido a um blackout de informações nos primeiros meses da epidemia de SARS.
Lições aprendidas em surtos anteriores ressaltaram a importância do compartilhamento de dados e publicações para combater a doença. Os principais facilitadores dessa troca são:
construção e manutenção da confiança entre as partes compartilhando dados de pesquisa
reciprocidade no compartilhamento de dados de pesquisa
colaboração inter-setorial inclusiva, baseada em papéis e responsabilidades pré-definidos
criação de um sistema de preparação e resposta atenda a todas as doenças infecciosas emergentes com infraestrutura técnica de suporte adequada, bem como direitos de acesso e responsabilidades pré-definidos das partes interessadas
ter parceiros internacionais confiáveis como conselheiros externos e centros de referência
abordar os obstáculos do compartilhamento de dados de pesquisa, com soluções que levem em conta a complexidade e a multiplicidade das principais causas que geram esses obstáculos.
Este resumo fornece uma visão geral das conquistas no compartilhamento de dados, publicações e criação de plataformas colaborativas online e descreve os desafios ainda restantes. Ele conclui fornecendo um roteiro direcionados a políticas melhores e ainda mais resilientes para o futuro.
Conquistas de iniciativas e compromissos de ciência aberta
Em janeiro de 2020, 117 organizações – incluindo revistas, órgãos de financiamento e centros de prevenção de doenças – assinaram uma declaração intitulada "Compartilhamento de dados de pesquisa e descobertas relevantes para o novo surto de coronavírus” (Sharing Research data and findings relevant to the novel coronavírus outbreak), comprometendo-se a dar acesso aberto e imediato a publicações peer-reviewed pelo menos durante o surto, a disponibilizar os resultados de pesquisa via servidores de pré-impressão e compartilhar resultados de maneira imediata com a Organização Mundial da Saúde (OMS). Isso foi seguido pela Iniciativa de Emergência em Saúde Pública COVID-19, lançada em março, por 12 países1, ao nível de conselheiros científicos ou equivalentes, exigindo acesso aberto às publicações e acesso aos dados legíveis por máquina relacionados à COVID-19, o que resultou em um compromisso ainda mais forte por parte dos editores. O Acordo Aberto da COVID foi lançado em abril de 2020 por uma coalizão internacional de cientistas, advogados e empresas de tecnologia convidando autores a disponibilizar toda propriedade intelectual sob seu controle, gratuitamente e sem ônus, para ajudar a acabar com a pandemia da COVID-19 e reduzir o impacto da doença. Alguns signatários notáveis incluem Intel, Facebook, Amazon, IBM, Sandia National Laboratories, Hewlett Packard, Microsoft, Uber, Open Knowledge Foundation, Massachusetts Institute of Technology e AT&T. Os signatários oferecerão uma “licença aberta e não exclusiva da COVID” para utilizar a propriedade intelectual com o propósito de diagnosticar, prevenir e tratar a COVID-19.
Seguindo esses compromissos, várias das principais revistas e editoras2 estão fornecendo acesso aberto e inúmeros servidores de dados estão disponíveis para o compartilhamento de dados epidemiológicos, clínicos e genômicos. Dados, protocolos e padrões utilizados para coletar informações também estão sendo compartilhados. O CORD-19 (Base Aberta de Pesquisas sobre COVID -19), contém 57.000 entradas, incluindo 41.000 artigos completos legíveis por máquina sobre a COVID-19 e outros coronavírus relacionados que servem como base para extração de dados através de técnicas de machine learning, a fim de responder a um conjunto de perguntas abertas sobre a COVID-19.
Também ilustrando o poder da ciência aberta, as plataformas online estão cada vez mais facilitando o trabalho colaborativo de pesquisadores da COVID-19 em todo o mundo. Estes são alguns exemplos:
A Nextstrain e a Gisaid permitem rastrear a propagação da epidemia através de mutações genéticas.
A modelagem da propagação epidêmica é possibilitada por plataformas como a MOBS Lab ou a MIDAS.
Pesquisas sobre tratamentos e vacinas são apoiadas pela Elixir, REACTing, CEPI e outros.
Os esforços de crowdsourcing como o Foldit envolvem desafios, enquanto os hackathons surgiram, como o #EUvsVirus e a COVID-19 study-a-thon virtual.
A Vivli é uma plataforma que oferece uma maneira fácil de solicitar dados anonimizados de estudos clínicos já concluídos.
A Comissão Europeia e vários parceiros criaram um portal de dados COVID-19, em abril de 2020, para permitir o compartilhamento rápido e aberto de dados de pesquisa para avançar nos estudos sobre a doença.
Os recursos de computação estão sendo oferecidos pela Plataforma de Computação de Alta Performance em COVID-19 e a Folding@home, uma plataforma de computação distribuída, está fornecendo mais de 1,5 exaFlops.
Desafios remanescentes
Embora dados clínicos, epidemiológicos e laboratoriais sobre a COVID-19 estejam amplamente disponíveis, incluindo o sequenciamento genômico do patógeno, uma série de desafios ainda permanecem:
Todos os dados não são suficientemente fáceis de se encontrar, acessíveis, interoperáveis e reutilizáveis (FAIR), ou ainda não são dados FAIR.
Fontes de dados tendem a ser dispersas, embora muitas iniciativas de organização e centralização estejam em andamento; a curadoria precisa ser operada "em tempo real".
O acesso ao compartilhamento de registros de saúde pessoal precisa ser facilmente acessível, mediante o consentimento do paciente. A legislação destinada a promover a interoperabilidade e evitar o bloqueio de informações ainda precisa ser aprovada em muitos países da OCDE. O acesso internacional é ainda mais difícil sob os atuais quadros de proteção de dados na maioria dos países da OCDE.
A fim de alcançar os objetivos duplos de respeitar a privacidade e garantir o acesso a dados clínicos interoperáveis, reutilizáveis e legíveis por máquina, a Virus Outbreak Data Network (VODAN) propõe criar repositórios de dados FAIR que podem ser usados por algoritmos (máquinas virtuais) para fazer perguntas específicas de pesquisa.
Adicionalmente muitas questões surgem em torno da interpretação dos dados – isso pode ser ilustrado pelas estatísticas epidemiológicas já seguidas. Normalmente, as estatísticas falam sobre "casos confirmados", "óbitos" e "recuperações"; cada um desses itens parece ser tratado de forma diferente em cada país e, às vezes, são sujeitos a mudanças metodológicas dentro de um mesmo país.
Sendo assim é necessário estabelecer normas específicas para os dados da COVID-19, e esta é uma das prioridades da Estratégia COVID-19 do Reino Unido. Um grupo de trabalho dentro da Research Data Alliance foi criado para propor tais normas a nível internacional.
Em alguns casos, pode-se inferir que a transparência das estatísticas pode ter levado alguns governos a restringir os testes a fim de limitar o número de "casos confirmados" e evitar o rápido aumento dos números. Taxas de teste mais baixas podem, por sua vez, reduzir a eficiência das medidas de quarentena, diminuindo a eficiência global do combate à doença.
Quanto ao acesso aberto às publicações, os desafios também permanecem:
Os atuais compromissos positivos das editoras devem expirar em três meses e a sustentabilidade a longo prazo é incerta. Também dizem respeito a um pequeno núcleo de conhecimento diretamente ligado a COVID-19 que não abriram a ampla base de conhecimento interdisciplinar3 necessária para a real compreensão do vírus. Um estudo recente mostra que menos de um terço das publicações interdisciplinares com referência a COVID-19 são de acesso aberto.
Resta saber como a crise impactará a ampla discussão sobre o avanço rumo à publicação de acesso aberto, incluindo iniciativas como o Plano S, um projeto internacional que exige que todas as publicações científicas resultantes de pesquisas financiadas por recursos públicos estejam disponíveis em acesso aberto.4
As pré-publicacões5 foram incentivadas como um veículo para rápida difusão do conhecimento durante a crise, o que tem se mostrado em grande parte positivo. Embora a circulação de pré-publicações permita um aumento da velocidade de difusão, apresenta riscos no controle de qualidade. Por exemplo, um artigo publicado no servidor BioRxiv em 2 de fevereiro afirmou erroneamente que a sequência do vírus COVID-19 poderia ter sido feita pelo homem. Felizmente, o erro foi logo detectado por outros cientistas e o artigo foi removido em poucas horas.
Os desafios também permanecem com plataformas que estão surgindo para facilitar a colaboração em pesquisa:
A comunicação e a coordenação entre as múltiplas iniciativas precisam ser melhoradas. Em alguns casos, a estruturação em rede em formato hub-and-spoke pode ajudar a melhorar a usabilidade.
A falta de coordenação é agravada por questões de interoperabilidade. Plataformas diferentes possuem arquiteturas diferentes e é essencial lidar com isso durante a fase inicial do processo.
O público-alvo das diferentes plataformas às vezes não é claro. Eles podem incluir pesquisadores, clínicos, decisores e/ou o público em geral. As necessidades dos três públicos-alvo precisam ser esclarecidas e atendidas.
Por fim, a sustentabilidade das plataformas de colaboração em pesquisa não é algo garantido. O financiamento está disponível no curto prazo como uma medida de resposta à crise, mas pode não estar no longo prazo, à medida em que outras prioridades surgirem.
O caminho a seguir: políticas científicas abertas resilientes
Dadas as conquistas e desafios da ciência aberta na crise atual, podemos tirar alguns aprendizados de experiências anteriores nos países da OCDE para auxiliar a construção de iniciativas científicas abertas para enfrentar a crise da COVID-19. Aplicar o quadro geral de recomendações referenciado em artigos anteriores da OCDE sobre o acesso a dados de ciência, tecnologia e inovação financiadas publicamente, as seguintes ações podem ajudar a fortalecer ainda mais a ciência aberta em apoio às respostas à crise da COVID-19:
1. Desenvolver modelos de governança de dados que permitem dados abertos de pesquisa como padrão, preservando a privacidade individual. Isso envolve a criação de sólidos mecanismos de consentimento monitorados por Conselhos de Ética. Códigos éticos são necessários para proteger todas as partes envolvidas (como pacientes, profissionais de saúde, instituições) de consequências imediatas e de longo prazo.
2. Fornecer marcos regulatórios que permitam a interoperabilidade nas redes de grandes provedores de registros eletrônicos de saúde, trocas mediadas por pacientes e trocas diretas entre pares.⁶ Os padrões de dados precisam garantir que os dados sejam fáceis de se encontrar, acessíveis, interoperáveis e reutilizáveis, incluindo padrões gerais de dados, bem como padrões específicos para a pandemia. A Research Data Alliance criou um grupo de trabalho da COVID-19 que deverá fornecer recomendações sobre esse aspecto em abril de 2020.
3. Trabalhar, junto a atores públicos, privados e a sociedade civil para desenvolver e/ou deixar claro uma estrutura de governança para o reaproveitamento confiável de dados de pesquisa de capital privado para o interesse público. Esse quadro deve incluir princípios de governança, políticas de dados abertos, acordos confiáveis de reutilização de dados, requisitos e garantias de transparência e mecanismos de responsabilização, incluindo Conselhos de Ética, que definirão claramente os devidos cuidados para com os dados acessados em contextos de emergência.
4. Esclarecer e destacar incentivos e recompensas para pesquisadores e exigir a divulgação imediata de dados, softwares e protocolos para publicação. As políticas institucionais e nacionais devem abordar questões de reconhecimento e barreiras culturais/estruturais entre os contribuintes de dados, modificando a cultura para uma onde o compartilhar é a norma.
5. Garantir uma infraestrutura adequada (incluindo repositórios de dados e software, infraestrutura computacional e plataformas de colaboração digital) para permitir ocorrências recorrentes de situações de emergência. Isso inclui uma rede global de repositórios certificados e interligados com padrões compatíveis entre si para garantir a preservação a longo prazo dos dados FAIR sobre a COVID-19, assim como a preparação para quaisquer emergências futuras.
6. Garantir que capital humano adequado e capacidades institucionais estejam disponíveis para gerenciar, criar, fazer a curadoria e reutilizar dados de pesquisa – tanto em instituições individuais quanto em instituições que atuam como agregadores de dados, cujo papel é a curadoria em tempo real de dados de diferentes fontes.
7. Permitir o acesso internacional a dados confidencias de pesquisa de maneira mais restrita e em ambientes seguros. Isso diz respeito, principalmente, a dados clínicos que podem não ser autorizados a sair de seus repositórios originais, mas que poderiam ser acessados por algoritmos móveis que poderiam, por sua vez, utilizar os dados para responder a perguntas específicas de pesquisas.
Leitura suplementar
OECD (2020), Enhanced Access to Publicly Funded Data for Science, Technology and Innovation, OECD Publishing, Paris, https://doi.org/10.1787/947717bc-en.
OECD (2020), “Open science initiatives related to the COVID-19 pandemic”, webpage, OECD, Paris, https://community.oecd.org/docs/DOC-172520.
OECD (2020), “Ensuring data privacy as we battle COVID-19”, OECD, Paris, https://www.oecd.org/coronavirus/policy-responses/ensuring-data-privacy-as-we-battle-covid-19/
OECD (2017), “Business models for sustainable research data repositories”, OECD Science, Technology and Industry Policy Papers, Vol. 47, OECD Publishing, Paris, https://doi.org/10.1787/302b12bb-en.
OECD (2016), “Research ethics and new forms of data for social and economic research”, OECD Science, Technology and Industry Papers, Vol. 34, OECD Publishing, Paris, http://dx.doi.org/doi.org/10.1787/23074957.
OECD (2015), “Making open science a reality”, OECD Science, Technology and Industry Policy Papers, Vol. 25, OECD Publishing, Paris, http://dx.doi.org/10.1787/5jrs2f963zs1-en.
OECD (2006), Recommendation of the Council concerning Access to Research Data from Public Funding, OECD, Paris, https://legalinstruments.oecd.org/en/instruments/OECD-LEGAL-0347
Contatos
Observações
← 1. Austrália, Brasil, Canadá, Alemanha, Índia, Itália, Japão, Nova Zelândia, Coréia, Cingapura, Reino Unido e Estados Unidos da América
← 2. The British Medical Journal, The Lancet, Nature, Elsevier, Springer, Cambridge University Press, Wiley e outros.
← 3. Os campos relevantes totalizam 138, incluindo virologia, bioquímica e biologia molecular, imunologia, pesquisa biomédica geral, microbiologia, medicina, farmacologia, biologia celular, genética, naturologia, sistema respiratório e saúde pública.
← 4. Alguns signatários da declaração da Welcome Trust citadas acima são opositores ao Plano S.
← 5. Pré-publicações são rascunhos de publicações submetidas à revistas científicas, aguardando revisão.