Repositórios para dados localizáveis, acessíveis, interoperáveis e reutilizáveis (FAIR): adaptando um repositório de dados para se comportar como um FAIR Data Point

João Luiz Rebelo Moreira, Luiz Bonino, Luís Ferreira Pires, Marten van Sinderen, Patricia Henning

Resumo


RESUMO É necessário um esforço significativo para encontrar, entender e reutilizar dados da pesquisa. Para endereçar esse problema, os princípios de dados Localizáveis, Acessíveis, Reutilizáveis e Interoperáveis (FAIR em inglês) foram criados, e descrevem um conjunto mínimo de requisitos para gerenciamento e administração de dados, considerados a base tecnológica para a Nuvem Europeia de Ciência Aberta. O FAIR Data Point (FDP) utiliza dados ligados (LD) para expor dados e metadados aderentes aos princípios de dados FAIR, especificando um conjunto de metadados padronizados que um repositório de dados deve implementar. Os proprietários de dados podem expor conjuntos de dados e os usuários de dados podem reutilizar conjuntos de dados por meio de serviços RESTful, permitindo a interoperabilidade em escala na web. Os repositórios de dados e o software subjacente apenas recentemente começaram a oferecer suporte à LD, e seus metadados estão disponíveis apenas como pares de valores-chave. Uma questão em aberto neste contexto é como permitir que um software de repositório de dados existente seja compatível com a especificação do FDP, ou seja, como adicionar descrições semânticas aos repositórios de dados para garantir a interoperabilidade semântica entre dados de diferentes repositórios. Este artigo descreve uma solução não invasiva e não intrusiva de proxy semântico que permite que um software de repositório de dados, o serviço EUDAT B2share, se comporte como um FDP, permitindo a interoperabilidade semântica por meio de traduções semânticas. A solução inclui uma metodologia para o mapeamento de metadados com base em transformações endógenas de modelos léxicos para modelos semânticos. Mostramos como os metadados nos pares de valores-chave de um repositório de uso geral podem ser compatíveis com a tecnologia LD sem alterar o software do repositório. A validação da solução inclui testes funcionais das camadas de metadados do FDP e uma análise de desempenho do impacto do proxy semântico na troca de dados. Os resultados mostram que o B2share pode ser compatível com as especificações do FDP, tendo impacto reduzido no desempenho da troca de dados. Portanto, a validação mostra que a solução é viável e adequada para transformar um software de repositório de dados de uso geral em um FDP.

Palavras-chave: Dados FAIR; Reusabilidade de Dados; Software de Repositório de Dados; FAIR Data Point.

Texto completo:

PDF (English)


DOI: https://doi.org/10.18617/liinc.v15i2.4817

Apontamentos

  • Não há apontamentos.


Direitos autorais 2019 Liinc em Revista

Licença Creative Commons
Esta obra está licenciada sob uma licença Creative Commons Atribuição 4.0 Internacional.

 _______________________________________________________________________

ISSN: 1808-3536
 
Licença Creative Commons
Esta revista está licenciada com uma Licença Creative Commons Atribuição 4.0 Internacional.