Dicionário Semântico de Dados: abordagem de anotação de dados aplicada à geração de indicadores de desempenho
DOI:
https://doi.org/10.18225/ci.inf.v49i3.5502Palavras-chave:
Modelos Dimensionais, Indicadores de Desempenho, KPI, Dicionário de Dados, Ontologia, Anotação Semântica, FAIRResumo
Key Performance Indicators (KPIs) são usados por organizações para avaliar o desempenho de suas atividades, apoiando a decisão. Com esses indicadores, elas reveem seus processos, buscando a sua melhoria contínua. Em modelagem de dados, os modelos dimensionais estruturam os dados agrupando-os em “fatos” e “dimensões”. Os fatos são representados por campos numéricos que permitem gerar KPIs. É importante, contudo, seguir técnicas e boas práticas de anotação de dados com metadados que minimizem interpretações divergentes. O modo de anotar dados é ilustrado com a técnica “Dicionário Semântico de Dados” (SDD), que os associa a conceitos e tem potencial para apoiar a geração de KPIs, enriquecendo-os e formalizando-os com ontologias. Seguindo essa técnica, é apresentado um breve experimento que anota um modelo de dados para cálculos de KPIs usando SDDs. Como resultado, o potencial dos SDDs no contexto da geração de KPIs em organizações é examinado. Conclui-se que, além da integração semântica dos dados, outra contribuição é a estruturação formal (em lógica) dos indicadores em grafos de conhecimento fundamentados por ontologias. Finalmente, o experimento contribui para a curadoria dos dados, já que o SDD segue as boas práticas e os princípios FAIR
Downloads
Referências
BIZER, Christian; HEATH, Tom; BERNERS-LEE, Tim. Linked data: The story so far. In: Semantic services, interoperability and web applications: emerging concepts. IGI Global, 2011. p. 205-227.
BUNEMAN, Peter; KHANNA, Sanjeev; WANG-CHIEW, Tan. Why and where: A characterization of data provenance. In: International conference on database theory. Springer, Berlin, Heidelberg, 2001. p. 316-330.
DBPEDIA. About: Triplestore. Disponível em: http://dbpedia.org/page/Triplestore. Acesso em: 16 de set de 2020.
DIAMANTINI, C., POTENA, D. and STORTI, E. SemPI: A Semantic Framework for the Collaborative Construction and Maintenance of a Shared Dictionary of Performance Indicators. Future Generation Computer Systems (FGCS), vol. 54, pages 352-365, Elsevier, 2016.
ERLING, Orri; MIKHAILOV, Ivan. RDF Support in the Virtuoso DBMS. In: Networked Knowledge-Networked Media. Springer, Berlin, Heidelberg, 2009. p. 7-24.
FEW, Stephen. Information dashboard design: The effective visual communication of data. O'Reilly Media, Inc., 2006.
GOV. ELETRONICO. e-PING Padrões de Interoperabilidade de Governo Eletrônico. Comitê Executivo de Governo Eletrônico, Nov, 2018.
HOGAN, Aidan, BLOMQVIST , Eva, COCHEZ , Michael, D'AMATO, Claudia, MELO Gerard de, GUTIERREZ, Claudio, GAYO, José Emilio Labra, KIRRANE, Sabrina, NEUMAIER, Sebastian, POLLERES, Axel, NAVIGLI, Roberto, NGOMO, Axel-Cyrille Ngonga, RASHID, Sabbir M., RULA, Anisa, SCHMELZEISEN, Lukas, SEQUEDA, Juan, STAAB, Steffen, ZIMMERMANN, Antoine. Knowledge Graphs. arXiv preprint arXiv:2003.02320, 2020.
KIMBALL, Ralph; ROSS, Margy. The data warehouse toolkit: The definitive guide to dimensional modeling. John Wiley & Sons, 2013.
KOLAR, Jana; HARRISON, Andrew e GLIKSOHN, Florian. Key performance indicators of Research Infrastructures. Disponível em: https://www.ceric-eric.eu/2018/08/30/key-performance-indicators-of-research-infrastructures/. 30 de Ago de 2018.
KOURTESIS, Dimitrios; ALVAREZ- RODRÍGUEZ, Jose María; PARASKAKIS, Iraklis. Semantic-based QoS management in cloud systems: Current status and future challenges. Future Generation Computer Systems, v. 32, p. 307-323, 2014.
KRITIKOS, Kyriakos; PLEXOUSAKIS, Dimitris; WOITSCH, Robert. Towards Semantic KPI Measurement. In: CLOSER. 2017. p. 63-74.
KRÖTZSCH M, SIMANCIK F, HORROCKS I. A description logic primer. arXiv preprint arXiv:1201.4089. 2012 Jan 19.
MEDEIROS, Claudia B. Gestão de Dados Científicos – da coleta à preservação. Disponível em https://blog.scielo.org/blog /2018/06/22/gestao-de-dados-cientificos-da-coleta-a-preservacao/#.XXZ82ChKjIV. Acesso em 04 de Set de 2019.
POWERBI. Microsoft PowerBI. Disponível em: https://powerbi.microsoft.com/pt-br/. Acesso em 24 de Abr de 2020.
PAN, Jeff Z. et al. (Ed.). Exploiting linked data and knowledge graphs in large organisations. Heidelberg: Springer, 2017.
PARMENTER, David. Key performance indicators: developing, implementing, and using winning KPIs. John Wiley & Sons, 2015.
PROTEGÉ. WebProtegé. Disponível em : https://protege.stanford.edu/about.php. Acesso em 23 de Abr de 2020.
RASHID, Sabbir M. et al. The Semantic Data Dictionary Approach to Data Annotation & Integration. In: SemSci@ ISWC. 2017. p. 47-54.
RASHID, S. M., MCCUSKER, J. P., PINHEIRO, P., BAX, M. P., SANTOS, H., STINGONE, J. A., ... & MCGUINNESS, D. L. (2020). The Semantic Data Dictionary–An Approach for Describing and Annotating Data. Data Intelligence, 443-486.
SEMANTIC DATA DICTIONARY. SDD Specification. Disponível em: https://github.com/tetherless-world/SemanticDataDictionary. Acesso em 22 de set de 2019.
SILVA, Vivian S.; HANDSCHUH, Siegfried; FREITAS, André. Categorization of semantic roles for dictionary definitions. arXiv preprint arXiv:1806.07711, 2018.
SIO. Semanticscience Integrated Ontology. 2020. Disponível em: https://bioportal. bioontology.org/ontologies/SIO. Acesso em 16 de set de 2020.
W3C. RDF 1.1 Concepts and Abstract Syntax. 2014. Disponível em: https://www.w3.org/TR/ rdf11-concepts/. Acesso em 16 de set de 2020.
WETZSTEIN, Branimir; MA, Zhilei; LEYMANN, Frank. Towards measuring key performance indicators of semantic business processes. In: International Conference on Business Information Systems. Springer, Berlin, Heidelberg, 2008. p. 227-238.
WILKINSON, M. D., DUMONTIER, M., AALBERSBERG, I. J., APPLETON, G., Axton, M., BAAK, A., and BOUWMAN, J. (2016). The FAIR Guiding Principles for scientific data management and stewardship. Scientific data, 3.
WISE, J., de BARRON, A. G., SPLENDIANI, A., BALAI-MOOD, B., VASANT, D., LITTLE, E., and VAN BOCHOVE, K. (2019). Implementation and relevance of FAIR data principles in biopharmaceutical R&D. Drug discovery today, 24(4), 933-938.
WISE, J., MÖLLER, A., CHRISTIE, D., Kalra, D., BRODSKY, E., GEORGIEVA, E., and AREND, M. (2018). The positive impacts of real-world data on the challenges facing the evolution of biopharma. Drug discovery today, 23(4), 788-801.
VAUDANO, E. (2013). The innovative medicines initiative: a public private partnership model to foster drug discovery. Computational and structural biotechnology journal, 6(7), e201303017.
Downloads
Publicado
Edição
Seção
Licença
Copyright (c) 2020 Evaldo de Oliveira da Silva

Este trabalho está licenciado sob uma licença Creative Commons Attribution-ShareAlike 4.0 International License.
- A publicação se reserva o direito de efetuar, nos originais, alterações de ordem normativa, ortográfica e gramatical, com vistas a manter o padrão culto da língua, respeitando, porém, o estilo dos autores;
- As provas finais não serão enviadas aos autores;
- Os autores mantém os direitos totais sobre seus trabalhos publicados na revista Ciência da Informação, ficando sua reimpressão total ou parcial, depósito ou republicação sujeita à indicação de primeira publicação na revista, por meio da Licença Pública 4.0 Internacional Atribuição-CompartilharIgual
- Deve ser consignada a fonte de publicação original;
- As opiniões emitidas pelos autores dos artigos são de sua exclusiva responsabilidade;
- Cada autor receberá dois exemplares da revista, caso esteja disponível no formato impresso.