Dicionário Semântico de Dados: abordagem de anotação de dados aplicada à geração de indicadores de desempenho

Autores

  • Evaldo de Oliveira da Silva UFMG - Universidade Federal de Minas Gerais
  • Marcello Peixoto Bax

Palavras-chave:

Modelos Dimensionais, Indicadores de Desempenho, KPI, Dicionário de Dados, Ontologia, Anotação Semântica, FAIR

Resumo

Key Performance Indicators (KPIs) são usados por organizações para avaliar o desempenho de suas atividades, apoiando a decisão. Com esses indicadores, elas reveem seus processos, buscando a sua melhoria contínua. Em modelagem de dados, os modelos dimensionais estruturam os dados agrupando-os em “fatos” e “dimensões”. Os fatos são representados por campos numéricos que permitem gerar KPIs. É importante, contudo, seguir técnicas e boas práticas de anotação de dados com metadados que minimizem interpretações divergentes. O modo de anotar dados é ilustrado com a técnica “Dicionário Semântico de Dados” (SDD), que os associa a conceitos e tem potencial para apoiar a geração de KPIs, enriquecendo-os e formalizando-os com ontologias. Seguindo essa técnica, é apresentado um breve experimento que anota um modelo de dados para cálculos de KPIs usando SDDs. Como resultado, o potencial dos SDDs no contexto da geração de KPIs em organizações é examinado. Conclui-se que, além da integração semântica dos dados, outra contribuição é a estruturação formal (em lógica) dos indicadores em grafos de conhecimento fundamentados por ontologias. Finalmente, o experimento contribui para a curadoria dos dados, já que o SDD segue as boas práticas e os princípios FAIR

Biografia do autor

Marcello Peixoto Bax

Pós-Doutorado pela Rensselaer Polytechnic Institute (RPI) - Estados Unidos. Doutor em Informática, Anal. Sistemas e Tratamento de Sinal pela Université Montpellier 2 - Sciences et Techniques (UM2) - França. Professor da Universidade Federal de Minas Gerais (UFMG) - Belo Horizonte, MG - Brasil.

Referências

AGRESTI, Alan. Categorical data analysis. John Wiley & Sons, 2003.
BIZER, Christian; HEATH, Tom; BERNERS-LEE, Tim. Linked data: The story so far. In: Semantic services, interoperability and web applications: emerging concepts. IGI Global, 2011. p. 205-227.
BUNEMAN, Peter; KHANNA, Sanjeev; WANG-CHIEW, Tan. Why and where: A characterization of data provenance. In: International conference on database theory. Springer, Berlin, Heidelberg, 2001. p. 316-330.
DBPEDIA. About: Triplestore. Disponível em: http://dbpedia.org/page/Triplestore. Acesso em: 16 de set de 2020.
DIAMANTINI, C., POTENA, D. and STORTI, E. SemPI: A Semantic Framework for the Collaborative Construction and Maintenance of a Shared Dictionary of Performance Indicators. Future Generation Computer Systems (FGCS), vol. 54, pages 352-365, Elsevier, 2016.
ERLING, Orri; MIKHAILOV, Ivan. RDF Support in the Virtuoso DBMS. In: Networked Knowledge-Networked Media. Springer, Berlin, Heidelberg, 2009. p. 7-24.
FEW, Stephen. Information dashboard design: The effective visual communication of data. O'Reilly Media, Inc., 2006.
GOV. ELETRONICO. e-PING Padrões de Interoperabilidade de Governo Eletrônico. Comitê Executivo de Governo Eletrônico, Nov, 2018.
HOGAN, Aidan, BLOMQVIST , Eva, COCHEZ , Michael, D'AMATO, Claudia, MELO Gerard de, GUTIERREZ, Claudio, GAYO, José Emilio Labra, KIRRANE, Sabrina, NEUMAIER, Sebastian, POLLERES, Axel, NAVIGLI, Roberto, NGOMO, Axel-Cyrille Ngonga, RASHID, Sabbir M., RULA, Anisa, SCHMELZEISEN, Lukas, SEQUEDA, Juan, STAAB, Steffen, ZIMMERMANN, Antoine. Knowledge Graphs. arXiv preprint arXiv:2003.02320, 2020.
KIMBALL, Ralph; ROSS, Margy. The data warehouse toolkit: The definitive guide to dimensional modeling. John Wiley & Sons, 2013.
KOLAR, Jana; HARRISON, Andrew e GLIKSOHN, Florian. Key performance indicators of Research Infrastructures. Disponível em: https://www.ceric-eric.eu/2018/08/30/key-performance-indicators-of-research-infrastructures/. 30 de Ago de 2018.
KOURTESIS, Dimitrios; ALVAREZ- RODRÍGUEZ, Jose María; PARASKAKIS, Iraklis. Semantic-based QoS management in cloud systems: Current status and future challenges. Future Generation Computer Systems, v. 32, p. 307-323, 2014.
KRITIKOS, Kyriakos; PLEXOUSAKIS, Dimitris; WOITSCH, Robert. Towards Semantic KPI Measurement. In: CLOSER. 2017. p. 63-74.
KRÖTZSCH M, SIMANCIK F, HORROCKS I. A description logic primer. arXiv preprint arXiv:1201.4089. 2012 Jan 19.
MEDEIROS, Claudia B. Gestão de Dados Científicos – da coleta à preservação. Disponível em https://blog.scielo.org/blog /2018/06/22/gestao-de-dados-cientificos-da-coleta-a-preservacao/#.XXZ82ChKjIV. Acesso em 04 de Set de 2019.
POWERBI. Microsoft PowerBI. Disponível em: https://powerbi.microsoft.com/pt-br/. Acesso em 24 de Abr de 2020.
PAN, Jeff Z. et al. (Ed.). Exploiting linked data and knowledge graphs in large organisations. Heidelberg: Springer, 2017.
PARMENTER, David. Key performance indicators: developing, implementing, and using winning KPIs. John Wiley & Sons, 2015.
PROTEGÉ. WebProtegé. Disponível em : https://protege.stanford.edu/about.php. Acesso em 23 de Abr de 2020.
RASHID, Sabbir M. et al. The Semantic Data Dictionary Approach to Data Annotation & Integration. In: SemSci@ ISWC. 2017. p. 47-54.
RASHID, S. M., MCCUSKER, J. P., PINHEIRO, P., BAX, M. P., SANTOS, H., STINGONE, J. A., ... & MCGUINNESS, D. L. (2020). The Semantic Data Dictionary–An Approach for Describing and Annotating Data. Data Intelligence, 443-486.
SEMANTIC DATA DICTIONARY. SDD Specification. Disponível em: https://github.com/tetherless-world/SemanticDataDictionary. Acesso em 22 de set de 2019.
SILVA, Vivian S.; HANDSCHUH, Siegfried; FREITAS, André. Categorization of semantic roles for dictionary definitions. arXiv preprint arXiv:1806.07711, 2018.
SIO. Semanticscience Integrated Ontology. 2020. Disponível em: https://bioportal. bioontology.org/ontologies/SIO. Acesso em 16 de set de 2020.
W3C. RDF 1.1 Concepts and Abstract Syntax. 2014. Disponível em: https://www.w3.org/TR/ rdf11-concepts/. Acesso em 16 de set de 2020.
WETZSTEIN, Branimir; MA, Zhilei; LEYMANN, Frank. Towards measuring key performance indicators of semantic business processes. In: International Conference on Business Information Systems. Springer, Berlin, Heidelberg, 2008. p. 227-238.
WILKINSON, M. D., DUMONTIER, M., AALBERSBERG, I. J., APPLETON, G., Axton, M., BAAK, A., and BOUWMAN, J. (2016). The FAIR Guiding Principles for scientific data management and stewardship. Scientific data, 3.
WISE, J., de BARRON, A. G., SPLENDIANI, A., BALAI-MOOD, B., VASANT, D., LITTLE, E., and VAN BOCHOVE, K. (2019). Implementation and relevance of FAIR data principles in biopharmaceutical R&D. Drug discovery today, 24(4), 933-938.
WISE, J., MÖLLER, A., CHRISTIE, D., Kalra, D., BRODSKY, E., GEORGIEVA, E., and AREND, M. (2018). The positive impacts of real-world data on the challenges facing the evolution of biopharma. Drug discovery today, 23(4), 788-801.
VAUDANO, E. (2013). The innovative medicines initiative: a public private partnership model to foster drug discovery. Computational and structural biotechnology journal, 6(7), e201303017.

Downloads

Publicado

25/11/2020

Como citar

de Oliveira da Silva, E., & Peixoto Bax, M. . (2020). Dicionário Semântico de Dados: abordagem de anotação de dados aplicada à geração de indicadores de desempenho. Ciência Da Informação, 49(3). Recuperado de http://revista.ibict.br/ciinf/article/view/5502