Mineração de textos aplicada a postagens do Twitter sobre Coronavírus: uma análise na linha do tempo

Autores

  • Alexandre Ribeiro Afonso Research Expert Group for Intelligent Information in Multimodal Environment using Natural language Technologies and Ontologies https://orcid.org/0000-0002-7199-7202
  • Cláudio Gottschalg Duque Programa de Pós-Graduação em Ciência da Informação, Faculdade de Ciência da Informação, Universidade de Brasília, Brasília, DF, Brasil https://orcid.org/0000-0003-3558-466X

DOI:

https://doi.org/10.18617/liinc.v16i2.5325

Palavras-chave:

Mineração de Textos, Corpus, Twitter, Coronavírus, Brasil

Resumo

Este artigo descreve uma pesquisa sobre a mineração de postagens coletadas do Twitter, contendo duas palavras-chave: “Coronavírus” e “Brasil”. O enfoque é a listagem das frequências dos substantivos (nouns), e a verificação de tais frequências como indicadores dos interesses de discussão, em quatro períodos de tempo: de fevereiro a junho de 2020. O método de pesquisa é quantitativo e envolve a coleta, filtragem, mineração dos textos e análise de resultados. Para a mineração de textos utiliza-se o algoritmo de clustering K-Means e, posteriormente, o software para análise de corpus AntConc. Conclui-se que o método aplicado sinaliza sobre os principais pontos de discussão e suas mudanças ao longo do tempo. Tais sinalizações poderiam contribuir para a criação de categorias de postagens mais detalhadas em uma posterior Análise de Conteúdo

Biografia do autor

Alexandre Ribeiro Afonso, Research Expert Group for Intelligent Information in Multimodal Environment using Natural language Technologies and Ontologies

Doutor em Ciência da Informação pela Universidade de Brasília (UnB) - Brasília, DF - Brasil.

Membro do grupo de pesquisa Research Expert Group for Intelligent Information in Multimodal

Environment using Natural language Technologies and Ontologies (R.E.G.I.I.M.E.N.T.O.).

http://lattes.cnpq.br/7017201402673628

Cláudio Gottschalg Duque, Programa de Pós-Graduação em Ciência da Informação, Faculdade de Ciência da Informação, Universidade de Brasília, Brasília, DF, Brasil

Doutor em Ciência da Informação pela Universidade Federal de Minas Gerais (UFMG) - Belo Horizonte, MG - Brasil.

Líder do grupo de pesquisa Research Expert Group for Intelligent Information in Multimodal Environment using Natural language Technologies and Ontologies (R.E.G.I.I.M.E.N.T.O.).

Professor Adjunto da Faculdade de Ciência da Informação da Universidade de Brasília (FCI-UnB) e do Programa de Pós-Graduação em Ciência da Informação (PPGCINF-UnB), Brasília-DF, Brasil.

http://lattes.cnpq.br/8531105272766089

Referências

AFONSO, A. R. A referenciação em textos do YouTube: um estudo com vistas à análise de sentimentos. Liinc em Revista, v. 13, n. 2, 2017. DOI: https://doi.org/10.18617/liinc.v13i2.3933

AFONSO, A. R.; DUQUE, C. G. Análise de sentimentos em comentários de vídeos do YouTube utilizando aprendizagem de máquinas supervisionada. Ciência da Informação, v. 48, n. 3, 2019.

AFONSO, A. R.; DUQUE, C. G. Automated text clustering of newspaper and scientific texts in brazilian portuguese: analysis and comparison of methods. JISTEM, São Paulo, v.11, n.2, p. 415-436, ago. 2014. DOI: https://doi.org/10.4301/S1807-17752014000200011

AFONSO, A. R.; TÉ, J. Um estudo sobre referenciação e a construção da opinião a partir de um corpus textual extraído do YouTube. Domínios de Lingu@gem, v. 11, n. 2, p. 339-350, 27 mar. 2017. DOI: https://doi.org/10.14393/DL29-v11n2a2017-4

ANTUNES, M. N. et al. Monitoramento de informação em mídias sociais: o e-Monitor Dengue. TransInformação, Campinas, v. 26, n. 1, p. 9-18, 2014. DOI: https://doi.org/10.1590/S0103-37862014000100002

ARANHA, C.; PASSOS, E. A tecnologia de mineração de textos. Revista Eletrônica de Sistemas de Informação, v. 5, n. 2, 2006. DOI: https://doi.org/10.21529/RESI.2006.0502001

BORBA, V. R.; MARINHO, A. C. M.; CAREGNATO, S. Análise do termo “Repositório Institucional” no twitter: um estudo altmétrico. Em Questão, v. 23, n. 5, p. 290-308, 2017. DOI: https://doi.org/10.19132/1808-5245230.290-308

BOWKER, L. Corpus linguistics is not just for linguists: considering the potential of computer-based corpus methods for library and information science research. Library Hi Tech, v.36, n.2, 2018. DOI: https://doi.org/10.1108/LHT-12-2017-0271

COSTA, S. M. S.; GOTTSCHALG-DUQUE, C. Towards an ontology of ElPub/SciX: a proposal. In: INTERNATIONAL CONFERENCE ON ELECTRONIC PUBLISHING, 11., 2007, Viena. Proceedings… Viena: ÖKK-Editions, 2007. V. 1. P. 249-256.

DUQUE, C. G.; LOBIN, H. Ontology extraction for index generation. In: ICCC - INTERNATIONAL CONFERENCE ON ELECTRONIC PUBLISHING, 8., 2004, Brasília. Proceedings... Brasília: ELPUB, 2004. p. 111-120.

KADER, C. C. C.; RICHTER, M. G. Linguística de corpus: possibilidades e avanços. Instrumento, v. 15, n. 1, p. 13-23, jan./jun. 2013.

KLINCZAK, M. N. M.; KAESTNER, C. A. Identificação de temas em redes sociais por meio de técnicas de agrupamento. Anais do Computer on the Beach, p. 090-099, 2017.

KOCH, I. V. Como se constroem e se reconstroem os objetos-de-discurso. Investigações, Recife, v. 21, n. 2, p. 99-114, 2008.

ROGERS, R. O fim do virtual: os métodos digitais. Lumina, v. 10, n. 3, 2016. DOI: https://doi.org/10.34019/1981-4070.2016.v10.21353

SOUZA, B. A. Uma abordagem para seleção de tópicos relevantes em redes sociais online. 2017. Dissertação de Mestrado (Programa de Pós-Graduação em Informática do Instituto de Computação) - Universidade Federal do Amazonas, Manaus, 2017.

Downloads

Publicado

11/12/2020

Como citar

RIBEIRO AFONSO, A.; GOTTSCHALG DUQUE, C. Mineração de textos aplicada a postagens do Twitter sobre Coronavírus: uma análise na linha do tempo. Liinc em Revista, [S. l.], v. 16, n. 2, p. e5325, 2020. DOI: 10.18617/liinc.v16i2.5325. Disponível em: https://revista.ibict.br/liinc/article/view/5325. Acesso em: 28 mar. 2024.

Edição

Seção

Perspectivas e desafios informacionais em tempos da pandemia da Covid-19