Mineração de textos aplicada a postagens do Twitter sobre Coronavírus: uma análise na linha do tempo
DOI:
https://doi.org/10.18617/liinc.v16i2.5325Palavras-chave:
Mineração de Textos, Corpus, Twitter, Coronavírus, BrasilResumo
Este artigo descreve uma pesquisa sobre a mineração de postagens coletadas do Twitter, contendo duas palavras-chave: “Coronavírus” e “Brasil”. O enfoque é a listagem das frequências dos substantivos (nouns), e a verificação de tais frequências como indicadores dos interesses de discussão, em quatro períodos de tempo: de fevereiro a junho de 2020. O método de pesquisa é quantitativo e envolve a coleta, filtragem, mineração dos textos e análise de resultados. Para a mineração de textos utiliza-se o algoritmo de clustering K-Means e, posteriormente, o software para análise de corpus AntConc. Conclui-se que o método aplicado sinaliza sobre os principais pontos de discussão e suas mudanças ao longo do tempo. Tais sinalizações poderiam contribuir para a criação de categorias de postagens mais detalhadas em uma posterior Análise de Conteúdo
Referências
AFONSO, A. R. A referenciação em textos do YouTube: um estudo com vistas à análise de sentimentos. Liinc em Revista, v. 13, n. 2, 2017.
AFONSO, A. R.; DUQUE, C. G. Análise de sentimentos em comentários de vídeos do YouTube utilizando aprendizagem de máquinas supervisionada. Ciência da Informação, v. 48, n. 3, 2019.
AFONSO, A. R.; DUQUE, C. G. Automated text clustering of newspaper and scientific texts in brazilian portuguese: analysis and comparison of methods. JISTEM, São Paulo, v.11, n.2, p. 415-436, ago. 2014.
AFONSO, A. R.; TÉ, J. Um estudo sobre referenciação e a construção da opinião a partir de um corpus textual extraído do YouTube. Domínios de Lingu@gem, v. 11, n. 2, p. 339-350, 27 mar. 2017.
ANTUNES, M. N. et al. Monitoramento de informação em mídias sociais: o e-Monitor Dengue. TransInformação, Campinas, v. 26, n. 1, p. 9-18, 2014.
ARANHA, C.; PASSOS, E. A tecnologia de mineração de textos. Revista Eletrônica de Sistemas de Informação, v. 5, n. 2, 2006.
BORBA, V. R.; MARINHO, A. C. M.; CAREGNATO, S. Análise do termo “Repositório Institucional” no twitter: um estudo altmétrico. Em Questão, v. 23, n. 5, p. 290-308, 2017.
BOWKER, L. Corpus linguistics is not just for linguists: considering the potential of computer-based corpus methods for library and information science research. Library Hi Tech, v.36, n.2, 2018.
COSTA, S. M. S.; GOTTSCHALG-DUQUE, C. Towards an ontology of ElPub/SciX: a proposal. In: INTERNATIONAL CONFERENCE ON ELECTRONIC PUBLISHING, 11., 2007, Viena. Proceedings… Viena: ÖKK-Editions, 2007. V. 1. P. 249-256.
DUQUE, C. G.; LOBIN, H. Ontology extraction for index generation. In: ICCC - INTERNATIONAL CONFERENCE ON ELECTRONIC PUBLISHING, 8., 2004, Brasília. Proceedings... Brasília: ELPUB, 2004. p. 111-120.
KADER, C. C. C.; RICHTER, M. G. Linguística de corpus: possibilidades e avanços. Instrumento, v. 15, n. 1, p. 13-23, jan./jun. 2013.
KLINCZAK, M. N. M.; KAESTNER, C. A. Identificação de temas em redes sociais por meio de técnicas de agrupamento. Anais do Computer on the Beach, p. 090-099, 2017.
KOCH, I. V. Como se constroem e se reconstroem os objetos-de-discurso. Investigações, Recife, v. 21, n. 2, p. 99-114, 2008.
ROGERS, R. O fim do virtual: os métodos digitais. Lumina, v. 10, n. 3, 2016.
SOUZA, B. A. Uma abordagem para seleção de tópicos relevantes em redes sociais online. 2017. Dissertação de Mestrado (Programa de Pós-Graduação em Informática do Instituto de Computação) - Universidade Federal do Amazonas, Manaus, 2017.
Downloads
Publicado
Edição
Seção
Licença
Copyright (c) 2020 Alexandre Ribeiro Afonso, Cláudio Gottschalg Duque

Este trabalho está licenciado sob uma licença Creative Commons Attribution 4.0 International License.
Autores que publicam na Liinc em Revista concordam com os seguintes termos:
Autores mantém os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons Atribuição 4.0 Internacional, que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista.
Consulte a Política de Acesso Livre e Autoarquivamento para informações permissão de depósitos de versões pré-print de manuscritos e artigos submetidos ou publicados à/pela Liinc em Revista.
Liinc em Revista, publicada pelo Instituto Brasileiro de Informação em Ciência e Tecnologia, é licenciada sob os termos da Licença Creative Commons Atribuição 4.0 Internacional – CC BY 4.0