Mineração de textos aplicada a postagens do Twitter sobre Coronavírus: uma análise na linha do tempo
DOI:
https://doi.org/10.18617/liinc.v16i2.5325Palavras-chave:
Mineração de Textos, Corpus, Twitter, Coronavírus, BrasilResumo
Este artigo descreve uma pesquisa sobre a mineração de postagens coletadas do Twitter, contendo duas palavras-chave: “Coronavírus” e “Brasil”. O enfoque é a listagem das frequências dos substantivos (nouns), e a verificação de tais frequências como indicadores dos interesses de discussão, em quatro períodos de tempo: de fevereiro a junho de 2020. O método de pesquisa é quantitativo e envolve a coleta, filtragem, mineração dos textos e análise de resultados. Para a mineração de textos utiliza-se o algoritmo de clustering K-Means e, posteriormente, o software para análise de corpus AntConc. Conclui-se que o método aplicado sinaliza sobre os principais pontos de discussão e suas mudanças ao longo do tempo. Tais sinalizações poderiam contribuir para a criação de categorias de postagens mais detalhadas em uma posterior Análise de Conteúdo
Referências
AFONSO, A. R. A referenciação em textos do YouTube: um estudo com vistas à análise de sentimentos. Liinc em Revista, v. 13, n. 2, 2017.
AFONSO, A. R.; DUQUE, C. G. Análise de sentimentos em comentários de vídeos do YouTube utilizando aprendizagem de máquinas supervisionada. Ciência da Informação, v. 48, n. 3, 2019.
AFONSO, A. R.; DUQUE, C. G. Automated text clustering of newspaper and scientific texts in brazilian portuguese: analysis and comparison of methods. JISTEM, São Paulo, v.11, n.2, p. 415-436, ago. 2014.
AFONSO, A. R.; TÉ, J. Um estudo sobre referenciação e a construção da opinião a partir de um corpus textual extraído do YouTube. Domínios de Lingu@gem, v. 11, n. 2, p. 339-350, 27 mar. 2017.
ANTUNES, M. N. et al. Monitoramento de informação em mídias sociais: o e-Monitor Dengue. TransInformação, Campinas, v. 26, n. 1, p. 9-18, 2014.
ARANHA, C.; PASSOS, E. A tecnologia de mineração de textos. Revista Eletrônica de Sistemas de Informação, v. 5, n. 2, 2006.
BORBA, V. R.; MARINHO, A. C. M.; CAREGNATO, S. Análise do termo “Repositório Institucional” no twitter: um estudo altmétrico. Em Questão, v. 23, n. 5, p. 290-308, 2017.
BOWKER, L. Corpus linguistics is not just for linguists: considering the potential of computer-based corpus methods for library and information science research. Library Hi Tech, v.36, n.2, 2018.
COSTA, S. M. S.; GOTTSCHALG-DUQUE, C. Towards an ontology of ElPub/SciX: a proposal. In: INTERNATIONAL CONFERENCE ON ELECTRONIC PUBLISHING, 11., 2007, Viena. Proceedings… Viena: ÖKK-Editions, 2007. V. 1. P. 249-256.
DUQUE, C. G.; LOBIN, H. Ontology extraction for index generation. In: ICCC - INTERNATIONAL CONFERENCE ON ELECTRONIC PUBLISHING, 8., 2004, Brasília. Proceedings... Brasília: ELPUB, 2004. p. 111-120.
KADER, C. C. C.; RICHTER, M. G. Linguística de corpus: possibilidades e avanços. Instrumento, v. 15, n. 1, p. 13-23, jan./jun. 2013.
KLINCZAK, M. N. M.; KAESTNER, C. A. Identificação de temas em redes sociais por meio de técnicas de agrupamento. Anais do Computer on the Beach, p. 090-099, 2017.
KOCH, I. V. Como se constroem e se reconstroem os objetos-de-discurso. Investigações, Recife, v. 21, n. 2, p. 99-114, 2008.
ROGERS, R. O fim do virtual: os métodos digitais. Lumina, v. 10, n. 3, 2016.
SOUZA, B. A. Uma abordagem para seleção de tópicos relevantes em redes sociais online. 2017. Dissertação de Mestrado (Programa de Pós-Graduação em Informática do Instituto de Computação) - Universidade Federal do Amazonas, Manaus, 2017.
Downloads
Publicado
Edição
Seção
Licença
Autores que publicam na Liinc em Revista concordam com os seguintes termos:
Autores mantém os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons Atribuição 4.0 Internacional, que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista.
Consulte a Política de Acesso Livre e Autoarquivamento para informações permissão de depósitos de versões pré-print de manuscritos e artigos submetidos ou publicados à/pela Liinc em Revista.
Liinc em Revista, publicada pelo Instituto Brasileiro de Informação em Ciência e Tecnologia, é licenciada sob os termos da Licença Creative Commons Atribuição 4.0 Internacional – CC BY 4.0