Text mining applied to Twitter posts on Coronavirus: an analysis in the timeline
DOI:
https://doi.org/10.18617/liinc.v16i2.5325Keywords:
Text Mining, Corpus, Twitter, Coronavírus, BrasilAbstract
This article describes a research about the mining of posts collected from Twitter, containing two keywords: “Coronavírus” and “Brasil”. The focus is on listing the frequencies of nouns, and verifying those frequencies as indicators about the interests of discussion, in four time periods: from February to June 2020. The research method is quantitative and involves the collection, filtering, text mining and analysis of results. In text mining, the K-Means clustering algorithm is used and, subsequently, AntConc corpus analysis software. It is concluded that the applied method signals about the main points of discussion and their changes over time. Such signs could contribute to the creation of more detailed categories of posts in a later Content Analysis
References
AFONSO, A. R. A referenciação em textos do YouTube: um estudo com vistas à análise de sentimentos. Liinc em Revista, v. 13, n. 2, 2017.
AFONSO, A. R.; DUQUE, C. G. Análise de sentimentos em comentários de vídeos do YouTube utilizando aprendizagem de máquinas supervisionada. Ciência da Informação, v. 48, n. 3, 2019.
AFONSO, A. R.; DUQUE, C. G. Automated text clustering of newspaper and scientific texts in brazilian portuguese: analysis and comparison of methods. JISTEM, São Paulo, v.11, n.2, p. 415-436, ago. 2014.
AFONSO, A. R.; TÉ, J. Um estudo sobre referenciação e a construção da opinião a partir de um corpus textual extraído do YouTube. Domínios de Lingu@gem, v. 11, n. 2, p. 339-350, 27 mar. 2017.
ANTUNES, M. N. et al. Monitoramento de informação em mídias sociais: o e-Monitor Dengue. TransInformação, Campinas, v. 26, n. 1, p. 9-18, 2014.
ARANHA, C.; PASSOS, E. A tecnologia de mineração de textos. Revista Eletrônica de Sistemas de Informação, v. 5, n. 2, 2006.
BORBA, V. R.; MARINHO, A. C. M.; CAREGNATO, S. Análise do termo “Repositório Institucional” no twitter: um estudo altmétrico. Em Questão, v. 23, n. 5, p. 290-308, 2017.
BOWKER, L. Corpus linguistics is not just for linguists: considering the potential of computer-based corpus methods for library and information science research. Library Hi Tech, v.36, n.2, 2018.
COSTA, S. M. S.; GOTTSCHALG-DUQUE, C. Towards an ontology of ElPub/SciX: a proposal. In: INTERNATIONAL CONFERENCE ON ELECTRONIC PUBLISHING, 11., 2007, Viena. Proceedings… Viena: ÖKK-Editions, 2007. V. 1. P. 249-256.
DUQUE, C. G.; LOBIN, H. Ontology extraction for index generation. In: ICCC - INTERNATIONAL CONFERENCE ON ELECTRONIC PUBLISHING, 8., 2004, Brasília. Proceedings... Brasília: ELPUB, 2004. p. 111-120.
KADER, C. C. C.; RICHTER, M. G. Linguística de corpus: possibilidades e avanços. Instrumento, v. 15, n. 1, p. 13-23, jan./jun. 2013.
KLINCZAK, M. N. M.; KAESTNER, C. A. Identificação de temas em redes sociais por meio de técnicas de agrupamento. Anais do Computer on the Beach, p. 090-099, 2017.
KOCH, I. V. Como se constroem e se reconstroem os objetos-de-discurso. Investigações, Recife, v. 21, n. 2, p. 99-114, 2008.
ROGERS, R. O fim do virtual: os métodos digitais. Lumina, v. 10, n. 3, 2016.
SOUZA, B. A. Uma abordagem para seleção de tópicos relevantes em redes sociais online. 2017. Dissertação de Mestrado (Programa de Pós-Graduação em Informática do Instituto de Computação) - Universidade Federal do Amazonas, Manaus, 2017.
Downloads
Published
Issue
Section
License
Authors who publish with this journal agree to the following terms:
Authors retain copyright and grant Liinc em Revista the right of first publication with the work simultaneously licensed under a Creative Commons Attribution 4.0 International License.
The authors have permission and are encouraged to deposit their manuscripts and versios of record (VoR) in their personal web pages or institutional repositories, generic repositories etc., before (pre-print) or after (post-print) the publication in Liinc em Revista, according to its open access depositing policy registered in the Directory of Editorial Policies of Brazilian Journals (DIADORIM), kindly providing a link to the article published on Liinc's website.
Liinc em Revista, published by Instituto Brasileiro de Informação em Ciência e Tecnologia, is licensed under a Creative Commons Attribution 4.0 International License – CC BY 4.0