Análise de sentimentos em comentários de vídeos do YouTube utilizando aprendizagem de máquinas supervisionada

Alexandre Ribeiro Afonso, Cláudio Gottschalg Duque

Resumo


O artigo descreve um conjunto de três experimentos em análise de sentimentos, especificamente, para comentários textuais em português brasileiro e para um vídeo do YouTube. Utiliza-se o pacote de mineração de dados Weka para filtragem e um classificador baseado em aprendizagem de máquinas supervisionada (SMO). Os experimentos diferenciam-se pelo corpus a classificar: o primeiro utiliza três classes de polaridade (positiva, negativa e neutra), o segundo e o terceiro experimentos trabalham com duas classes (negativa e não negativa). No terceiro experimento são selecionadas somente postagens que comentam uma entidade (referente) específica. Os resultados de Acurácia e Medida-F Média são consideravelmente melhores para os experimentos contendo duas classes. O terceiro experimento atinge valores em volta de 81% para as duas medidas citadas, e sugere que quanto mais entidades são comentadas nos discursos do corpus, mais difícil seria a classificação de polaridades.

Palavras-chave


Análise de sentimentos; YouTube; Português brasileiro; Aprendizagem de máquinas

Referências


AFONSO, Alexandre Ribeiro. A referenciação em textos do YouTube: um estudo com vistas à análise de sentimentos| Referenciation in YouTube Texts: a study for Sentiment Analysis. Liinc em Revista, v. 13, n. 2, 2017.

ARAÚJO, Mateus; GONÇALVES, Pollyanna; BENEVENUTO, Fabrício. Métodos para análise de sentimentos no Twitter. In: BRAZILIAN SYMPOSIUM ON MULTIMEDIA AND THE WEB, WEBMEDIA 2013, 19., Salvador, 2013. Proceedings... Salvador: Brazilian Computer Society, 2013.

AVANÇO, Lucas V.; BRUM, Henrico B.; NUNES, M. G. V. Improving opinion classifiers by combining different methods and resources. XIII Encontro Nacional de Inteligência Artificial e Computacional (ENIAC), p. 25-36, 2016.

AVANÇO, Lucas Vinicius; NUNES, Maria das Graças Volpe. Lexicon-based sentiment analysis for reviews of products in Brazilian Portuguese. In: Intelligent Systems (BRACIS), 2014 Brazilian Conference on. IEEE, 2014. p. 277-281.

BALAGE FILHO, Pedro P.; PARDO, Thiago Alexandre Salgueiro; ALUÍSIO, Sandra M. An evaluation of the Brazilian Portuguese LIWC dictionary for sentiment analysis. In: Proceedings of the 9th Brazilian Symposium in Information and Human Language Technology. 2013.

BALAGE FILHO, Pedro; PARDO, Thiago. NILC_USP: A hybrid system for sentiment analysis in twitter messages. In: Second Joint Conference on Lexical and Computational Semantics (* SEM), Volume 2: Proceedings of the Seventh International Workshop on Semantic Evaluation (SemEval 2013). 2013. p. 568-572.

BRUM, H. B.; NUNES, M. G. V. Building a Sentiment Corpus of Tweets in Brazilian Portuguese. In: LREC 2018, Eleventh International Conference on Language Resources and Evaluation, 2018, Miyazaki. Proceedings of LREC 2018, Eleventh International Conference on Language Resources and Evaluation, 2018. v. 1. p. 4167-4172.

DURAN, M. S.; AVANÇO, L.; NUNES, M. G. V. A normalizer for ugc in brazilian portuguese. In: Workshop on Noisy User-generated Text. Association for Computational Linguistics-ACL, 2015.

FARZINDAR, Atefeh; INKPEN, Diana. (Org.). Natural language processing for social media. Morgan & Claypool Publishers, 2015.

FREITAS, Cláudia et al. Vampiro que brilha... rá! Desafios na anotação de opinião em um corpus de resenhas de livros. ENCONTRO DE LINGUÍSTICA DE CORPUS, v. 11, p. 22, 2012.


Apontamentos

  • Não há apontamentos.


Direitos autorais 2019 Alexandre Ribeiro Afonso, Cláudio Gottschalg Duque

Licença Creative Commons
Esta obra está licenciada sob uma licença Creative Commons Atribuição - Não comercial - Compartilhar igual 4.0 Internacional.


Instituto Brasileiro de Informação em Ciência e Tecnologia (Ibict)
SAUS - Setor de Autarquias Sul, Quadra 5, Lote 6, Bloco H
Seção de Editoração - sala 500
CEP 70070-912
Brasília-DF, Brasil

Licença Creative Commons
Todo o conteúdo publicado nesta revista está licenciado com uma Licença Creative Commons - Atribuição-CompartilhaIgual 4.0 Internacional.