Representação de conteúdo via indexação automática em textos integrais em língua portuguesa

Autores

  • Flávia Pereira Braga Mamfrim

DOI:

https://doi.org/10.18225/ci.inf.v20i2.355

Palavras-chave:

Recuperação da informação. Indexação automática derivativa. Fórmula de Transição de Goffman.

Resumo

Verifica-se a possibilidade da indexação automática derivativa de textos em língua portuguesa, a partir de seu texto integral. É aplicada a Fórmula de Transição de Goffman a 10 artigos na área de Bibliometria e formulado um algorltimo probabilístico de indexação. A Fórmula de Transição de Goffman ê perfeitamente aplicável à língua portuguesa, apontando para uma região de frequência de palavras onde estão concentradas as palavras indicativas do conteúdo dos artigos analisados.

Palavras-chave

Recuperação da informação. Indexação automática derivativa. Fórmula de Transição de Goffman.

Representation of contents by the automatic indexing process of full texts in Portuguese language

Abstract

Possibility of automatic derived indexing of full texts in Portuguese is verifyed. Ten papers in Bibliometrics were indexed and their different parts considered for quantitative and qualitative analysis. Structure and disíríbution patterns of words were studied. Goffman's transition formula proved to be adequate as a slarting point for the indexing algorithm, which yielded, in all papers, a concentration zone forsemantic loaded terms. The algorithm worked as an uncenainty reducer, feading to the semantically important words.

Keywords

Information retrieval. Automatic derived indexing. Goffman's transition formula.

Downloads

Os dados de download ainda não estão disponíveis.

Biografia do Autor

  • Flávia Pereira Braga Mamfrim
    Mestre em Ciência da Informação pela Escola de Comunicação da Universidade Federal do Rio de Janeiro. Técnico em informação do Centro de In- formação em Economia Internacional do Departa- mento de Economia da Pontifícia Universidade Católica, Rio de Janeiro.

Downloads

Edição

Seção

Artigos