Representação de conteúdo via indexação automática em textos integrais em língua portuguesa

Flávia Pereira Braga Mamfrim

Resumo


Verifica-se a possibilidade da indexação automática derivativa de textos em língua portuguesa, a partir de seu texto integral. É aplicada a Fórmula de Transição de Goffman a 10 artigos na área de Bibliometria e formulado um algorltimo probabilístico de indexação. A Fórmula de Transição de Goffman ê perfeitamente aplicável à língua portuguesa, apontando para uma região de frequência de palavras onde estão concentradas as palavras indicativas do conteúdo dos artigos analisados.

Palavras-chave

Recuperação da informação. Indexação automática derivativa. Fórmula de Transição de Goffman.

Representation of contents by the automatic indexing process of full texts in Portuguese language

Abstract

Possibility of automatic derived indexing of full texts in Portuguese is verifyed. Ten papers in Bibliometrics were indexed and their different parts considered for quantitative and qualitative analysis. Structure and disíríbution patterns of words were studied. Goffman's transition formula proved to be adequate as a slarting point for the indexing algorithm, which yielded, in all papers, a concentration zone forsemantic loaded terms. The algorithm worked as an uncenainty reducer, feading to the semantically important words.

Keywords

Information retrieval. Automatic derived indexing. Goffman's transition formula.


Palavras-chave


Recuperação da informação. Indexação automática derivativa. Fórmula de Transição de Goffman.

Texto completo:

PDF

Apontamentos

  • Não há apontamentos.


Direitos autorais 1969 Flávia Pereira Braga Mamfrim

Licença Creative Commons
Esta obra está licenciada sob uma licença Creative Commons Atribuição - Não comercial - Compartilhar igual 4.0 Internacional.


Instituto Brasileiro de Informação em Ciência e Tecnologia (Ibict)
SAUS - Setor de Autarquias Sul, Quadra 5, Lote 6, Bloco H
Seção de Editoração - sala 500
CEP 70070-912
Brasília-DF, Brasil

Licença Creative Commons
Todo o conteúdo publicado nesta revista está licenciado com uma Licença Creative Commons - Atribuição-CompartilhaIgual 4.0 Internacional.