Indexação automática de textos: uma abordagem otimizada e simples

Autores/as

  • Jaime Robredo

DOI:

https://doi.org/10.18225/ci.inf.v20i2.348

Palabras clave:

Recuperação da informação. Indexação automática. Lingüística computacional. Sistema BIB/DIALOGO – AUTOMINDEX.

Resumen

Após uma breve referência às modernas tendências no processamento automático das Informações textuais e às principais abordagens conceituais do processo de indexação automática de textos e mais particularmente à abordagem lingüístico-computacional e à abordagem baseada na eliminação, no texto, das palavras vazias de significado, apresenta-se uma variante desta última abordagem,a qual permite acelerar, consideravelmente, o processo de escolha dos termos considerados significativos, assim como reduzir de forma importante o volume dos antidicionários de palavras vazias. A abordagem apresentada, já testada com sucesso, integra-se num sistema versátil de indexação automática de textos - o sistema AUTOMINDEX -, o qual, pela sua vez, constitui-se num subsistema do sistema BB/DIALOGO. Apresentam-se exemplos de aplicação da nova abordagem do processo de indexação automática da textos que mostram sua flexibilidade.

Palavras-chave


Recuperação da informação. Indexação automática. Lingüística computacional. Sistema BIB/DIALOGO - AUTOMINDEX.

Automatic text indexing: an improved and simple approach

Abstract

Following a short reference to the modern trends in the automatic processing of textual information, as well as to the most relevant conceptual approaches to the processes of automatic text indexing and, more specifically, the computational-linguistic approach and that one based on the elimination in the text of non-significant words, a modification of this last approach is described, which makes it possible to accelerate significantly the process of identification of the terms considered significant, reducing, at the same time, the volume of the anti-dictionnaries of stopwords. The new approach, which has been successfully tested and applied, is a component of a versatile system of automatic indexing of texts - the AUTOMINDEX System -, this being, in turn, an integrating part of the System BIB/DIALOGO. Examples of appIication of the new approach of automatic text indexing are given, which demonstrate its versatility and flexibility.

Descargas

Los datos de descarga aún no están disponibles.

Biografía del autor/a

  • Jaime Robredo
    Doutor em Ciências, professor titular do Departamento de Biblioteconomia da Faculdade de Ciências Sociais Aplicadas da Universidade de Brasília.

Número

Sección

Artículos