Indexação automática de textos: uma abordagem otimizada e simples
DOI:
https://doi.org/10.18225/ci.inf.v20i2.348Keywords:
Recuperação da informação. Indexação automática. Lingüística computacional. Sistema BIB/DIALOGO – AUTOMINDEX.Abstract
Após uma breve referência às modernas tendências no processamento automático das Informações textuais e às principais abordagens conceituais do processo de indexação automática de textos e mais particularmente à abordagem lingüístico-computacional e à abordagem baseada na eliminação, no texto, das palavras vazias de significado, apresenta-se uma variante desta última abordagem,a qual permite acelerar, consideravelmente, o processo de escolha dos termos considerados significativos, assim como reduzir de forma importante o volume dos antidicionários de palavras vazias. A abordagem apresentada, já testada com sucesso, integra-se num sistema versátil de indexação automática de textos - o sistema AUTOMINDEX -, o qual, pela sua vez, constitui-se num subsistema do sistema BB/DIALOGO. Apresentam-se exemplos de aplicação da nova abordagem do processo de indexação automática da textos que mostram sua flexibilidade.
Palavras-chave
Recuperação da informação. Indexação automática. Lingüística computacional. Sistema BIB/DIALOGO - AUTOMINDEX.
Automatic text indexing: an improved and simple approach
Abstract
Following a short reference to the modern trends in the automatic processing of textual information, as well as to the most relevant conceptual approaches to the processes of automatic text indexing and, more specifically, the computational-linguistic approach and that one based on the elimination in the text of non-significant words, a modification of this last approach is described, which makes it possible to accelerate significantly the process of identification of the terms considered significant, reducing, at the same time, the volume of the anti-dictionnaries of stopwords. The new approach, which has been successfully tested and applied, is a component of a versatile system of automatic indexing of texts - the AUTOMINDEX System -, this being, in turn, an integrating part of the System BIB/DIALOGO. Examples of appIication of the new approach of automatic text indexing are given, which demonstrate its versatility and flexibility.
Downloads
Downloads
Issue
Section
License
- This publication reserves the right to modify the original, regarding norms, spelling and grammar, in order to maintain the standards of the language, still respecting author writing style;
- The final proofs will not be sent to the authors;
- Published works become Ciência da Informação's property, their second partial or full print being subject to expressed authorization by IBICT's Director;
- The original source of publicaton must be provided at all times;
- The authors are solely responsible fo the views expressed within the article;
- Each author will receive two hard copies of the issue, if made availalbe in print.