Indexação automática de textos: uma abordagem otimizada e simples
DOI:
https://doi.org/10.18225/ci.inf.v20i2.348Palabras clave:
Recuperação da informação. Indexação automática. Lingüística computacional. Sistema BIB/DIALOGO – AUTOMINDEX.Resumen
Após uma breve referência às modernas tendências no processamento automático das Informações textuais e às principais abordagens conceituais do processo de indexação automática de textos e mais particularmente à abordagem lingüístico-computacional e à abordagem baseada na eliminação, no texto, das palavras vazias de significado, apresenta-se uma variante desta última abordagem,a qual permite acelerar, consideravelmente, o processo de escolha dos termos considerados significativos, assim como reduzir de forma importante o volume dos antidicionários de palavras vazias. A abordagem apresentada, já testada com sucesso, integra-se num sistema versátil de indexação automática de textos - o sistema AUTOMINDEX -, o qual, pela sua vez, constitui-se num subsistema do sistema BB/DIALOGO. Apresentam-se exemplos de aplicação da nova abordagem do processo de indexação automática da textos que mostram sua flexibilidade.
Palavras-chave
Recuperação da informação. Indexação automática. Lingüística computacional. Sistema BIB/DIALOGO - AUTOMINDEX.
Automatic text indexing: an improved and simple approach
Abstract
Following a short reference to the modern trends in the automatic processing of textual information, as well as to the most relevant conceptual approaches to the processes of automatic text indexing and, more specifically, the computational-linguistic approach and that one based on the elimination in the text of non-significant words, a modification of this last approach is described, which makes it possible to accelerate significantly the process of identification of the terms considered significant, reducing, at the same time, the volume of the anti-dictionnaries of stopwords. The new approach, which has been successfully tested and applied, is a component of a versatile system of automatic indexing of texts - the AUTOMINDEX System -, this being, in turn, an integrating part of the System BIB/DIALOGO. Examples of appIication of the new approach of automatic text indexing are given, which demonstrate its versatility and flexibility.
Descargas
Descargas
Número
Sección
Licencia
- La publicación se reserva el direcho de realizar, en los originales, cambios de orden normativa, ortográfica y gramatical, para mantener la norma culta del idioma, respetando el estilo de los autores;
- Las pruebas finales no seran enviadas a los autores;
- Los trabajos publicados pasan a ser propriedad de la revista Ciência da Informação, siendo su reimpresión total o parcial, sujeta a autorización expresa de la dirección del IBICT;
- Debe ser consignada la fuente de publicação original;
- Són de exclusiva responsabilidad de los autores las opiniones emitidas en sus artículos;
- Cada autor recibirá dos ejemplares de la revista, caso esté disponible en el formato impreso.