Indexação automática baseada em métodos lingüísticos e estatísticos e sua aplicabilidade à língua portuguesa
DOI:
https://doi.org/10.18225/ci.inf.v12i1.195Keywords:
Ambiguidade. Análise sintética. Entropia. Estatística. Filtros. Indexação automática. Indexação ponderada. Linguística. Matrizes de precedência. Método de aprendizado. Proximidade. Relações léxicosemânticasAbstract
Considera-se neste artigo a indexação automática usando o processamento de documentos em linguagem natural, que é obtido com o auxílio de métodos linguísticos combinados com métodos estatísticos permitindo uma indexação ponderada. A título ilustrativo descreve-set em linhas gerais, um sistema de indexação desse género denominado SPIRIT, o qual foi desenvolvido para o idioma francês por uma equipe de pesquisadores do CNRS. Enfim, são tratados aspectos essenciais de sua adaptação à língua portuguesa.
Descritores
Ambiguidade. Análise sintética. Entropia. Estatística. Filtros. Indexação automática. Indexação ponderada. Linguística. Matrizes de precedência. Método de aprendizado. Proximidade. Relações léxicosemânticas.
Abstract
This paper deals with automatic indexing based on linguistic and statistical methods, which aims to allow the processing of documents in natural language. The main lines of a system called SPIRIT, that uses such methods, and that was developed for the French Languages by a group of researchers of the CNRS, including the first author,is described. Some basic aspects of the applicability of those methods to the Portuguese Language are considered.
Downloads
Downloads
Issue
Section
License
- This publication reserves the right to modify the original, regarding norms, spelling and grammar, in order to maintain the standards of the language, still respecting author writing style;
- The final proofs will not be sent to the authors;
- Published works become Ciência da Informação's property, their second partial or full print being subject to expressed authorization by IBICT's Director;
- The original source of publicaton must be provided at all times;
- The authors are solely responsible fo the views expressed within the article;
- Each author will receive two hard copies of the issue, if made availalbe in print.