Precisão no processo de busca e recuperação da informação: uso da mineração de textos

Autores/as

  • Rogério Henrique de Araújo Júnior Departamento de Ciência da Informação e Documentação da UnB
  • Kira Tarapanoff Departamento de Ciência da Informação e Documentação da UnB

DOI:

https://doi.org/10.18225/ci.inf.v35i3.1130

Palabras clave:

Processo de recuperação da informação, Índice de precisão, Revocação, Processo de indexação, Mineração de textos.

Resumen

Trata da comparação entre a indexação manual e a ferramenta de mineração de textos, por meio da análise do índice de precisão de resposta no processo de busca e recuperação da informação. O estudo de caso escolhido para o desenvolvimento da pesquisa foi o Centro de Referência e Informação em Habitação (Infohab), cuja base de dados sobre habitação, saneamento e urbanização foi indexada de forma manual por bibliotecários da Caixa Econômica Federal, com base em uma lista de palavras-chave. Houve o desenvolvimento de um protótipo cujos itens bibliográficos correspondem às teses e dissertações contidas no Infohab, o que permitiu a aplicação do software BR/Search para a execução da mineração de textos. As pesquisas no Infohab e no protótipo foram realizadas a partir da demanda de especialistas da Caixa nos assuntos contidos na base. Conclui que não há ganhos significativos na precisão ao se aplicar a ferramenta de mineração de textos em relação à indexação manual.

Palavras-chave
Processo de recuperação da informação. Índice de precisão. Processo de indexação. Mineração de textos.

Precision rate in the information retrieval process: the use of text mining

Abstract

This research deals with the comparison between manual indexing and the text mining tool, using the analysis of reply precision rate in the information retrieval process. The case study selected for this research was the Centro de Referência e Informação em Habitação – Infohab. The center which contains the database on habitation, sanitation and urbanization was manually indexed by the librarians of Caixa Econômica Federal, using a list of key words. A prototype was developed, containing bibliographic references that corresponded to the theses and dissertations of Infohab, which allowed the application of BR/Search software of text mining. The researches performed on the prototype and in Infohab were demanded by specialists of Caixa in database subjects. The research gave evidenced that there are no significant profits in the precision rate with the applications of text mining tool in relation to the manual indexing.

Keywords
Information retrieval process. Precision rate. Indexing process. Text mining.

Descargas

Los datos de descarga aún no están disponibles.

Biografía del autor/a

  • Rogério Henrique de Araújo Júnior, Departamento de Ciência da Informação e Documentação da UnB
    Doutor em Ciência da Informação pela Universidade de Brasília, é Professor Adjunto do Departamento de Ciência da Informação e Documentação da Universidade de Brasília. SHIGS 713 Bl. N Casa 29 CEP.: 70.380-714, Brasília – DF (61) 3345-0035/(61) 9221-9322 E-mail: araujojr@unb.br
  • Kira Tarapanoff, Departamento de Ciência da Informação e Documentação da UnB
    Doutora em Ciência da Informação pela Universidade de Sheffield – Inglaterra, é Pesquisadora Sênior e Coordenadora do Curso de Especialização em Inteligência Organizacional e Competitiva na Sociedade da Informação do Departamento de Ciência da Informação e Documentação da Universidade de Brasília. SQN 309 Bl. O Aptº 305 CEP.: 70.755-150, Brasília – DF (61) 3274-4012/(61) 8117-9161 E-mail: kat309@unb.br

Publicado

07/07/2007

Número

Sección

Relatos de Experiências

Artículos más leídos del mismo autor/a

1 2 > >>