Estudo comparativo entre sistemáticas de digitalização de documentos: formatos HTML e PDF

Autores/as

  • André Raabe
  • Omer Pohlmann Filho

DOI:

https://doi.org/10.18225/ci.inf.v27i3.784

Palabras clave:

Conversão de documentos do formato tradicional para o digital, Sistemáticas de conversão para HTML, Geração de arquivos PDF, Tecnologias de reconhecimento óptico dos caracteres

Resumen

Este artigo apresenta o resultado de experimentos realizados pelo Laboratório de Biblioteca Digital da PUCRS voltados para a captura e conversão de documentos a partir do formato tradicional (papel) para o formato digital. São apresentadas e avaliadas as principais etapas envolvidas no processo de digitalização utilizando duas sistemáticas diferentes: uma baseada na conversão para HTML; a outra baseada na geração de arquivos PDF usados pelo software Adobe Acrobat Reader. São abordados também fatores essenciais aos trabalhos de digitalização tais como tecnologias de Reconhecimento Óptico dos Caracteres (OCR) e avaliação das características do acervo a ser digitalizado. Por fim, é realizado um comparativo entre as duas sistemática estudadas, apontando pontos positivos e negativos que devem ser considerados na escolha de uma diretriz de trabalho.

Descargas

Los datos de descarga aún no están disponibles.

Biografía del autor/a

  • André Raabe
    Bacharel em Informática, PUCRS, 1997. Mestrando em Informática, PUCRS 1998.
  • Omer Pohlmann Filho
    Bacharel em Administração de Empresas, PUCRS, 1979. Especialista em Análise de Sistemas, PUCRS, 1981. Mestre em Informática, PUCRS, 1996.

Número

Sección

Artículos