Estudo comparativo entre sistemáticas de digitalização de documentos: formatos HTML e PDF

Autores

  • André Raabe
  • Omer Pohlmann Filho

DOI:

https://doi.org/10.18225/ci.inf.v27i3.784

Palavras-chave:

Conversão de documentos do formato tradicional para o digital, Sistemáticas de conversão para HTML, Geração de arquivos PDF, Tecnologias de reconhecimento óptico dos caracteres

Resumo

Este artigo apresenta o resultado de experimentos realizados pelo Laboratório de Biblioteca Digital da PUCRS voltados para a captura e conversão de documentos a partir do formato tradicional (papel) para o formato digital. São apresentadas e avaliadas as principais etapas envolvidas no processo de digitalização utilizando duas sistemáticas diferentes: uma baseada na conversão para HTML; a outra baseada na geração de arquivos PDF usados pelo software Adobe Acrobat Reader. São abordados também fatores essenciais aos trabalhos de digitalização tais como tecnologias de Reconhecimento Óptico dos Caracteres (OCR) e avaliação das características do acervo a ser digitalizado. Por fim, é realizado um comparativo entre as duas sistemática estudadas, apontando pontos positivos e negativos que devem ser considerados na escolha de uma diretriz de trabalho.

Downloads

Os dados de download ainda não estão disponíveis.

Biografia do Autor

  • André Raabe
    Bacharel em Informática, PUCRS, 1997. Mestrando em Informática, PUCRS 1998.
  • Omer Pohlmann Filho
    Bacharel em Administração de Empresas, PUCRS, 1979. Especialista em Análise de Sistemas, PUCRS, 1981. Mestre em Informática, PUCRS, 1996.

Downloads

Edição

Seção

Artigos