Estudo comparativo entre sistemáticas de digitalização de documentos: formatos HTML e PDF
DOI:
https://doi.org/10.18225/ci.inf.v27i3.784Palavras-chave:
Conversão de documentos do formato tradicional para o digital, Sistemáticas de conversão para HTML, Geração de arquivos PDF, Tecnologias de reconhecimento óptico dos caracteresResumo
Este artigo apresenta o resultado de experimentos realizados pelo Laboratório de Biblioteca Digital da PUCRS voltados para a captura e conversão de documentos a partir do formato tradicional (papel) para o formato digital. São apresentadas e avaliadas as principais etapas envolvidas no processo de digitalização utilizando duas sistemáticas diferentes: uma baseada na conversão para HTML; a outra baseada na geração de arquivos PDF usados pelo software Adobe Acrobat Reader. São abordados também fatores essenciais aos trabalhos de digitalização tais como tecnologias de Reconhecimento Óptico dos Caracteres (OCR) e avaliação das características do acervo a ser digitalizado. Por fim, é realizado um comparativo entre as duas sistemática estudadas, apontando pontos positivos e negativos que devem ser considerados na escolha de uma diretriz de trabalho.Downloads
Os dados de download ainda não estão disponíveis.
Downloads
Edição
Seção
Artigos
Licença
- A publicação se reserva o direito de efetuar, nos originais, alterações de ordem normativa, ortográfica e gramatical, com vistas a manter o padrão culto da língua, respeitando, porém, o estilo dos autores;
- As provas finais não serão enviadas aos autores;
- Os autores mantém os direitos totais sobre seus trabalhos publicados na revista Ciência da Informação, ficando sua reimpressão total ou parcial, depósito ou republicação sujeita à indicação de primeira publicação na revista, por meio da Licença Pública 4.0 Internacional Atribuição-CompartilharIgual
- Deve ser consignada a fonte de publicação original;
- As opiniões emitidas pelos autores dos artigos são de sua exclusiva responsabilidade;
- Cada autor receberá dois exemplares da revista, caso esteja disponível no formato impresso.