Diários oficiais aderem à digitalização de conteúdo

Valor Econômico - Quarta-feira, 11 de abril de 2007

qua, 11/04/2007 - 11h21 | Do Portal do Governo

Do Valor Econômico

O conteúdo publicado ao longo dos 117 anos do Diário Oficial de São Paulo (Doesp) foi parar em uma pequena geladeira. Os milhares de jornais, que hoje ocupam uma sala abarrotada de estantes, acabam de ser totalmente digitalizados e agora cabem em um pequeno rack, instalado na sala-cofre da Imprensa Oficial.

Com o projeto, que custou R$ 10 milhões, a instituição levará para a internet as informações de aproximadamente 10 milhões de páginas do jornal, material que inclui documentos históricos, como a Constituição da República dos Estados Unidos do Brasil, promulgada em 24 de fevereiro de 1891, e publicada na segunda edição do periódico, em 2 de maio daquele ano, época em que as atas ainda eram escritas a mão.

Para arquivar o material digitalizado, a Imprensa Oficial teve que dobrar a capacidade de armazenamento de dados, que saltou de 8 para 16 terabytes, diz o diretor de tecnologia da instituição, Márcio Moreira. A iniciativa envolveu a mão-de-obra dos 70 funcionários de tecnologia da entidade, além da contratação dos serviços da empresa de tecnologia TCI , do Recife, e a aquisição de produtos da EMC.

Moreira explica que, até agora, apenas os jornais publicados desde 1991 estavam digitalizados e disponíveis na internet. Agora, com a conclusão do projeto, os cem anos iniciais do Doesp também poderão ser pesquisados na rede a partir do fim deste mês, e gratuitamente. “O usuário só pagará se quiser fazer uma pesquisa por um determinado assunto”, comenta Moreira.

A iniciativa do Doesp ilustra um movimento que vem ganhando força entre os principais diários oficiais do país. O Diário Oficial da União (DOU), que em 2008 completará 200 anos de idade, acaba de fechar uma acordo com o Serpro, empresa pública de tecnologia, para transformar suas publicações impressas em bits. Nos próximos dias, o Serpro divulgará um edital com as exigências técnicas para selecionar a empresa que apoiará a iniciativa. De maneira geral, estima-se que o processo consuma cerca de R$ 10 milhões da Imprensa Nacional.

A digitalização também está nos planos do Diário Oficial de Minas Gerais, que investirá cerca de R$ 6 milhões para levar para a internet seus 112 anos de publicação. “Não há qualquer plano de deixar a publicação impressa de lado, mas é claro que a edição eletrônica é algo inexorável, embora ainda estejamos muito longe de uma situação ideal”, diz Francisco Pedalino Costa, presidente do DO mineiro e – há uma semana – diretor geral da Associação Brasileira das Imprensas Oficiais (Abio).

Segundo projeções da Abio, hoje mais de 90% dos diários oficiais do país ainda não têm conteúdo digitalizado, mas “isso é algo que deve mudar radicalmente daqui para frente”, diz Costa. De fato, o que não falta é trabalho a ser feito. No DO do Estado do Rio de Janeiro, por exemplo, até dois atrás ainda se usava da tradicional colagem de anúncios para montar as páginas da edição impressa, comenta o coordenador de tecnologia do diário carioca, Wu Chan Yan. “Mudamos esse processo há pouco tempo. Só agora começaremos a pensar na digitalização do acervo.”

Mais do que alta tecnologia, a digitalização de acervos antigos costuma exigir um tratamento complexo dos papéis, o que muitas vezes onera os projetos e inviabiliza a iniciativa de diários de menor porte. Para colocar o conteúdo impresso na internet, primeiro é preciso escanear as páginas, transformando-as em imagens. Em seguida, outro software se encarrega de converter essas imagens em texto digital, recurso que facilita a busca de documentos. No DO de São Paulo, o projeto também inclui as mudanças da língua portuguesa ocorridas no último século. “O sistema de busca está preparado para garantir que, se um usuário procurar pelo termo ‘farmácia’ publicado em 1902, por exemplo, encontre os registros onde aparece a palavra ‘pharmacia'”, diz o diretor de tecnologia da Imprensa Oficial paulista, Márcio Moreira.

No Diário Oficial da União, que é publicado desde 1808, as preocupações começam no simples manuseio das páginas. “Muitas delas estão bem secas e podem se quebrar se não foram tratadas da maneira correta”, diz o gerente de documentação histórica do DOU, Paulo Penha.

Uma vez que o conteúdo é digitalizado, diz ele, outra dificuldade é a indexação dos dados, muitas vezes atrelados a seções de jornais que deixaram de existir. Responsável pelo levantamento histórico do DOU, Penha lembra que o próprio periódico nacional teve vários nomes: nasceu como a Gazeta do Governo, depois foi rebatizado para Diário Fluminense, Diário do Rio de Janeiro e, em 1862, passou a se chamar Diário Oficial do Império do Brasil. O Serpro estima que o projeto do DOU seja concluído em 2009, mas até final deste ano parte do acervo já deverá ir para a internet, onde o usuário poderá acessar documentos como a Proclamação da República, de 1889, ou mesmo o registro da prisão de um cidadão ocorrida em 1815, quando tentava roubar galinhas.