Compartilhe

quarta-feira, 22 de julho de 2009

Editando arquivos em PDF

Se você é estudante do ensino médio ou universitário e está acostumado a fazer pesquisas na internet então já deve ter se deparado com textos importantes passíveis de serem lidos e baixados na extensão PDF. Nestes casos, vc tem algumas opções: se tiver disponível em sua máquina um programa leitor desse formato pode baixar o arquivo e ler o texto na tela do computador (ou Palm) ou, uma outra possibilidade, se sua consciência ecológica não for lá essas coisas, imprimir o referido artigo.

Em ambos os casos você terá de ler e produzir suas notas de estudo em outro documento ou nas fichas/cadernos tradicionais já que uma das qualidades dos arquivos PDF é sua segurança diante da alteração dos dados e, deste modo, da impossibilidade em editar e alterar o referido arquivo.

Num certo momento você talvez precisará copiar partes do arquivo e, neste caso, terá de fazê-lo página por página, já que os programas leitores de PDF não possibilitam a seleção de todo o documento e sua transferência para outro documento. Por vezes, talvez centenas de vezes, você terá de ler e estudar utilizando-se dos arquivos PDF - caso você esteja realizando sua pesquisa para monografia de conslusão de curso ou mestrado/doutorado - e, neste momento, começa a perceber os limites da tecnologia PostScript da qual derivaram os atuais PDF.

Este artigo procura descrever o panorâma atual sobre as ferramentas tecnológicas para uso dos arquivos PDF. Faz uma avaliação dos softwares ou tecnologias disponíveis para a leitura e edição destes arquivos e finaliza com algumas sugestões e possibilidades para desenvolvedores e demais interessados no tema.

index_html_m7c437f38

Fig. 1 – exemplo de arquivo em PDF. O livro de Josten Gardener «O mundo de Sofia».

Situando o problema: estudando utilizando-se de arquivos em PDF

PDF (Portable Document Format - formato de documento portável) é um formato de arquivos produzido pela Adobe System® desde 1990 com o intuito de propor uma qualidade superior de impressão e ser utilizado em todas as plataformas, sistemas e dispositivos existentes a época. Isso significava, e ainda significa, que um arquivo em PDF deverá ser visualizado em qualquer PC ou Computador, independente do sistema operacional nele instalado, do dispositivo ou arquitetura utilizado para visualizá-lo (Pocket PC, Palm, etc.) sem que em cada um desses sistemas ou aparelhos o arquivo seja visualizado de modo diferente, bastando para tanto a presença de um programa leitor deste formato1. Além desta vantagem, os arquivos em PDF possuem a característica de serem seguros devido ao impedimento que se tem de editá-los.

A única ferramenta oficial que nos dá poderes absolutos sobre um arquivo PDF não travado, ou seja, um arquivo cujo autor permite que este seja editável, é o próprio Adobe Writer® da Adobe Systems. Isso, como se pode rapidamente perceber, oferece por um lado a segurança necessária para muitos propósitos do comércio na internet e, por outro, provoca uma monopolização exagerada por parte da Adobe Systems.

Contudo, apesar de muitos outras empresas ou inventores proporem outros formatos de arquivo igualmente universais (ex: o formato DjVu da Bell systems), a difusão já alcançada pelos arquivos PDF e a sua ampla utilização na internet faz com que encontrar concorrente para este formato seja difícil e, em certos aspectos, desencorajado. Além disso, nos últimos anos, a Adobe System tem permitido que outros softwares possam produzir arquivos PDF o que tem levado a empresa a manter apenas o monopólio na manipulação e editoração de arquivos PDF já produzidos. Na verdade, atualmente os negócios envolvendo a manipulação de arquivos PDF, seus direitos autorais, segurança, portabilidade etc, ganham a casa de milhões de dólares. Se tiver dúvida, faça uma rápida pesquisa no Google® ou ferramenta de busca de sua preferência utilizando-se das palavras PDF e Edição e verá milhares de sites e centenas de empresas que procuram abocanhar uma fatia deste enorme mercado.

Como decorrência da confiabilidade, segurança, compactação e portabilidade que possuem os arquivos PDF, estes têm sido amplamente utilizados nos diversos setores da tecnologia digital e, de modo especial, no setor educacional, onde é fácil encontrar cursos inteiros, textos, artigos científicos, apostilas etc. distribuídos neste formato.

As dificuldades na manipulação dos arquivos PDF

A segurança (leia-se, garantia mínima dos direitos autorais), estabilidade e excelente portabilidade do formato PDF fez com que esse tipo de arquivo se espalhasse com grande velocidade por toda a Internet. Assim, num mundo tão flexível e vulnerável como tem sido o mundo virtual contemporâneo, a confiabilidade nos arquivos PDF é sentida como que uma "ilha paradisíaca" nesse grande mar de instabilidade.

Se você costuma utilizar-se de alguma técnica de leitura ou estudo, como a AIM (Author Intented Message) ou KWL (O que eu sei – Know -, quero – Want – e aprendi – Learned – com o texto?), estratégias que focam em uma atitude ativa por parte do leitor, então certamente sentirá aquela «coceira» por manipular e editar/riscar o texto que está lendo e, neste caso, verá que não é nada fácil mexer nestes arquivos.2

Deste modo, estamos diante de uma difícil equação: é extremamente necessário um formato de arquivo que seja confiável e à prova de violações pois isso nos transmite confiabilidade mas, por outro lado, em um mundo onde a obrigação de imprimir estes documentos para poder riscá-los, acrescentar alguma nota ou simplismente grifar uma idéia interessante para ser utilizada em outro momento, já não faz muito sentido. Sendo assim, começam a surgir alternativas para este pequeno impasse tecnológico. A seguir veremos três possibilidades de manipulação de arquivos PDF: os softwares direcionados para o sistema operacional Windows®, os para a família *NIX (Unix, Linux, BSD etc.) e, por fim, as ferramentas web, portáveis igualmente para os sistemas anteriores.

As novas possibilidades: softwares Windows® e Linux e a ferramenta Google

Softwares para Windows

Se seu sistema operacional é o Windows® as opções para manipulação/edição dos arquivos PDF são inúmeras, desde um PDF-Creator®, com licença entre U$80 a U$100 (dólares) até um FoxIt PDF Editor®, na mesma faixa de preços, e com as mesmas funcionalidades de criar, editar, modificar, eliminar páginas, inserir figuras etc. Os dois programas podem ser baixados com a licença Shareware com praticamente todas as funcionalidades ativadas porém, ambos deixam suas «marcas» ou «carimbos» nas páginas editadas e a única forma de retirá-las é licenciando o programa. Ora, se você utiliza esses programas apenas para fins pessoais as tais "marcas" podem até não te chatear demais; porém, se você pensa em enviar os documentos editados para alguém ou disponibilizá-los na internet avalie se não há outras possibilidades e, até mesmo, comprar a licença do Adobe Writer (atualmente entre U$113 a U$180), o que lhe proporcionará uma solução mais profissional.

Mas se o que você deseja é apenas produzir artigos em PDF ou editar seus próprios artigos, poderá optar por instalar a suite de escritório OpenOffice (que irei detalhar adiante) ou utilizar-se do Latex (leia-se Leitek) um editor de textos profissionais criado por Leslie Lamport.

Apesar de ser possível efetuar os trabalhos diretamente no Latex, ele exige o aprendizado de uma série de comandos e de uma sintaxe próprias, por este motivo tem-se preferido programas que simplificam e visualizam graficamente muitas das ações efetuadas pelo Latex. No mundo Windows® o mais famoso destes programas é o MikTex. A vantagem de se usar o Latex – que também está disponível para o mundo *NIX – é que você estará editando um documento fonte e que toda e qualquer alteração neste documento refletirá no PDF criado. Apesar da curva de aprendizado ser maior – aprendizado mais lento – os que se utilizam do Latex garantem que a edição profissional de textos, artigos, livros só é plenamente alcançada para aqueles que se apoderam desta ferramenta.

Softwares para Linux

No sistema operacional GNU/Linux a opção para produzir arquivos em PDF é enorme. A que iremos destacar trata-se, talvez, da mais divulgada, a utilização do OpenOffice. A suíte de escritório fundada pela Sun Systems e produzida com a colaboração de uma gigantesca teia de colaboradores internacionais tem em cada um de seus programas (desde o Writer, clone do Word®, até o Impress, clone do PowerPoint® ) a possibilidade de exportar qualquer um de seus arquivos para o formato PDF.

No entanto, se vc deseja possuir um controle ainda maior sobre o resultado deste arquivo, basta instalar o add-on do OpenOffice chamado Extended PDF, que te dará condições para controlar a compressão das imagens, a criação dos bookmarks, a visão padrão e os controles de segurança (encriptação).

Porém, se o seu caso é editar arquivos que já estejam no Portable Document Format então as possibilidades diminuem drasticamente. Apesar das insistentes demandas dos usuários Linux, ainda não se tem uma solução definitiva para esse problema. As possibilidades nativas são o uso do PDFTK e o PDFEdit. O primeiro oferece a possibilidade de mesclar documentos, inserir figuras de fundo, cortar páginas etc. Porém, nada de funcionalidades ideais para o estudante, como anotação, sublinhar ou marcar uma determinada frase ou parágrafo. Cabe ao segundo algumas destas funcionalidades. O problema fica por conta da instalação do PDFedit, que exige uma longa biblioteca Qt mas, ao que parece funcional no Ubuntu 7.4.

Outra alternativa é a utilização do FoxIt PDFreader® via Wine. Para instalá-lo será necessário, provavelmente, que você adcione o arquivo MFC42.dll, facilmente encontrável na Internet. Instale-o junto ao diretório /:C criado pelo Wine e, após, instale o programa normalmente.

O inconveniente do FoxIt® é sua «marca» manter-se em todos as páginas editadas. No entanto, fora esse merchandissing exagerado, o software atende bem às necessidades daqueles que querem, também no ambiente Linux, usar dos arquivos PDF para estudar, fazer anotações, sublinhar ou marcar texto. Infelizmente, os textos editados pelo FoxIt reader são visualizados em sua potencialidade apenas dentro do FoxIt, ou seja, se você tiver de abrir o arquivo editado em um PC sem aquele programa terá a visualização de apenas algumas das anotações, correndo o risco mesmo de não conseguir abrir o arquivo (o Adobe Reader conflita diretamente com os arquivos editados por outros programas).

A conclusão é que as alternativas para edição, marcação ou anotação de arquivos PDF requer ainda um pouco de paciência do usuário Linux. Ficamos todos no aguardo do Okular, um visualizador de arquivos gerais que sairá como visualizador padrão no KDE 4 e que, além de visualizar, possibilitará a edição de notas, grifos e inclusão de desenhos nos arquivos PDF. Isso ocorrerá através da acoplagem ao referido arquivo de outro arquivo editável o que manterá os direitos autorais e atendará as demandas dos estudantes.

index_html_5032f052

Fig. 2 – Uma primera visualização do Okular, programa que virá por padrão no KDE4 e que permitirá visualização e edição, mínima, de arquivos PDF.

Ferramenta Google: PDF para HTML

A menos de um ano a empresa Google® lançou uma importante novidade para aqueles que trabalham com a leitura constante de arquivos PDF. Desde então, ao selecionar um arquivo PDF através dos motores de pesquisa da Google apresenta-se abaixo do título do arquivo um link para visualizá-lo no formato HTML.

De fato, alguns arquivos em PDF não são totalmente travados por seus autores o que permite ao Google transformar o arquivo original em uma página HTML. Ora, as diferenças são marcantes. A começar, há uma grande perda no layout - imagens, formatação etc.- que não são corretamente transformadas e, muitas vezes, deixadas de serem visualizadas. Em artigos cuja formatação de página é em duas ou mais colunas, a transformação não consegue ser realizada plenamente, confundindo e, as vezes, até impedindo a leitura do texto.

Por outro lado, há o ganho frente a portabilidade do arquivo que agora no formato HTML pode ser facilmente copiado em sua totalidade e transportado para outro meio que o usuário achar mais adequado (texto no Writer, página HTML no QuantaPlus, por exemplo). Outra vantagem é o encontrar palavras ou trechos de frases. Através de um simples Ctrl + F você pode identificar rapidamente uma palavra ou expressão que esteja procurando. Essa transposição, contudo, tem seu preço: o formato PDF de arquivos é 30% a 40% menor que os arquivos de texto.

index_html_m123f0ffe

Fig 3- Exemplo de página gerada pela Google a partir de um arquivo PDF.

Conclusões

Procuramos apresentar algumas possibilidades para a leitura e edição de textos PDF, de modo especial aquelas que permitem a edição destes arquivos o que pode facilitar na leitura e estudo através da internet. O formato de arquivos desenvolvido pela Adobe System continua sendo o mais utilizado e difundido no mundo virtual. Isso traz inúmeras vantagens para a estabilidade das transações realizadas e algumas poucas desvantagens para o estudante que depende deste formato para realizar suas pesquisas e estudos. Felizmente, algumas soluções para a manipulação destes arquivos estão surgindo. Já há várias possibilidades no mundo Windows® e um menor número no mundo *NIX. No entanto, neste último, novidades estão apontando no horizonte que podem renovar as expectativas destes usuários.

Como sugestão aos desenvolvedores, propomos que estes dêem maior atenção aos arquivos PDF que, embora ainda monopolizados pela Adobe System®, são uma realidade inegável em todos os setores da internet. Por vezes nos deparamos com uma centena de arquivos deste formato em nossos diretórios e, neste momento, outra demanda aparece: como rastrear, identificar o conteúdo, palavra ou frase no interior de diversos arquivos ao mesmo tempo? Pequena funcionalidade que muito pode acrescentar a acessibilidade destes arquivos e suas informações.

Um site imperdível para ter-se mais conhecimento sobre a história da tecnologia PDF é http://www.adobe.com/pdf/about/history/ que traça uma linha do tempo sobre o mesmo.

Outros links interessantes:

https://help.ubuntu.com/community/PDFedit que explica a instalação e uso da ferramenta PDFedit.

http://www.linuxjournal.com/node/1000235 uma excelente discussão sobre as potencialidades dos arquivos PDF e sua manipulação e edição no universo Linux.

http://lwn.net/Articles/113094/ lista os inúmeros visualizadores de arquivos PDF nos vários sistemas, mostrando suas funcionalidades, modos de instação e efetua, também, uma avaliação sobre eles.

1 O Adobe Reader® foi distribuído gratuitamente desde 1993. De lá para cá, mais de 500 milhões de downloads foram computados pela Adobe System.

2 Uma outra possibilidade que não exploraremos neste artigo mas que também entraria na categoria Estudo e PDF é efetuar apresentações de slides a partir de arquivos PDF. Tanto o Acrobat Reader® quanto o KPDF oferecem essa possibilidade. Uma vez mais seria a garantia da universalidade e do mesmo layout em diferentes máquinas ou arquiteturas. Em síntese, uma apresentação que não te deixara na mão.



Fonte: GDH

0 comentários:

Postar um comentário

Deixe aqui seu comentário!!!

Obrigado!!!

Downloadsdicasetutorias - 2009

  ©Desenvolvido por: Weblina -Criação e Desenvolvimento de Websites-.