+ Accueil du site > I. Fiches pratiques > 1.3. Produire / Créer / Publier > 1.3.6. Documents composites > PAO

[Logiciels] Une trousse à outils pour manipuler les fichiers PDF

Mis en ligne le 2/01/2009

Contexte pédagogique : on trouve sur le web une multitude de documents au format pdf. Comment les lire ? Comment les éditer ? Comment créer ses propres documents pdf pour diffuser et mutualiser ses productions ?

PDF = Portable Document Format

http://fr.wikipedia.org/wiki/Pdf : "Le Portable Document Format (qui se traduit de l’anglais en « format de document portable »), généralement abrégé PDF, est un format de fichier informatique créé par Adobe Systems, comme évolution du format PostScript.

L’avantage du format PDF est qu’il préserve les polices, les images, les objets graphiques et la mise en forme de tout document source, quelles que soient l’application et la plate-forme utilisées pour le lire."

Aussi, comme la modification (facilement) n’est pas autorisée, c’est un format intéressant pour diffuser ses documents sur le web.

Pratiquement, le format PDF est largement utilisé par les professionnels de la P.A.O.

Quels outils pour le particulier ? Une liste d’outils libres est présentée dans la rubrique de Framasoft PDF : Lire et Éditer.


Trouver des fichiers pdf

Ils sont partout ! Normal, c’est le format idéal pour diffuser un document sans autoriser sa modification. On les trouve donc partout sur le web et ils remplacent même la documentation imprimée des périphériques informatiques...

On trouve notamment des sites spécialisés dans diffusion et la recherche de documents au format pdf : scribd.com, pdf-search-engine.com...

Téléchargement des fichiers pdf, quelques astuces :
- lorsqu’on trouve un lien vers un fichier pdf sur le web, il est préférable de l’enregistrer sans l’ouvrir (clicD>Enregistrer la cible du lien sous...) plutôt que de l’ouvrir directement dans le navigateur. Lire à ce propos les conseils sur le site du CNDP (lien).

- Lorsque plusieurs documents PDF sont téléchargeables sur une même page web (par exemple celle-ci), il peut être utile d’automatiser leur téléchargement : c’est justement le rôle du plugin DownThemAll pour Firefox [1]


Lire les fichiers PDF

- La plupart des utilisateurs utilise le lecteur historique Adobe Reader : il est souvent proposé de l’installer sur les sites web qui diffusent des fichiers pdf. Un guide d’utilisation est consultable sur le site d’Adobe.

  • Avantages : gratuit, complet (trop ?), la barre d’outils permet notamment de copier du texte(1) et de faire des captures des images (2).
  • inconvénients : lourd, lent à démarrer, chaque version nouvelle nécessite une configuration plus puissante (lire les configurations requises sur le site d’Adobe)...

- Foxit Reader est une alternative gratuite intéressante : le logiciel démarre plus rapidement et permet également de capturer texte (1) et images (2) :

- Autre alternative intéressante au trop lourd lecteur d’Adobe, Sumatra PDF peut vous intéresser (seulement sous Windows). Ce logiciel est rapide, et il existe également en version portable.


Créer des fichiers PDF

Jusqu’à quelques années, il fallait se procurer Adobe Acrobat (payant !) pour créer des fichiers pdf.

Heureusement, les choses ont bien évolué :

- OpenOffice.Org, la suite bureautique libre propose directement d’imprimer en pdf (bouton pdf de la barre d’outils standard) :

- PdfCreator est une imprimante virtuelle aussi indispensable que simple d’utilisation : lorsque vous voulez convertir un document en pdf, faites simplement Fichier>Imprimer et sélectionnez PdfCreator dans la liste des imprimantes :

- Avec Linux, PdfCreator est inutile : il suffit d’imprimer dans un fichier pour créer un document .pdf ou .ps

- Google Docs est une suite bureautique en ligne gratuite qui permet de créer des documents et de les enregistrer en PDF.

- http://www.htm2pdf.co.uk/ , http://www.web2pdfconvert.com/, http://www.pdfmyurl.com/ sont des sites web (ne nécessitent donc pas d’installation !) qui permettent de convertir une page web en fichier pdf téléchargeable.

L’intérêt ? La qualité des fichiers (parfois meilleure qu’avec pdfcreator), le fait de ne pas avoir à installer pdfcreator, l’opportunité de sauvegarder proprement un document (si vous ne connaissez pas l’extension ScrapBook pour Firefox)

- Scribus, le logiciel libre de P.A.O qui monte, est réputé pour créer des documents pdf d’excellente qualité.

- Les scientifiques auront grandement intérêt à explorer la piste LateX [2] pour créer des documents magnifiques. Tous les sujets de concours et examens sont édités avec cet outil génial (voir notamment l’édition d’équations)... À ce propos, SPIP permet d’insérer des formules LateX dans les articles (SPIP est un CMS, ce site est motorisé par SPIP).


Manipuler et exploiter les fichiers pdf

Si la plupart des utilisateurs se contentera des outils précédents, on peut avoir besoin de certaines fonctionnalités avancées :

- Éditer les fichiers pdf

  • Importer une page pdf dans Inkscape : depuis la version 0.46, Inkscape permet d’importer des documents pdf... Très pratique pour créer vos propres documents pédagogiques à partir de sources glanées sur le web... Tout en respectant les droits d’auteur !

- Ré-organiser des documents pdf

  • Livret v0.2 permet de ré-agencer un fichier pdf en livret recto-verso (certaines imprimantes savent le faire directement) mais l’outil vaut le détour.
  • Le logiciel libre PDF Split and Merge permet de scinder (split) des documents pdf en plusieurs documents, de fusionner(merge) plusieurs documents pdf en un seul. De plus il existe pour Windows, Linux et Mac.

  • Le site http://pdfhammer.com/ permet de faire la même chose en ligne : assembler, réorganiser les pages d’un document pdf.

- Convertir un fichier pdf en un autre format texte

  • http://pdftextonline.com/ : ce site web permet de convertir les documents pdf en fichiers- texte bruts... sans formatage aucun !
  • Convertir un fichier pdf en document Word (.doc) : http://www.convertpdftoword.net/fr.aspx : si la sélection de texte est généralement suffisante, ce service en ligne gratuit permet de transformer un document pdf en document MS Word... À ouvrir avec OpenOffice.org bien sûr !

- Transformez vos pdf en livres virtuels : http://issuu.com/ : un service web récent pour publier sur le web vos productions pdf.

- Dans le même esprit, vous pouvez convertir vous documents pdf en animations SWF pour les diffuser sur le web : SWFTOOLS est une collection d’outils pour convertir divers formats en objets SWF (pour Windows et Linux) :

- Extraire les images incluses dans un du document pdf :

  • Pour extraire une image d’un fichier pdf, une capture d’écran peut suffire,
  • SomePdfImageExtract vous permettra d’extraire dans un dossier TOUTES les images d’un document pdf sous Windows... Utile pour gagner du temps,
  • Vous pouvez également utiliser PDF Image Xtractor qui ne nécessite pas d’installation (pratique sur clé USB),

  • Sous linux, vous pouvez utiliser un simple script (lien) ou installer Xpdf.

- Convertir un fichier pdf en images

  • pour une page unique, PDFCreator fait très bien l’affaire : imprimez votre fichier pdf avec PDFCreator et choisissez simplement un format de sortie au format image ;
  • pour un fichier pdf multipages, j’ai dû chercher (si vous avez mieux, je suis preneur !)... avec Gimp et le greffon continuous-save.scm à installer dans le répertoire GIMP\share\gimp\2.0\scripts :
    • Ouvrez le fichier pdf avec GIMP : une fenêtre permet de choisir la résolution de l’image (i.e. la taille), les pages sont réparties dans des calques,
    • Le scrip Continuous Save (Menu Script-Fu>Utils>Continuous save) permet ensuite d’exporter tous les calques vers des fichiers images... CQFD !
    • Note : Si votre GIMP n’ouvre pas les fichiers pdf, vous avez peut-être besoin de faire la manipulation décrite ici  ;
  • MAJ le 24/06/2010 : voici une solution logicielle plus simple ! 123 pdf to image. Attention, la version gratuite est limitée aux documents de moins de 50 pages... Et ne fonctionne pas sous linux !

À compléter...


D’autres listes d’outils pdf ?
- http://en.wikipedia.org/wiki/List_o...
- http://freewares-tutos.blogspot.com...
- http://www.lea-linux.org/documentat...
- http://www.iquid.fr/dossiers/devene...
- ...

Version à imprimer

FORUM


Répondre à cet article
Creative Commons License
Le contenu de ce site est mis à disposition par Christophe Coubret sous un contrat Creative Commons. | Site réalisé avec SPIP
Ce site respecte la charte de l'anneau Sitinstit