Comment convertir des pages HTML ou un site complet (en ligne ou en local) au format PDF avec Adobe Acrobat 5/6/7/8/9, tout en conservant les hyperliens et la structure des fichiers originaux.
Convertir des pages HTML ou un site entier au format PDF trouve de multiples applications dans tous les domaines, de la simple documentation technique en-ligne que l'on veut garder sous la main jusqu'à l'archivage de toutes les versions du site d'un client, ce ne sont pas les exemples qui manquent.
Car les fichiers ainsi créés ne sont pas statiques, il suffit ensuite de les mettre à jour.
Tuto vidéo :
Durée : 6'51
Astuce : si la lecture de la vidéo est saccadée, mettez là en pause et attendez son chargement complet (barre de progression grise) avant de relancer la lecture. Veuillez accepter nos excuses pour la mauvaise qualité sonore de cette vidéo.
Tuto classique :
Il faut commencer par régler les Préférences de Capture Web :
Menu Édition (menu Acrobat dans Mac OSX) --> Préférences --> Capture Web… (ou Web Capture selon les versions).
Il faut sélectionner l'ouverture des liens web dans Adobe Acrobat, c'est ce qui permettra par la suite d'ajouter des pages HTML au document PDF nouvellement créé simplement en cliquant sur les hyperliens. Sinon (réglage par défaut) les pages cibles des liens cliqués s'affichent dans le navigateur web. Cette option reste modifiable à la volée via un clic-droit sur le lien.
Il faut aussi cocher l'affichage des signets..., c'est toujours plus facile pour s'y retrouver ensuite.
Capturer :
Menu Outils (Options avancées dans la version 6) --> Capture Web --> Ouvrir une page web… ou via le menu Fichier.
Pour la capture en ligne, copiez-collez une URL depuis un navigateur, ou entrez la au clavier. Pour la capture sur un volume local il faut 'Parcourir…' et désigner le fichier HTML.
Ici on va télécharger uniquement les pages incluses dans le chemin (l'URL) sur deux niveaux, c'est-à-dire la page dont on a inscrit l'URL et toutes celles qui lui sont immédiatement liées. Les 'niveaux' correspondent à la profondeur de l'arborescence des fichiers HTML. L'option 'un seul serveur' évite de charger des pages inutiles (liens vers des publicités ou des logiciels gratuits comme QuickTime, Adobe Reader, RealPlayer.) et devient donc quasiment indispensable si l'on augmente le nombre de niveaux.
L'explicite option 'Télécharger le site entièrement' prend le pas sur les autres mais elle est à manier avec précaution dans le cas d'une capture en ligne. Il faut connaître le site visé sous peine de se retrouver avec des disques durs saturés après de longues heures de connexion ! Cette option est plus maniable dans le cas de capture hors ligne.
Il faut ensuite régler les options de conversion :
Onglet 'Général'
Les cases à cocher sont explicites.
'Créer les signet' ajoute un signet reprenant le nom de chaque page HTML, ou à défaut son nom de fichier.
'Créer les balises PDF' ajoute des sous-signets structurés.
'Enregistrer les actualisations' permet les mises-à-jour du fichier PDF. C'est-à-dire de recharger ultérieurement les éléments modifiés du site, sans tout recommencer.
En sélectionnant Texte ou HTML dans la fenêtre centrale on accède à des options de conversion qui sont propres à chaque format.
Une option du format HTML permet de ne pas convertir les images capturées, pratique pour l'archivage (par défaut elles sont recompressées en ZIP ou JPG, en fonction de leur nature). Une autre option permet l'incorporation des polices : indispensable !
Onglet 'Mise en page'
Ici deux stratégies possibles en fonction de la destination du document :
si on doit l'imprimer on préférera un format de papier standard type A4 et on cochera "Ajuster le contenu…". (Les surfaces vierges et inutiles des pages plus courtes n'augmentent pas la taille du fichier.)
si on prévoit plutôt une consultation à l'écran il est préférable de conserver la hauteur des futures pages PDF identique à celle des pages HTML, qui sont parfois très longues (comme celle-ci), auquel cas on ne cochera pas "Ajuster le contenu…".
L'avantage c'est qu'à chaque page HTML correspondra une seule page PDF et un seul signet, on conserve donc le même type de navigation et la même logique de présentation au lieu de se perdre dans des pages tronçonnées et en surnombre. La hauteur maximale est de 508 centimètres (200 pouces).
Il n'y a plus qu'à «capturer» en validant les deux boîtes de dialogues.
Ne perdez pas votre temps à regarder les fichiers défiler dans la boîte d'état de Web Capture, Adobe Acrobat fonctionne parfaitement en tâche de fond !
Navigation dans le fichier PDF
Affichez en 'Taille écran' pour recadrer les pages (trop) longues avec l'outil de recadrage, cela évitera les pages blanches à l'impression, et aux utilisateurs du document de faire défiler des kilomètres de vide. Dans le cas de nombreuses pages on peut plus simplement recadrer toutes les pages en même temps après avoir repéré la plus longue en s'aidant des vignettes (le recadrage dans Adobe Acrobat est toujours réversible).
Lors du survol d'un lien dans le nouveau document PDF, le curseur peut prendre deux formes : la forme normale du curseur 'main' d'Adobe Acrobat lorsque la cible est déjà incorporée au PDF, et ce même curseur contenant le signe [+] lorsque la page cible n'est pas incorporée et qu'il faut la télécharger (l'URL cible s'affiche en info-bulle). Il suffit de cliquer sur le lien pour convertir la page HTML cible et ainsi l'ajouter au document existant.
Par la suite, pour mettre le document à jour il faudra utiliser le menu Outils --> Capture Web --> Actualiser, ou le menu Options avancées dans Adobe Acrobat 6 Pro.
Réglages d'ouverture
Menu Fichier --> Propriétés du document --> Options d'ouverture…
Acrobat 5
Acrobat 6
Sélectionnez 'Pleine largeur' et 'Une seule page' pour conserver un mode de navigation semblable aux fichiers HTML.
'Afficher le titre' ne fonctionne que dans Adobe Acrobat ou Adobe Reader à partir de la version 5, et ne fonctionne pas du tout dans les navigateurs web.
'Redimensionner pour contenir…' a un comportement fantaisiste sous Windows, si Adobe Acrobat est déjà ouvert, la fenêtre reste quand même en plein écran. Si Adobe Acrobat se lance à l'ouverture du document, ça fonctionne parfois…
Enregistrez sous… à la fin du travail pour optimiser le fichier PDF.
Limitations :
Capture Web n'interprète pas toutes les subtilités du langage HTML actuel, les cadres (frames) notamment ne sont pas reconnus. Les fichiers HTML deviennent alors autant de pages PDF qu'il y a de cadres. Cependant, dans le cas d'un menu en colonne ou d'une barre de menus horizontale (c'est le cas du site abracadabraPDF, par exemple) cette faiblesse est très bien compensée par les signets du PDF.
Dans l'exemple ci-dessous,le menu en colonne (en jaune) n'était pas dans un cadre. Il fait presque double emploi avec les signets créés par Capture Web, 'presque' car ces signets n'existent que pour les pages déjà capturées.
Date de création : 13/02/2007 : 21:37
Dernière modification : 23/06/2010 : 04:19
Catégorie : Tutotrucs & astuces Page lue 388 fois
Ca ce n'est pas un commentaire, c'est une question pour le forum, où on se fera un plaisir d'y répondre…
En attendant il me parait indispensable d'effectuer les mises à jour, Acrobat est aujourd'hui en version 9.1.2.
:)
Réaction n°1
par pphil13 le 10/06/2009 : 17:42
Bonjour J'utilise acrobat pro 9.0 Tout d'un coup 'capture web' ne fonctionne plus depuis que je suis passé de la version 8 standart à 9 pro ( mais c'est peut-être une coïncidence ...) Il me renvoit le message suivant : fichier inconnu De quoi cela peut-il venir d'après vous ? D'avance merci
Les PDF nous facilitent bien la vie !
Ils sont partout, même lorsque vous installez un jeu vidéo, ou allez sur un casino en ligne. C’est tellement plus simple et plus pratique que de lire des pages et des pages sur un site internet…
Une petite révolution dans le monde de l’internet, qui pourrait vivre sans de nos jours ?
Toute reproduction même partielle du contenu de ce site sans autorisation est interdite
Tous droits réservés - abracadabraPDF 2001/2009 - JR Boulay
Designed and Hosted by : dvotocka