Donnez vie à vos documents numériques !
 

Reconnaissance du texte sur liste à numéro ne fonctionne pas

abracadabraPDF Forums PDF – Général Reconnaissance du texte sur liste à numéro ne fonctionne pas

  • Ce sujet est vide.
  • Créateur
    Sujet
  • #46131
    So
    Membre

    Bonjour groupe, j’espère pouvoir avoir votre aide rapidement.

    J’ai un document provenant de Word (815 pages) qui contient des listes hiérarchiques. J’utilise Acrobat XI. La reconnaissance de texte fonctionne très bien sur la plupart des chiffres qui contiennent d’autres chiffres suivant le point (exemple 490.1 fonctionne bien lors d’une recherche)… tous les nombres se terminant par un point, (exemple 490. ne fonctionne pas dans la recherche) … les chiffres restent en image. Donc à partir de la liste à numéro tous les points principaux jusqu’au point 875. ne fonctionnent pas dans la recherche.

    J’inclus la table des matières pour vous donner un exemple concret en petit format. Pouvez-vous m’aider ?
    :mur:

    Il ne semble pas avoir vu de sujet ouvert concernant ce problème. Étant des règlements, je ne peux pas modifier le type de liste.

Affichage de 15 réponses de 1 à 15 (sur un total de 15)
  • Auteur
    Réponses
  • #66161
    Merlin
    Maître des clés

    Ce document PDF n’a pas été créé depuis Word, ce sont des pages imprimées qui ont été scannées avec Acrobat Pro (c’est indiqué dans les métadonnées).

    L’idéal serait de partir du document Word original, est-ce possible ?


    PS : ton Acrobat Pro devrait être en version 11.0.23, pas en version 11.0.0 : mise à jour !!!
    Voir : https://www.abracadabrapdf.net/ressources-et-tutos/acrobat-reader/acrobat-11-fin-de-vie/

    #66162
    So
    Membre

    Bonjour,

    Voici un autre fichier pdf dont aucune page n’a été extraite.

    Merci de nouveau

    #66163
    bebarth
    Maître des clés

    bonjour,
    Pour le niveau des numéros de chapitres se terminant par un point, ce numéro n’est pas reconnu comme du texte, mais comme une image.
    Je ne sais pas comment a été généré le pdf, mais pour moi problème vient de la feuille de style de ce niveau sous Word. La police est-elle identique aux autres niveaux.
    Peux-tu partager une partie de ton fichier Word ?
    @+
    :bonjour:

    #66164
    So
    Membre

    J’ai vérifié dans Word et la police est identique, de même que la liste a numéro. Le site n’accepte pas les documents word mais je peux tenter de vous le faire parvenir en changeant l’extension en .jpeg .
    Je ne sais pas si ceci fonctionnera si vous le renommez en .docx

    #66165
    bebarth
    Maître des clés

    bonjour,
    Le pdf généré sur Mac fonctionne !!! :Euuuh:
    Je vais essayé de regarder pourquoi !
    @+
    :bonjour:

    #66166
    So
    Membre

    Bonjour,
    C’est bien étrange ! merci pour votre aide c’est très apprécié!  :priere:

    #66167
    Merlin
    Maître des clés

    Le site n’accepte pas les documents word

    C’est corrigé, j’ai aussi ajouté ses cousins de la suite Microsoft.
    Ce qui fait en tout comme types de fichier acceptés : gif,jpg,jpeg,png,tif,tiff,fdf,pdf,zip,txt,rtf,idml,docx,xlsx,pptx

    :extra:

    #66168
    So
    Membre

    Merci Merlin!  :Smiley00:

    #66169
    bebarth
    Maître des clés

    bonjour,
    Je viens de me rappeler que j’ai eu “plusieurs fois”, pour ne pas dire “toujours”, des soucis pour générer des fichiers .pdf avec les “nouvelles” versions Word (depuis Word 2010 je crois) que j’ai réussi à résoudre en ré-enregistrant les fichiers au format .doc.
    Ce n’est pas toujours possible selon l’utilisation de nouvelles fonctionnalités, mais (pour moi en tout cas) ça à toujours fonctionné, et c’est apparemment le cas pour ton fichier.
    Je ne peux t’expliquer le pourquoi, mais j’ai eu de très nombreux fichiers pdf à générer depuis Word sous Windows, et pratiquement à chaque fois que c’était un fichier .docx je le ré-enregistrais en .doc sans même vérifier si le .docx fonctionnait correctement !!!
    …et crois moi, j’en ai fait un paquet.

    …et je rajoute une précision :
    Je n’ai jamais eu de problème avec des documents .docx créés sous Word Mac et dont je générais les fichiers .pdf sous Windows dont le pdfMaker permet de générer automatiquement les signets.
    …et ça aussi j’en ai fait un paquet.

    @+
    :bonjour:

    PS: Je n’ai pas joint le fichier .doc car il n’est pas autorisé et je te laisse faire l’essai sur le document complet !!!
    Tu me diras le résultat…

    #66170
    Merlin
    Maître des clés

    Je n’ai pas joint le fichier .doc car il n’est pas autorisé

    Les fichiers aux formats .doc, .xls et .ppt ne sont pas acceptés car ils ne sont pas compressés, car ils sont potentiellement dangereux et surtout car ils sont obsolètes.
    :geek:

    #66171
    Merlin
    Maître des clés

    J’ai résolu beaucoup de problèmes de ce genre en ouvrant le fichier DOC ou DOCX avec LibreOffice et en exportant en PDF depuis LibreOffice.
    :soleil:

    ==> https://fr.libreoffice.org/download/telecharger-libreoffice/

    #66172
    So
    Membre

    Merci je vais vérifier avec libre office et je vais venir vous aviser si ça fonctionne!

    #66173
    Merlin
    Maître des clés

    Merci de nous dire ce que ça donnera, mais ce n’est pas urgent.
    :Smiley01:

    #66174
    So
    Membre

    Bonjour,

    J’ai tenté avec Libre Office mais ça ne fonctionne pas sur plus de la moitié des 850 pages et ça change la police drastiquement et eurkkk.

    Finalement, la solution a été trouvé (tellement simple que ça m’a paru évident  :oh: ).

    À partir de Word, ne pas faire Exporter au format PDF mais plutôt choisir Enregistrer sous… , changer le Type pour PDF et modifier les options afin de cocher la case Compatible ISO 19005-1 (PDF/A)

    #66175
    Merlin
    Maître des clés

    :bravo:

Affichage de 15 réponses de 1 à 15 (sur un total de 15)
  • Vous devez être connecté pour répondre à ce sujet.