Donnez vie à vos documents numériques !
 

Conversion PDF/X via ACROBAT PRO fait perdre la recherche. – RÉPONDU

abracadabraPDF Forums PDF – Général Conversion PDF/X via ACROBAT PRO fait perdre la recherche. – RÉPONDU

  • Ce sujet est vide.
  • Créateur
    Sujet
  • #43989
    ALG-ECF
    Membre

    Bonjour,

    Je suis perplexe, un PDF 1.6 converti en PDF/X dans Acrobat Pro 8 me fait perdre la capacité de rechercher en full texte. La recherche est active avant conversion, elle ne l’est plus après. La taille du fichier montre que le texte a été vectorisé.

    Cette même conversion dans PITSTOP laisse la recherche intacte.

    Merci de votre aide.

Affichage de 7 réponses de 1 à 7 (sur un total de 7)
  • Auteur
    Réponses
  • #51943
    Merlin
    Maître des clés

    Bonjour et bienvenue sur le forum,

    il y a fort à parier que le paramètre de conversion en PDF/X utilisé force la vectorisation des caractères lors de l’aplatissement des transparences (obligatoire pour PDF/-1 et PDF/X-3).

    Pour en être certain il faudrait savoir comment tu fais pour convertir en PDF/X, et vers quel type de PDF/X précisément.
    😎

    #51944
    ALG-ECF
    Membre

    Merci pour l’accueil.

    C’est une conversion en PDF/X1a obtenue en imprimant dans le driver d’Acrobat avec un joboption paramétré en conséquence (joint). Ce qui est troublant, c’est que sur d’autres PDF cet aplatissement des transparences ne forçait pas la vectorisation.
    Quand je fais une tentative de reconnaissance OCR, il est retourné que c’est déjà du texte.

    [attachment deleted by admin]

    #51945
    Merlin
    Maître des clés

    Quelle est la version d’Acrobat utilisée ?
    Peux tu poster un exemple de fichier “vectorisé” ?

    #51946
    ALG-ECF
    Membre

    Version Acrobat Pro = 8
    Je joins un fichier vectorisé.

    [attachment deleted by admin]

    #51947
    Merlin
    Maître des clés

    C’est effectivement très curieux : le texte n’est pas recherchable, tout comme s’il était vectorisé alors qu’il est bien là en tant que texte…
    Je donne ma langue au chat ! (Mais je garde cet exemple dans ma collection de PDF à 5 pattes, ça intéresse toujours les développeurs).

    Cependant la méthode de conversion en PDF/X n’est pas bonne, avec Acrobat 8 il faut demander : menu Fichier : Exporter : PDF/X.
    Le réimpression virtuelle et la re-Distillation sont de toute façon fortement déconseillés, par Adobe notamment…
      :ampoule:

    PS : ne pas oublier d’effectuer les mises-à-jour, il me semble que actuellement Acrobat 8 est en version 8.2.6 (ou plus).

    #51948
    ALG-ECF
    Membre

    Du coup une question additionnelle : Comment peut-on détecter (en dehors de ce cas apparemment tordu) qu’un PDF est “searchable” ou pas ? Il y a une sans doute une propriété que peut détecter ACROBAT puisqu’il nous dit qu’on ne peut pas faire de l’OCR puisque le PDF contient du texte détectable.

    PS : Les bouton rouges avec texte en noir sont difficilement lisibles.

    #51949
    Merlin
    Maître des clés

    Je n’en n’ai aucune idée, mais il semble bien que l’on ait affaire à un cas particulier.
    Dans un PDF normal il y a du texte ou il n’y en pas, s’il y en a il est indexable et recherchable, et s’il n’y a pas de texte le PDF est OCRisable…
    :Euuuh:

    PS : Les bouton rouges avec texte en noir sont difficilement lisibles.

    Si jamais quelqu’un sait comment on peut modifier les CSS des Thèmes du forum qu’il n’hésite pas à se manifester.
    :Smiley03:

Affichage de 7 réponses de 1 à 7 (sur un total de 7)
  • Vous devez être connecté pour répondre à ce sujet.