Donnez vie à vos documents numériques !
 

Réactiver la reconnaissance de caractères dans un PDF

abracadabraPDF Forums PDF – Général Réactiver la reconnaissance de caractères dans un PDF

  • Ce sujet est vide.
  • Créateur
    Sujet
  • #45229
    bendesarts
    Participant

    Bonjour,

    Sur un PDF, j’ai effectué les manips suivantes avec Adobe Acrobat :

    1) Recadrage de mon texte
    2) Reconnaissance de texte (outils –> Reconnaissance de texte)
    3) Imprimer à nouveau le PDF en un nouveau PDF de façon à agrandir mon texte.
    Mon problème est le suivant :

    Surement à cause de l’étape 3, je n’arrive plus rechercher des mots dans le texte. En d’autres termes, si j’utilise la fonction recherche, aucun mot dans mon texte n’est accessible.

    J’ai alors tenté de réappliquer à nouveau la reconnaissance de texte mais j’obtiens le message suivant :
    “Acrobat n’a pas pu procéder à la reconnaissance de texte de la page pour la raison suivante : La page contient du texte à générer”.

    Bref que mes pages ont déjà été traduites en texte.

    Question :
    Comment est-ce que je peux faire pour faire que la fonction recherche puisse à nouveau fonctionner ?

    Merci pour vos lumières

Affichage de 3 réponses de 1 à 3 (sur un total de 3)
  • Auteur
    Réponses
  • #59443
    Merlin
    Maître des clés

    Bonjour.

    C’est l’étape 3 qui bousille tout : il ne faut jamais “réchauffer” un PDF.
    Tout est expliqué là : http://abracadabrapdf.net/ressources-et-tutos/prepresse-ressources/refrying-pdfs-en-v-f/

    C’est d’autant plus dommage que, a priori, cette étape ne sert à rien.
    Pourquoi vouloir “agrandir” un PDF ?

    Un PDF ne peut être vu qu’à l’écran et sur papier, après impression.
    Dans les deux cas on peut zoomer (écran) ou agrandir (impression).

    Pour obtenir du texte vectoriel après la reconnaissance de caractères, et donc zoomable à l’infini, il faut sélectionner l’option “Clear Scan” (devenue “Textes & images modifiables” dans Acrobat DC).

    :Smiley01:

    #59444
    bendesarts
    Participant

    Bonjour,

    Merci pour ta réponse claire.

    1) Je confirme : tu m’as bien pointé sur la cause de mon soucis (=étape 3).

    2) En fait, l’étape 3 m’a permis d’ajuster le recadrage effectué à l’étape 1 sur un format A4. Ceci m’a permis d’imprimer mon document de manière agrandi au format A4.

    3) Pour l’étape 2, j’avais bien fait reconnaissance de texte avec ClearScan.

    Question:
    Heureusement, j’ai gardé mon pdf source recadré (avant reconnaissance de texte).
    Comment est-ce que je peux faire pour obtenir mon texte :
    – reconnu au niveau des caractères
    – au format A4 ?

    J’avais choisi de réaliser les étapes mentionnées précédemment :
    1) Recadrage de mon texte2) Reconnaissance de texte (outils –> Reconnaissance de texte)3) Imprimer à nouveau le PDF en un nouveau PDF de façon à agrandir mon texte.
    car il me semble que , lors de la reconnaissance de texte, le texte est remis bien à l’horizontal avant que la reconnaissance de caractères commence.

    Pour avoir le résultat escompté, il faudrait que je puisse faire les étapes suivantes :
    1) déjà fait -> je pars de mon fichier recadré
    2) mis d’aplomb c’est-dire texte bien à l’horizontal –> là je ne sais pas faire. Si tu as une idée de comment, je suis interessé?
    3) Centrage et agrandissement au format A4 –> là, je ne sais faire qu’en relançant une impression de mon pdf.
    4) Lancer la reconnaissance de texte en dernier pour ne plus rencontrer le problème que tu m’as évoqué à savoir : “réchauffer” un pdf.

    Peux-tu me conseiller une procédure pour arriver à mes fins ?

    Je te remercie d’avance pour ton aide.

    #59445
    Merlin
    Maître des clés

    Avant passage dans Acrobat ces pages ne sont que de “bêtes” images scannées, c’est donc avec un logiciel de traitement d’image qu’il faut les agrandir et les recadrer.

    De plus, avec des poids lourds comme Photoshop ou GIMP c’est automatisable (sauf le redressement mais Acrobat le fait très bien pendant l’OCR).

    Sinon, tu peux éventuellement bricoler avec Acrobat, c’est-à-dire :

    – Créer un PDF vierge au format A4 (avec les abracadabraTools par exemple).
    – Ouvrir la palette des calques et “importer sous forme de calque” le document à agrandir. Les options de placement sont assez riches.
    – Aplatir les calques.

    On peut aussi faire presque la même chose avec l’outil Filigrane.

    :Smiley15:

Affichage de 3 réponses de 1 à 3 (sur un total de 3)
  • Vous devez être connecté pour répondre à ce sujet.