Donnez vie à vos documents numériques !
 

Scan PDF, OCR et fichier Excel

abracadabraPDF Forums PDF – Général Scan PDF, OCR et fichier Excel

  • Ce sujet est vide.
  • Créateur
    Sujet
  • #46429
    Jimi4270
    Membre

    Bonjour à tous,

    voici ma problématique. Je dois traiter des fichiers similaires qui comportent plusieurs références.
    J’aimerais extraire “à la volée” des informations du PDF en question. J’aimerais qu’une zone soit “scanné OCR” et que les résultats se mettent sur une colonne Excel et que cela s’applique pour toutes les pages du PDF.

    Ayant un peu de mal à exprimer mon besoin, j’ai mis une photo.

    Un grand merci pour votre aide :)

    Bonne journée à vous

Affichage de 7 réponses de 1 à 7 (sur un total de 7)
  • Auteur
    Réponses
  • #68196
    bebarth
    Maître des clés

    bonjour,
    C’est possible si tu utilises Acrobat Pro. !
    Les données à extraire se situent toujours au même endroit sur les pages ?
    Il faudra partager quelques pages afin de déterminer exactement la zone.
    @+
    :bonjour:

    #68197
    Jimi4270
    Membre

    Merci pour ce retour rapide !
    Oui c’est toujours dans la même zone, je télécharge acrobat pro illico.

    #68198
    Jimi4270
    Membre

    Bon alors, j’ai téléchargé Adobe Pro. C’est génial !
    Mais je ne trouve pas comment je peux:
    – extraire plusieurs zones de textes dans une même page et que ce la s’applique sur les mêmes zones.
    – affilier chacune des zones à une colonne excel.

    Je cherche mais impossible :/

    #68199
    bebarth
    Maître des clés

    C’est normal, parce que c’est possible… mais avec un peu de programmation !!!
    Une dernière remarque, si ce sont des scans, il faut qu’ils soient de bonne qualité pour que la fonction OCR reconnaisse bien tous les caractères, et qu’ils n’aient pas été scannés trop de travers.
    Je peux t’aider, mais il faudra partager quelques pages et me donner quelques indications (ou se trouve la référence à récupérer, en 1 mot ou en plusieurs, s’il y a plusieurs variantes, etc.).
    Si tu ne veux pas partager sur le forum, tu peux trouver mon adresse e-mail en cliquant sur mon pseudo.
    Sinon, il faudra trouver une autre solution.
    @+
    :bonjour:

    #68200
    Merlin
    Maître des clés

    Bonjour

    Tabula est un utilitaire gratuit dédié à l’extraction de données dans des PDF et importation dans un tableur : https://tabula.technology/
    Il en existe un autre à petit prix qui ne fonctionne que sur MacOS et certainement plus facile d’utilisation mais je ne me souviens plus de son nom.

    Par-contre ces deux utilitaires ne font ni scan ni OCR, donc Acrobat Pro ne sera pas inutile.

    #68201
    gagalo
    Membre

    OCR ???????????????????????????????
    PDF ?????????????????????????????????
    OCR ???????????????
    PDF ?????
    Excel ????
    Renee PDF Aide

    #68202
    Merlin
    Maître des clés

    1000 excuses, je l’avais oublié.

Affichage de 7 réponses de 1 à 7 (sur un total de 7)
  • Vous devez être connecté pour répondre à ce sujet.