Donnez vie à vos documents numériques !
 

Comment fractionner un fichier PDF en plusieurs fichiers PDF ? – RÉPONDU

abracadabraPDF Forums PDF – Général Comment fractionner un fichier PDF en plusieurs fichiers PDF ? – RÉPONDU

  • Ce sujet est vide.
  • Créateur
    Sujet
  • #44258
    Becarbonfree
    Membre

    Bonjour,

    J’ai un problème que je vais illustrer par un exemple.
    J’ai un fichier pdf créé à partir de CEGID Expert Paie qui contient 30 bulletins de salaires. Je cherche un moyen de fractionner ce fichier PDF en 30 fichiers PDF en nommant automatique chacun des 30 fichiers avec des données (récupérées par OCR ou autre moyen ?) se trouvant dans chaque pdf (date de paie, matricule salarié et nom du salarié…).

    J’ai essayé sans succès avec Acrobat Pro v9.5.2 et Omnipage Pro v15.2 mais peut être n’ai je pas essayer toutes les fonctionnalités.

    J’espère que j’ai été explicite dans l’explication de ma problèmatique.

    Merci de votre aide.

    Bien cordialement

    Patrice

Affichage de 5 réponses de 1 à 5 (sur un total de 5)
  • Auteur
    Réponses
  • #53484
    Merlin
    Maître des clés

    Bonjour et bienvenue,

    – il faudrait savoir si les PDF générés par CEGID Expert Paie sont de « vrais » PDF contenant du texte et des informations « intelligentes », ou bien si ce ne sont des images (amas de pixels inintelligents) emballées au format PDF.
    Parce-que dans le 2e cas il faudra avoir recours à l’OCR, et selon la qualité des « images » le résultat de l’OCR est plus ou moins prédictible…

    – dans tous les cas le fractionnement des PDF est un jeu d’enfant, ce qui est compliqué et ce qui va requérir un développement JavaScript spécifique c’est le renomage automatique des fichiers en fonction des infos contenues, qu’il faut localiser et extraire.

    :Smiley01:

    #53485
    Becarbonfree
    Membre

    Bonjour,

    Merci pour votre réponse et votre rapidité

    Je pense en effet que ce sont des « pixels inintelligents  » mais dont la qualité d’image est plus que correcte.

    Concernant le développement JavaScript spécifique pour le renomage automatique des fichiers, est ce que l’extraction et la localisation seront plus simples dans la mesure où les informations sont situées au même endroit sur chaque page ?

    Existe-t-il des outils « standards » pour le faire? (même si je pense que non) :Smiley03:

    Merci encore.

    Très cordialement

    #53486
    Merlin
    Maître des clés

    Il est impératif que les éléments soient toujours au même emplacement.
    Et donc, non. Il n’y a pas d’outils standard : développement sur-mesure.
    :Smiley01:

    #53487
    alex
    Membre

    Mon cher Merlin, je te rappelle que nous avons développé ensemble un script d’extraction de factures pour Acrobat au mois d’avril (dernière version du 26 avril) répondant à ce problème… Or dans ce script, nous avions fonctionné à partir de la détection du mot clef « Facture » puis sur le contrôle de cohérence du numéro de facture (nombre, nature des caractères) pour fractionner une liasse de factures ayant un nombre de pages variables. En général les applications générant des factures au format .pdf sont compatibles avec la méthode que nous avons utilisée (getNthWord()) pour récupérer les chaînes de texte à analyser.

    #53488
    Merlin
    Maître des clés

    Là, on passe directement du développement personnalisé au développement personnalisable.
    :extra:

Affichage de 5 réponses de 1 à 5 (sur un total de 5)
  • Vous devez être connecté pour répondre à ce sujet.