Donnez vie à vos documents numériques !
 

Trier des pages sur un critere "texte"

abracadabraPDF Forums PDF – Général Trier des pages sur un critere "texte"

  • Ce sujet est vide.
  • Créateur
    Sujet
  • #45798
    moxuox
    Membre

    Bonjour à tous,

    J’ai fait quelques recherches sur le forum, mais je n’ai rien trouvé répondant à ma demande.
    Voici donc ce que je souhaiterais faire :
    Je reçois chaque semaine un fichier PDF contenant entre 1000 et 2000 pages.
    Ce que je voudrais réaliser, c’est d’après un critère “texte”, c’est a dire un mot,  extraire toutes les pages qui contiennent ce mot.
    Par exemple toutes les pages contenant “Rouen” serait exportées vers l’imprimante virtuelle.
    Cela semble simple, mais malgré mes recherches je n’ai pas trouvé.

    À noter que j’ai une version Pro d’Acrobat.

    Merci d’avance de votre aide !
    :soleil:

Affichage de 11 réponses de 26 à 36 (sur un total de 36)
  • Auteur
    Réponses
  • #63354
    Merlin
    Maître des clés

    1. Normalement le balisage automatique fonctionne directement, sans rien demander.
    Pas de souci pour l’automatiser (ci-joint).

    2. OK, je comprend.

    #63355
    bebarth
    Maître des clés

    bonjour,
    C’est ce que j’ai fait, mais lorsque je lance l’action ça demande de sélectionner une zone !
    @+
    :bonjour:

    #63356
    Merlin
    Maître des clés

    Ci-joint une action qui ne demande rien.
    Je suppose que tu n’as peut-être pas choisi la bonne commande.  :Euuuh:

    #63357
    bebarth
    Maître des clés

    bonjour,
    Voici le résultat final.
    Le fichier de l’action est en pièce attachée au document joint.
    Là aussi, je me suis un peu lâché !!!

    Ci-joint une action qui ne demande rien.

    Effectivement, elle ne demande rien et fonctionne très bien.
    Par contre, intégrée à mon script et sur un document de 1350 pages, j’ai fait un essai sans (4 minutes) et un essai avec (plus d’une heure et demi). Et il manque un fichier final !!!

    #63358
    Merlin
    Maître des clés

    et un essai avec (plus d’une heure et demi)

    Ça ne me surprend pas, ce sont des opérations complexes.
    En tout cas, chapeau bas encore une fois.
    :bravo:

    #63359
    Simon
    Membre

    Bonsoir à toutes et à tous,

    Je souhaitais te remercier pour ce script qui fonctionne à la perfection !!! Chapeau l’artiste !  :bravo: :bravo:

    Malheureusement, j’ai une petite erreur sur mon fichier de 160 pages :

    Recherche sur page 1
    TypeError: pts is null
    4990:byteCodeTool”

    La différence qu’il y a par rapport aux pages PDF que l’on a testé, c’est qu’il y a des pages sur lesquelles il n’y a pas le pied de page “Coupon à joindre à votre règlement” car il y a 3 pages de factures par exemple, et ce pied de page est inséré à la dernière page. J’ai essayé plusieurs scénarios, et dès l’absence de pied de page, le script bloque et affiche cette erreur.  :mur:

    Je te joins un fichier PDF qui reproduit cette erreur. La page 1 est correctement traitée (pied de page présent), tandis que l’erreur s’affiche sur la page 2 (pied de page absent) car le pied de page se situe sur la page 3.

    Je te remercie énormément pour ton aide.  :bonjour:

    Bonne soirée

    #63360
    bebarth
    Maître des clés

    bonjour,
    Je pense que le fait qu’il n’y a pas de coupon n’est qu’une coïncidence. Il doit y avoir une erreur (laquelle ????).
    Si tu lances l’action de balisage automatique de Merlin, il n’y a plus de problème :
    https://abracadabrapdf.net/forum/index.php?action=dlattach;topic=3410.0;attach=5162
    Ci-joint ton fichier après balisage automatique.
    @+
    :bonjour:

    #63361
    Simon
    Membre

    Je vous remercie vous deux, effectivement, il n’y a plus de message d’erreur.

    En revanche, après la fin du script, seulement 6 nouveaux fichiers ont été créés.

    Lorsque je relance le script, il m’extrait qu’une seule page sur les 156…  :doute:

    Création des différents fichiers
    Création dufichier pour N° de compte : Sans numéro de compte
    ––––––––––––––
    Fin du process : 02-04 22:50
    Durée du process : 3minutes 8.6 secondes

    Est-ce que cela signifie qu’il ne reconnait pas le nom de la société ?  :Euuuh:

    #63362
    bebarth
    Maître des clés

    bonjour,

    … Et il manque un fichier final !!!

    Lorsque j’avais essayé le balisage automatique, il me manquait également un fichier, mais je n’ai pas cherché le pourquoi !!!
    Dans la version précédente du script, le numéro de compte était supposé être le mot suivant le mot “Compte”, ce qui était apparemment tout le temps vrai avant le balisage.
    Après balisage, il semble que ce ne soit plus le cas. J’ai donc modifié le script qui maintenant revérifie tous les mots après avoir trouvé le mot “Compte”, qui vérifie si c’est bien un nombre et sa position par rapport au mot “Compte”.
    Idem pour les mots du nom de client.
    Ci-joint une nouvelle action qui du coup devrait être un peu plus lente…
    @+
    :bonjour:

    #63363
    Simon
    Membre

    Merci bien ! :)

    Je teste ce soir et je te fais un retour !

    Excellente journée.

    #63364
    Merlin
    Maître des clés

    Je teste ce soir et je te fais un retour !

    C’est un test vraiment approfondi !
    :Smiley01:

Affichage de 11 réponses de 26 à 36 (sur un total de 36)
  • Vous devez être connecté pour répondre à ce sujet.