Donnez vie à vos documents numériques !
 

Trier des pages sur un critere "texte"

abracadabraPDF Forums PDF – Général Trier des pages sur un critere "texte"

  • Ce sujet est vide.
15 sujets de 1 à 15 (sur un total de 37)
  • Auteur
    Messages
  • #45798
    moxuox
    Membre

    Bonjour à tous,

    J’ai fait quelques recherches sur le forum, mais je n’ai rien trouvé répondant à ma demande.
    Voici donc ce que je souhaiterais faire :
    Je reçois chaque semaine un fichier PDF contenant entre 1000 et 2000 pages.
    Ce que je voudrais réaliser, c’est d’après un critère « texte », c’est a dire un mot,  extraire toutes les pages qui contiennent ce mot.
    Par exemple toutes les pages contenant « Rouen » serait exportées vers l’imprimante virtuelle.
    Cela semble simple, mais malgré mes recherches je n’ai pas trouvé.

    À noter que j’ai une version Pro d’Acrobat.

    Merci d’avance de votre aide !
    :soleil:

    #63329
    Merlin
    Maître des clés

    Bonjour et bienvenue.

    Veux tu extraire les pages dans des fichiers séparés ou les réunir dans un seul ?
    Pourquoi les exporter vers une imprimante virtuelle ? Dans quel but ?

    #63330
    bebarth
    Maître des clés

    bonjour,
    Ce n’ai pas du « tout simple » mais j’ai déjà fait quelque chose comme ça…
    Même question que Merlin : au final tu veux des fichiers individuels ou un seul fichier final ?
    @+
    :bonjour:

    #63331
    moxuox
    Membre

    Bonjour,

    Je souhaiterai regrouper les pages  identiques dans un seul fichier.
    Par exemple un fichier « rouen » comme dans mon exemple, un autre « paris » un autre « marseille »
    L imprimante virtuelle c etait pour regouper ces pages en un fichier justement :)

    merci à vous !

    #63332
    bebarth
    Maître des clés

    bonjour,
    je pense que je devrais avoir quelque chose pour toi !
    Je n’aurais pas le temps de regarder ce weekend, mais promis dès lundi.
    @+
    :bonjour:

    #63333
    Merlin
    Maître des clés

    L’imprimante virtuelle c’était pour regrouper ces pages en un fichier justement

    Pourquoi il ne faut jamais faire ça : https://is.gd/sRpyYK

    La fonction d’enregistrement d’Acrobat Pro est plus simple à utiliser et pas du tout destructrice pour les fichiers PDF.

    #63334
    moxuox
    Membre

    merci à vous deux pour toutes ces infos !  :bonjour:
    à lundi !  :extra:

    #63335
    bebarth
    Maître des clés

    bonjour,
    voici donc une action que j’ai créé à partir de 2-3 scripts déjà réalisés (il reste peut être quelques variables inutiles…).
    Ici, pour accélérer le processus, je ne vérifie qu’une fois si le mot est présent sur la page, puis passe à la page suivante.
    J’ai fait quelques vérifications et cela fonctionne. J’espère n’avoir rien oublié, sinon merci de me signaler le/les problèmes(s).
    @+
    :bonjour:

    #63336
    moxuox
    Membre

    Bonjour, tout d’abord merci pour le script ! je suis un néophyte dans ce domaine, mais j ai reussi à le recuperer via Notepad++ et l’inserer dans le fichier. Toutefois, il me donne un message d’erreur le voici : Syntaxerror : missing ; before statement 3 : à la ligne 4
    la j’ai essayé de modifier , mais rien n y fait .  Merci !

    #63337
    bebarth
    Maître des clés

    bonsoir,
    pourquoi ne charges-tu pas l’action ??? juste un double clique sur le fichier .sequ puis tu la lances (cf. copies d’écrans).
    Je viens de chercher le mot « document » et extraire les pages dans l’api reference (779 pages) sans aucun problème en un peu plus de 5 minutes !!!
    @+
    :bonjour:

    #63338
    moxuox
    Membre

    Merci Bebarth ! ça marche très bien ! je pensais qu’il fallait insérer le script directement… avec ta méthode c est nettement plus simple ! petite question : dans le fichier généré, le mot clé est encadré en rouge. Comment supprimer ce cadre? le but est de pouvoir retrouver les pages sélectionnées dans leur état initial.
    Encore merci pour ce script et pour ton aide ! :)

    #63339
    bebarth
    Maître des clés

    bonjour,
    dans ce cas, tu supprimes les lignes :

    Code:
                //Créer un rectangle sur le mot trouvé
                var q = this.getPageNthWordQuads(p, i);
                …
                // Epaisseur des bords
                l.borderWidth = 2;

    @+
    :bonjour:

    #63340
    moxuox
    Membre

    Merci Bebarth, je regarde ça dans le week end ! mais ça marche c’est top ! :)

    #63341
    Merlin
    Maître des clés
    #63342
    Simon
    Membre

    Bonjour à toutes et à tous,

    Je recherche également une solution pour pouvoir extraire toutes les pages contenant un mot clé (numéro d’identifiant).

    Un de mes programmes génère environ 200 pages de factures. Exemple :

    Page N°1 : Facture Client A
    Page N°2 : Facture Client A
    Page N°3 : Facture Client A
    Page N°4 : Facture Client B
    Page N°5 : Facture Client C
    etc..

    Je peux les distinguer par le numéro d’identifiant du client. (A, B, C, etc.)

    Je souhaite que toutes les factures du Client A soient dans un seul fichier pdf, les factures du Client B dans un autre fichier pdf, etc.

    Je dispose d’Adobe Pro également.
    [font=verdana, arial, helvetica, sans-serif]Pouvez-vous me venir en aide ?[/font] :geek:

    Merci à vous :)

15 sujets de 1 à 15 (sur un total de 37)
  • Vous devez être connecté pour répondre à ce sujet.