Donnez vie à vos documents numériques !
 

surlignage et export du texte selon la couleur choisie

abracadabraPDF Forums PDF – Général surlignage et export du texte selon la couleur choisie

  • Ce sujet est vide.
  • Créateur
    Sujet
  • #45480

    Bonjour,

    je dispose d’un volumineux fichier pdf  sur le thème de la mythologie.
    Mon objectif est de créer une fiche  pour chacun des dieux. Or le livre  n’est pas structuré par dieu mais par histoires dans lesquelles interviennent une ou plusieurs divinités.

    Après une recherche par mot , j’ai surligné les paragraphes du pdf avec la même couleur pour chaque dieu  : rouge pour ce qui se rapporte à “Jupiter”, jaune pour “Mars” ,….

    Existe  t il un moyen d’extraire tous les bouts de texte par couleur : je voudrais par exemple récupérer le texte de tous les paragraphes surlignés en rouge qui concernent jupiter ?

    merci pour votre aide
    L

Affichage de 6 réponses de 1 à 6 (sur un total de 6)
  • Auteur
    Réponses
  • #61213
    Merlin
    Maître des clés

    Bonjour et bienvenue.

    Ce n’est peut être pas impossible mais c’est certainement assez difficile.
    La difficulté ne va pas être de trouver les mots surlignés en couleur, la difficulté va être de savoir quelle quantité de texte il va falloir sélectionner et comment l’extraire (sous quelle forme)…

    Je passe la main à de plus grands magiciens que moi…  :joker:

    #61214
    bebarth
    Maître des clés

    bonjour,

    La difficulté ne va pas être de trouver les mots surlignés en couleur, …

    Trouver les mots surlignés est effectivement faisable, le problème c’est de savoir ce qu’il y a entre ces mots !!! La ponctuation quoi…
    getPageNthWordQuads permet de récupérer uniquement les mots (si je ne me trompe pas). On peut mettre un espace entre chaque mot, mais je ne vois pas comment récupérer la ponctuation !

    Pour info, il y a un article qui traite ce sujet (il y en a surement d’autres…)
    http://asserttrue.blogspot.fr/2010/07/workaround-for-acrobat-javascripts-lack.html#

    @+
    :bonjour:

    #61215
    Merlin
    Maître des clés
    #61216
    bebarth
    Maître des clés

    bonjour,
    Il est certainement trop tard pour brian.letoxis qui a déjà terminé de surligner tous les textes qui lui étaient nécessaires.
    Je me demandais si avec l’option “Copier le texte sélectionné dans les fenêtres de texte surligné…” (dans les préférences) puis “Tout exporter vers un fichier de données…” (dans l’outil liste de commentaires) on ne pouvait pas faire quelque chose !!!
    On exporte un fichier fdf et là, je n’y connais plus grand chose en format fdf, mais Merlin a-t-il peut-être une idée ????

    Pour ma par, j’ai réimporté le fichier fdf and un pdf vierge que j’ai lui-même ré-enregistré en docx pour pouvoir l’ouvrir sous Word. c’est du bidouillage mais ça fonctionne… il y a encore de la mise en page à faire, mais le texte des commentaires est récupéré (avec ponctuation), et ce sont de vrais paragraphes et non une succession de lignes…
    @+
    :bonjour:

    #61217
    Merlin
    Maître des clés

    bebarth tu es un génie.  :bravo:
    Ça devrait être effectivement une bonne piste à explorer…

    #61218
    Merlin
    Maître des clés

    Ça me fait penser qu’il existe deux Actions pour Acrobat qui font des choses de ce genre, proposées gratuitement par Lori Kassuba (alias “the PDF Queen”).

    Il faut chercher “Find, Highlight, and Extract Words” et “Find and Highlight Words” sur cette page :
    https://acrobatusers.com/actions-exchange

Affichage de 6 réponses de 1 à 6 (sur un total de 6)
  • Vous devez être connecté pour répondre à ce sujet.