Donnez vie à vos documents numériques !
 

extraction du texte

abracadabraPDF Forums PDF – Général extraction du texte

  • Ce sujet est vide.
  • Créateur
    Sujet
  • #43182
    Richard
    Invité

    Bonjour,

    connaîtriez-vous une api java autre que pdfbox qui permettrait d’extraire le texte d’un fichier pdf (pdfbox ne me rend pas le texte dans l’ordre) ?

Affichage de 4 réponses de 1 à 4 (sur un total de 4)
  • Auteur
    Réponses
  • #47555
    Merlin
    Maître des clés

    Cékoi une “api java” ?

    :scra:

    #47556
    Richard
    Invité

    Java est un langage de programmation (ce truc qui sert à faire les programmes qu’on utilise en informatique). Une API est une sorte de boîte à outils dans laquelle on peut puiser pour effectuer un certain nombre de tâches pour lesquelles cette API a été faite.

    Par exemple, j’imagine que dans acrobat writer il est possible de faire du dessin ou encore d’écrire du texte. Dans ce cas on aurait un API dessin qui fournirait des lignes, rectangles et autre et une API texte qui fournirait des font, des tailles, …

    #47557
    Lionel
    Membre

    Bonjour,

    Regardes dans les spécifications comment est conçu le format :

    Les spécifications du format PDF :

    http://partners.adobe.com/asn/tech/pdf/specifications.jsp

    Toutes les ressources d’Adobe :

    http://partners.adobe.com/asn/techresources.jsp

    Lionel.

    #47558
    Merlin
    Maître des clés

    OK, OK.

    PS : Acrobat Writer est une imprimante virtuelle qui ne servait qu’à convertir des fichiers natifs en PDF, et qui n’existe plus depuis belle lurette…

    ;-)

Affichage de 4 réponses de 1 à 4 (sur un total de 4)
  • Vous devez être connecté pour répondre à ce sujet.