Donnez vie à vos documents numériques !
 

Répondre à : Comment extraire le texte d’un pdf (1.4)

abracadabraPDF Forums PDF – Général Comment extraire le texte d’un pdf (1.4) Répondre à : Comment extraire le texte d’un pdf (1.4)

#50332
Leam
Invité

Les essais que je viens de faire viennent confirmer l’idée que j’ai au sujet du codage des phrases  :soleil:

Si sur le PDF j’ai :
ABCDEFGHJIKLMNOPQRSTUVWXYZ.
(guillemets ajoutés)
je récupère exactement la même choses et il n’y a pas un seul caractère qui ne manque.

Si j’essaie avec une vrai phrase :
J’écris cette phrase pour voir si je retrouve bien tous les caractères et je ne suis capable de savoir comment le fichier PDF fait pour codé tout ça ???
(guillemets ajoutés)
Je récupère :
J’écris etphaouvjbnlèdmfPDFç?

Il n’est ainsi pas possible de dire que ce soit un cas isolé. De ce que je comprend c’est que quand je fais des mots corrects en français je ne peut récupérer la phrase et à l’inverse quand je écris des caractères sans sens litérale je peux lire les tous les caractères sans problèmes.

J’en conclu que comme les téléphones portables codes les mots en mode T9 les PDF codes les phrases entières avec un mode bien défini…

Mais comment faire pour les décoder  :Euuuh:
Est-ce que mon raisonnement est juste  ?

Les PDF (1.4) sur lesquels je travail sont créés sous Open Office 3.
Merci pour tous éclaircissement.