Sprachen

Benutzeranmeldung
Registrieren

Navigation

Neuste Spenden

Luca Daghino
gespendet € 30.00

Kevin Peng
gespendet $ 50.00

abualijawad
gespendet CAD 5.00

knife
gespendet € 20.00

Spenden Sie jetzt!

bc1q3t3vxjhd3dmvg3cfn24k4l7n4mf750utpp75hn

Verfasst von john78 am Di, 05/29/2012 - 20:33

PDF vers Word converter ??

Bitte lesen und halten Sie sich an die Community-Verhaltensregeln.

Anmelden oder Registrieren um Kommentare zu schreiben

4 Antworten [Letzter Beitrag]

Di, 05/29/2012 - 20:33

john78

Offline

Beigetreten: 05/29/2012

Bonjour, je n'auelqu'un pourrait -il me dire où trouver ce qu'il me manque?

Mi, 05/30/2012 - 06:00

Magic Banana

I am a member!

I am a translator!

Offline

Beigetreten: 07/24/2010

Je doute que cela existe. En revanche je suppose que tu peux être intéressé par la commande 'pdftotext' qui est fournie par le paquet poppler-utils qui devrait être installé par défaut. Elle extrait le texte brut d'un PDF. Cela fonctionne bien si le texte est disposé en une seule colonne.

Mi, 05/30/2012 - 07:49

john78

Offline

Beigetreten: 05/29/2012

Merci beaucoup pour votre rapidité, j'avais besoin de ça car on m'a envoyé un docu word à remplir en ligne et je n'avais pas d'autre choix que de le scanner et le transformer en PDF car on me demandait d'ajouter ma photo dans le doc.

Je précise que j'ai trisquel brigantia 5.5 et que je ne trouve pas le packet poppler dans add/remove software. Ou puis je le trouver svp?

Mi, 05/30/2012 - 10:09

Mark

Offline

Beigetreten: 04/14/2012

Bonjour !
Tu peux essayer d'utiliser le Gestionnaire de paquets Synaptic, il se situe dans la fenêtre "paramètre système".
Tu peux chercher poppler dans la barre de recherche que contient le gestionnaire de paquets Synaptic.

Mi, 05/30/2012 - 13:46

Magic Banana

I am a member!

I am a translator!

Offline

Beigetreten: 07/24/2010

En effet... sauf que 'pdftotext' ne te donnera rien si le PDF vient d'un scan, c'est à dire d'une image !

Ce que tu veux c'est un logiciel de reconnaissance de caractères, OCR en anglais. En tapant ces trois lettres dans le champ de recherche rapide de Synaptic, tu trouveras plusieurs options.

Je pense que 'tesseract-ocr' est celui qui fonctionne le mieux (Google l'a utilisé pour sa numérisation de livres)... mais il n'a pas d'interface graphique et, surtout, je ne crois pas qu'il fonctionne directement sur des PDF multi-pages. Il te faudrait alors convertir chaque page en une image sur laquelle la commande est lancée (tout cela s'automatise en un script).

Pour des PDF multi-pages, j'essaierai 'gscan2pdf'. Il a l'air très simple d'emploi. Vu sa description, la sortie semble être un nouveau PDF mais tu pourras, cette fois, le traiter avec 'pdftotext'.

Anmelden oder Registrieren um Kommentare zu schreiben

top

Sprachen

Navigation

Neuste Spenden

PDF vers Word converter ??