[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Extraction du texte d'un PDF



Bonjour,

J'ai un outil qui permet de lire vocalement du texte comme ceci ;

$ espeak -v fr "Hello"
ou
$ cat mon.txt | espeak -v fr
ou
$ espeak -v fr < mon.txt

Dans le cas où le fichier est un PDF contenant du texte , comment éviter de lire les "commandes de formatage" ?
Je voudrais éviter les manipulations avec Acrobat.
J'ai envie d'écrire un truc du genre :

$ cat mon.pdf | ... | espeak -v fr

Et en utilisant la commande pdftotext et un pipe ?

Une idée les libristes ?
--
pierre estrem