----- Mail original -----
De: "Pierre ESTREM"<linux-31@culte.org>
À: "Linux 31"<linux-31@culte.org>
Envoyé: Dimanche 18 Juillet 2021 04:51:10
Objet: Extraction du texte d'un PDF
Bonjour,
J'ai un outil qui permet de lire vocalement du texte comme ceci ;
$ espeak -v fr "Hello"
ou
$ cat mon.txt | espeak -v fr
ou
$ espeak -v fr < mon.txt
Dans le cas où le fichier est un PDF contenant du texte , comment
éviter
de lire les "commandes de formatage" ?
Je voudrais éviter les manipulations avec Acrobat.
J'ai envie d'écrire un truc du genre :
$ cat mon.pdf | ... | espeak -v fr
Et en utilisant la commande pdftotext et un pipe ?
Une idée les libristes ?
Bonjour,
J'ai consulté les questions et réponses données
où il est question de pouvoir lire un document
*.pdf dans un terminal :
pdftotext -layout mon.pdf - | tee | espeak -v fr
documentation d'origine :
https://unix.stackexchange.com/questions/41362/view-pdf-file-in-terminal
autrement il faut également installer le paquet :
brltty-espeak
pour ma part je préfère coupler mbrola dans la chaine
car la voix est plus "humaine" et moins synthétique
en version corrigée, voici la solution qui est plus
élégante :
pdftotext -layout ~/PDF/Scientologie.pdf - | espeak -a 200 -v mb-fr1 -s 150
pour plus de détail :
https://raspberry-pi.fr/faire-parler-raspberry-pi-espeak/
Merci pour ton aimable participation
Bien à toi
Bernard