[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Extraction du texte d'un PDF (lecture d'un document pdf en terminal et vocalisation)




----- Mail original -----
> De: "Pierre ESTREM" <linux-31@culte.org>
> À: "Linux 31" <linux-31@culte.org>
> Envoyé: Dimanche 18 Juillet 2021 04:51:10
> Objet: Extraction du texte d'un PDF
> 
> Bonjour,
> 
> J'ai un outil qui permet de lire vocalement du texte comme ceci ;
> 
> $ espeak -v fr "Hello"
> ou
> $ cat mon.txt | espeak -v fr
> ou
> $ espeak -v fr < mon.txt
> 
> Dans le cas où le fichier est un PDF contenant du texte , comment
> éviter
> de lire les "commandes de formatage" ?
> Je voudrais éviter les manipulations avec Acrobat.
> J'ai envie d'écrire un truc du genre :
> 
> $ cat mon.pdf | ... | espeak -v fr
> 
> Et en utilisant la commande pdftotext et un pipe ?
> 
> Une idée les libristes ?


Bonjour,


J'ai consulté les questions et réponses données 
où il est question de pouvoir lire un document 
*.pdf dans un terminal :

pdftotext -layout  mon.pdf - | tee | espeak -v fr

documentation d'origine :
https://unix.stackexchange.com/questions/41362/view-pdf-file-in-terminal

autrement il faut également installer le paquet : 

brltty-espeak


pour ma part je préfère coupler mbrola dans la chaine 
car la voix est plus "humaine" et moins synthétique 


en version corrigée, voici la solution qui est plus 
élégante :

pdftotext -layout ~/PDF/Scientologie.pdf - | espeak -a 200 -v mb-fr1 -s 150

pour plus de détail :
https://raspberry-pi.fr/faire-parler-raspberry-pi-espeak/


Merci pour ton aimable participation 

Bien à toi

Bernard