[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Supprimer toutes les entêtes



Le dimanche 21 novembre 2021 à 23:22 +0100, Jean-Marc MONGRELET a
écrit :
> Bonsoir,
> 
> Le 21/11/2021 20:07, peterpan31 a écrit :
> > 
> > Je souhaite n'afficher que le "texte utile" de fichiers .eml (et si
> > possible y compris ceux rédigés en HTML, c-è-d enéjectant les
> > balises).
> > 
> > N'existe-t-il pas un outil près à l'emploi faisant cela ?
> 
> Une piste à suivre est de passer par le format PDF...
> 
> https://forum.framasoft.org/viewtopic.php?t=36341
> 
> puis:
> https://doc.ubuntu-fr.org/poppler-utils#extraction_de_texte
> 
> Bon hack, ;-)
> 
> JM
> 
> -- 

Ça n'aurait aucun effet : aucun des outils proposés sur la page de
framasoft ne fait de filtrage intelligent basé sur le fait que la
source est un courriel, c'est juste de la conversion de format de
document.

Donc là :

- avec a2ps, on prend un fichier texte brut (supposé ASCII)
partiellement voire totalement illisible, on le convertit en un fichier
Postscript toujours partiellement voire totalement illisible ;

- avec ps2pdf, on prend ce fichier Postscript partiellement voire
totalement illisible, on le convertit en un fichier PDF toujours
partiellement voire totalement illisible ;

- avec popler, on prend ce fichier PDF partiellement voire totalement
illisible, on le convertit en un fichier texte brut (ou Postscript, ou
HTML) toujours partiellement voire totalement illisible.

Amicalement,
Albert.