Enregistrer le PDF vers un format TXT¶
Avec python¶
- Il fallu vérifier que python existait sur ma machine
- Récupérer une librairie (pdfminer) qui extrait le texte d'un pdf et l'extraire quelque part : "pdfminer-20140328"
- Lancer une transformation (redirection vers un fichier avec même nom mais extension .txt)
$ python --version
$ cd pdfminer-20140328/
$ sudo python setup.py install
------ A faire sur chaque fichier, à moins de préparer un script pour lire le dossier et lancer la commande de manière répétée ---------
$ pdf2txt.py ../testpdf/PEDT_CC_Mugron.pdf > ../testpdf/PEDT_CC_Mugron.txt