Enregistrer le PDF vers un format TXT

Avec python

  1. Il fallu vérifier que python existait sur ma machine
  2. Récupérer une librairie (pdfminer) qui extrait le texte d'un pdf et l'extraire quelque part : "pdfminer-20140328"
  3. Lancer une transformation (redirection vers un fichier avec même nom mais extension .txt)
$ python --version
$ cd pdfminer-20140328/
$ sudo python setup.py install

------ A faire sur chaque fichier, à moins de préparer un script pour lire le dossier et lancer la commande de manière répétée ---------
$ pdf2txt.py ../testpdf/PEDT_CC_Mugron.pdf > ../testpdf/PEDT_CC_Mugron.txt