Documents

User documentation

TXT brut séance 19 janvier 1910 - V3 (version finale)

12/06/2017 16:38

Version finale du débat du 19 janvier 1910, format TXT.

Corpus extrait "Laïcité" (19 janvier 1910) pour TXM

19/06/2017 11:29

Le corpus extrait a été encodé automatiquement en XML-TEI avec un script python. Pour pouvoir être importé dans TXM, on a récupéré le fichier XSL du projet MPT ainsi que la structure du fichier de métadonnées "metadata.csv".

Débats Parlementaires Europe pour TXM

20/06/2017 10:54

Ressources pour TXM (6 fichiers XML, 1 fichier CSV de métadonnées) et 1 fichier propre à TXM "import.properties"

Europresse

23/05/2017 15:32

Récupération d'une source Europresse en HTML (echos_1_fromEuropress.html) et PDF.

Transformation du pdf vers HTML avec Adobe Pro (echos_1_avecAdobe.html)

TXT brut séance 19 janvier 1910

23/05/2017 14:24

Le texte brut du débat, sans retranscription au propre.

ET aussi une version en UTF-8 (grâce à la macro de TXM dans "txt" > "changeEncoding")

Corpus : débats janvier 1910

24/04/2017 10:13

Débats à la Chambre des Députés sur la question scolaire (manuels, laïcité).

Débats janvier 1910 - Partie 1

24/04/2017 10:15

Débats txt

04/05/2017 15:00

Retranscription des débats - imparfaitement océrisés - au format brut.