Utilitaires sur le projet : extraction ou modification du corpus

Voir aussi les scripts pour la détection d'anomalies et modification des divers fichiers en fonction de celles-ci.

A) Modifier le corpus

1. Faire une sélection du corpus

Nom de code du script : SCRIPT_CORPUS_EXTRACTION

2. Enlever toutes les annotations

Nom de code du script : SCRIPT_REMOVE_ALLANNOTATION

B) Analyser l'organisation des index, des annotations, des entrées dictionnaire, des équivalences

1. Récupérer les localisations (fichier index) d'un lemme

Nom de code du script : SCRIPT_FINDOCCS_FORLEMME

HM_Script_CorpusSelection.png (32.6 kB) Severine Gedzelman, 01/26/2017 01:39 pm

HM_Script_RemoveAllAnnotations.png (24.3 kB) Severine Gedzelman, 01/26/2017 01:41 pm

HM_Script_FindLocalisationLemmaInIndexFiles.png (35.2 kB) Severine Gedzelman, 01/26/2017 01:42 pm