Task #3342

Load, corpus restoration, ignore broken/deleted corpora

Ajouté par Serge Heiden il y a plus de 2 ans. Mis à jour il y a plus d'un an.

Statut:Closed Début:15/02/2023
Priorité:Normal Echéance:
Assigné à:- % réalisé:

100%

Catégorie:Corpus Temps passé: -
Version cible:TXM 0.8.3

Description

Currently, TXM tries to restore deleted corpora and throws a stacktrace before stopping the load.

Here is a typical sample console log:

Le corpus binaire /home/sheiden/TXM-0.8.2/corpora/CAPITAINEFRACASSE est au format 0.8.0.
Le corpus binaire /home/sheiden/TXM-0.8.2/corpora/CONLLU-TEST est au format 0.8.0.
** Erreur : le dossier d'entrée /home/sheiden/TXM-0.8.2/corpora/CONLLU-TEST n'est pas conforme au format de corpus binaire de TXM : corpus ignoré.
TXM a besoin des dossiers /home/sheiden/TXM-0.8.2/corpora/CONLLU-TEST/HTML, /home/sheiden/TXM-0.8.2/corpora/CONLLU-TEST/data, /home/sheiden/TXM-0.8.2/corpora/CONLLU-TEST/registry et /home/sheiden/TXM-0.8.2/corpora/CONLLU-TEST/.settings.
** Échec du chargement du corpus à partir du dossier /home/sheiden/TXM-0.8.2/corpora/CONLLU-TEST. Impossible de trouver les composants nécessaires.
Stacktrace: 
[1]           org.txm.rcp.commands.workspace.Load080BinaryCorpus.         loadBinaryCorpusAsDirectory  Load080BinaryCorpus.java, 158
[2]              org.txm.rcp.commands.workspace.LoadBinaryCorpus.         loadBinaryCorpusAsDirectory  LoadBinaryCorpus.java, 362
[3]    org.txm.rcp.commands.workspace.LoadBinaryCorporaDirectory.loadBinaryCorpusFromCorporaDirectory  LoadBinaryCorporaDirectory.java, 380
[4]  org.txm.rcp.commands.workspace.LoadBinaryCorporaDirectory$1.                                 run  LoadBinaryCorporaDirectory.java, 168
Le corpus binaire /home/sheiden/TXM-0.8.2/corpora/ELEMENTS-HOBBES est au format 0.8.0.
Le corpus binaire /home/sheiden/TXM-0.8.2/corpora/ELEMENTS-HOBBES-03-09 est au format 0.8.0.

The CONLLU-TEST corpus should be ignored or at least no stacktrace should be displayed (it is not a TXM internal error).

Solution

Detect if the directory is well-formed before trying to load the corpus (the directory is skipped if malformed)

Historique

#1 Mis à jour par Matthieu Decorde il y a plus de 2 ans

  • Sujet changé de Load, corpus restoration, ignore deleted corpora à Load, corpus restoration, ignore broken/deleted corpora
  • Description mis à jour (diff)
  • % réalisé changé de 0 à 80

#2 Mis à jour par Sebastien Jacquot il y a plus d'un an

  • % réalisé changé de 80 à 100

#3 Mis à jour par Sebastien Jacquot il y a plus d'un an

  • Statut changé de New à Closed

Formats disponibles : Atom PDF