Feature #3356

import, tokenizer step, display total number of tokens and texts at the end of the step

Ajouté par Serge Heiden il y a plus de 2 ans.

Statut:New Début:27/03/2023
Priorité:Normal Echéance:
Assigné à:- % réalisé:

0%

Catégorie:Import Temps passé: -
Version cible:TXM 0.8.4

Description

To help diagnose certain volumetric problems when importing a corpus, it can be interesting to provide an order of magnitude of the corpus.

Even if an import stops at a later stage, the word count is a good indicator of volume.

Formats disponibles : Atom PDF