Feature #1503

TBX: X.X, use one instance of TreeTagger to tag all corpus texts

Ajouté par Matthieu Decorde il y a plus de 3 ans. Mis à jour il y a 8 mois.

Statut:New Début:17/09/2015
Priorité:Normal Echéance:
Assigné à:- % réalisé:

0%

Catégorie:Import Temps passé: -
Version cible:TXM 0.8.0

Description

Currently TreeTagger is launched for each tagged XML-TXM .

This cost time during import process.

Solution

Concat TreeTagger sources in one stream per model file.
Question : are text limits well managed ?
use https://reckart.github.io/tt4j ?

Historique

#1 Mis à jour par Matthieu Decorde il y a plus de 3 ans

  • Description mis à jour (diff)

#2 Mis à jour par Sebastien Jacquot il y a 8 mois

  • Version cible changé de TXM 0.8.0a (split/restructuration) à TXM 0.8.0

Formats disponibles : Atom PDF