Feature #2042

RCP: X.X, Import annotations from Glozz corpus command

Ajouté par Matthieu Decorde il y a environ 2 ans. Mis à jour il y a 8 mois.

Statut:New Début:16/02/2017
Priorité:Normal Echéance:
Assigné à:- % réalisé:

0%

Catégorie:Annotation Temps passé: -
Version cible:TXM Democrat 4.0

Description

Currently, in the "Import a Glozz corpus..." command, the TXT+CSV import module tokenization seems sufficient for raw text Analec annotated texts. But for XML-TRS source files or part of files, the XML-TRS import module tokenization doesn't work.

Solution

Add a "Import annotations from Glozz..." command to align Analec annotations (character positions) to a TXM corpus Analec annotations (word positions).

The algorithm must deal with missing or added characters in the base text character flow.

Historique

#1 Mis à jour par Serge Heiden il y a presque 2 ans

  • Description mis à jour (diff)

#2 Mis à jour par Serge Heiden il y a presque 2 ans

  • Description mis à jour (diff)

#3 Mis à jour par Serge Heiden il y a presque 2 ans

  • Description mis à jour (diff)

#4 Mis à jour par Serge Heiden il y a presque 2 ans

  • Description mis à jour (diff)

#5 Mis à jour par Serge Heiden il y a presque 2 ans

  • Description mis à jour (diff)

#6 Mis à jour par Serge Heiden il y a presque 2 ans

  • Version cible changé de TXM Democrat 3.0 à TXM Democrat 4.0

#7 Mis à jour par Matthieu Decorde il y a environ un an

  • % réalisé changé de 0 à 80

#8 Mis à jour par Matthieu Decorde il y a environ un an

  • % réalisé changé de 80 à 0

#9 Mis à jour par Matthieu Decorde il y a 8 mois

  • Sujet changé de RCP: X.X, align Analec annotation with an imported corpus à RCP: X.X, Import annotations from Glozz corpus command
  • Description mis à jour (diff)

Formats disponibles : Atom PDF