Feature #2042
RCP: X.X, Import annotations from Glozz corpus command
Statut: | New | Début: | 16/02/2017 | |
---|---|---|---|---|
Priorité: | Normal | Echéance: | ||
Assigné à: | - | % réalisé: | 0% |
|
Catégorie: | Annotation | Temps passé: | - | |
Version cible: | TXM Annotation URS X.X |
Description
Currently, in the "Import a Glozz corpus..." command, the TXT+CSV import module tokenization seems sufficient for raw text Analec annotated texts. But for XML-TRS source files or part of files, the XML-TRS import module tokenization doesn't work.
Solution¶
Add a "Import annotations from Glozz..." command to align Analec annotations (character positions) to a TXM corpus Analec annotations (word positions).
The algorithm must deal with missing or added characters in the base text character flow.
Historique
#1 Mis à jour par Serge Heiden il y a plus de 8 ans
- Description mis à jour (diff)
#2 Mis à jour par Serge Heiden il y a plus de 8 ans
- Description mis à jour (diff)
#3 Mis à jour par Serge Heiden il y a plus de 8 ans
- Description mis à jour (diff)
#4 Mis à jour par Serge Heiden il y a plus de 8 ans
- Description mis à jour (diff)
#5 Mis à jour par Serge Heiden il y a plus de 8 ans
- Description mis à jour (diff)
#6 Mis à jour par Serge Heiden il y a plus de 8 ans
- Version cible changé de TXM Annotation URS 3.0 à TXM Annotation URS X.X
#7 Mis à jour par Matthieu Decorde il y a presque 8 ans
- % réalisé changé de 0 à 80
#8 Mis à jour par Matthieu Decorde il y a presque 8 ans
- % réalisé changé de 80 à 0
#9 Mis à jour par Matthieu Decorde il y a plus de 7 ans
- Sujet changé de RCP: X.X, align Analec annotation with an imported corpus à RCP: X.X, Import annotations from Glozz corpus command
- Description mis à jour (diff)