Feature #3190
Import, CoNLL-U corpus
Statut: | New | Début: | 07/12/2021 | ||
---|---|---|---|---|---|
Priorité: | Normal | Echéance: | |||
Assigné à: | - | % réalisé: | 60% |
||
Catégorie: | Import | Temps passé: | - | ||
Version cible: | TXM Syntax 2.0 |
Description
Add a new import module : conllu
The import creates a CQP corpus with the ud words and properties
+ create CQP structures using CoNLL-U comment lines
+ based on the XTZ import with texts order, metadata, XSLs, ...
+ manage the word contractions
+ it creates the head-* and deps-* pre-computed conllu properties
+ it creates also a TIGERSearch representation
see https://groupes.renater.fr/wiki/txm-info/public/chantier_profiterole/chantier_finalisation_extension_syntactic_annotation and https://groupes.renater.fr/wiki/txm-info/public/import/conllu
Demandes liées
Historique
#1 Mis à jour par Matthieu Decorde il y a presque 4 ans
- % réalisé changé de 0 à 50
head and deps projection not done yet
#2 Mis à jour par Matthieu Decorde il y a presque 4 ans
- Description mis à jour (diff)
#3 Mis à jour par Matthieu Decorde il y a presque 4 ans
- % réalisé changé de 50 à 80
#4 Mis à jour par Matthieu Decorde il y a environ 3 ans
- % réalisé changé de 80 à 60
split the conllu files before all processes