Feature #3190

Import, CoNLL-U corpus

Ajouté par Matthieu Decorde il y a presque 4 ans. Mis à jour il y a environ 3 ans.

Statut:New Début:07/12/2021
Priorité:Normal Echéance:
Assigné à:- % réalisé:

60%

Catégorie:Import Temps passé: -
Version cible:TXM Syntax 2.0

Description

Add a new import module : conllu

The import creates a CQP corpus with the ud words and properties

+ create CQP structures using CoNLL-U comment lines

+ based on the XTZ import with texts order, metadata, XSLs, ...

+ manage the word contractions

+ it creates the head-* and deps-* pre-computed conllu properties

+ it creates also a TIGERSearch representation

see https://groupes.renater.fr/wiki/txm-info/public/chantier_profiterole/chantier_finalisation_extension_syntactic_annotation and https://groupes.renater.fr/wiki/txm-info/public/import/conllu


Demandes liées

lié à Bug #3296: Import, CoNLL-U corpus, '--' sentence comment word breaks... New 06/10/2022

Historique

#1 Mis à jour par Matthieu Decorde il y a presque 4 ans

  • % réalisé changé de 0 à 50

head and deps projection not done yet

#2 Mis à jour par Matthieu Decorde il y a presque 4 ans

  • Description mis à jour (diff)

#3 Mis à jour par Matthieu Decorde il y a presque 4 ans

  • % réalisé changé de 50 à 80

#4 Mis à jour par Matthieu Decorde il y a environ 3 ans

  • % réalisé changé de 80 à 60

split the conllu files before all processes

Formats disponibles : Atom PDF