Feature #3049

UDPipe annotation engine, tokenizer

Ajouté par Matthieu Decorde il y a plus de 4 ans.

Statut:New Début:09/04/2021
Priorité:Normal Echéance:
Assigné à:- % réalisé:

0%

Catégorie:Annotation Temps passé: -
Version cible:TXM - Eltec 1.0

Description

Integrate the UDPipe annotation engine in TXM like TreeTagger is.

If available, The UDPipe annotation engine can be selected in the import form instead of TreeTagger (in the Language section).

To work properly, the UD tagger needs the appropriate tokenization.

During the import process, if the UDPipe annotation engine is selected, TXM will not use its tokenisation rules but the UD pipe model tokenisation.


Demandes liées

lié à Feature #3051: Tokenizer, separate the XML parsing and the String tokeni... New 09/04/2021

Formats disponibles : Atom PDF