Bug #2059

RCP: 0.7.8, fix pre-encoded word properties in XML/w+CSV

Ajouté par Serge Heiden il y a plus de 8 ans. Mis à jour il y a plus d'un an.

Statut:Closed Début:07/03/2017
Priorité:Urgent Echéance:
Assigné à:- % réalisé:

100%

Catégorie:Import Temps passé: -
Version cible:TXM 0.8.2

Description

Currently, if a <w> element in an XML source pre-encodes a property possibly built by TreeTagger, the TreeTagger properties are added to the word instead of not being touched (pre-encoding has priority over on the fly annotations).
For example, the following XML source :

établissements membres et d’un organisme de recherche associé, l’INSERM.
<w frpos="PUN">■</w>

L’Université Claude Bernard, qui forme chaque année 40 000 étudiants dans les sciences

produces the following TXM text:

établissements membres et d’un organisme de recherche associé, l’INSERM. ■ L’Université Claude Bernard, qui forme chaque année 40 000 étudiants dans les sciences

Where the '■' word properties are :
  • frpos:PUN
  • n:4516
  • frpos:NOM
  • frlemma:■

instead of the correct following TXM text:

établissements membres et d’un organisme de recherche associé, l’INSERM. ■ L’Université Claude Bernard, qui forme chaque année 40 000 étudiants dans les sciences

Where the '■' word properties are :
  • frpos:PUN
  • n:4516
  • frlemma:■

Solution

Add a new import parameter to activate or not the existing annotation correction see for details https://groupes.renater.fr/wiki/txm-info/public/annotation/tal_treetagger

Historique

#1 Mis à jour par Matthieu Decorde il y a presque 8 ans

  • Priorité changé de Normal à Urgent

#2 Mis à jour par Sebastien Jacquot il y a plus de 7 ans

  • Version cible changé de TXM 0.8.0a (split/restructuration) à TXM 0.8.0

#3 Mis à jour par Matthieu Decorde il y a plus de 6 ans

  • Version cible changé de TXM 0.8.0 à TXM 0.8.2

#4 Mis à jour par Matthieu Decorde il y a presque 5 ans

  • Description mis à jour (diff)

#5 Mis à jour par Matthieu Decorde il y a plus de 4 ans

  • % réalisé changé de 0 à 80

There was not need for an option, if a property value is already set in thx XML source files, it is used

#6 Mis à jour par Sebastien Jacquot il y a plus d'un an

  • % réalisé changé de 80 à 100

#7 Mis à jour par Sebastien Jacquot il y a plus d'un an

  • Statut changé de New à Closed

Formats disponibles : Atom PDF