Bug #2059
RCP: 0.7.8, fix pre-encoded word properties in XML/w+CSV
Statut: | Closed | Début: | 07/03/2017 | |
---|---|---|---|---|
Priorité: | Urgent | Echéance: | ||
Assigné à: | - | % réalisé: | 100% |
|
Catégorie: | Import | Temps passé: | - | |
Version cible: | TXM 0.8.2 |
Description
Currently, if a <w> element in an XML source pre-encodes a property possibly built by TreeTagger, the TreeTagger properties are added to the word instead of not being touched (pre-encoding has priority over on the fly annotations).
For example, the following XML source :
établissements membres et d’un organisme de recherche associé, l’INSERM. <w frpos="PUN">■</w> L’Université Claude Bernard, qui forme chaque année 40 000 étudiants dans les sciences
produces the following TXM text:
établissements membres et d’un organisme de recherche associé, l’INSERM. ■ L’Université Claude Bernard, qui forme chaque année 40 000 étudiants dans les sciences
Where the '■' word properties are :
- frpos:PUN
- n:4516
- frpos:NOM
- frlemma:■
instead of the correct following TXM text:
établissements membres et d’un organisme de recherche associé, l’INSERM. ■ L’Université Claude Bernard, qui forme chaque année 40 000 étudiants dans les sciences
Where the '■' word properties are :
- frpos:PUN
- n:4516
- frlemma:■
Solution¶
Add a new import parameter to activate or not the existing annotation correction see for details https://groupes.renater.fr/wiki/txm-info/public/annotation/tal_treetagger
Historique
#1 Mis à jour par Matthieu Decorde il y a presque 8 ans
- Priorité changé de Normal à Urgent
#2 Mis à jour par Sebastien Jacquot il y a plus de 7 ans
- Version cible changé de TXM 0.8.0a (split/restructuration) à TXM 0.8.0
#3 Mis à jour par Matthieu Decorde il y a plus de 6 ans
- Version cible changé de TXM 0.8.0 à TXM 0.8.2
#4 Mis à jour par Matthieu Decorde il y a presque 5 ans
- Description mis à jour (diff)
#5 Mis à jour par Matthieu Decorde il y a plus de 4 ans
- % réalisé changé de 0 à 80
There was not need for an option, if a property value is already set in thx XML source files, it is used
#6 Mis à jour par Sebastien Jacquot il y a plus d'un an
- % réalisé changé de 80 à 100
#7 Mis à jour par Sebastien Jacquot il y a plus d'un an
- Statut changé de New à Closed