Bug #2059

Mis à jour par Matthieu Decorde il y a presque 5 ans

Currently, if a <w> element in an XML source pre-encodes a property possibly built by TreeTagger, the TreeTagger properties are added to the word instead of not being touched (pre-encoding has priority over on the fly annotations).
For example, the following XML source :
<pre>
établissements membres et d’un organisme de recherche associé, l’INSERM.
<w frpos="PUN">■</w>

L’Université Claude Bernard, qui forme chaque année 40 000 étudiants dans les sciences
</pre>

produces the following TXM text:

<pre>
établissements membres et d’un organisme de recherche associé, l’INSERM. ■ L’Université Claude Bernard, qui forme chaque année 40 000 étudiants dans les sciences
</pre>
Where the '■' word properties are :

* frpos:PUN
* n:4516
* frpos:NOM
* frlemma:■

instead of the correct following TXM text:

<pre>
établissements membres et d’un organisme de recherche associé, l’INSERM. ■ L’Université Claude Bernard, qui forme chaque année 40 000 étudiants dans les sciences
</pre>
Where the '■' word properties are :

* frpos:PUN
* n:4516
* frlemma:■

h3. Solution

Add a new import parameter to activate or not the existing annotation correction see for details https://groupes.renater.fr/wiki/txm-info/public/annotation/tal_treetagger

Retour