Bug #2462
RCP: 0.7.9, XML import modules broken on </form> closing tag
| Statut: | Closed | Début: | 16/10/2018 | |
|---|---|---|---|---|
| Priorité: | Normal | Echéance: | ||
| Assigné à: | - | % réalisé: | 100% |
|
| Catégorie: | Import | Temps passé: | - | |
| Version cible: | TXM 0.8.0 |
Description
A </form> closing tag breaks the <txm:form> management -> word properties get shifted.
Example:
<form>
...
<orth>
<hi rend="b">
<w id="w_EdmondBéquetArtDramatique_703">
<txm:form>ABANDON</txm:form>
<txm:ana resp="none" type="#n">703</txm:ana>
<txm:ana resp="#txm" type="#frpos">NAM</txm:ana>
<txm:ana resp="#txm" type="#frlemma">ABANDON</txm:ana>
</w>
</hi>
</orth>
<w id="w_EdmondBéquetArtDramatique_704">
<txm:form>.</txm:form>
<txm:ana resp="none" type="#n">704</txm:ana>
<txm:ana resp="#txm" type="#frpos">SENT</txm:ana>
<txm:ana resp="#txm" type="#frlemma">.</txm:ana>
</w>
</form>
<def>
<w id="w_EdmondBéquetArtDramatique_705">
<txm:form>Action</txm:form>
<txm:ana resp="none" type="#n">705</txm:ana>
<txm:ana resp="#txm" type="#frpos">SENT</txm:ana>
<txm:ana resp="#txm" type="#frlemma">.</txm:ana>
</w>
<w id="w_EdmondBéquetArtDramatique_706">
<txm:form>de</txm:form>
<txm:ana resp="none" type="#n">706</txm:ana>
<txm:ana resp="#txm" type="#frpos">NOM</txm:ana>
<txm:ana resp="#txm" type="#frlemma">action</txm:ana>
</w>
...
</def>
->
- the 'Action' form gets the '.' lemma;
- the 'de' form gets the 'action' lemma.
- ...
Solution 1¶
Check that the </form> tag is inside a <w> element.
Solution 2¶
Use XML namespaces to disambiguate XML semantics.
If necessary, build a whole namespace environment for XML sources that don't declare namespaces explicitly or formally.
Historique
#1 Mis à jour par Matthieu Decorde il y a environ 7 ans
- % réalisé changé de 0 à 80
#2 Mis à jour par Sebastien Jacquot il y a presque 2 ans
- % réalisé changé de 80 à 100
#3 Mis à jour par Sebastien Jacquot il y a presque 2 ans
- Statut changé de New à Closed