Bug #2462
RCP: 0.7.9, XML import modules broken on </form> closing tag
Statut: | Closed | Début: | 16/10/2018 | |
---|---|---|---|---|
Priorité: | Normal | Echéance: | ||
Assigné à: | - | % réalisé: | 100% |
|
Catégorie: | Import | Temps passé: | - | |
Version cible: | TXM 0.8.0 |
Description
A </form> closing tag breaks the <txm:form> management -> word properties get shifted.
Example:
<form> ... <orth> <hi rend="b"> <w id="w_EdmondBéquetArtDramatique_703"> <txm:form>ABANDON</txm:form> <txm:ana resp="none" type="#n">703</txm:ana> <txm:ana resp="#txm" type="#frpos">NAM</txm:ana> <txm:ana resp="#txm" type="#frlemma">ABANDON</txm:ana> </w> </hi> </orth> <w id="w_EdmondBéquetArtDramatique_704"> <txm:form>.</txm:form> <txm:ana resp="none" type="#n">704</txm:ana> <txm:ana resp="#txm" type="#frpos">SENT</txm:ana> <txm:ana resp="#txm" type="#frlemma">.</txm:ana> </w> </form> <def> <w id="w_EdmondBéquetArtDramatique_705"> <txm:form>Action</txm:form> <txm:ana resp="none" type="#n">705</txm:ana> <txm:ana resp="#txm" type="#frpos">SENT</txm:ana> <txm:ana resp="#txm" type="#frlemma">.</txm:ana> </w> <w id="w_EdmondBéquetArtDramatique_706"> <txm:form>de</txm:form> <txm:ana resp="none" type="#n">706</txm:ana> <txm:ana resp="#txm" type="#frpos">NOM</txm:ana> <txm:ana resp="#txm" type="#frlemma">action</txm:ana> </w> ... </def>->
- the 'Action' form gets the '.' lemma;
- the 'de' form gets the 'action' lemma.
- ...
Solution 1¶
Check that the </form> tag is inside a <w> element.
Solution 2¶
Use XML namespaces to disambiguate XML semantics.
If necessary, build a whole namespace environment for XML sources that don't declare namespaces explicitly or formally.
Historique
#1 Mis à jour par Matthieu Decorde il y a presque 7 ans
- % réalisé changé de 0 à 80
#2 Mis à jour par Sebastien Jacquot il y a plus d'un an
- % réalisé changé de 80 à 100
#3 Mis à jour par Sebastien Jacquot il y a plus d'un an
- Statut changé de New à Closed