Task #3242

Import, XTZ, manage nested w elements

Ajouté par Matthieu Decorde il y a plus de 3 ans. Mis à jour il y a plus de 3 ans.

Statut:New Début:21/04/2022
Priorité:Normal Echéance:
Assigné à:- % réalisé:

0%

Catégorie:Import Temps passé: -
Version cible:TXM 0.8.4

Description

Decide what to do with nested w elements

<text>
<w><w>un</w> <w>mot</w> <w>spécial</w></w>
</text>

Currently the compiler and pager steps creates a phantom words after the inner words

eg, in the example : indexes and HTML pages contains the following words : "un", "mot", "spécial" and ""


Demandes liées

lié à Bug #3233: Import, TreeTagger, fails with nested w elements Closed 04/03/2022

Historique

#1 Mis à jour par Serge Heiden il y a plus de 3 ans

TXM XML importers don't define nested <w> (the XML TEI-TXM format neither) -> nested <w> must be rejected or ignored

Formats disponibles : Atom PDF