Bug #528

Task #490: RCP: 0.7.5 Fix 0.7.5 beta bugs

RCP: 0.7.5, xml/w import module, some xml tags are indexed as words

Ajouté par Alexey Lavrentev il y a plus de 11 ans. Mis à jour il y a environ 10 ans.

Statut:Closed Début:17/01/2014
Priorité:Normal Echéance:
Assigné à:Matthieu Decorde % réalisé:

100%

Catégorie:Import Temps passé: -
Version cible:TXM 0.7.5

Description

Some xml tags from the source document appear as words in lexical indexes, e.g.

</?ab.*>
in Schiller corpus (check source documents and binary corpus at /SpUV/Schiller).

The same sources were correctly imported with TXM 0.7.2 with the same parameters...

In the BVHEPISTEMON2014 corpus, such misinterpreted tags are very numerous.

Historique

#1 Mis à jour par Alexey Lavrentev il y a plus de 11 ans

  • Description mis à jour (diff)

#2 Mis à jour par Matthieu Decorde il y a plus de 11 ans

  • % réalisé changé de 0 à 70

fix bugs in the SattributeListener class:
- structure depth
- missing properties

#3 Mis à jour par Matthieu Decorde il y a plus de 11 ans

  • Tâche parente mis à #490

#4 Mis à jour par Matthieu Decorde il y a plus de 11 ans

I've add a test after cwb-encode call to check if the registry file was created or not. This would help people to spot the bug.

#5 Mis à jour par Matthieu Decorde il y a plus de 11 ans

  • % réalisé changé de 70 à 100

#6 Mis à jour par Matthieu Decorde il y a plus de 11 ans

  • Statut changé de New à Closed

#7 Mis à jour par Matthieu Decorde il y a environ 10 ans

  • Catégorie mis à Import

Formats disponibles : Atom PDF