Support #1049

KF: Corpus Mariage pour tous: Import or Sub-corpus

Ajouté par Serge Heiden il y a presque 11 ans. Mis à jour il y a environ 5 ans.

Statut:Closed Début:09/10/2014
Priorité:Normal Echéance:
Assigné à:- % réalisé:

0%

Catégorie:Import Temps passé: -
Version cible:Support

Description

From KF:

Problem with 'mariage pour tous' corpus.
import > XML TEI TXM > sous-corpus impossible mais pas de bug évident
import > XML /w + CSV > sous-corpus possible
testé sur corpus MPT (mariage pour tous)

In 'Mariage pour tous' corpus web site (Nicolas Legrand): https://github.com/nlegrand/mariagepourtousInXML

We find two corpora:

Diagnostic 1

Test with binary version:
  • File / Load MPT-TXM_2013-03-20 -> new 'MPT' corpus
  • Sub-corpus structure=metadata, property=debat, value=mpt -> new sub-corpus
  • Lexicon on sub-corpus working -> '24730 items pour 946286 occurrences.'

Conclusion 1

Impossible to reproduce the problem.

Diagnostic 2

Test with source version:

  • File / Import / XML/w+CSV MPT -> new 'MPTSRC' corpus
  • Sub-corpus structure=metadata, property=debat, value=mpt -> new sub-corpus
  • Lexicon on sub-corpus working -> '24730 items pour 946286 occurrences.'

Conclusion 2

Impossible to reproduce the problem.

Diagnostic 3

Test with binary version on Windows 7 64-bit:

Load command should abort with the following error (FR), [from AD]:

Échec de l'extraction du corpus binaire : java.io.FileNotFoundException: ...\TXM\corpora\mpt\data\MPT\metadata_debat.avs (L’opération demandée n’a pu s’accomplir sur un fichier ayant une section mappée utilisateur ouverte)

Conclusion 3

Historique

#1 Mis à jour par Serge Heiden il y a presque 11 ans

  • Description mis à jour (diff)

#2 Mis à jour par Serge Heiden il y a presque 11 ans

  • Description mis à jour (diff)

#3 Mis à jour par Serge Heiden il y a presque 11 ans

  • Sujet changé de TXM 0.7.6 Corpus Mariage pour tous: Import or Sub-corpus à KF: Corpus Mariage pour tous: Import or Sub-corpus

#4 Mis à jour par Matthieu Decorde il y a environ 5 ans

  • Statut changé de New à Closed

Formats disponibles : Atom PDF